วันพฤหัสบดีที่ 6 ธันวาคม พ.ศ. 2561

บทที่ 3 ฐานข้อมูล และคลังข้อมูล


บทที่ 3 ฐานข้อมูล และคลังข้อมูล
โครงสร้างข้อมูล
                มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต(Bit) ไบต์(Byte)  เขตข้อมูล(Field) ระเบียนข้อมูล(Record) และไฟล์(File)  ตามลำดับ
-                               บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์ เป็นเลขฐานสอง 0 กับ 1
-                               ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต มาเรียงต่อกันเป็น 1 ไบท์ สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 = 256 ตัว
-                               เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย
-                               ระเบียนข้อมูล (Record) กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน
-                               ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน

ปัญหาเกี่ยวกับแฟ้มข้อมูล
1. ความซ้ำซ้อนของข้อมูล (Data Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล
2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง จะมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม
3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได
4. การขาดความร่วมมือ (Lack of Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่ ๆ
5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล มีขอบเขตความสามารถจำกัด

แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
            1. ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
                2. มีความเป็นอิสระต่อกัน (Data Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
3. สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
4. มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
5. มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น
   
องค์ประกอบของระบบฐานข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบ 4 ส่วน คือ
1.             ข้อมูล (Data) คือ ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
2.             ฮาร์ดแวร์ (Hardware) คือ เครื่องคอมพิวเตอร์ และอุปกรณ์รอบข้าง
3.             ซอฟต์แวร์ (Software) คือ ระบบปฏิบัติการ และระบบจัดการข้อมูล รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
4.             ผู้ใช้ (Users) คือ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล ผู้เขียนโปรแกรม และผู้ใช้งาน

รูปแบบของฐานข้อมูล (Database Model)
                แบบจำลองฐานข้อมูลอธิบายถึงโครงสร้างและความสัมพันธ์ระหว่างข้อมูล แบบจำลองมีหลายรูปแบบ คือ

        1. แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายต้นไม้ ข้อมูลมีความสัมพันธ์เรียกว่า One-to-Many  หนึ่งต่อกลุ่ม ข้อมูลจัดเก็บในรูปของ Segment ที่อยู่บนสุด เรียกว่า Root Node ถัดลงมาเรียกว่า Child Node ข้อดีคือมีความซับซ้อนน้อย มีโครงสร้างเข้าใจง่าย เรียงลำดับอย่างต่อเนื่อง ข้อจำกัด คือ การเข้าถึงข้อมูลมีความคล่องตัวน้อย เพราะต้องเริ่มจาก Root Segment เสมอ 


           2. แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model) โครงสร้างเป็นลักษณะ Multi-list Structure มีความสัมพันธ์ของข้อมูลแบบ Many to Many  แต่ละชั้นมี Segment  สามารถมี Parent ได้มากกว่าหนึ่ง เรียก Parent ว่า Owner  ส่วน Child เรียกว่า Member  ความซ้ำซ้อนของข้อมูลมีน้อย สามารถเชื่อมโยงข้อมูลแบบไป กลับได้ แต่จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ มีความยุ่งบากในการเปลี่ยนแปลงโครงสร้างข้อมูล
           
         3. แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model) โครงสร้างข้อมูลอยู่ในรูปแบบตาราง เรียกตารางว่า รีเลชั้น แต่ละรีเลชั่น ประกอบด้วย แถวหรือทัพเพิล และคอลัมน์ เรียกว่า แอตทริบิวต์ แต่ละรีเลชั่นจะมีแอตทริบิวต์ เรียกว่า คีย์ บอกถึงความแตกต่างของแต่ละทัพเพิล  เป็นโครงสร้างที่เข้าใจง่าย ข้อมูลมีความเป็นอิสระจากโปรแกรม

การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล
                มี 2 ประเภท คือ
1.    การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP)  OLAP เป็นเครื่องมือที่มีความสามารถการค้นหา และการวิเคราะห์ข้อมูลจากคลังข้อมูล ในลักษณะต่าง ๆ เช่น
  การหมุนมิติ (Rotation) การวิเคราะห์ ดูข้อมูลหลายมิติ หลายมุมมอง
  การเลือกช่วงข้อมูล (Ranging) สามารถเลือกดูข้อมูลเฉพาะส่วนที่สนใจ และนำมาวิเคราะห์ได้โดยไม่ใช้ข้อมูลทั้งหมด
  การเลือกระดับชั้นของข้อมูล (Hierarchy) สามารถจัดแบ่งข้อมูลเป็นลำดับชั้น เพื่อให้เรียกดูข้อมูลจากระดับบนแล้วไประดับล่าง ดูรายละเอียดได้
2.     ดาต้าไมนิ่ง (Data Mining)  เป็นเครื่องมือและเทคนิคในการสกัดข้อมูล และประมวลผลข้อมูลเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลใหญ่ สามารถค้นหารูปแบบ แนวโน้ม พฤติกรรม ความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลเพื่อให้ได้ความรู้ใหม่
ที่มา : https://pimpanp.wordpress.com/2008/04/26

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

แบบฝึกหัดบทที่ 10 เทคโนโลยีกับการจัดการความรู้

แบบฝึกหัดบทที่ 10 เทคโนโลยีกับการจัดการความรู้ 1. สรุปสาระสำคัญเกี่ยวกับเนื้อหา 1 หน้ากระดาษรายงานเพื่อเตรียมสอบ ตอบ เทคโนโลยีสารสนเ...