บทที่ 3 ฐานข้อมูล และคลังข้อมูล
โครงสร้างข้อมูล
มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต(Bit) ไบต์(Byte) เขตข้อมูล(Field) ระเบียนข้อมูล(Record) และไฟล์(File) ตามลำดับ
-
บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์
เป็นเลขฐานสอง 0 กับ 1
-
ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต
มาเรียงต่อกันเป็น 1 ไบท์
สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 =
256 ตัว
-
เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย
-
ระเบียนข้อมูล (Record) กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน
-
ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน
ปัญหาเกี่ยวกับแฟ้มข้อมูล
1. ความซ้ำซ้อนของข้อมูล (Data
Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง
ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล
2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data
Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม
โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง
จะมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง
ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม
3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack
of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก
ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได
4. การขาดความร่วมมือ (Lack of
Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่
ๆ
5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor
Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล
มีขอบเขตความสามารถจำกัด
แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
1. ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
2. มีความเป็นอิสระต่อกัน (Data
Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ
ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
3. สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้
โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
4. มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน
มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน
และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
5. มีระบบรักษาความปลอดภัยของข้อมูลสูง (High
Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย
โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ
และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น
องค์ประกอบของระบบฐานข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบ 4 ส่วน คือ
1.
ข้อมูล (Data) คือ ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
2.
ฮาร์ดแวร์ (Hardware) คือ เครื่องคอมพิวเตอร์ และอุปกรณ์รอบข้าง
3.
ซอฟต์แวร์ (Software) คือ ระบบปฏิบัติการ และระบบจัดการข้อมูล รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
4.
ผู้ใช้ (Users) คือ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล ผู้เขียนโปรแกรม และผู้ใช้งาน
รูปแบบของฐานข้อมูล (Database
Model)
แบบจำลองฐานข้อมูลอธิบายถึงโครงสร้างและความสัมพันธ์ระหว่างข้อมูล
แบบจำลองมีหลายรูปแบบ คือ
1. แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical
Database Model) มีโครงสร้างคล้ายต้นไม้
ข้อมูลมีความสัมพันธ์เรียกว่า One-to-Many หนึ่งต่อกลุ่ม
ข้อมูลจัดเก็บในรูปของ Segment ที่อยู่บนสุด
เรียกว่า Root Node ถัดลงมาเรียกว่า Child
Node ข้อดีคือมีความซับซ้อนน้อย มีโครงสร้างเข้าใจง่าย
เรียงลำดับอย่างต่อเนื่อง ข้อจำกัด คือ การเข้าถึงข้อมูลมีความคล่องตัวน้อย
เพราะต้องเริ่มจาก Root Segment เสมอ
2. แบบจำลองฐานข้อมูลเครือข่าย (Network
Database Model) โครงสร้างเป็นลักษณะ Multi-list
Structure มีความสัมพันธ์ของข้อมูลแบบ Many to Many แต่ละชั้นมี Segment สามารถมี Parent ได้มากกว่าหนึ่ง เรียก Parent ว่า Owner ส่วน Child เรียกว่า Member ความซ้ำซ้อนของข้อมูลมีน้อย สามารถเชื่อมโยงข้อมูลแบบไป กลับได้
แต่จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์
มีความยุ่งบากในการเปลี่ยนแปลงโครงสร้างข้อมูล
การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล
มี 2 ประเภท คือ
1. การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP) OLAP เป็นเครื่องมือที่มีความสามารถการค้นหา
และการวิเคราะห์ข้อมูลจากคลังข้อมูล ในลักษณะต่าง ๆ เช่น
– การหมุนมิติ (Rotation) การวิเคราะห์ ดูข้อมูลหลายมิติ หลายมุมมอง
– การเลือกช่วงข้อมูล (Ranging) สามารถเลือกดูข้อมูลเฉพาะส่วนที่สนใจ และนำมาวิเคราะห์ได้โดยไม่ใช้ข้อมูลทั้งหมด
– การเลือกระดับชั้นของข้อมูล (Hierarchy) สามารถจัดแบ่งข้อมูลเป็นลำดับชั้น
เพื่อให้เรียกดูข้อมูลจากระดับบนแล้วไประดับล่าง ดูรายละเอียดได้
2. ดาต้าไมนิ่ง (Data
Mining) เป็นเครื่องมือและเทคนิคในการสกัดข้อมูล
และประมวลผลข้อมูลเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลใหญ่ สามารถค้นหารูปแบบ แนวโน้ม
พฤติกรรม ความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลเพื่อให้ได้ความรู้ใหม่
ที่มา : https://pimpanp.wordpress.com/2008/04/26
ที่มา : https://pimpanp.wordpress.com/2008/04/26
ไม่มีความคิดเห็น:
แสดงความคิดเห็น