วันอาทิตย์ที่ 25 กันยายน พ.ศ. 2554

ระบบฐานข้อมูล

ระบบฐานข้อมูล
1.       ระบบแฟ้มข้อมูลและฐานข้อมูล
ระบบแฟ้มข้อมูล คือ ระบบข้อมูลภายในองค์กรในแต่ละระบบที่แยกเป็นอิสระต่อกัน ทำให้แต่ละระบบหรือหน่วยงานมีข้อมูลของตนเองโดยไม่เชื่อมโยงกัน
·        ปัญหาแฟ้มข้อมูล
o ความซ้ำซ้อนของข้อมูล (Data Redundancy)
o ความไม่สอบคล้องกันของข้อมูล(Data Inconsistency)
o ขาดความยืดหยุ่น(Lack of Flexibility)
o ความไม่ปลอดภัยของข้อมูล(Poor Security)
o ขาดความเป็นอันหนึ่งอันเดียวกันของข้อมูล(Lack of data Integrity)
o ข้อมูลมีความสัมพันธ์ลักษณะขึ้นต่อกันกับโปรแกรม(Application/Data Dependencies)
o ข้อมูลแยกอิสระต่อกัน(Data Isolation)
o ขาดการใช้ข้อมูลร่วมกัน(Lack of Data Sharing)
2.       ฐานข้อมูลและการจัดการฐานข้อมูล
ฐานข้อมูล (Database หรือ Databank) คือ การจัดกลุ่มของแฟ้มข้อมูล ที่มีความสัมพันธ์กันเพื่อนำไปใช้ในการทำงาน โดยใช้ซอร์ฟแวร์ชุดหนึ่ง (DBMS) ซึ่งสามารถเข้าถึงข้อมูลในฐานข้อมูลได้ ซึ่งช่วยบรรเทาปัญหาต่าง ๆ ที่เกิดจากแฟ้มข้อมูลได้
ระบบการจัดการฐานข้อมูล (Database Management Systems – DBMS) คือ ซอร์ฟแวร์หรือกลุ่มโปรแกรมที่ช่วยในการวางแผนรวบรวมข้อมูล จัดการและเข้าถึงข้อมูลได้อย่างมีประสิทธิภาพ ผู้ใช้สามารใช้ DBMS ในการเพิ่มเติมข้อมูล ลบข้อมูล แสดงผล เป็นต้น
·        ส่วนประกอบของ DBMS
o โมเดลของข้อมูล (Data Model)
ทำหน้าที่กำหนดรูปแบบของโครงสร้างของข้อมูล เช่น จัดเป็นลำดับขั้น(Hierarchy) หรือ แบบเครือข่าย(Network) หรือ แบบความสัมพันธ์(Relational)
o ภาษาจำกัดความของข้อมูล (Data Definition Language - DDL)
เป็นการกำหนดลักษณะของข้อมูลในแต่ละเรคคอร์ดหรือฟิลด์ที่ปรากฏในฐานข้อมูล เช่น จะตั้งชื่อว่าอย่างไร เป็นข้อมูลชนิดไหน ความยาวเรคคอร์ดเท่าใด รวมทั้งความสัมพันธ์ระหว่างเรคคอร์ดต่าง ๆ และลักษณะของคีย์

o ภาษาในการจัดการข้อมูล (Data Manipulation Language – DML)
เป็นภาษาที่ใช้ในการถามเกี่ยวกับเนื้อหาในฐานข้อมูล หรือใช้เป็นการเก็บหรือปรับปรุงข้อมูลให้ทันสมัย และการพัฒนา application นอกจากนี้ยังช่วยให้ผู้ใช้สามารถดึง จัดเรียง แสดงผล ลบข้อมูล ในฐานข้อมูลได้ด้วย ภาษาที่ใช้ในการจัดการข้อมูล อาจจะใช้ภาษา ยุคที่ 3 ยุคที่ 4 หรือ Object-Oriented ก็ได้ ตัวอย่าง คือ Structured Query Language (SQL)

o พจนานุกรมข้อมูล (Data Dictionary)
เป็นการเก็บรวบรวมคำจำกัดความของข้อมูลและลักษณะข้อมูลต่าง ๆ ที่อยู่ในฐานข้อมูล อันจะทำให้เกิดมาตรฐานความสอดคล้องของข้อมูลในแฟ้มต่าง ๆ และยังทำให้การพัฒนาโปรแกรมทำได้รวดเร็ว เพราะโปรแกรมเมอร์ สามารถดูข้อมูลจากพจนานุกรมข้อมูลได้
3.       องค์ประกอบแบบฐานข้อมูล
องค์ประกอบของฐานข้อมูลขึ้นอยู่กับมุมมองของการสร้างข้อมูล และมุมมองในลักษณะโครงสร้างลำดับชั้นของข้อมูล ซึ่งมี 2 ประเภท ดังต่อไปนี้
1.       องค์ประกอบฐานข้อมูลโดยพิจารณาจากการสร้างฐานข้อมูล
v เอนติตี้ (Entity) เป็นเรื่องเกี่ยวกับบุคคล สถานที่ สิ่งของ หรือเหตุการณ์ที่ต้องการเก็บข้อมูล
v ลักษณะเฉพาะของเอนติตี้ (Data items หรือ Attribute) คือลักษณะของเอนติตี้ที่ต้องการเก็บข้อมูล เช่น เอนติตี้ของนักศึกษาประกอบด้วย attribute คือ รหัสนักศึกษา, ชื่อ, สกุล, คณะ, กลุ่ม ฯลฯ
v ระเบียนหรือเรคคอร์ด (Records) คือ ชุดของลักษณะเฉพาะที่เกี่ยวกับเอนติตี้หนึ่ง ๆ ซึ่งจะใช้ในการประมวลผลด้วยกัน
v แฟ้มข้อมูล (File) ประกอบด้วยเรคคอร์ดที่สัมพันธ์กันหลาย ๆ อันมารวมกัน เช่น แฟ้มข้อมูลพนักงานจะประกอบด้วยเรคคอร์ดของพนักงานแต่ละคน
v ฐานข้อมูล (Database) ประกอบด้วยแฟ้มข้อมูลหลาย ๆ แฟ้มที่มีความสัมพันธ์กันมารวมกัน
2.       องค์ประกอบฐานข้อมูลพิจารณาจากโครงสร้างข้อมูลตามลำดับชั้น
v บิต (Bit) เป็นตัวแทนของหน่วยที่เล็กที่สุดของข้อมูล ที่ประมวลผลโดยคอมพิวเตอร์ (0 1)
v ไบต์ (Byte) เป็นตัวอักษรหรือตัวเลขหรือสัญลักษณ์ 1 ตัว บางครั้งอาจจะเรียกว่าอักขระ (Character)
v ฟิลด์(Bit) เป็นหน่วยที่เล็กที่สุดในลำดับขั้นข้อมูลที่มนุษย์สามารถแปลความหมายได้ เกิดจากการนำอักขระหลาย ๆ ตัวมารวมกัน ทำให้มีความหมายหรือเป็นคำขึ้นมา
v ระเบียนหรือเรคคอร์ด (Record) เป็นการรวมกลุ่มฟิลด์หลาย ๆ ฟิลด์ที่มีความสัมพันธ์กันมารวมกันอย่างมีความหมาย
v ไฟล์ (File) หรือแฟ้มข้อมูล เป็นการนำเรคคอร์ดหลาย ๆ เรคคอร์ดที่เกี่ยวพันกันมารวมกัน
v ฐานข้อมูล (Database) ประกอบด้วยหลาย ๆ ไฟล์ที่เกี่ยวพันกันมารวมกัน
                ความสัมพันธ์ของข้อมูลแบ่งเป็น 3 ประเภทคือ
1.        ความสัมพันธ์แบบ One to One คือความสัมพันธ์ของข้อมูล 2 ตัว ที่มีลักษณะ 1 ต่อ 1 หรือข้อมูลตัวหนึ่ง จะมีความสัมพันธ์กับข้อมูลอีกตัวหนึ่งได้เพียงค่าเดียวเท่านั้น
2.        ความสัมพันธ์แบบ One to Many คือ ความสัมพันธ์ซึ่งข้อมูลตัวหนึ่งมีความสัมพันธ์กับข้อมูลตัวอื่นได้หลายอย่าง
3.        ความสัมพันธ์แบบ Many to Many คือ ความสัมพันธ์ซึ่งข้อมูลตัวหนึ่งมีหลายค่า และมีความสัมพันธ์กับข้อมูลตัวอื่นได้หลายอย่าง เช่น มีวิชาที่เปิดสอนหลายวิชา แต่ละวิชามีนักศึกษาหลายคน
                ประเภทของการออกแบบฐานข้อมูล
1.       ฐานข้อมูลแบบลำดับชั้น(Hierarchical Database Model)
        มีลักษณะเป็นลำดับชั้นคล้ายคลึงกับความสัมพันธ์ของโครงสร้างสายการบังคับบัญชาที่พบในองค์กรทั่วไป โดยมีลำดับชั้นลดหลั่นกันลงมาเป็นชั้นๆ ข้อมูล
        ข้อมูลที่ใช้ฐานข้อมูลลำดับชั้นจะต้องเป็นข้อมูลที่มีความสัมพันธ์แบบ one to one หรือ one to many เท่านั้น
v ข้อดี
o   มีประสิทธิภาพในการค้นหา การค้นหาทำได้รวดเร็วเนื่องจากจัดลำดับชั้นและความสัมพันธ์เอาไว้แล้วทำให้ไม่เสียเวลาในการค้นหาข้อมูลที่ไม่จำเป็น
v ข้อจำกัด
o   ต้องมีการกำหนดลักษณะความสัมพันธ์ของข้อมูลทุกตัวก่อนเพื่อจะนำมาจัดเป็นโครงสร้างได้ และการค้นหาข้อมูลมีจำกัด นอกจากนี้โครงสร้างแบบนี้ไม่ได้เหมาะกับงานทุกประเภท

2.       ฐานข้อมูลแบบเครือข่าย(Network Database Model)
        คล้ายกับฐานข้อมูลแบบลำดับชั้น แต่ข้อมูลมีความสัมพันธ์กันในลักษณะ many to many เท่านั้น
v ข้อดี
o   ข้อมูลที่อยู่ในเครือข่ายไม่มีข้อจำกัดเรื่องความสัมพันธ์ มีความสอดคล้องในโลกของความเป็นจริงมากกว่า
v ข้อจำกัด
o   มีความซับซ้อนมาก โดยเฉพาะถ้ามีการเพิ่มลบข้อมูลและความสัมพันธ์ การทำงานจะซับซ้อนมากและการบำรุงรักษาจะยากขึ้นตามไปด้วย
3.       ฐานข้อมูลแบบสัมพันธ์(Relational Database Model)
        ใช้ตารางเพื่อเก็บข้อมูลให้เป็นระเบียบ ตารางเหล่านี้เรียกว่า ตารางความสัมพันธ์(relations) การออกแบบฐานข้อมูลแบบความสัมพันธ์จะประกอบด้วยตารางที่มีขนาดไม่ใหญ่มากนักหลายๆ ตาราง แต่ละแถวแนวนอนเรียกว่า row ในตารางจะบรรจุข้อมูลเป็นชุดๆ เรียกว่า record ข้อมูล 1 ชนิดในแต่ละชุดเรียกว่า field
v ข้อดี
o   เป็นแนวคิดที่ง่าย และสามารถเชื่อมโยงข้อมูลได้โดยไม่จำเป็นต้องทราบความสัมพันธ์ของข้อมูลล่วงหน้า
o   มีความยืดหยุ่นต่อผู้ใช้สูง และสามารถนำไปใช้กับแอพพลิเคชันได้หลายอย่าง
o   มองเห็นโครงสร้างข้อมูลได้ง่าย โดยพิจารณาจากตาราง
v ข้อจำกัด
o   ถ้าฐานข้อมูลมีขนาดใหญ่มากจะประกอบด้วยตารางความสัมพันธ์จำนวนมาก ทำให้การออกแบบมีความซับซ้อน และทำให้การค้นหาข้อมูลหรือการดึงข้อมูลมีความล่าช้า
o   ผลจากการค้นหาและการดึงข้อมูลที่ช้าทำให้การประมวลผลไม่มีประสิทธิภาพทำให้เกิดการไม่ยอมรับระบบฐานข้อมูลแบบนี้
o   มีความเป็นอันหนึ่งอันเดียวกันของข้อมูลน้อย เมื่อเปรียบเทียบกับแบบลำดับชั้นหรือแบบเครือข่าย
4.       แนวโน้มของฐานข้อมูล
·        Object-Oriented Database Model
เรียกอีกชื่อว่า OODB หรือ O-O Database Model เป็นการจัดการข้อมูลโดยการเก็บทั้งข้อมูลและวิธีการจัดการข้อมูลไว้ในอ็อบเจ็ค(Object) ซึ่งสามารถดึงและใช้งานร่วมกันได้โดยอัตโนมัติ
o   องค์ประกอบที่สำคัญของ OODB
v อ็อบเจ็ค(Object):เป็นข้อมูลจำนวนมามากนักที่นำมารวมกันมีความหมายเหมือนกับแอนติตี้ ซึ่งเป็นตัวแทนของคน สถานที่ สิ่งของ แต่อ็อบเจ็คจะรวมถึงกระบวนการหรือวิธการที่เกี่ยวข้องกับการประมวลผลข้อมูลด้วย
v แอตตริบิวต์(Attribute): เป็นลักษณะของ อ็อบเจ็ค ในช่วงเวลาหนึ่งๆ เช่น อายุของพนักงาน
v วิธีการ(Method):หรือพฤติกรรมของอ็อบเจ็ค เมื่อเกิดการปฏิบัติการขึ้นจะมีการส่งข้อมูลไปยังอ็อบเจ็คที่ส่งมา เพื่อจะกระตุ้นให้เกิดปฏิบัติการอื่นที่ต่อเนื่องกัน
·        Hypermedia
เป็นการจัดการข้อมูลในลักษณะเหมือนกับเครือข่ายของโหนด แต่ละโหนดจะประกอบด้วยข้อมูลซึ่งจะเป็นข้อความ รูปภาพ เสียง ภาพเคลื่อนไหว หรือโปรแกรมการทำงานอื่นๆ ฐานข้อมูลแบบ OODB และ Hypermedia จะสามารถเก็บข้อมูลที่มีลักษณะซับซ้อนมากกว่าฐานข้อมูลแบบตาราง ประสิทธิภาพจะช้ากว่าแบบความสัมพันธ์หากมีข้อมูลจำนวนมาก
·        Data Warehouse
o   เป็นฐานข้อมูลที่เก็บข้อมูลทั้งในปัจจุบันและในอดีตซึ่งดึงมาจากระบบปฏิบัติการหลายระบบ และนำมารวมกันเพื่อประโยชน์ในการจัดทำรายงานหรือวิเคราะห์ข้อมูล
o   ดาต้าแวร์เฮาส์ประกอบด้วยเครื่องมือในการถามที่เป็นมาตรฐาน(standardized query tool) เครื่องมือในการวิเคราะห์ และเครื่องมืออำนวยความสะดวกในการทำงานในลักษณะกราฟิก
o   ดาต้าแวร์เฮาส์สามารถทำการวิเคราะห์ข้อมูลในเชิงวิเคราะห์แนวโน้ม หรือเจาะหาข้อมูล (drill) ในรายละเอียดเมื่อต้องการได้
ลักษณะที่สำคัญของดาต้าแวร์เฮาส์
v ข้อมูลมาจากฐานข้อมูลหลายแห่ง
v ดาต้าแวร์เฮาส์มีหลายมิติ
v ดาต้าแวร์เฮาส์ใช้สนับสนุนการตัดสินใจ ไม่ใช่ประมวลผลรายการ
·        Data Mining
ดาต้าไมน์นิ่งเป็นเครื่องมือของซอฟต์แวร์ที่ใช้ในการวิเคราะห์สารสนเทศโดยอัตโนมัติ เพื่อค้นหารูปแบบและความสัมพันธ์ของข้อมูลในดาต้าแวร์เฮาส์รวมทั้งพยากรณ์แนวโน้มและพฤติกรรมในอนาคต(Stair&Reynolds,1999:Turban, et al.,(2001))
จุดมุ่งหมายของดาต้าไมน์นิ่ง
v การดึงรูปแบบ แนวโน้มและกฎเกณฑ์จากข้อมูลในดาต้าแวร์เฮาส์เพื่อที่จะประเมินกลยุทธ์ของหน่วยงาน
v ปรับปรุงความได้เปรียบในการแข่งขัน
v เป็นวิธีการที่นำมาใช้ในด้านการตลาด เช่น การรักษาลูกค้า การจัดโฆษณา ช่องทางการตลาด การวิเคราะห์ราคา
ส่วนประกอบของดาต้าไมน์นิ่ง
v เครื่องมือในการถามและจัดทำรายงาน(Query-and-reporting-tools)
v อุปกรณ์ด้านปัญญาประดิษฐ์(Intelligent Agents)
v เครื่องมือในการวิเคราะห์ข้อมูลหลายมิติ(Multidimensional analysis tools-MDA)




ไม่มีความคิดเห็น:

แสดงความคิดเห็น