Structured Data VS Unstructured Data
top of page

Structured Data VS Unstructured Data


โครงสร้างของข้อมูล เป็นหัวใจของการพัฒนาระบบบริหารข้อมูล หรือ การสร้าง Model เพราะ “ข้อมูล” คือ ทรัพยากรที่สำคัญ

ตามหลักโครงสร้างของข้อมูล ข้อมูลจะถูกแบ่งออกเป็น 2 ประเภท ได้แก่

1.Structured Data หรือ ข้อมูลที่มีโครงสร้าง เป็นข้อมูลที่สามารถนำมาทำเป็น Table ได้ โดยมีการให้คำจัดกัดความของชุดข้อมูลนั้นๆ ได้ เช่น ข้อมูลประเภท “อายุ” จะเป็นตัวเลขระหว่าง 0-120, ข้อมูลรหัสไปรษนีย์ จะเป็นตัวเลขที่ถือว่าเป็นตัวอักษรที่เขียนติดกัน แต่ไม่ได้มีความหมายเป็นตัวเลขเชิงการคำนวณ เป็นต้น

ข้อมูลประเภทนี้ จะสามารถนำมาจัดเรียงใน Database ได้ และสะดวกต่อการนำไปใช้งานต่อ ส่วนใหญ่จะใช้โปรแกรม SQL เพื่อจัดการข้อมูล

2. Unstructured Data หรือ ข้อมูลที่ไม่มีโครงสร้าง เป็นข้อมูลที่ไม่สามารถระบุโครงสร้างที่ชัดเจนได้ เช่น ข้อความ ภาพ เสียง หรือ วีดิโอ ในการใช้งานข้อมูลประเภทนี้ จะต้องนำมาระบุความหมายของข้อมูลเสียก่อน เช่น คำว่า Hello ประกอบไปด้วยตัวอักษร H e l l o ซึ่งตัวอักษรแต่ละตัว เป็น Structured Data และเมื่อตัวอักษรเหล่านี้ เขียนติดกัน จะถือว่ากลายเป็นคำว่า Hello 1 คำ เป็นต้น

ในการจัดการข้อมูลประเภทนี้ จะใช้โปรแกรม Nosql

ในยุคก่อนหน้านี้ การบริหารข้อมูลจะอยู่ในรูป Data Warehouse ซึ่งส่วนใหญ่แล้ว จะสามารบริหารข้อมูลแบบ Structured Data ได้เท่านั้น แต่ในปัจจุบัน มีข้อมูลแบบ Unstructured Data เกิดขึ้นจำนวนมาก ทำให้ระบบ Warehouse แบบเดิมไม่ตอบโจทย์ในการทำงาน เป็นที่มาของการออกแบบ Data Lake ที่สามารถเก็บทั้งข้อมูลแบบ Structured Data และ Unstructured Data ได้

สำหรับการสร้าง Model นั้น โดยธรรมชาติแล้ว Machine Learning จะเรียนรู้จาก Structured Data เพราะการเรียนรู้ เกิดขึ้นจากการหา Pattern หรือ ความสัมพันธ์ของข้อมูลนั้นๆ สำหรับการสร้าง Model สำหรับ Unstructured Data จะมีขั้นตอนการแปลง Data ให้มีโครงสร้างเสียก่อน เช่น ในตัวรูปภาพ จะมีสีที่แตกต่างกัน โดยแต่ละสี มีตัวเลขที่บ่งบอกถึงสีนั้นๆ ดังนั้น AI ประเภท Image Processing จึงเรียนรู้จากโค้ดของสีภาพที่เป็น Structure แล้วนั่นเอง

ข้อมูลที่มีโครงสร้างต่างกัน จะมีวิธีในการบริหาร จัดเก็บ และวิเคราะห์ที่ต่างกัน ดังนั้นในการลงทุน หรือ ออกแบบโครงการที่มีข้อมูลที่หลากหลาย จึงจำเป็นอย่างยิ่ง ที่จะต้องเข้าใจพื้นฐานโครงสร้าง และความละเอียดของการใช้ข้อมูล เพื่อสามารถพัฒนา หรือ มองหาเทคโนโลยีที่ตอบโจทย์ได้อย่างเหมาะสมต่อไป


แท็ก:

< Previous
Next >
bottom of page