Please reload

Recent Posts

Structured Data VS Unstructured Data

October 2, 2019

 

 

โครงสร้างของข้อมูล เป็นหัวใจของการพัฒนาระบบบริหารข้อมูล หรือ การสร้าง Model เพราะ “ข้อมูล” คือ ทรัพยากรที่สำคัญ

 

ตามหลักโครงสร้างของข้อมูล ข้อมูลจะถูกแบ่งออกเป็น 2 ประเภท ได้แก่

 

      1.Structured Data หรือ ข้อมูลที่มีโครงสร้าง เป็นข้อมูลที่สามารถนำมาทำเป็น Table ได้ โดยมีการให้คำจัดกัดความของชุดข้อมูลนั้นๆ ได้ เช่น ข้อมูลประเภท “อายุ” จะเป็นตัวเลขระหว่าง 0-120, ข้อมูลรหัสไปรษนีย์ จะเป็นตัวเลขที่ถือว่าเป็นตัวอักษรที่เขียนติดกัน แต่ไม่ได้มีความหมายเป็นตัวเลขเชิงการคำนวณ เป็นต้น


     ข้อมูลประเภทนี้ จะสามารถนำมาจัดเรียงใน Database ได้ และสะดวกต่อการนำไปใช้งานต่อ ส่วนใหญ่จะใช้โปรแกรม SQL เพื่อจัดการข้อมูล

 

     2. Unstructured Data หรือ ข้อมูลที่ไม่มีโครงสร้าง เป็นข้อมูลที่ไม่สามารถระบุโครงสร้างที่ชัดเจนได้ เช่น ข้อความ ภาพ เสียง หรือ วีดิโอ ในการใช้งานข้อมูลประเภทนี้ จะต้องนำมาระบุความหมายของข้อมูลเสียก่อน เช่น คำว่า Hello ประกอบไปด้วยตัวอักษร H e l l o ซึ่งตัวอักษรแต่ละตัว เป็น Structured Data และเมื่อตัวอักษรเหล่านี้ เขียนติดกัน จะถือว่ากลายเป็นคำว่า Hello 1 คำ เป็นต้น

 


ในการจัดการข้อมูลประเภทนี้ จะใช้โปรแกรม Nosql

 

     ในยุคก่อนหน้านี้ การบริหารข้อมูลจะอยู่ในรูป Data Warehouse ซึ่งส่วนใหญ่แล้ว จะสามารบริหารข้อมูลแบบ Structured Data ได้เท่านั้น แต่ในปัจจุบัน มีข้อมูลแบบ Unstructured Data เกิดขึ้นจำนวนมาก ทำให้ระบบ Warehouse แบบเดิมไม่ตอบโจทย์ในการทำงาน เป็นที่มาของการออกแบบ Data Lake ที่สามารถเก็บทั้งข้อมูลแบบ Structured Data และ Unstructured Data ได้

 

     สำหรับการสร้าง Model นั้น โดยธรรมชาติแล้ว Machine Learning จะเรียนรู้จาก Structured Data เพราะการเรียนรู้ เกิดขึ้นจากการหา Pattern หรือ ความสัมพันธ์ของข้อมูลนั้นๆ สำหรับการสร้าง Model สำหรับ Unstructured Data จะมีขั้นตอนการแปลง Data ให้มีโครงสร้างเสียก่อน เช่น ในตัวรูปภาพ จะมีสีที่แตกต่างกัน โดยแต่ละสี มีตัวเลขที่บ่งบอกถึงสีนั้นๆ ดังนั้น AI ประเภท Image Processing จึงเรียนรู้จากโค้ดของสีภาพที่เป็น Structure แล้วนั่นเอง

 

 

     ข้อมูลที่มีโครงสร้างต่างกัน จะมีวิธีในการบริหาร จัดเก็บ และวิเคราะห์ที่ต่างกัน ดังนั้นในการลงทุน หรือ ออกแบบโครงการที่มีข้อมูลที่หลากหลาย จึงจำเป็นอย่างยิ่ง ที่จะต้องเข้าใจพื้นฐานโครงสร้าง และความละเอียดของการใช้ข้อมูล เพื่อสามารถพัฒนา หรือ มองหาเทคโนโลยีที่ตอบโจทย์ได้อย่างเหมาะสมต่อไป

 

 

#BigData
#DataScience
#Optimization
#ProductivityImprovement
#DigitalTrsnaformation
#MachineLearning
#ArtificialIntelligence

#Coraline ให้คำปรึกษาการทำ Big Data, Data Model, Artificial Intelligence และ Digital Transformation เพื่อเพิ่มศักยภาพของธุรกิจ

Share on Facebook
Share on Twitter
Please reload

Please reload

Contact

Follow

02 114 7003 

77/129, 30th floor, Sinn Sathorn Tower, Thanon Krung Thon Buri, Khlong Ton Sai, Khlong San, Bangkok 10600 

©2017 by Coraline