top of page

"การเชื่อมโยงข้อมูล" คือ ปัญหาใหญ่ที่รอไม่ได้

Big Data มีที่มาจาก 4V ซึ่งประกอบไปด้วย “Volume, Velocity, Variety, Veracity” ซึ่ง Variety ในที่นี้ หมายถึงความหลากหลายของข้อมูล ที่มาจากแหล่งข้อมูลหลายๆ แหล่ง และมีรูปแบบโครงสร้างของข้อมูลที่แตกต่างกัน ดังนั้นการทำโครงการ Big Data จึงจำเป็นต้องมีการเชื่อมข้อมูลส่วนนี้ และจัดการให้อยู่ในรูปที่พร้อมใช้ ปัญหาข้อมูลจากแหล่งต่างๆ แยกส่วนกันเก็บ และมีค่าที่ไม่ตรงกัน เป็นปัญหาที่พบได้บ่อยและทั่วไป ซึ่งแนวทางการแก้ก็ชัดเจนอยู่ในตัวเอง ก็คือ ต้องทำความสะอาด และออกแบบช่องทางให้เก็บรวบรวมข้อมูลเอาไว้ที่เดียว เพื่อให้เกิดความสมบูรณ์แบบของข้อมูลมากที่สุด แต่แนวทางในการแก้ปัญหานั้น ค่อนข้างลำบากมาก เพราะอะไร เพราะแต่ละส่วน ต่างก็ต้องการเป็นเจ้าของข้อมูล และอาจไม่ได้รับความร่วมมือจากเจ้าของข้อมูลเดิมก็เป็นได้ อีกทั้ง แนวทางในการเชื่อมและออกแบบระบบ ก็จำเป็นต้องมีผู้เชี่ยวชาญด้านระบบ หรือ System Engineer และ Data Engineer ที่มีประสบการณ์ เป็นผู้รับหน้าที่ออกแบบและดูแลระบบนี้ ทำไมการเชื่อมโยงข้อมูล ถึงเป็น ปัญหาใหญ่ ที่รอไม่ได้ ... เพราะไม่รู้ว่าทำไมต้องรอ รอเพื่ออะไร ยิ่งรอก็ยิ่งปล่อยให้เวลาผ่านไปโดยเปล่าประโยชน์ โดยเฉพาะอย่างยิ่ง ข้อมูลที่เกี่ยวข้องกับประชาชน เช่น สิทธิด้านการบริการต่างๆ ข้อมูลการเพาะปลูกทางการเกษตร ข้อมูลการซื้อขายผลิตภัณฑ์ทางการเกษตร ข้อมูลสุขอนามัยของประชาชน อัตราการจ้างงาน ข้อมูลประทำโครงการของภาครัฐที่สามารถตรวจสอบวันเวลาของโครงการได้ เป็นต้น ข้อมูลกลางที่ถูกนำมาเชื่อมโยงกันนี้ จะสามารถนำมาวิเคราะห์และต่อยอดได้อีกมากมาย เช่น หากมีการเชื่อมโยงข้อมูลการเกษตร การท่องเที่ยว และการจ้างงาน จะทำให้ทราบได้ว่า ในแต่ละช่วงเวลา มีอัตราว่างงานสำหรับพนักงานมากน้อยเพียงใด แต่ละภาคธุรกิจ ต้องการแรงงานทักษะอย่างไร และจะมีการวางแผนให้มีการศึกษาในอนาคตได้อย่างไร เนื่องมาจากว่า แต่ละสถานที่ท่องเที่ยว มีฤดูกาลของการท่องเที่ยว เช่นเดียวกัน การเพาะปลูกก็มีฤดูกาลของการเพาะปลูก ถ้าสามารถนำข้อมูลมาเชื่อมกับการจ้างงานของภาครัฐและเอกชนได้ จะทำให้สามารถวางแผนการจ้างงานได้ เมื่อประชาชนมีงาน ก็มีรายได้ต่อไป ทั้งนี้ โครงการการวิเคราะห์อัตราการจ้างงานแบบยั่งยืนนี้ ต้องเริ่มจากการเชื่อมโยงข้อมูลที่เกี่ยวข้องกับการจ้างงานเสียก่อน ในมุมของภาครัฐ การจัดการและบริหารข้อมูล อาจจะทำได้ยากเสียหน่อย ด้วยขนาดของข้อมูล และระบบเดิมที่มีเก็บข้อมูลแยกส่วน แต่นั่นยิ่งเป็นความท้าทายที่เป็นเครื่องพิสูจน์ว่าภาครัฐจะสามารถทำโครงการใหญ่ๆ เพื่อประชาชนนี้ได้สำเร็จหรือไม่ ในส่วนของภาคเอกชนก็เช่นกัน เพราะก่อนหน้านี้ การลงทุนกับระบบต่างๆ เป็นรูปแบบของการจัดซื้อจัดจ้างแยกส่วนกัน ทำให้มีระบบ Software หลายยี่ห้อในองค์กรเดียว ส่งผลให้ข้อมูลอยู่แยกส่วนกัน การเชื่อมโยงข้อมูล จะต้องทำด้วยความต้องการของคนใน หมายความว่า คนในองค์กรต้องเป็นคนเสนอความต้องการ เพื่อให้ผู้เชี่ยวชาญทำการเชื่อมให้ โดยอาจจะเป็น Outsource หรือจะเป็น IT ขององค์กรเป็นผู้เชื่อมก็ได้ แต่ทั้งนี้ จะต้องมีความต้องการในการเชื่อมที่ชัดเจน ปัญหาอาจไม่ได้อยู่ที่ว่า ข้อมูลไม่เชื่อมกัน เพราะเครื่องมือของการเชื่อมโยงข้อมูลนั้นมีตัวเลือกมากมายในตลาด พร้อมให้หยิบใช้ได้อย่างสะดวก ปัญหาที่แท้จริง คือ ยังไม่รู้ว่าจะต้องเอาอะไรมาเชื่อมกันอะไรมากกว่า เพราะถ้าไม่มี “เป้าหมาย” ของการทำโครงการ ก็ยังไม่ทราบอยู่ดีว่าต้องนำอะไรมาเชื่อมกับอะไร อย่างไรก็ตาม หากไม่มีการเชื่อมโยงข้อมูล ก็ไม่สามารถวิเคราะห์ข้อมูลต่อได้ ทำให้ข้อมูลที่มีอยู่ อาจไม่มีประโยชน์อะไร ซึ่งเรามีความจำเป็นที่ต้องมี Big Data ให้พร้อม ก่อนที่ AI จะเข้ามา Disrupt ระบบอะไรหลายๆ อย่าง เพราะ AI ต้องใช้ Big Data เป็นแหล่งข้อมูล แต่หากไม่มี Big Data ให้ AI เรียนรู้ AI นั้นก็จะไม่มีประโยชน์อะไรเช่นกัน ที่บอกว่า ต้องทำโดยเร็ว เพราะในแต่ละวัน มีข้อมูลเกิดขึ้นมากมาย แค่ข้อมูลเก่า ยิ่งปล่อยไป ยิ่งมีขนาดใหญ่ และมีความซับซ้อนมากขึ้น จึงต้องเร่งทำ “เดี๋ยวนี้” ทั้งนี้ งานยิ่งมีความ “ใหญ่” มากเท่าใด ก็ยิ่งต้องได้รับความร่วมมือมากเท่านั้น ในความเป็นจริง อาจไม่จำเป็นต้องมองเป็นภาพใหญ่ที่สุด ณ ที่ปลายสุด แต่เราสามารถเริ่มได้ทีละนิดละหน่อย เพราะให้เกิดเป็นผลสำเร็จเล็กๆ และเดินต่อไปเรื่อยๆ จนถึงชัยชนะที่วางเอาไว้ แต่หากเราไม่ทำอะไรเลย .... ไม่ใช่แค่เราจะหยุดนิ่ง แต่เราอาจจะกำลังเดินถอยหลัง เพื่อรอถึงวันที่คนอื่นเข้ามาทำร้ายเราก็เป็นได้ หากมีข้อมูลที่อยู่กันกระจัดกระจาย ต้องให้คนไป save หรือ ต้องรอเพื่อได้มาซึ่งข้อมูลนั้นนานแสนนาน นั่นแหละค่ะ คือ คอขวดของโครงการ Big Data อย่างหนึ่ง .... และควรได้รับการแก้ไข ด้วยการเชื่อมโยง ให้เป็นระบบที่สมบูรณ์

"การเชื่อมโยงข้อมูล" คือ ปัญหาใหญ่ที่รอไม่ได้

Big Data มีที่มาจาก 4V ซึ่งประกอบไปด้วย “Volume, Velocity, Variety, Veracity” ซึ่ง Variety ในที่นี้ หมายถึงความหลากหลายของข้อมูล...

bottom of page