top of page

อย่าเอาคำว่า “Big Data” มาเป็นตัวประกัน

ตอนนี้จะไปไหน ก็มีแต่คนพูดถึงเรื่อง Big Data เพราะเป็นคำที่ถูกใช้บ่อยในการทำโปรเจค หรือวางกลยุทธ์ใดๆ จนกลายเป็นว่า คำนี้เหมือนเป็นคำลอยๆ ไปเสียแล้ว เมื่อคนสื่อสารไม่สามารถให้ความหมาย หรือแนวทางในการทำงานได้อย่างชัดเจน จึงเป็นที่มาของบทความวันนี้ว่า “อย่าเอาคำว่า “Big Data” มาเป็นตัวประกัน” ก่อนอื่น เรามาเข้าใจ Big Data กันเสียก่อน หลายท่านพยายามให้คำนิยามคำนี้ เริ่มจาก 3V ได้แก่ Volumn, Velocity และ Variety และขยายเป็น 5V + 1C ซึ่งเพิ่ม Variability, Veracity และ Complexity เข้ามา แต่สำหรับ Coraline เราขอนิยามคุณสมบัติของคำว่า “Big Data” ด้วยหลักการ 4V ง่ายๆ ดังนี้ Volume หมายถึง ขนาดของข้อมูล แน่นอนว่าคำว่า Big Data ก็ทำให้เราเห็นภาพอยู่บ้างแล้วว่ามันต้องมีขนาด “ใหญ่” แต่ไม่มีการระบุความใหญ่ที่ชัดเจนได้ ตามหลักแล้วจะพูดถึงข้อมูลที่มีปริมาณมากกว่าที่เครื่องมือปกติทั่วไปจะรองรับได้ เช่น ขนาดที่ Excel เปิดไม่ได้ เป็นต้น นอกจากนี้ข้อมูลที่ถือว่าเป็น Big Data จะต้องเป็นข้อมูลที่สามารถขยายตัวต่อไปได้ ไม่หยุดอยู่กับที่ ทำให้การจัดการในการเก็บข้อมูลไม่สามารถใช้วิธีการจัดการแบบปกติได้เช่นกัน Velocity หมายถึง ความเร็ว ทั้งในมุมของการสร้างข้อมูล และการประมวลผล ต่อเนื่องจากข้อ 1 ตรงที่ว่าเรากำลังใช้ข้อมูลที่มีขนาดใหญ่มากๆ เหมือนก้อนน้ำแข็ง กว่าจะละลายได้หมดก็ต้องใช้พลังงานเยอะ ในขณะที่ความเป็นจริง ข้อมูลพวกนี้ต้องการใช้งานโดยเร็ว ตัวอย่างเช่น การซื้อขายหุ้นในตลาดหุ้น การทำ Fault Detection ในระบบการธนาคาร หรือแม้กระทั่ง การจองแท๊กซี่ใน Grab Taxi ที่ต้องดึงข้อมูลมาจากหลายแหล่ง และต้องมีการกระทำอย่างต่อเนื่องแบบ Real-Time จึงต้องมีการวาง Work Flow ที่ชัดเจน เพราะหากเกิดความผิดพลาดที่ใด ต้องมีการแก้ไขได้โดยเร็วเช่นกัน Variety หมายถึง ความหลากหลาย ในที่นี้คือความหลากหลายของตัวข้อมูล และชนิดของข้อมูล ตัวอย่างเช่น เมื่อเราป่วย ไปโรงพยาบาล สิ่งที่คุณหมอถามเราคือ “มีอาการอย่างไร” นั้นก็ถือว่าเป็นข้อมูลรูปแบบหนึ่งที่เป็นข้อความ ต่อมานางพยาบาลจะเข้ามาวัดความดัน ส่วนสูง น้ำหนัก ทั้งหมดนี้เป็นข้อมูลรูปแบบตัวเลข หากต้องมีการ X-Ray ก็จะได้ข้อมูลประเภทรูปภาพอีกด้วย เหล่านี้เป็นข้อมูลเพื่อประกอบการวินัจฉัยของแพทย์ทั้งสิ้น ในโลกแหล่งความจริง แม้จะเป็นข้อมูลเดียวกัน แต่อยู่กันคนละระบบ ก็ถือว่าเป็นความหลากหลายของข้อมูลได้เช่นเดียวกัน ดังนั้นการจะใช้ข้อมูลต้องผ่านการวิเคราะห์ และสร้างความสัมพันธ์ของตัวแปร และแหล่งที่มาของข้อมูล เพื่อสามารถประมวลผลได้ในเวลาที่รวดเร็วต่อไป Veracity หมายถึง ความแม่นยำ เพราะข้อมูลประเภท Big Data มีขนาดใหญ่ ที่ต้องการความเร็วในการใช้งาน และมีความหลากหลายสูง ดังนั้นในตัวข้อมูลเองจะมีความไม่แน่นอนรวมอยู่ด้วย ซึ่งอาจจะเกิดจาก Error ต่างๆ ระหว่างการสร้างข้อมูล หรือเป็นข้อมูลที่อยู่นอกกรอบก็เป็นได้ ตัวอย่างเช่น กรุงเทพมหานคร สามารถเขียนว่า กทม. หรือ กรุงเทพ หรือ กรุงเพทฯ ก็ได้ ซึ่งในทางปฏิบัติจะเข้าใจได้ว่าเป็นจังหวัดเดียวกัน แต่คอมพิวเตอร์จะไม่สามารถทราบได้ ส่วนในกรณีการประมวลผลนั้น ก่อนจะนำข้อมูลใดๆ เข้าไปสร้างโมเดลต้องมีการทำความสะอาดข้อมูลอีกรอบ เพื่อให้แน่ใจว่าข้อมูลที่จะเป็นต้นแบบนั้นอยู่ในกรอบการใช้งานได้จริง จากความหมายของ Big Data จะเข้าใจได้ว่า Big Data ก็เป็นเพียงแค่ข้อมูลเยอะๆ ที่มีความหลากหลาย และยุ่งยากในการใช้งาน หากเปรียบเทียบแล้ว Big Data ก็เป็นเพียงวัตถุดิบเพื่อให้นำไปปรุงแต่ง หรือใช้การต่อเท่านั้น หากเก็บเอาไว้เฉยๆ ก็ไม่มีประโยชน์อันใด แต่ถ้าพูดถึง Big Data Project จะพูดถึงการทำ Project ที่ใช้ Big Data มาประมวลผล และต้องมีการวางแผนอย่างละเอียดรอบคอบ โดยต้องตอบคำถามต่างๆ เหล่านี้ให้ได้ Who : ใครเป็นผู้รับผิดชอบงานนี้ และใครเป็นผู้ได้ประโยนช์กับความสำเร็จของ Project นี้ What : อะไรคือแนวทาง วิธีการ หรือเครื่องมือต่างๆ ที่จะช่วยให้ Project นี้เกิดได้ Where : ที่ไหนคือแหล่งข้อมูล When : เมื่อไหร่จะเริ่มทำ Project และเมื่อไหร่ Project นี้จะสำเร็จ Why : ทำไม Project นี้ถึงมีความสำคัญ ซึ่งควรต้องมีการวางแผนเรื่องผลตอบแทน หรือการเติบโตในอนาคตด้วย อาจรวมไปถึง Return of Investment How : อย่างไรที่จะทำให้เกิดขั้นตอนต่างๆ ได้ นั้นคือ แต่ละ Step ต้องมีรายละเอียดเช่นไร How Much : เท่าไหร่ที่ต้องจ่ายสำหรับการทำ Project นี้ ซึ่งควรเขียน Business Plan และวางงบเป็น Step ไม่ใช่เขียนแค่งบกลมๆ ในตอนท้าย ทั้งนี้ การทำ Big Data Project ไม่จำเป็นต้องมีข้อมูลที่เป็น Big Data ก่อน แล้วค่อยเริ่มทำ เพราะการวางกลยุทธ์ และเริ่มเก็บข้อมูลก็ถือว่าเป็นการทำ Project แล้ว กลับกัน การมี Big Data แต่ไม่ได้นำไปใช้ประโยชน์ต่างหาก ที่ไม่สามารถเรียกได้ว่าเป็น Project ดังนั้น ทุกครั้งที่มีการพูดถึงกลยุทธ์ในการทำ Big Data Project จึงอยากให้มีการพูดถึงแนวทางในการทำงาน เป้าหมายที่ชัดเจน เพื่อให้เข้าใจได้ว่า องค์กรนั้น บริษัทนั้น หรือบุคคลผู้เอ่ยคำนั้น มีเข้าใจในคำว่า Big Data จริงๆ มิฉะนั้นแล้ว คำว่า Big Data ก็จะแค่เป็นคำหนึ่งที่ใช้อ้างในการเขียน Proposal เพื่อของบประมาณ โดยที่ไม่ทราบได้ว่างบประมาณนั้นได้ถูกนำไปใช้งานอย่างที่ควรจะเป็นหรือไม่ และหากเป็นเช่นนั้นไปเรื่อยๆ สุดท้ายแล้ว คำว่า Big Data ก็จะไม่มีพลังใดๆ เลย อย่าให้คำว่า Big Data เป็นเพียงตัวประกันที่เอาไว้ใช้เรียกความสนใจ แต่จงให้ Big Data เป็นดั่งทรัพยากรที่มีค่า พร้อมที่จะนำไปสร้างประโยชน์ที่ยิ่งใหญ่ได้ต่อไป

อย่าเอาคำว่า “Big Data” มาเป็นตัวประกัน

ตอนนี้จะไปไหนก็มีแต่คนพูดถึงเรื่อง Big Data เพราะเป็นคำที่ถูกใช้บ่อยในการทำโปรเจค หรือวางกลยุทธ์ใดๆ จนกลายเป็นว่า คำนี้เหมือนเป็นคำลอยๆ...

bottom of page