"20 Claims About Big Data and Why They All Are Wrong" โดย DataI
top of page

บทความ "20 Claims About Big Data and Why They All Are Wrong" โดย DataInformed


20 Claims About Big Data and Why They All Are Wrong

20 ข้อเรียกร้องเกี่ยวกับ Big Data และทำไมพวกเขาถึงเข้าใจผิด

บทความนี้ถูกเขียนโดย ที่ปรึกษาด้าน Big Data นามว่า "Bernard Marr" ซึ่งเขาได้อธิบายว่า หากบริษัทไหนต้องการทำโปรเจคเกี่ยวกับ Big Data บริษัทนั้นควรระวัง และทำความเข้าใจกับสิ่งเหล่านี้

1. Big data is nothing new.

Big Data ไม่ใช่สิ่งใหม่ มันมีมานานแล้ว เพียงแค่ทุกวันการเพิ่มปริมาณของข้อมูล และความสามารถในการวิเคราะห์ได้ถูกพัฒนาให้ล้ำสมัยขึ้น

2. Big data will change everything.

Big data จะเปลี่ยนแปลงทุกอย่าง “ไม่ใช่เรื่องจริง” แต่มันก็มีส่วนทำให้โลกเราเปลี่ยนแปลงไปในทุกวัน และมีแนวโน้นจะเปลี่ยนแปลงต่อไป ซึ่งเราจะพบว่า ทุกๆ บริษัทที่ประสบความสำเร็จ มักจะใช้ Big Data กันไปหมดแล้ว

3. The only cost for big data is hardware and software.

ในการทำ Big Data ต้องลงทุนมหันต์กับ hardware และ software ไม่จริงเสมอไป เพราะที่แพงมันคือการสร้างทีมที่เข้มแข็ง ไม่ว่าจะเป็นการเข้าถึงข้อมูล การวิเคราะห์ข้อมูล และการดูแลระบบ เพื่อไม่ให้เกิดปัญหาในอนาคต และเพื่อสามารถปรับตัว และรองรับกับข้อมูลใหญ่ๆ ได้อย่างทันท่วงที ราคาแพงที่สุดที่บริษัทต้องจ่าย คือ การลงทุนกับระบบที่ไม่เหมาะสมต่างหาก

4. Big data applications require little or no performance optimization.

ระบบ Big Data ต้องมีการคำนวณประสิทธิภาพที่เหมาะสมน้อยมาก หรือไม่ต้องมีการคำนวณเลยก็ได้ อันนี้เป็นความเข้าใจที่ผิดมาก เพราะด้วยความใหญ่ของข้อมูลเอง ก็เกิดความยุ่งยากจนหาคำว่า perfect ได้ยากอยู่แล้ว โดยเฉพาะอย่างยิ่ง เมื่อข้อมูลที่มีอยู่ไม่สะอาด หรือมีคุณภาพที่ดีพอ จึงจำเป็นต้องมีระบบ Optimization หรือการคิดคำนวณเพื่อหาจุดเหมาะสมของระบบ

5. You need to hire one data scientist.

จะทำ Big Data ต้องจ้าง Data Scientist 1 คน ไม่จริงเสมอไป ใช่อยู่ที่ Data Scientist นั้นเปรียบเหมือนมนุษย์ทองคำ (ต่างชาติจะเรียกว่า “ยูนิคอร์น”) ซึ่ง คนเดียวสามารถช่วยตอบโจทย์ยากๆ ให้องค์กรได้ แต่ว่าสิ่งสำคัฐที่องค์กรควรจะมีมากกว่าคน 1 คน คือ ทีมงาน ที่สามารถทำงานให้หลายๆ มุมได้ ช่วยกันแก้ปัญหาต่างๆ เพื่อผลักดันให้งานเกิดขึ้นได้อย่างสำเร็จ

6. We need to implement machine learning.

เราต้องใช้ Machine Learning เท่านั้น จริงหรือไม่ ซึ่งต้องแยกก่อนว่า งานของคุณคือ Analytics หรือ Machine Learning ไม่จำเป็นว่าต้องสร้างโมเดลมากมาย เพียงแค่คุณเข้าใจระบบงานเสียก่อน

7. Every problem is a big data problem.

ทุกๆ ปัญหา คือ Big Data ไม่จริงเสมอไป ไม่ต้องมีถึงขั้น Big Data ก็ได้ เพียงแค่มีข้อมูล และมีเป้าหมายในการใช้ข้อมูล ก็ยิ่งใหญ่แล้ว

8. I don’t have enough data for big data.

มีข้อมูลไม่พอ ถึงขั้น Big Data ไม่ใช่ปัญหา แต่มันคือ ข้ออ้าง การระบุปัญหา และวางเป้าหมายคือหัวใจหลัก ซึ่งจะทำให้คุณรู้ตัวเองว่า คุณมีข้อมูลเพียงพอแล้วหรือยัง

9. We need real-time data.

ต้องมีข้อมูลแบบ Real-time เท่านั้น ในการวิเคราะห์จำเป็นต้องใช้ข้อมูลเก่า เพื่อหาแนวโน้มต่างๆ ภายในตัวของข้อมูล ส่วนการใช้ Real-time จะเป็นการตัดสินใจในขณะนั้นๆ ซึ่งอาจจะดี หรือไม่ดีก็เป็นได้

10. Data analysts are the new gods of the Information Age.

นักวิเคราะห์ข้อมูลคือพระเจ้าองค์ใหม่ของยุคนี้ อาจจะจริงในตอนนี้ แต่ต่อไปไม่แน่ เนื่องจาก Analyst จะใช้ Tool ต่างๆ ซึ่งแลดูเหมือนว่า Tool พวกนี้จะถูกสร้างมาให้ใช้งานได้ง่ายขึ้น ทำให้ต่อไป เหล่า Business หรือ user คนอื่นๆ ก็อาจใช้งาน Tool นี้เองได้

11. Big data has all the answers.

Big Data มีทุกคำตอบ แน่นอนว่ามันไม่จริง Big Data ก็เป็นแค่แหล่งข้อมูล เราจะหาคำตอบจากแหล่งข้อมูลได้อย่างไร นั้นคือหน้าที่ของตัวเราเอง

12. Hadoop is the Holy Grail of big data.

Hadoop คือ สิ่งที่วิเศษที่สุดของ Big Data แท้จริงแล้ว ตัวมันเองก็มีทั้งข้อดี-ข้อเสีย ซึ่งข้อดีคือมันออกแบบมาไว้ใช้กับ Big data แต่ข้อเสียคือ มันต้องใช้ technician ที่เก่งกาจ (และแสนแพง) เพื่อจัดการสิ่งยากๆ ไม่ว่าจะเป็นการ cluster และ debug โดยที่มันไม่สามารถรองรับข้อมูลแบบ Real-time ได้ ดังนั้น จึงบอกได้ว่า มันไม่ใช่เครื่องมือที่ตอบโจทย์ได้ทุกอย่างจริงๆ

13. Big data is an IT matter.

อาจะเพราะชื่อมันคือ Data คนเลยคิดถึงแค่ IT แต่จริงๆ แล้ว มันรวมไปถึงส่วนงานอื่นๆ ด้วย เช่น แผนกการขาย การตลาด R&D แผนกบริการลูกค้า แผนก HR แผนก supply chain management และส่วนอื่นๆ ซึ่ง IT มีหน้าที่ในการ support

14. Having so much data makes data flaws insignificant.

การมีข้อมูลเยอะ ทำให้ข้อบทพร่องของข้อมูลนั้นไม่สำคัญ ไม่จริงเลย เพราะ Outlier คือ ส่วนที่ทำให้สกปรก ซึ่งยิ่งมีข้อมูลเยอะ ยิ่งทำให้เกิดข้อบกพร่องเยอะตามมาด้วย เราจึงต้องให้ความสำคัญกับจุดบกพร่องนี้

15. Data warehouses aren’t needed for advanced analytics.

Data warehouses ไม่จำเป็นสำหรับการวิเคราะห์ขั้นสูง ที่เข้าใจกันผิดนี้ เพราะมี term ใหม่ที่เรียกว่า Data lakes เข้ามา นั้นคือการใช้ข้อมูลดิบๆ เลย แทนที่การใช้ Data Warehouse ที่ต้องมีการจัดโครงสร้างเสียก่อน ความเข้าใจนี้ ไม่จริงเสมอไป เพราะในการออกแบบวิธีการวิเคราะห์ก็จำเป็นต้องใช้ข้อมูลที่เป็นโครงสร้างเช่นเดียวกัน

16. Big data is only for big companies.

โปรเจค Big Data นั้นสำหรับบริษัทใหญ่ๆ เท่านั้น ไม่จริงเลย เพราะไม่ว่าจะเล็ก จะใหญ่ ก็สามารถใช้ข้อมูลมาวิเคราะห์เพื่อใช้ตัดสินใจในการทำธุรกิจได้เสมอ

17. All of our competitors have already adopted big data.

คบริษัทคู่แข่งทั้งหมดตอนนี้ใช้ Big Data กันหมดแล้ว แท้จริงแล้ว มีการรายงานว่า มีเพียง 29% ของบริษัทต่างๆ เท่านั้นที่มีการใช้ Big Data ใรการตัดสินใจขององค์กร อย่างไรก็ตาม เราก็ไม่ควรจะรอ เพราะการดำเนินการเกี่ยวกับ Big Data จะทำให้บริษัทมีข้อได้เปรียบอย่างสูง

18. Big data can overcome human bias.

Big Data จะเข้ามาทำให้มนุษย์มีความลำเอียงน้อยลง ไม่จริงเสมอไป ใช่อยู่ว่า Analytics และ Machine Learning จะเข้ามาช่วย แต่สุดท้ายก็เป็นการตัดสินใจของมนุษย์ที่ต้องอาศัยประสบการณ์อยู่ดี

19. End users want flexibility, not guidance.

End Users ต้องการความยืดหยุ่น ไม่ใช่แค่คำชี้เฉพาะ ไม่จริงเสมอไป บางครั้งเยอะเกินอาจจะไม่ดีก็ได้ สิ่งที่คนอยากได้ คือ ความชัดเจน

20. No one has asked for it.

ไม่มีใครอยากได้ Big Data ไม่จริงเลย บางครั้งแค่การทำ Report หรือ การเปรียบเทียบอะไรก็ตาม มันก็คือการใช้ตัวเลขแล้ว จะเล็กหรือจะใหญ่ก็คือ Data โดยทั้งสิ้น

 

ต้นฉบับ สามารถอ่านได้ที่ CLICK

ขอบคุณบทความต้นฉบับ จาก DataInformed ค่ะ


< Previous
Next >
bottom of page