top of page

Data Governance คืออะไร ?


Data Governance คืออะไร?
Data Governance คืออะไร?

คำว่า Data Governance แปลเป็นไทยว่า การธรรมาภิบาลข้อมูล ซึ่งหมายถึง การกำกับดูแลข้อมูล โดยมีการกำหนดนโยบายที่เกี่ยวข้องกับข้อมูลอย่างมีระบบ ตั้งแต่การเกิดของข้อมูล การจัดเก็บ การวิเคราะห์ การทำลาย การเข้าถึง การรักษาความปลอดภัย และการนำไปใช้ โดยให้ความสำคัญทั้งในมุมกระบวนการ บุคลากร และเทคโนโลยี

การจัดทำ Data Governance ไม่มีหลักปฏิบัติที่ตายตัว เพราะแต่ละองค์กรมีแหล่งที่มาของข้อมูลที่ไม่เหมือนกัน และมีหน่วยงานรับผิดชอบข้อมูลที่มีโครงการแตกต่างกัน ดังนั้นเมื่อต้องการศึกษาเกี่ยวกับ Data Governance จึงมีรายละเอียดให้ศึกษาได้น้อย ซึ่งในประเทศไทยเอง จะมีหน่วยงาน DGA ที่ได้นำเสนอ Framework ในการจัดทำ Data Governance

(คลิกอ่านรายละเอียดเพิ่มเติมเกี่ยวกับ Data Governance Framework by DGA )

ทำไม Data Governance ถึงมีความสำคัญ ? เพราะ Data ที่เกิดขึ้นในองค์กร มีความกระจัดกระจาย ทำให้ไม่สามารถเข้าถึงชุดข้อมูลเดียวกันได้แม้จะอยู่ในองค์กรเดียวกัน ส่งผลให้องค์กรไม่สามารถนำ Data นั้นไปใช้ประโยชน์ได้อย่างเต็มที่ การมี Data Governance ทำให้เกิดกฎระเบียบในการบริหารจัดการข้อมูลที่ชัดเจนขึ้นและยังช่วยลดความเสี่ยงในการเกิดข้อมูลซ้ำซ้อน ข้อมูลไม่มีคุณภาพ และการหวงแหนข้อมูลได้อีกด้วย

ผลลัพธ์ที่ได้จากการทำ Data Governance ไม่ใช่แค่เอกสารที่เป็นกฎระเบียบขององค์กรเท่านั้น แต่ต้องมีการปรับเปลี่ยนระบบ Infrastructure ใหม่เสียด้วย เพราะการเข้าถึงข้อมูลจะต้องโปร่งใสและมีการกำหนดสิทธิในการเข้าถึงข้อมูลอย่างชัดเจน ดังนั้นในท้ายที่สุดของการผลักดันโครงการ Data Governance จะเป็นการปรับเปลี่ยนวิธีการทำงานขององค์กรทั้งหมด เพื่อรองรับการทำงานแบบ Data-Driven Business นั่นเอง

วัฏจักรในการดำเนิน Data Governance ประกอบไปด้วย

1.Data Ownership Discovery

การระบุแหล่งที่มาของข้อมูลและผู้รับผิดชอบ โดยจะต้องชี้แจงรายละเอียดของการได้มาซึ่งข้อมูล เช่น กรอกข้อมูลในระบบใด มีรูปแบบการเก็บอย่างไร ฝ่ายใดเป็นผู้รับผิดชอบ หรือเป็นเจ้าของข้อมูล เป็นต้น

2.Data Policy and Risk Level

การระบุความเสี่ยงของข้อมูลและกำหนดระดับความเป็นส่วนตัวของข้อมูล โดยสามารถแบ่งระดับความเสี่ยงเป็นระดับ เช่น ข้อมูลความลับ ข้อมูลสาธารณะ เพื่อใช้เป็นตัวบ่งชี้ในการบริหารข้อมูลด้านความปลอดภัย ซึ่งผู้กำหนดระดับความเสี่ยงของข้อมูลนี้ คือ หน่วยงานผู้รับผิดชอบข้อมูลโดยตรง

3.Data Proliferation

การระบุความเชื่อมโยงของการกำเนิด ใช้งานและทำลายข้อมูล ในขั้นตอนนี้จะเป็นการเขียน Flow เพื่อมองหาจุดเชื่อมโยงของข้อมูล เช่น ฝ่ายบัญชี ได้รับข้อมูลมาจากระบบ POS และระบบ ERP ซึ่งผู้รับผิดชอบกรอกข้อมูลใน ERP ประกอบไปด้วยส่วนหน้าร้าน ส่วนคลังสินค้า ส่วนขนส่ง และส่วนงานออกแบบผลิตภัณฑ์ เป็นต้น


โดย Flow นี้ สามารถเขียนเป็นกล่องเชื่อมโยงอย่างง่ายโดยไม่จำเป็นต้องวาดเป็น ER-Diagram เพราะวัตถุประสงค์ของ Flow เพราะให้เห็นถึงการเชื่อมโยงข้อมูลกันในเชิงปฏิบัติ ดังนั้นคนที่เขียน Flow นี้ อาจจะไม่ใช่กลุ่มงาน IT แต่อาจเป็น Data Analyst หรือผู้มีหน้าที่รับผิดชอบโครงการ Data Governance


ทั้งนี้ผลลัพธ์ที่ได้จากการทำ Data Proliferation คือการออกแบบโครงสร้างของข้อมูลใหม่ เพื่อให้สามารถนำข้อมูลไปใช้ที่ปลายทางได้อย่างมีประสิทธิภาพมากขึ้น โดยมีส่วนของการเชื่อมโยงข้อมูล (Data Integration), การทำความสะอาดข้อมูล (Data Cleansing) และการออกแบฐานข้อมูลใหม่ (Database Design) มาเกี่ยวข้องด้วย

4.Data Dictionary

การร่างเอกสารเพื่อระบุสถานะ การจัดเก็บข้อมูล ซึ่ง Data Dictionary เป็นพื้นฐานที่ทุกองค์กรควรจะมี เพราะเอกสารฉบับนี้เป็นเอกสารที่บ่งบอกได้ว่ามีการเก็บข้อมูลอะไรเอาไว้ที่ไหนบ้าง อย่างไรก็ตามในแต่ละช่วงเวลา Data Dictionary จะมีการเปลี่ยนแปลงไปเพราะมีข้อมูลใหม่ๆ เข้ามาในระบบมากขึ้น ดังนั้นหน่วยงานที่มีหน้าที่จัดทำ และ Update เอกสาร Data Dictionary คือ หน่วยงาน IT หรือ Data Admin


ทั้งนี้ปัญหาขององค์กรใหญ่ที่มีการลงระบบมานาน พบว่าไม่ได้มีการเก็บ Data Dictionary เอาไว้และเมื่อระบบเป็นระบบใหญ่ ทำให้ยากต่อการสร้าง Data Dictionary ใหม่ อาจจะเป็นเพราะก่อนหน้านี้ Vendor ที่มาลงระบบไว้ ไม่ได้มอบ Data Dictionary ให้ก็เป็นได้ แต่เมื่อต้องดำเนินการในโครงการ Data Governance ก็เลี่ยงไม่ได้ที่จะต้องมี Data Dictionary เพราะจำเป็นจะต้องระบุความรับผิดชอบของข้อมูลนั่นเอง

5.Data Protection

การออกแบบช่องทางการป้องกันข้อมูล เป็นงานต่อเนื่องจากขั้นตอนที่ 2 และ 3 โดยในส่วนที่ 5 Data Protection นี้จะเป็นการออกแบบระบบตามหลักความปลอดภัย หรือ Database Security ซึ่งกระบวนการนี้จำเป็นต้องมีการ Review การออกแบบ Infrastructure ใหม่ทั้งหมด เพื่อรอบรับระดับความเสี่ยงของชุดข้อมูลแต่ละชุด ซึ่งในยุคก่อนจะมีการสร้าง Data Warehouse ที่เดียว และติดตั้งระบบ Security แบบเดียว แต่ในปัจจุบันเนื่องจากต้องการการเข้าถึงข้อมูล ควรมีการบริหารจัดการที่ยืดหยุ่น และเปิดให้เข้าถึงได้ตามสิทธิ์ ทำให้การออกแบบ Data Warehouse ไม่จำเป็นต้องมีแค่ที่เดียวอีกต่อไป

6.Data Access and Authorization

การออกแบบระบบเพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ตามสิทธิ หรือ ขอ Request ข้อมูลได้จากผู้มีอำนาจในการอนุมัติสิทธิ เป็นการเปลี่ยนรูปแบบการทำงานจากเมื่อก่อนที่การจะขอข้อมูลจะมีหน่วยงาน IT เป็นคนดึงข้อมูลให้ แต่เมื่อมีการออกแบบระบบข้อมูลแบบใหม่ก็จะสามารถเปิดโอกาสให้ผู้ใช้งานสามารถเลือกใช้ข้อมูลได้ตามระดับของความเสี่ยงของข้อมูล ซึ่งหากข้อมูลมีความลับหรือเป็นข้อมูลที่จำกัดสิทธิ์ก็สามารถกรอกรายละเอียดการขอข้อมูลผ่านระบบได้เพื่อส่งรายงานไปยังผู้อนุมัติได้โดยตรง ซึ่งระบบการขออนุมัตินี้ทางหน่วยงาน IT จะเป็นผู้รับผิดชอบออกแบบระบบและดูแลรักษาระบบ การมีระบบนี้จะทำให้ข้อมูลทั้งหมดมีความโปร่งใสและเป็นแนวทางทางในการแก้ปัญหาการหวงแหนข้อมูลได้เป็นอย่างดี


จะเห็นได้ว่าทั้ง 6 ข้อนี้จะมีทั้งส่วนการรับผิดชอบแบ่งออกเป็น ส่วนเจ้าของข้อมูล หน่วยงาน IT และผู้มีความต้องการใช้ข้อมูล ซึ่งการดำเนินโครงการ Data Governance ที่ดีควรคำนึงถึงการนำไปใช้จริงให้ได้มากที่สุด ไม่ใช่แค่เป็นนโยบายในกระดาษแต่จะต้องมีการออกแบบ Infrastructure เพื่อรองรับการเข้าถึงข้อมูลได้อย่างโปร่งใส

วัฏจักรในการดำเนิน Data Governance
วัฏจักรในการดำเนิน Data Governance

ดังนั้น โครงการที่ควรทำควบคู่ไปกับการทำ Data Governance คือการสร้าง Data Lake เพื่อเป็นถังข้อมูลกลางที่เก็บข้อมูลแบบดิบๆ ก่อนที่จะนำข้อมูลดิบไปไว้ที่ Data Warehouse ตามระดับความเสี่ยงของข้อมูลต่อไป

ในทางปฏิบัติ ฝ่าย IT อาจทำหน้าที่เป็นเจ้าของโครงการ แต่การเริ่มโครงการจะต้องเริ่มจากการสำรวจ และชี้แจงความรับผิดชอบในการใช้งาน ทำลาย และระบุระดับความเสี่ยงของข้อมูล ซึ่งเป็นหน้าที่ของผู้ใช้งาน ดังนั้นหากจะมีการดำเนินโครงการ Data Governance จริงๆ สิ่งแรกที่ต้องเร่งดำเนินการ คือ การสร้างความเข้าใจเพื่อให้ทุกคนมีส่วนร่วมในโครงการ ที่สำคัญที่สุดคือการให้ความรู้ด้านความปลอดภัยและความเป็นส่วนตัวของข้อมูล เพื่อสามารถชี้แจงระดับความเสี่ยงของข้อมูลนั้นๆ ได้

Data Governance เป็นโครงการระดับใหญ่ที่ทุกองค์กรจะต้องดำเนินการเพื่อให้เป็นไปตามมาตรฐานการดูแลรักษาข้อมูล โดยผลลัพธ์ที่ได้จากโครงการนี้นอกจากจะเป็นระบบข้อมูลที่โปร่งใสแล้วยังช่วยลดวัฒนธรรมการหวงแหนข้อมูลในองค์กรอีกด้วย ทำให้การวิเคราะห์หรือใช้ประโยชน์จากข้อมูลเป็นไปได้สะดวกและรวดเร็วขึ้นอีกด้วย

 



Comments


< Previous
Next >
bottom of page