Data Science & Data Collection
ในยุคดิจิทัลที่ทุกอย่างขับเคลื่อนด้วยเทคโนโลยี "ข้อมูล (Data)" เปรียบเสมือนขุมทรัพย์ที่มีค่ามหาศาล แต่ข้อมูลดิบๆ ที่กระจัดกระจายอยู่จะไม่มีประโยชน์เลย หากเราไม่รู้จักวิธีนำมา "ประมวลผล" วันนี้เราจะมาทำความรู้จักกับวิทยาการข้อมูลและการเก็บรวบรวมข้อมูลกันครับ!
ก่อนที่เราจะจัดการข้อมูลได้ เราต้องรู้ก่อนว่าข้อมูลนั้นมีหน้าตาแบบไหน ซึ่งสามารถแบ่งออกได้ 2 แบบหลักๆ คือ:
ข้อมูลที่เป็น "ตัวเลข" สามารถนำมาบวกลบคูณหาร หรือเปรียบเทียบขนาดได้ชัดเจน เช่น อายุ, น้ำหนัก, ส่วนสูง, ยอดขาย, คะแนนสอบ
ข้อมูลที่เป็น "ลักษณะหรือความรู้สึก" ไม่สามารถนำมาคำนวณทางคณิตศาสตร์ได้โดยตรง เช่น เพศ, สีที่ชอบ, ความคิดเห็น, ระดับความพึงพอใจ
💡 รู้หรือไม่? หากแบ่งตาม "วิธีการเก็บรวบรวม" ข้อมูลที่เราไปเดินสอบถาม สังเกต หรือจดบันทึกมาด้วยตัวเองเรียกว่า ข้อมูลปฐมภูมิ (Primary Data) ส่วนข้อมูลที่เราไปค้นหามาจากอินเทอร์เน็ตที่คนอื่นรวบรวมไว้แล้ว เรียกว่า ข้อมูลทุติยภูมิ (Secondary Data)
วิทยาการข้อมูล คือการนำข้อมูลมาศึกษา วิเคราะห์ เพื่อให้เกิดความหมายและนำไปใช้ประโยชน์ได้ โดยมี 5 ขั้นตอนสำคัญ ดังนี้:
การจะเริ่มกระบวนการ Data Science ได้ เราต้องมี "ข้อมูล" ก่อน! ซึ่งเครื่องมือที่ทรงประสิทธิภาพ ใช้งานง่าย และได้รับความนิยมสูงสุดในการสร้างแบบสอบถามออนไลน์ก็คือ Google Forms
ทดสอบความเข้าใจเรื่องวิทยาการข้อมูลและการเก็บรวบรวมข้อมูล
ข้อที่ 1: ข้อมูลในข้อใดจัดเป็น "ข้อมูลเชิงปริมาณ (Quantitative Data)"?
ข้อที่ 2: หากนักเรียนรวบรวมข้อมูลโดยการ "ลงพื้นที่สังเกตพฤติกรรม" ของผู้ซื้อสินค้าด้วยตนเอง ข้อมูลนั้นจัดเป็นข้อมูลประเภทใด?
ข้อที่ 3: ขั้นตอนใดในกระบวนการวิทยาการข้อมูล (Data Science) ที่เน้นการ "คัดกรองข้อมูลที่ผิดพลาดหรือไม่สมบูรณ์" ออกไป?
ข้อที่ 4: การตั้งคำถามใน Google Forms ที่ดีตามหลักการ "Relevant" หมายถึงอะไร?
ข้อที่ 5: ข้อดีที่สุดของการใช้ Google Forms ควบคู่กับ Google Sheets ในงานวิทยาการข้อมูลคืออะไร?