Please enable JavaScript.
Coggle requires JavaScript to display documents.
การเก็บรวบรวมและสำรวจข้อมู - Coggle Diagram
การเก็บรวบรวมและสำรวจข้อมู
ความเหมาะสมของแหล่งข้อมูล
การเลือกใช้แหล่งข้อมูล
ก่อนเลือกใช้แหล่งข้อมูล ควรพิจารณาความเหมาะสมของแหล่งข้อมูลตามมุมมอง
จุดมุ่งหมายของแหล่งข้อมูล (purpose)
ความทันสมัยของข้อมูล (currency)
ความสอดคล้องกับการใช้งาน (relevance)
ความน่าเชื่อถือของแหล่งข้อมูล (authority)
ความถูกต้องแม่นยำ (accuracy)
แหล่งที่มาของข้อมูล
จำแนกตามแหล่งที่มาได้ 2 ทาง
ข้อมูลปฐมภูมิ (primary data)
ข้อมูลที่ได้จากแหล่งกำเนิดข้อมูลหรือจุดเริ่มต้นของข้อมูล เช่น ข้อมูลจากการทดลอง การค้นพบทางวิทยาศาสตร์
ข้อมูลทุติยภูมิ (secondary data)
ข้อมูลที่ไม่ได้มาจากแหล่งกำเนิดโดยตรง แต่ได้มาจากการอ้างอิงถึงข้อมูลปฐมภูมิ หรือนำข้อมูลปฐมภูมิมาวิเคราะห์ ประมวลผล ซึ่งอาจอยู่ในรูปบทวิจารณ์ บทความ เอกสารต่างๆ
แหล่งข้อมูลทุติยภูมิ
data.go.th เป็นแหล่งข้อมูลทุติยภูมิสถิติจากศูนย์กลางข้อมูลภาครัฐ เพื่อประโยชน์ต่อสาธารณชนและหน่วยงานทั้งภาครัฐและเอกชน สามารถค้นหาและเข้าถึงข้อมูลที่มีคุณภาพของภาครัฐได้โดยสะดวก ซึ่งมีให้ดาวน์โหลดไฟล์ในรูปแบบ .xls และรูปแบบ .csv นอกจากนี้ยังสามารถดาวน์โหลดไฟล์คำอธิบายข้อมูล (metadata) ได้
การรวบรวมข้อมูล
มีวิธีจัดการข้อมูลที่แตกต่างกัน ขึ้นกับรูปแบบที่เผยแพร่
ไฟล์
ไฟล์ที่ได้จากโปรแกรมตาราทำงาน (นามสกุล .xls, .xlsx, .odp) หรือไฟล์แบบข้อความ (text) (นามสกุล .csv) สามารถดาวน์โหลดไปใช้งานได้โดยไม่ต้องอาศัยขั้นต้อนซับซ้อนในการแปลงข้อมูล ส่วนไฟล์นามสกุล .pdf สามารถดาวน์โหลดได้แต่มีกระบวนการซับซ้อนในการแปลงข้อมูลให้อยู่ในรูปแบบที่นำไปใช้คำนวณ
รายงานหรือตารางบนเว็บไซต์
เป็นข้อมูลที่ผ่านการสรุปมาแล้ว ไม่มีข้อมูลดิบประกอบ ทำให้ยากในการนำข้อมูลไปวิเคาาะห์ในประเด็นอื่น เช่น ข้อมูลสรุปจำนวนผู้ติดเชื้อและเสียชีวิตในช่วงการแพร่ระบาดของโรคโควิด-19 ซึ่งไม่มีรายละเอียดของแต่ละบุคคล ทำให้ไม่สามารถวิเคราะห์ถึงช่วงอายุของผู้ติดเชื้อหรือเสียชีวิต
การเตรียมข้อมูล
เพื่อทำให้ข้อมูลมีความถูกต้อง ครบถ้วน สมบูรณ์ ไม่มีค่าผิดปกติ เพื่อเตรียมพร้อมสำหรับการประมวลผลข้อมูล
การทำความสะอาดข้อมูล (Data Cleansing)
การแก้ไขข้อมูลเมื่อพบว่ามีข้อผิดพลาด สามารถทำได้โดยการแก้ไขให้ถูกต้อง หรือลบข้อมูลที่ไม่ส่งผลกระทบต่อการประมวลผล หากข้อมูลมีจำนวนไม่มาก สามารถใช้คนดำเนินการตรวจสอบและแก้ไขข้อมูล แต่หากข้อมูลมีจำนวนมาก ต้องอาศัยโปรแกรมคอมพิวเตอร์ในการดำเนินการ
การแปลงข้อมูล (Data Transformation)
เป็นการเตรียมข้อมูลให้อยู่ในรูปแบบที่พร้อมสำหรับการประมวลผล โดยรูปแบบของข้อมูลที่พร้อมประมวลผลในโปรแกรมตารางทำงานนั้น แต่ละแถว (บรรทัด) คือข้อมูล 1 รายการ และแต่ละคอลัมน์ (หลัก) คือ คุณลักษณะ หรือแอตทริบิวต์
การเชื่อมโยงข้อมูล (Data Combining)
กรณีที่ต้องการใช้ข้อมูลของกลุ่มตัวอย่างที่มีการเผยแพร่จากหลายแหล่ง หรือมีหลายไฟล์ข้อมูล ต้องทำการเชื่อมโยงข้อมูลจากหลายแหล่งเข้าด้วยกัน โดยใช้คุณลักษณะหรือแอตทริบิวต์ ที่มีอยู่รวมกันของหลายแหล่งข้อมูล เป็นตัวเชื่อมโยง