สาระสำคัญ
เป็นการเก็บรวบรวมข้อมูลทุติยภูมิ นักเรียนต้องกำหนดเป้าหมายให้ชัดเจนจะนำข้อมูลที่รวบรวมได้ไปใช้ในเรื่องใด และจะวิเคราะห์อย่างไร เพื่อให้ได้ผลลัพธ์ตามที่ต้องการ โดยเป้าหมายนี้จะสามารถบอกได้ว่าข้อมูลที่ต้องการ จะรวบรวมได้จากที่ใดและด้วยวิธีการใด ข้อมูลทุติยภูมิที่เผยแพร่บนอินเทอร์เน็ต มีอยู่หลากหลายรูปแบบ เช่น xls , xlsx , odp , csv หรืออยู่ในรูปแบบรายงานหรือตารางบนเว็บไซต์ แหล่งข้อมูลทุติยภูมิ การพิจารณาความเหมาะสมของแหล่งข้อมูล สามารถใช้มุม มองทั้ง 5 ด้าน ได้แก่ ความทันสมัยของข้อมูลความสอดคล้องกับการใช้งาน ความน่าเชื่อถือของแหล่งข้อมูล ความถูกต้องแม่นยำ และจุดมุ่งหมายของแหล่งข้อมูล
2.1 การเก็บรวบรวมข้อมูล
ในปัจจุบันแหล่งข้อมูลทุติยภูมิมีการเผยแพร่บนอินเทอร์เน็ต และอยู่ในหลากหลายรูปแบบ (format) ในการนำไปใช้งานอาจมีวิธีจัดการข้อมูลที่แตกต่างกัน ขึ้นอยู่กับรูปแบบที่เผยแพร่ ดังต่อไปนี้
1. ไฟล์
ไฟล์ที่มีนามสกุล xls, xlsx หรือ odp เป็นไฟล์ที่ได้จากโปรแกรมตารางทำงาน หรือนามสกุล cvs เป็นไฟล์แบบข้อมูลความ (text) โดยไฟล์เหล่านี้สามารถดาวน์โหลดไปใช้ได้โดยไม่ต้องเขียนโปรแกรมเพิ่มเติม ส่วนไฟล์ที่มีนามสกุล pdf สามารถดาวน์โหลดได้แต่นำข้อมูลไปใช้งานต่อได้ยาก เนื่องจากมีกระบวนการซับซ้อนในการแปลงไฟล์ให้อยู่ในรูปแบบที่สามารถนำไปใช้คำนวณได้
นอกจากนี้ยังมีข้อมูลที่อยู่ในรูปแบบที่ต้องเขียนโปรแกรมในการนำข้อมูลเหล่านั้นมาใช้ เช่น ถ้าต้องการใช้ข้อมูลจากเฟซบุ๊ก หรือทวิตเตอร์ (Twitter) จะต้องเขียนโปรแกรมผ่านวิธีการเชื่อมต่อเฉพาะ (API: Application Programming Interface) เพื่อเรียกค้นข้อมูลไปใช้ซึ่งโปรแกรมนี้อาจจะเขียนขึ้นเองหรือใช้โปรแกรมที่มีผู้อื่นเขียนไว้แล้ว
2.1.1 แหล่งข้อมูลทุติยภูมิ สมมตินักเรียนสนใจข้อมูลเกี่ยวกับรายได้ประชากรของประเทศไทย นักเรียนอาจเริ่มจากการค้นข้อมูลสถิติจากเว็บไซต์ให้บริการข้อมูลของสำนักงานพัฒนารัฐบาลดิจิทัล data.go.th ซึ่งเป็นศูนย์กลางข้อมูลภาครัฐเพื่อประโยชน์ต่อสาธารณชนและหน่วยงานทั้งภาครัฐและเอกชนให้สามารถค้นหาและเข้าถึงข้อมูลที่มีคุณภาพของภาครัฐได้ง่าย
2.1.2 ความเหมาะสมของแหล่งข้อมูล การเลือกใช้แหล่งข้อมูลที่ไม่เหมาะสมหรือมีการบิดเบือน อาจทำให้ข้อสรุปที่ได้ผิดพลาด นอกจากนี้อาจทำให้เกิดอันตรายและสร้างความเสียหายในรูปแบบต่าง ๆ ได้ นักเรียนสามารถใช้มุมมองทั้ง 5 ด้าน ประกอบการพิจารณาความเหมาะสมของแหล่งข้อมูล
1.ความทันสมัยของข้อมูล (currency) ควรตรวจสอบว่าข้อมูลเผยแพร่เมื่อใด สำรวจและปรับปรุงเมื่อใด นอก จากนี้ในปัญหาที่สนใจ ควรตรวจสอบว่าสามารถใช้ข้อมูลที่เผยแพร่นานมาแล้วได้หรือไม่
กิจกรรมที่ 2.1 พิจารณาตัวอย่างการเลือกใช้ข้อมูลต่อไปนี้ และอธิบายถึงความเหมาะสมและผลกระทบที่เกิดขึ้นหากใช้ข้อมูลในทางที่ไม่เหมาะสม
กรณีที่ 1 ใบตองค้นข้อมูลเพื่อวิเคราะห์เกี่ยวกับผู้สูงอายุในประเทศไทย เธอหาจำนวนผู้สูงอายุจากสถิติของกรมกิจการผู้สูงอายุในปี 2567 อย่างไรก็ตามเธอไม่ได้ค้นจำนวนประชากรของประเทศไทยทั้งหมด เธอใช้ข้อมูลจากหนังสือที่หาได้ พบว่าในปี 2566 ประเทศมีประชากรประมาณ 66 ล้านคน
กรณีที่ 2 ช่อม่วงศึกษาเกี่ยวกับข้อมูลการขายสินค้าออนไลน์ ข้อมูลประกอบการโฆษณาให้ใช้บริการเว็บไซต์จากผู้ให้บริการเว็บไซต์ซื้อขายสินค้ารายหนึ่งแจ้งว่า การซื้อขายสินค้าออนไลน์มีแนวโน้มเพิ่มขึ้น 70% ของการซื้อสินค้าทั้งหมด
กรณีที่ 3 อัญชันดาวน์โหลดข้อมูลเกี่ยวกับการขนส่งในประเทศ เธอพบว่าในแฟ้มข้อมูลที่ดาวน์โหลดมามีการพิมพ์ชื่อจังหวัดผิดพลาดหลายที่ และมีข้อมูลบางจังหวัดปรากฎขึ้นซ้ำกัน
เกร็ดน่ารู้ : แอตทริบิวต์
แอตทริบิวต์ (attribute) เป็นคุณลักษณะเฉพาะที่ระบุคุณสมบัติของวัตถุ สิ่งของ หรือสิ่งที่เราสนใจ โดยค่าที่เก็บของแต่ละแอตทริบิวต์ สามารถใช้อ้างอิงไปถึงวัตถุ สิ่งของ หรือสิ่งที่เราสนใจได้
ตัวอย่าง นักเรียนคนหนึ่ง มีแอตทริบิวต์ที่แสดงคุณลักษณะเฉพาะ เช่น ชื่อ เพศ อายุ ความสูง น้ำหนัก ขนาดรองเท้า รายได้ รายจ่าย โดยค่าที่เก็บของแต่ละแอตทริบิวต์ที่ใช้อ้างอิงไปยังนักเรียนคนนี้ เช่น ชื่อ ก เพศ ชาย อายุ(ปี) 17 ความสูง(ซม.) 175 น้ำหนัก(กก.) 72 ขนาดรองเท้า(ซม.) 27 รายได้ต่อเดือน(บาท) 3,000 รายจ่ายต่อเดือน(บาท) 2,500
เกร็ดน่ารู้ : แอตทริบิวต์
ในปัจจุบันมีเทคโนโลยีอินเทอร์เน็ตของสรรพสิ่ง (Internet of Things) หรือไอโอที (IoT) เป็นเครือข่ายของวัตถุ อุปกรณ์ พาหนะ สิ่งปลูกสร้าง และสิ่งของอื่น ๆ ที่มีการฝังวงจรอิเล็กทรอนิกส์ ซอฟต์แวร์ เซ็นเซอร์ และเชื่อมต่อกับอินเทอร์เน็ต สิ่งเหล่านี้สามารถเก็บบันทึกและแลกเปลี่ยนข้อมูลได้ ทำให้เข้าใจสภาพแวดล้อมที่อยู่ห่างไกลได้แบบเรียลไทม์ โดยไม่ต้องไปอยู่ในสถานที่จริง