สาระสำคัญ
การวิเคราะห์ข้อมูลนอกจากจะทำให้เห็นภาพรวมของข้อมูลแล้ว ยังช่วยในการคาดการณ์ผลในอนาคตและแนะนำทางเลือกที่เหมาะสมที่สุดสำหรับการตัดสินใจของบุคคลหรือองค์กร โดยการวิเคราะห์เชิงพรรณนาเป็นการวิเคราะห์ขั้นพื้นฐาน การวิเคราะห์เชิงทำนายเป็นการวิเคราะห์เพื่อทำนายสิ่งที่อาจจะเกิดขึ้นในอนาคต ส่วนการวิเคราะห์เชิงแนะนำเป็นการวิเคราะห์ที่ต่อยอดมากจากการวิเคราะห์เชิงพรรณนาและเชิงทำนาย โดยใช้ทักษะการแก้ปัญหาและวางแผน
3.1 การวิเคราะห์เชิงพรรณนา (descriptive analytics) เป็นการวิเคราะห์ขั้นพื้นฐานที่ทำให้เห็นภาพรวมของข้อมูล และความสัมพันธ์ระหว่างข้อมูล ช่วยอธิบายว่าเกิดอะไรขึ้นบ้างในช่วงที่ผ่านมาและอาจนำมาช่วยในการตัดสินใจ โดยอาจใช้สถิติ เช่น การหาสัดส่วนหรือร้อยละ การวัดค่ากลางของข้อมูล (central tendency) การวัดการกระจายของข้อมูล และการหาความสัมพันธ์ของชุดข้อมูล (correlation) การวิเคราะห์ประเภทนี้จึงเป็นรูปแบบที่นำมาใช้งานเพื่อดูภาพรวมของข้อมูลที่สนใจ
3.1.1 การหาสัดส่วนหรือร้อยละ
การหาสัดส่วนหรือร้อยละ เป็นการจัดการข้อมูลที่ซ้ำกันให้เป็นระเบียบและเป็นหมวดหมู่ ซึ่งจะทำให้ง่ายต่อการนำข้อมูลไปใช้ และง่ายต่อการสังเกตการเปลี่ยนแปลงต่างๆ ที่เกิดขึ้น โดยอาจแสดงในรูปของเศษส่วน ทศนิยม หรือร้อยละ และสามารถนำเสนอให้อยู่ในรูปของแผนภูมิ หรือแผนภาพ เพื่ออธิบายความหมายของข้อมูลชุดนั้นเช่น การสำรวจการเข้าศึกษาต่อในระดับอุดมศึกษาต่อจำนวน 100 คน จากทั้งหมด 400 คน คิดเป็นร้อยละ 25
3.1.2 การวัดค่ากลางของข้อมูล
การวัดค่ากลางของข้อมูลใช้เพื่อหาค่าที่เป็นตัวแทนของข้อมูลทั้งหมดทำให้สะดวกในการจดจำหรือสรุปเรื่องราวเกี่ยวกับข้อมูลชุดนั้น ๆ ได้มากขึ้น ค่ากลางของข้อมูลที่นิยมใช้ได้แก่ ค่าเฉลี่ย (mean) มัธยฐาน (median) และฐานนิยม (mode) สำหรับชุดข้อมูลปริมาณที่มีค่าใกล้เคียงกัน (ค่าการกระจ่ายของข้อมูลต่ำ) ค่าเฉลี่ยอาจเป็นค่ากลางที่ดี แต่ค่าเฉลี่ยอาจไม่เหมาะที่จะใช้เป็นค่ากลางของชุดข้อมูลที่มีค่าแตกต่างกันมากคือมีข้อมูลบางตัวที่ค่าสูงมาก ๆ หรือต่ำมาก ๆ ดังนั้นการพิจารณาค่าเฉลี่ยจึงควรจะพิจารณาการกระจายของข้อมูลด้วยซึ่งสามารถดูได้จากค่าส่วนเบื่ยงเบนมาตรฐาน (standard deviation)
เกร็ดความรู้ : ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ส่วนเบี่ยงเบนมาตรฐานที่ใช้ในการวัดการกระจายของชุดข้อมูล จะมีค่าเป็นบวกเสมอ และมีหน่วยเดียวกับค่าของข้อมูล ถ้าส่วนเบี่ยงเบนมาตรฐานมีค่าน้อยหรือใกล้ศูนย์ หมายถึงข้อมูลมีการกระจายน้อยมากหรือข้อมูลเกาะกลุ่มกัน แต่ถ้าส่วนเบี่ยงเบนมาตรฐานมีค่ามากจะหมายถึงข้อมูลมีการกระจายมากหรือข้อมูลมีความแตกต่างกันนั่นเอง นักสถิตินิยมใช้ค่าส่วนเบี่ยงเบนมาตรฐานนี้ในการวัดการกระจายเนื่องจากมีการใช้ข้อมูลทุก ๆ ค่า หรือมีการนำข้อมูลทุกตัวมาคำนวณ ซึ่งจะทำให้ค่าการกระจายมีความละเอียดถูกต้องและเชื่อถือได้
3.1.3 การหาความสัมพันธ์ของชุดข้อมูล
การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างข้อมูล 2 ชุด (pairwise) จะบ่งบอกถึงทิศทาง (direction) ของความสัมพันธ์ และระดับ (degree) ของความสัมพันธ์ ทิศทางของความสัมพันธ์สามารถพิจารณาได้ 2 กรณี คือ
😘😘😘 นอกจากพิจารณาทิศทางของความสัมพันธ์แล้วยังต้องพิจารณาระดับของความสัมพันธ์ด้วยว่าอยู่ที่ระดับใด เช่น มาก (strong) ปานกลาง (moderate) หรือน้อย (weak) การวิเคราะห์ความสัมพันธ์เบื้องต้นสามารถทำได้โดยนำค่าของข้อมูลทั้งสองชุดมาสร้างแผนภาพการกระจาย ซึ่งทำให้เห็นทิศทางของความสัมพันธ์ได้ชัดเจนและสามารถประมาณระดับของความสัมพันธ์ได้
กิจกรรมที่ 3.1 ให้เลือกชุดข้อมูลใดข้อมูลหนึ่งแล้วสร้างแผนภาพการกระจายของข้อมูลและหาความสัมพันธ์ของชุดข้อมูลที่เลือก
1.ข้อมูลไฟป่า
1. จงหาค่าต่ำสุด และสูงสุดของแต่ละปัจจัย
2. อุณหภูมิช่วงใดสูงกว่าช่วงอื่น ๆ พร้อมแสดงแผนภาพให้เห็นผลลัพธ์ของคำตอบ
3. เดือนไหนฝนตกมากที่สุด พร้อมแสดงแผนภาพให้เห็นผลลัพธ์ของคำตอบ
2.สินค้าอุปโภคบริโภคของไทย
4. จงหาค่าต่ำสุด และสูงสุดของแต่ละปีของสินค้าแต่ละชนิด (พริกไทยดำคละ , ส้มเขียวหวาน , มังคุดคละ)
5. สินค้ากลุ่มผลไม้ใดที่ทำรายได้มากที่สุด พร้อมแสดงแผนภาพให้เห็นผลลัพธ์ของคำตอบ
3.ผลสอบ O-NET วิชาภาษาไทย คณิตศาสตร์ วิทยาศาสตร์ สังคม และภาษาอังกฤษ
6. จงหาคะแนนต่ำสุด สูงสุด และคะแนนเฉลี่ยของแต่ละปีของแต่ละวิชา
7. ในปีถัดไปคิดว่าแนวโน้มคะแนนต่ำสุด สูงสุด และคะแนนเฉลี่ยของวิชาภาษาไทย คณิตศาสตร์ และวิชาอังกฤษ จะเป็นอย่างไรพร้อมแสดงแผนภาพให้เห็นผลลัพธ์ของคำตอบ
กิจกรรมที่ 3.2 สัมพันธ์กันหรือไม่ (ใช้ไฟล์ข้อมูล “ไฟป่า” ในการตอบคำถาม)
ข้อที่ 1 ความสัมพันธ์ของค่าเฉลี่ยความชื้นของชั้นลึกปานกลางของเชื้อเพลง (DMC) กับ ค่าความชื้นของชั้นลึกสุดของเชื้อเพลิง (DC)
ข้อที่ 2 ความสัมพันธ์ของอุณหภูมิ (temp) กับ ความชื้นสัมพัทธ์ (RH)