สาระสำคัญ การคาดการณ์หรือการรู้อนาคตเป็นสิ่งที่คนส่วนใหญ่ให้ความสำคัญ เพื่อนำมาประกอบการตัดสินใจให้สามารถเลือกสิ่งที่ดีที่สุดสำหรับตัวเองหรือองค์กรได้ ในเชิงธุรกิจผู้ประกอบการอาจมีความต้องการที่จะรู้ว่าการลงทุนกับสินค้าชนิดใดแล้วจะได้กำไรเท่าไร เพื่อให้เลือกลงทุนได้อย่างเหมาะสม สำหรับบุคคลทั่วไป อาจมีความต้องการที่จะคาดการณ์สิ่งที่จะเกิดขึ้นในชีวิตประจำวัน เช่น ก่อนออกจากบ้านอาจต้องการที่จะคาดการณ์ว่าฝนจะตกหรือไม่ จะได้นำร่มติดตัวไปด้วย
การทำนายเชิงหมวดหมู่ คือการทำนายข้อมูลที่สนใจที่ไม่ใช่ข้อมูลตัวเลขจากข้อมูลอีกชุดหนึ่งที่มีความสัมพันธ์กัน เช่น การทำนายว่าฝนจะตกหรือไม่ (ตกหรือไม่ตก) อาหารโปรด (ต้มยำกุ้ง , ผัดไทย , กะเพราไก่) แนวเพลงที่ชอบ (Jazz , Pop , Rock , R&B) ประเภทเครื่องดื่ม (น้ำอัดลม , น้ำผลไม้) เป็นต้น แนวคิดหลักในการทำนาย คือใช้ข้อมูลในอดีตที่มีการระบุหมวดหมู่มาแล้วเพื่อทำนายข้อมูลชุดใหม่ที่ยังไม่ทราบหมวดหมู่ เทคนิคที่ใช้ในการจัดหมวดหมู่นั้นมีหลากหลายในที่นี้จะกล่าวถึงการจัดหมวดหมู่ด้วยวิธีการค้นหาเพื่อบ้านใกล้เคียงที่สุด K ตัว (K-Kearest Neighbors: K-NN)
แนวคิดหลักของเทคนิคการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว คือ การเทียบเคียงข้อมูลใหม่ที่ยังไม่ได้จัดหมวดหมู่กับข้อมูลเดิมที่ถูกจัดหมวดหมู่ไว้แล้วซึ่งการเทียบเคียงจะเทียบเคียงข้อมูลใหม่กับข้อมูลเดิมที่มีระยะห่างน้อยที่สุดก่อนแล้วเปรียบเทียบกับข้อมูลเดิมที่มีระยะห่างจากข้อมูลใหม่ถัดออกไปตามลำดับจนกระทั้งครบ K ตัว และใช้ข้อมูลดังกล่าวเพื่อระบุหมวดหมู่ให้กับข้อมูลใหม่ได้
การประเมินความถูกต้องในการจําแนกกลุ่มข้อมูลเพื่อทํานายผลในอนาคตเป็นสิ่งสําคัญมาก เพราะหากผลการทํานายผิดพลาดอาจเกิดความเสียหายเมื่อนําไปใช้จริง ซึ่งการประเมินความถูกต้องควรนําไปทดสอบกับชุดข้อมูลที่ทราบคําตอบอยู่แล้ว ซึ่งมักเป็นข้อมูลชุดเดียวกันกับข้อมูลตั้งต้น แต่ถูกแยกไว้เฉพาะเพื่อการประเมิน ส่วนที่เหลือสามารถนําไปใช้เป็นเครื่องมือในการทํานาย
สรุป
การวิเคราะห์ข้อมูลเป็นการดำเนินการกับข้อมูลเพื่อให้เกิดความเข้าใจข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา โดยผล ลัพธ์ของการวิเคราะห์ข้อมูลสามารถนำไปประกอบการตัดสินใจ เพื่อให้เกิดประโยชน์สูงสุดต่อการดำเนินการของบุคคลหรือองค์กร
การวิเคราะห์เชิงพรรณนา เป็นการวิเคราะห์ที่ทำให้เห็นภาพรวมของข้อมูลรูปแบบของข้อมูลและความสัมพันธ์ระหว่างข้อมูล
การวิเคราะห์เชิงทำนาย ดำเนินการต่อจากการวิเคราะห์เชิงพรรณนา หลังจากที่พบว่าข้อมูลมีความสัมพันธ์กันโดยนำข้อมูลที่สัมพันธ์กันนั้นมาสร้างเป็นรูปแบบเพื่อการทำนายหรือคาดการณ์สิ่งที่น่าจะเกิดขึ้นในอนาคต
ในการแนะนำทางเลือกที่เหมาะสมที่สุดกับสถานการณ์ที่จะเป็นไปได้ การดำเนินการวิเคราะห์ข้อมูลสามารถเลือกใช้วิธีและเครื่องมือที่เหมาะสมเพื่อช่วยในการวิเคราะห์ข้อมูล โดยเครื่องมือที่เลือกใช้อาจเป็นโปรแกรมตารางการทำงาน หรือการเขียนโปรแกรมภาษาเพื่อช่วยเพิ่มความแม่นยำของผลลัพธ์ที่ได้จากการดำเนินการวิเคราะห์ข้อมูล
กิจกรรมที่ 3.4 k ไหนดีกว่า
ให้นักเรียนลองใช้ขั้นตอนวิธี K-NN เพื่อทำนายว่าในวันที่อุณหภูมิ 18 องศา และความชื้นสัมพันธ์เท่ากับ 44% จะเกิดไฟป่าหรือไม่ นำผลการจำแนกด้วยค่า k ที่ได้แล้วทำการทดสอบด้วยข้อมูลที่แยกไว้เพื่อตัดสินว่าค่า K ไหนทำนายได้แม่นยำที่สุด