โดย อ.เอ๋ ฐิติมา อดุลประเสริฐสุข ขอบคุณชุดรูปภาพจาก PIXAbay.com ทำไมความน่าจะเป็นของตัวแปรสุ่มต่อเนื่องจึงเป็นพื้นที่ใต้กราฟ ? ตัวอย่าง กำหนดจำนวนเต็ม ตั้งแต่ 0 ถึง 10 หากให้เลือกจำนวนเต็มออกมา 1 จำนวน จะได้ว่า ตัวแปรสุ่ม X = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} มีทั้งหมด 11 จำนวน โดยที่ ความน่าจะเป็นที่แต่ละจำนวนจะถูกเลือกมีค่าเท่ากันทั้งหมด เท่ากับ 1/11 เขียนกราฟฟังก์ชันมวลความน่าจะเป็น (pmf.) ของตัวแปรสุ่ม X ได้ดังรูปที่ 1 รูปที่ 1 : กราฟฟังก์ชันมวลความน่าจะเป็นของตัวแปรสุ่มไม่ต่อเนื่อง X เมื่อเลือกจำนวนเต็ม 1 จำนวน จากจำนวนเต็ม ตั้งแต่ 0 ถึง 10 ตัวอย่าง กำหนดช่วงของจำนวนจริง [0, 1] หากให้เลือกจำนวนจริงออกมา 1 จำนวน จะได้ว่า ตัวแปรสุ่ม X = [0, 1] จะเห็นว่า ตัวแปรสุ่ม X เป็นตัวแปรสุ่มต่อเนื่อง ที่มีสมาชิกเป็นจำนวนอนันต์ ความน่าจะเป็นที่แต่ละจำนวนในช่วง [0, 1] จะถูกเลือก ควรมีค่าเท่ากันทั้งหมด สมมติให้มีค่าเท่ากับ c พิจารณาค่าที่ควรเป็นไปได้ของ c เนื่องจากจำนวนสมาชิกในช่วง [0, 1] มีเป็นจำนวนอนันต์ และ ความน่าจะเป็นที่แต่ละจำนวนจะถูกเลือกมีค่าเท่ากัน ทำให้ความน่าจะเป็นของแต่ละจำนวนที่จะถูกเลือก มีค่าน้อยมากๆ จนเข้าใกล้ 0 หากสรุปว่า c = 0 แสดงว่าทุกจำนวนมีความน่าจะเป็นที่จะถูกเลือก เท่ากับ 0 ทำให้ผลรวมความน่าจะเป็นทั้งหมดได้เท่ากับ 0 ซึ่งสิ่งนี้จะไปขัดแย้งกับหลักการของความน่าจะเป็น คือ ผลรวมความน่าจะเป็นทั้งหมด ต้องเท่ากับ 1 การพิจารณาแยกหาค่าความน่าจะเป็นของแต่ละค่าๆ จึงเป็นวิธีที่ไม่เหมาะสมนัก ในทางปฏิบัติ จึงหันมาพิจารณาค่าความน่าจะเป็นในรูปช่วงของค่า เช่น ผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] มีค่าเท่ากับ 1/4 พิจารณาการเขียนกราฟการแจกแจงความน่าจะเป็น จากผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] มีค่าเท่ากับ 1/4 เราไม่สามารถนำค่าความน่าจะเป็น1/4ไปลงเป็นค่าบนแกน Y ของกราฟการแจกแจงความน่าจะเป็นได้ เพราะ 1/4มิใช่ความน่าจะเป็นของค่าแต่ละค่า แต่เป็นผลรวมความน่าจะเป็นในช่วง [0.25, 0.5] ดังแสดงในรูปที่ 2 รูปที่ 2 : กราฟการแจกแจงความน่าจะเป็นที่จะได้จำนวนในช่วง [0.25, 0.5] เมื่อเลือกจากช่วง [0, 1] นักคณิตศาสตร์แก้ปัญหานี้ ด้วยการใส่ความน่าจะเป็นลงไปในรูป พื้นที่ จากผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] มีค่าเท่ากับ 1/4 นั่นคือ พื้นที่ในช่วง [0.25, 0.5] มีค่าเท่ากับ 1/4 ดังแสดงในรูปที่ 3 รูปที่ 3 : กราฟการแจกแจงความน่าจะเป็นที่จะได้จำนวนในช่วง [0.25, 0.5] เมื่อเลือกจากช่วง [0, 1] แต่เนื่องจาก การเลือกจำนวนจริง 1 จำนวนจากช่วง [0, 1] นั้น จำนวนทุกจำนวนในช่วง [0, 1] จะมีความน่าจะเป็นในการถูกเลือกเท่ากันทั้งหมด ดังนั้น เส้นกราฟที่จะทาให้คำนวณได้พื้นที่คงที่ตลอดช่วง [0, 1] ต้องเป็นเส้นตรงที่ขนานกับแกน X ดังแสดงในรูปที่ 4 รูปที่ 4 : กราฟการแจกแจงความน่าจะเป็นที่จะได้จำนวนในช่วง [0.25, 0.5] เมื่อเลือกจากช่วง [0, 1] เมื่อ ผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] ที่แสดงในรูปพื้นที่ มีค่าเท่ากับ1/4 จะเห็นว่า พื้นที่ใต้กราฟของเส้นตรงขนานกับแกน X จาก x = 0.25 ถึง x = 0.5 เป็นพื้นที่ที่อยู่ภายในรูปสี่เหลี่ยมมุมฉาก จากสูตร พื้นที่สี่เหลี่ยมมุมฉาก = ความกว้าง × ความยาว หรือ พื้นที่สี่เหลี่ยมมุมฉาก = ฐาน × สูง ดังนั้น ค่าบนแกน Y หรือ f(x) จะหาได้จาก การนำพื้นที่ใต้กราฟที่เป็นรูปสี่เหลี่ยมมุมฉาก มาหารด้วยช่วงระยะของ x หรือกล่าวได้ว่า f(x) คือ อัตราส่วนของพื้นที่ใต้กราฟต่อช่วงระยะของx อีกนัยหนึ่ง จะเรียก f(x) ว่าเป็น ค่าความหนาแน่นของความน่าจะเป็น (probability density) จึงเรียก ฟังก์ชัน f ว่า ฟังก์ชันความหนาแน่นความน่าจะเป็น (probability density function : p.d.f.) หมายเหตุ : 1. เทียบเคียงได้กับสูตร (ความหนาแน่น) ความสัมพันธ์ระหว่างความหนาแน่น มวล และปริมาตรแสดงได้ดังรูปที่ 5 รูปที่ 5 : กราฟแสดงความสัมพันธ์ระหว่างความหนาแน่น มวล และปริมาตร โดยเป้าหมายหลักที่ต้องการจากกราฟแจกแจงความน่าจะเป็น คือ ค่าความน่าจะเป็น ซึ่งถูกเรียกว่า มวล (M) สำหรับตัวแปรสุ่มไม่ต่อเนื่อง : เมื่อแกน Y เป็นค่าของ M (มวล) ที่หมายถึง ค่าความน่าจะเป็น ตรงกับที่ต้องการอยู่แล้ว จึงเรียกเส้นกราฟว่าเป็น เส้นกราฟมวลความน่าจะเป็น และเรียกฟังก์ชันว่าเป็น ฟังก์ชันมวลความน่าจะเป็น (pmf.) สำหรับตัวแปรสุ่มต่อเนื่อง : เมื่อแกน Y เป็นค่าของ D (ความหนาแน่นของความน่าจะเป็น) จึงเรียกเส้นกราฟว่าเป็น เส้นกราฟความหนาแน่นความน่าจะเป็น และเรียกฟังก์ชันว่าเป็น ฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf.) แล้วนำ pdf. ไปใช้หาพื้นที่ใต้กราฟที่ทำหน้าที่เป็น M (มวล) ซึ่งหมายถึง ค่าความน่าจะเป็น ที่ต้องการ 2. เส้นกราฟความหนาแน่นความน่าจะเป็น ไม่จำเป็นต้องเป็นเส้นตรงเพียงอย่างเดียว อาจอยู่ในรูปเส้นโค้งใดๆ ก็ได้
แต่การยกตัวอย่างด้วยเส้นตรง เพื่อให้เห็นความสัมพันธ์ระหว่างพื้นที่, ค่าบนแกน X และค่าบนแกน Y เท่านั้น ซึ่งจะทำให้สามารถอธิบายผ่านรูปเรชาคณิตที่เข้าใจง่ายได้ เนื้อหาฉบับเต็มคลิกที่นี่ ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น Comments are closed.
|