โดย อ.เอ๋ ฐิติมา อดุลประเสริฐสุข ขอบคุณชุดรูปภาพจาก PIXAbay.com ในสูตรจึงนำความแปรปรวนมาถอดค่าราก เมื่อมองจากมุมนี้ ก็ดูไม่มีปัญหาอะไร แต่ถ้ามองเริ่มต้นจากสูตรของส่วนเบี่ยงเบนมาตรฐาน เราอาจจะเข้าใจในมุมของส่วนเบี่ยงเบนมาตรฐานว่า ค่าที่นำมาหาค่าเฉลี่ย ถ้าเราจับมาคูณกันเพื่อทำการหาค่าเฉลี่ย เราสามารถถอดค่ารากได้ทันที แต่ต้องเป็น"การถอดรากที่ N" นะ ค่าที่ได้นั้น จะเป็น"ค่าเฉลี่ย"ได้เลย โดยไม่ต้องทำอะไรต่ออีก เรียกค่าเฉลี่ยนี้ว่า "ค่าเฉลี่ยเรขาคณิต" แต่ถ้าค่าที่นำมาหาค่าเฉลี่ย เรานำมาบวกกัน เพื่อทำการหาค่าเฉลี่ย เราต้องนำมาหารเฉลี่ยด้วย N ค่าที่ได้จะเป็น"ค่าเฉลี่ย"ที่เรียกว่า"ค่าเฉลี่ยเลขคณิต" เนื่องจากเรานำค่าเหล่านี้มารวมกัน (คือผลบวก) การหาค่าเฉลี่ยจึงต้องออกมาในรูปหารเฉลี่ยด้วย N ก่อน เมื่ออยากได้ในรูปค่ากำลังหนึ่ง จึงค่อยมาถอดรากที่สองทีหลัง จึงเป็นเหตุผลว่า ทำไม N จึงต้องหารอยู่ภายในค่ารากที่สอง หารเฉลี่ยก่อนแล้วค่อยถอดรากถูกต้องแล้ว✓
ดังนั้น เวลาคำนวณหาส่วนเบี่ยงเบนมาตรฐาน อย่าลืมนำN เข้าไปหารภายในเครื่องหมายค่ารากด้วยเสมอ✓ เนื้อหาฉบับเต็ม เข้าใจดี statistics คลิกที่นี่ค่ะ โดย อ.เอ๋ ฐิติมา อดุลประเสริฐสุข ขอบคุณชุดรูปภาพจาก PIXAbay.com เมื่อทำการสุ่มตัวอย่าง ตัวอย่างที่ได้ จะเป็นข้อมูลบางส่วนของประชากร ค่าเฉลี่ยเลขคณิตของตัวอย่างที่สุ่มออกมา อาจเท่าหรือไม่เท่ากับค่าเฉลี่ยเลขคณิตของประชากร ขึ้นอยู่กับความสามารถในการสุ่มตัวอย่าง และจำนวนกลุ่มตัวอย่าง แต่โอกาสไม่เท่าจะมีมากกว่า ผลรวมของกำลังสองความยาวเส้นสีฟ้า จะน้อยกว่า ผลรวมของกำลังสองความยาวเส้นสีเทา
โดย อ.เอ๋ ฐิติมา อดุลประเสริฐสุข ขอบคุณชุดรูปภาพจาก PIXAbay.com ทำไมความน่าจะเป็นของตัวแปรสุ่มต่อเนื่องจึงเป็นพื้นที่ใต้กราฟ ? ตัวอย่าง กำหนดจำนวนเต็ม ตั้งแต่ 0 ถึง 10 หากให้เลือกจำนวนเต็มออกมา 1 จำนวน จะได้ว่า ตัวแปรสุ่ม X = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} มีทั้งหมด 11 จำนวน โดยที่ ความน่าจะเป็นที่แต่ละจำนวนจะถูกเลือกมีค่าเท่ากันทั้งหมด เท่ากับ 1/11 เขียนกราฟฟังก์ชันมวลความน่าจะเป็น (pmf.) ของตัวแปรสุ่ม X ได้ดังรูปที่ 1 รูปที่ 1 : กราฟฟังก์ชันมวลความน่าจะเป็นของตัวแปรสุ่มไม่ต่อเนื่อง X เมื่อเลือกจำนวนเต็ม 1 จำนวน จากจำนวนเต็ม ตั้งแต่ 0 ถึง 10 ตัวอย่าง กำหนดช่วงของจำนวนจริง [0, 1] หากให้เลือกจำนวนจริงออกมา 1 จำนวน จะได้ว่า ตัวแปรสุ่ม X = [0, 1] จะเห็นว่า ตัวแปรสุ่ม X เป็นตัวแปรสุ่มต่อเนื่อง ที่มีสมาชิกเป็นจำนวนอนันต์ ความน่าจะเป็นที่แต่ละจำนวนในช่วง [0, 1] จะถูกเลือก ควรมีค่าเท่ากันทั้งหมด สมมติให้มีค่าเท่ากับ c พิจารณาค่าที่ควรเป็นไปได้ของ c เนื่องจากจำนวนสมาชิกในช่วง [0, 1] มีเป็นจำนวนอนันต์ และ ความน่าจะเป็นที่แต่ละจำนวนจะถูกเลือกมีค่าเท่ากัน ทำให้ความน่าจะเป็นของแต่ละจำนวนที่จะถูกเลือก มีค่าน้อยมากๆ จนเข้าใกล้ 0 หากสรุปว่า c = 0 แสดงว่าทุกจำนวนมีความน่าจะเป็นที่จะถูกเลือก เท่ากับ 0 ทำให้ผลรวมความน่าจะเป็นทั้งหมดได้เท่ากับ 0 ซึ่งสิ่งนี้จะไปขัดแย้งกับหลักการของความน่าจะเป็น คือ ผลรวมความน่าจะเป็นทั้งหมด ต้องเท่ากับ 1 การพิจารณาแยกหาค่าความน่าจะเป็นของแต่ละค่าๆ จึงเป็นวิธีที่ไม่เหมาะสมนัก ในทางปฏิบัติ จึงหันมาพิจารณาค่าความน่าจะเป็นในรูปช่วงของค่า เช่น ผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] มีค่าเท่ากับ 1/4 พิจารณาการเขียนกราฟการแจกแจงความน่าจะเป็น จากผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] มีค่าเท่ากับ 1/4 เราไม่สามารถนำค่าความน่าจะเป็น1/4ไปลงเป็นค่าบนแกน Y ของกราฟการแจกแจงความน่าจะเป็นได้ เพราะ 1/4มิใช่ความน่าจะเป็นของค่าแต่ละค่า แต่เป็นผลรวมความน่าจะเป็นในช่วง [0.25, 0.5] ดังแสดงในรูปที่ 2 รูปที่ 2 : กราฟการแจกแจงความน่าจะเป็นที่จะได้จำนวนในช่วง [0.25, 0.5] เมื่อเลือกจากช่วง [0, 1] นักคณิตศาสตร์แก้ปัญหานี้ ด้วยการใส่ความน่าจะเป็นลงไปในรูป พื้นที่ จากผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] มีค่าเท่ากับ 1/4 นั่นคือ พื้นที่ในช่วง [0.25, 0.5] มีค่าเท่ากับ 1/4 ดังแสดงในรูปที่ 3 รูปที่ 3 : กราฟการแจกแจงความน่าจะเป็นที่จะได้จำนวนในช่วง [0.25, 0.5] เมื่อเลือกจากช่วง [0, 1] แต่เนื่องจาก การเลือกจำนวนจริง 1 จำนวนจากช่วง [0, 1] นั้น จำนวนทุกจำนวนในช่วง [0, 1] จะมีความน่าจะเป็นในการถูกเลือกเท่ากันทั้งหมด ดังนั้น เส้นกราฟที่จะทาให้คำนวณได้พื้นที่คงที่ตลอดช่วง [0, 1] ต้องเป็นเส้นตรงที่ขนานกับแกน X ดังแสดงในรูปที่ 4 รูปที่ 4 : กราฟการแจกแจงความน่าจะเป็นที่จะได้จำนวนในช่วง [0.25, 0.5] เมื่อเลือกจากช่วง [0, 1] เมื่อ ผลรวมความน่าจะเป็นของค่าทุกค่า ที่อยู่ในช่วง [0.25, 0.5] ที่เลือกจากช่วง [0, 1] ที่แสดงในรูปพื้นที่ มีค่าเท่ากับ1/4 จะเห็นว่า พื้นที่ใต้กราฟของเส้นตรงขนานกับแกน X จาก x = 0.25 ถึง x = 0.5 เป็นพื้นที่ที่อยู่ภายในรูปสี่เหลี่ยมมุมฉาก จากสูตร พื้นที่สี่เหลี่ยมมุมฉาก = ความกว้าง × ความยาว หรือ พื้นที่สี่เหลี่ยมมุมฉาก = ฐาน × สูง ดังนั้น ค่าบนแกน Y หรือ f(x) จะหาได้จาก การนำพื้นที่ใต้กราฟที่เป็นรูปสี่เหลี่ยมมุมฉาก มาหารด้วยช่วงระยะของ x หรือกล่าวได้ว่า f(x) คือ อัตราส่วนของพื้นที่ใต้กราฟต่อช่วงระยะของx อีกนัยหนึ่ง จะเรียก f(x) ว่าเป็น ค่าความหนาแน่นของความน่าจะเป็น (probability density) จึงเรียก ฟังก์ชัน f ว่า ฟังก์ชันความหนาแน่นความน่าจะเป็น (probability density function : p.d.f.) หมายเหตุ : 1. เทียบเคียงได้กับสูตร (ความหนาแน่น) ความสัมพันธ์ระหว่างความหนาแน่น มวล และปริมาตรแสดงได้ดังรูปที่ 5 รูปที่ 5 : กราฟแสดงความสัมพันธ์ระหว่างความหนาแน่น มวล และปริมาตร โดยเป้าหมายหลักที่ต้องการจากกราฟแจกแจงความน่าจะเป็น คือ ค่าความน่าจะเป็น ซึ่งถูกเรียกว่า มวล (M) สำหรับตัวแปรสุ่มไม่ต่อเนื่อง : เมื่อแกน Y เป็นค่าของ M (มวล) ที่หมายถึง ค่าความน่าจะเป็น ตรงกับที่ต้องการอยู่แล้ว จึงเรียกเส้นกราฟว่าเป็น เส้นกราฟมวลความน่าจะเป็น และเรียกฟังก์ชันว่าเป็น ฟังก์ชันมวลความน่าจะเป็น (pmf.) สำหรับตัวแปรสุ่มต่อเนื่อง : เมื่อแกน Y เป็นค่าของ D (ความหนาแน่นของความน่าจะเป็น) จึงเรียกเส้นกราฟว่าเป็น เส้นกราฟความหนาแน่นความน่าจะเป็น และเรียกฟังก์ชันว่าเป็น ฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf.) แล้วนำ pdf. ไปใช้หาพื้นที่ใต้กราฟที่ทำหน้าที่เป็น M (มวล) ซึ่งหมายถึง ค่าความน่าจะเป็น ที่ต้องการ 2. เส้นกราฟความหนาแน่นความน่าจะเป็น ไม่จำเป็นต้องเป็นเส้นตรงเพียงอย่างเดียว อาจอยู่ในรูปเส้นโค้งใดๆ ก็ได้
แต่การยกตัวอย่างด้วยเส้นตรง เพื่อให้เห็นความสัมพันธ์ระหว่างพื้นที่, ค่าบนแกน X และค่าบนแกน Y เท่านั้น ซึ่งจะทำให้สามารถอธิบายผ่านรูปเรชาคณิตที่เข้าใจง่ายได้ เนื้อหาฉบับเต็มคลิกที่นี่ ตัวแปรสุ่มและการแจกแจงความน่าจะเป็น |