สูตรความน่าจะเป็นทั้งหมด สูตรเบย์ คำอธิบายง่ายๆ ของทฤษฎีบทของเบย์ส
ทฤษฎีบทของ Bayes มีการอธิบายโดยละเอียดในบทความแยกต่างหาก เป็นผลงานที่มหัศจรรย์ แต่มีความยาวถึง 15,000 คำ การแปลบทความเดียวกันจาก Kalid Azad อธิบายโดยย่อถึงสาระสำคัญของทฤษฎีบท
- ผลการวิจัยและการทดสอบไม่ใช่เหตุการณ์มีวิธีการวินิจฉัยโรคมะเร็งและมีเหตุการณ์เกิดขึ้นคือการปรากฏตัวของโรค อัลกอริทึมจะตรวจสอบว่าข้อความมีสแปมหรือไม่ แต่เหตุการณ์ (สแปมมาถึงทางไปรษณีย์จริง ๆ ) จะต้องพิจารณาแยกต่างหากจากผลงาน
- มีข้อผิดพลาดในผลการทดสอบบ่อยครั้งที่วิธีการวิจัยของเราเผยให้เห็นสิ่งที่ไม่มีอยู่ (ผลบวกลวง) และไม่ได้ระบุว่ามีอะไรอยู่ (ผลลบลวง)
- ด้วยความช่วยเหลือของการทดสอบ เราจะได้รับความน่าจะเป็นของผลลัพธ์ที่แน่นอนบ่อยครั้งที่เราพิจารณาผลการทดสอบเพียงอย่างเดียวและไม่คำนึงถึงข้อผิดพลาดของวิธีการ
- เท็จ ผลลัพธ์ที่เป็นบวกบิดเบือนภาพสมมติว่าคุณกำลังพยายามระบุปรากฏการณ์ที่หายากมาก (1 รายใน 1,000,000) แม้ว่าวิธีการของคุณจะแม่นยำ แต่มีโอกาสที่ผลลัพธ์เชิงบวกของคุณจะเป็นผลบวกลวงจริงๆ
- สะดวกกว่าในการทำงานกับตัวเลขธรรมชาติดีกว่าที่จะพูดว่า: 100 จาก 10,000 ไม่ใช่ 1% ด้วยวิธีนี้ข้อผิดพลาดจะน้อยลง โดยเฉพาะเมื่อทำการคูณ สมมติว่าเราต้องดำเนินการกับ 1% นี้ต่อไป การใช้เหตุผลเป็นเปอร์เซ็นต์เป็นเรื่องที่งุ่มง่าม: “ใน 80% ของกรณีจาก 1% ให้ผลลัพธ์ที่เป็นบวก” ข้อมูลเข้าใจง่ายกว่ามากดังนี้: “ใน 80 กรณีจาก 100 กรณีมีการสังเกตผลลัพธ์ที่เป็นบวก”
- แม้แต่ในทางวิทยาศาสตร์ ข้อเท็จจริงใดๆ ก็ตามเป็นเพียงผลลัพธ์ของการประยุกต์ใช้วิธีการเท่านั้นจากมุมมองเชิงปรัชญา การทดลองทางวิทยาศาสตร์เป็นเพียงการทดสอบที่อาจเกิดข้อผิดพลาดได้ มีวิธีการที่เปิดเผย สารเคมีหรือปรากฏการณ์บางอย่าง คือ เหตุการณ์นั้นเอง - การมีอยู่ของปรากฏการณ์นี้ วิธีทดสอบของเราสามารถให้ได้ ผลลัพธ์เท็จและอุปกรณ์ใดๆก็มีข้อผิดพลาดโดยธรรมชาติ
- หากเราทราบความน่าจะเป็นของเหตุการณ์และความน่าจะเป็นของผลบวกลวงและผลลบลวง เราก็สามารถแก้ไขข้อผิดพลาดในการวัดได้
- ทฤษฎีบทเชื่อมโยงความน่าจะเป็นของเหตุการณ์หนึ่งกับความน่าจะเป็นของผลลัพธ์ที่แน่นอน เราเชื่อมโยง Pr(A|X): ความน่าจะเป็นของเหตุการณ์ A เมื่อกำหนดผลลัพธ์ X และ Pr(X|A): ความน่าจะเป็นของผลลัพธ์ X เมื่อพิจารณาจากเหตุการณ์ A
มาทำความเข้าใจวิธีการกัน
บทความที่เชื่อมโยงในตอนต้นของบทความนี้จะตรวจสอบวิธีการวินิจฉัย (แมมโมแกรม) ที่ตรวจพบมะเร็งเต้านม ลองพิจารณาวิธีนี้โดยละเอียด- 1% ของผู้หญิงทั้งหมดเป็นมะเร็งเต้านม (และด้วยเหตุนี้ 99% จึงไม่ได้รับ)
- 80% ของการตรวจแมมโมแกรมตรวจพบโรคเมื่อมีอยู่จริง (และ 20% ตรวจไม่พบ)
- 9.6% ของการทดสอบตรวจพบมะเร็งเมื่อไม่มีเลย (และด้วยเหตุนี้ 90.4% จึงสามารถตรวจพบผลลัพธ์เชิงลบได้อย่างถูกต้อง)
จะทำงานกับข้อมูลนี้อย่างไร?
- ผู้หญิง 1% เป็นมะเร็งเต้านม
- หากผู้ป่วยมีโรคให้ดูคอลัมน์แรกมีโอกาส 80% ที่วิธีนี้ให้ ผลลัพธ์ที่ถูกต้องและมีโอกาส 20% ที่ผลการทดสอบจะไม่ถูกต้อง (ผลลบลวง)
- หากไม่สามารถระบุโรคของผู้ป่วยได้ ให้ดูคอลัมน์ที่สอง ด้วยความน่าจะเป็น 9.6% เราสามารถพูดได้ว่าผลการทดสอบเชิงบวกนั้นไม่ถูกต้อง และด้วยความน่าจะเป็น 90.4% เราสามารถพูดได้ว่าผู้ป่วยมีสุขภาพแข็งแรงอย่างแท้จริง
วิธีการมีความแม่นยำเพียงใด?
ตอนนี้เรามาดูผลการทดสอบที่เป็นบวกกัน ความน่าจะเป็นที่บุคคลนั้นป่วยจริงคือเท่าไร: 80%, 90%, 1%?ลองคิดดู:
- มีผลในเชิงบวก ลองดูผลลัพธ์ที่เป็นไปได้ทั้งหมด: ผลลัพธ์อาจเป็นได้ทั้งผลบวกจริงหรือผลบวกลวง
- ความน่าจะเป็นของผลบวกที่แท้จริงจะเท่ากับ: ความน่าจะเป็นที่จะเป็นโรคคูณกับความน่าจะเป็นที่การทดสอบตรวจพบโรคจริง 1% * 80% = .008
- ความน่าจะเป็นของผลบวกลวงเท่ากับ: ความน่าจะเป็นที่ไม่มีโรคคูณกับความน่าจะเป็นที่วิธีการตรวจพบโรคไม่ถูกต้อง 99% * 9.6% = .09504
ความน่าจะเป็นที่บุคคลจะป่วยจริงหากได้รับการตรวจแมมโมแกรมเป็นบวกคือเท่าใด ความน่าจะเป็นของเหตุการณ์คืออัตราส่วนของจำนวนผลลัพธ์ที่เป็นไปได้ของเหตุการณ์ต่อจำนวนผลลัพธ์ที่เป็นไปได้ทั้งหมด
ความน่าจะเป็นของเหตุการณ์ = ผลลัพธ์ของเหตุการณ์ / ผลลัพธ์ที่เป็นไปได้ทั้งหมด
ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกที่แท้จริงคือ .008 ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกคือความน่าจะเป็นของผลลัพธ์ที่เป็นบวกจริง + ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกลวง
(.008 + 0.09504 = .10304)
ดังนั้น ความน่าจะเป็นของโรคที่ผลการตรวจเป็นบวกจึงคำนวณได้ดังนี้ .008/.10304 = 0.0776 ค่านี้คือประมาณ 7.8%
นั่นคือผลการตรวจแมมโมแกรมที่เป็นบวกเพียงหมายความว่าความน่าจะเป็นที่จะเป็นโรคคือ 7.8% ไม่ใช่ 80% (ค่าหลังเป็นเพียงความแม่นยำโดยประมาณของวิธีการ) ผลลัพธ์นี้ดูเหมือนเข้าใจยากและแปลกในตอนแรก แต่คุณต้องคำนึงถึง: วิธีการนี้ให้ผลลัพธ์ที่ผิดพลาดในกรณี 9.6% (ซึ่งค่อนข้างมาก) ดังนั้นจะมีผลลัพธ์ที่เป็นบวกปลอมมากมายในตัวอย่าง สำหรับ โรคที่หายากผลลัพธ์เชิงบวกส่วนใหญ่จะเป็นผลบวกลวง
ลองดูที่ตารางแล้วพยายามเข้าใจความหมายของทฤษฎีบทโดยสัญชาตญาณ หากเรามี 100 คน จะมีเพียง 1 คนเท่านั้นที่เป็นโรคนี้ (1%) สำหรับบุคคลนี้มีโอกาส 80% ที่วิธีนี้จะให้ผลลัพธ์ที่เป็นบวก ส่วนที่เหลืออีก 99% นั้น 10% จะให้ผลลัพธ์ที่เป็นบวก ซึ่งพูดคร่าวๆ ให้เราทราบคือผลบวกลวง 10 รายการจาก 100 รายการ หากเราพิจารณาผลลัพธ์ที่เป็นบวกทั้งหมด จะมีเพียง 1 ใน 11 เท่านั้นที่เป็นจริง ดังนั้น หากผลเป็นบวก ความน่าจะเป็นของโรคจะเป็น 1/11
ข้างต้นเราคำนวณว่าความน่าจะเป็นนี้คือ 7.8% นั่นคือ จริงๆ แล้วตัวเลขนั้นใกล้กับ 1/13 มากขึ้น แต่ด้วยเหตุผลง่ายๆ บางประการ เราจึงสามารถหาค่าประมาณคร่าวๆ ได้โดยไม่ต้องใช้เครื่องคิดเลข
ทฤษฎีบทของเบย์
ตอนนี้เรามาอธิบายขบวนความคิดของเราโดยใช้สูตรที่เรียกว่าทฤษฎีบทของเบย์ ทฤษฎีบทนี้ช่วยให้คุณสามารถแก้ไขผลการศึกษาตามการบิดเบือนที่เกิดจากผลลัพธ์บวกลวง:- Pr(A|X) = ความน่าจะเป็นของโรค (A) เมื่อให้ผลเป็นบวก (X) นี่คือสิ่งที่เราอยากรู้จริงๆ ความน่าจะเป็นของเหตุการณ์จะเป็นเท่าใดหากผลลัพธ์เป็นบวก ในตัวอย่างของเราคือ 7.8%
- Pr(X|A) = ความน่าจะเป็นของผลบวก (X) กรณีผู้ป่วยป่วยจริงๆ (A) ในกรณีของเรา นี่คือค่าบวกที่แท้จริง - 80%
- Pr(A) = ความน่าจะเป็นที่จะป่วย (1%)
- Pr(ไม่ใช่ A) = ความน่าจะเป็นที่จะไม่ป่วย (99%)
- Pr(X|ไม่ใช่ A) = ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกของการศึกษาหากไม่มีโรค นี่คืออัตราผลบวกลวง - 9.6%
Pr(X) คือค่าคงที่การทำให้เป็นมาตรฐาน มันช่วยเราได้ดี หากไม่มีมัน ผลการทดสอบที่เป็นบวกจะทำให้เรามีโอกาส 80% ที่เหตุการณ์จะเกิดขึ้น
Pr(X) คือความน่าจะเป็นของผลลัพธ์เชิงบวกใดๆ ไม่ว่าจะเป็นผลลัพธ์เชิงบวกที่แท้จริงในการศึกษาของผู้ป่วย (1%) หรือผลลัพธ์บวกลวงในการศึกษา คนที่มีสุขภาพดี (99%).
ในตัวอย่างของเรา Pr(X) เป็นจำนวนที่ค่อนข้างมาก เนื่องจากความน่าจะเป็นของผลบวกลวงมีสูง
Pr(X) ให้ผลลัพธ์ 7.8% ซึ่งเมื่อดูเผินๆ ดูเหมือนจะขัดกับสัญชาตญาณ
ความหมายของทฤษฎีบท
เรากำลังดำเนินการทดสอบเพื่อค้นหาสถานการณ์ที่แท้จริง หากการทดสอบของเราสมบูรณ์แบบและแม่นยำ ความน่าจะเป็นของการทดสอบและความน่าจะเป็นของเหตุการณ์ต่างๆ ก็จะตรงกัน ผลลัพธ์เชิงบวกทั้งหมดจะเป็นบวกอย่างแท้จริง และผลลัพธ์เชิงลบทั้งหมดจะเป็นลบ แต่เราอยู่. โลกแห่งความจริง- และในโลกของเรา การทดสอบให้ผลลัพธ์ที่ไม่ถูกต้อง ทฤษฎีบทของเบย์อธิบายถึงผลลัพธ์ที่มีอคติ แก้ไขข้อผิดพลาด สร้างประชากรขึ้นใหม่ และค้นหาความน่าจะเป็นที่จะเป็นบวกอย่างแท้จริงตัวกรองสแปม
ทฤษฎีบทของ Bayes ถูกนำมาใช้อย่างประสบความสำเร็จในตัวกรองสแปมเรามี:
- เหตุการณ์ A - สแปมในจดหมาย
- ผลการทดสอบ - เนื้อหาของคำบางคำในตัวอักษร:
ตัวกรองจะพิจารณาผลการทดสอบ (เนื้อหาของคำบางคำในตัวอักษร) และคาดการณ์ว่าจดหมายนั้นมีสแปมหรือไม่ ทุกคนเข้าใจดีว่า ตัวอย่างเช่น คำว่า "ไวอากร้า" มักพบในสแปมมากกว่าในตัวอักษรทั่วไป
ตัวกรองสแปมตามบัญชีดำมีข้อเสีย - มักจะให้ผลลัพธ์ที่ผิดพลาด
ตัวกรองสแปมทฤษฎีบทของ Bayes ใช้วิธีการที่สมดุลและชาญฉลาด: ใช้ได้กับความน่าจะเป็น เมื่อเราวิเคราะห์คำในอีเมล เราสามารถคำนวณความเป็นไปได้ที่อีเมลนั้นเป็นสแปม แทนที่จะตัดสินใจใช่หรือไม่ใช่ หากความน่าจะเป็นที่จดหมายมีสแปมคือ 99% แสดงว่าจดหมายนั้นมีอยู่จริง
เมื่อเวลาผ่านไป ตัวกรองจะได้รับการฝึกกับตัวอย่างที่มีขนาดใหญ่ขึ้นเรื่อยๆ และอัปเดตความน่าจะเป็น ดังนั้น ตัวกรองขั้นสูงที่สร้างขึ้นตามทฤษฎีบทของ Bayes จะตรวจสอบคำหลายคำติดต่อกันและใช้เป็นข้อมูล
แหล่งข้อมูลเพิ่มเติม:
แท็ก: เพิ่มแท็ก
แบบฟอร์มกิจกรรม เต็มกลุ่มหากอย่างน้อยหนึ่งรายการจะเกิดขึ้นอย่างแน่นอนอันเป็นผลมาจากการทดลองและเข้ากันไม่ได้แบบคู่
สมมุติว่าเหตุการณ์นั้น กสามารถเกิดขึ้นได้เฉพาะกับหนึ่งในหลายเหตุการณ์ที่เข้ากันไม่ได้แบบคู่ซึ่งก่อตัวเป็นกลุ่มที่สมบูรณ์ เราจะเรียกกิจกรรม ( ฉัน= 1, 2,…, n) สมมติฐานประสบการณ์เพิ่มเติม (นิรนัย) ความน่าจะเป็นที่จะเกิดเหตุการณ์ A ถูกกำหนดโดยสูตร ความน่าจะเป็นเต็ม :
ตัวอย่างที่ 16มีโกศอยู่สามองค์ โกศแรกประกอบด้วยลูกบอลสีขาว 5 ลูกและสีดำ 3 ลูก โกศที่สองมีลูกบอลสีขาว 4 ลูกและสีดำ 4 ลูก และโกศที่สามมีลูกบอลสีขาว 8 ลูก โกศหนึ่งอันจะถูกเลือกโดยการสุ่ม (เช่น อาจหมายความว่าตัวเลือกนั้นทำจากโกศเสริมที่มีลูกบอลสามลูกหมายเลข 1, 2 และ 3) ลูกบอลจะถูกสุ่มออกมาจากโกศนี้ ความน่าจะเป็นที่จะเป็นสีดำเป็นเท่าใด?
สารละลาย.เหตุการณ์ ก– ลูกบอลสีดำจะถูกลบออก หากรู้ว่าลูกบอลถูกดึงมาจากโกศใด ความน่าจะเป็นที่ต้องการสามารถคำนวณได้โดยใช้คำจำกัดความดั้งเดิมของความน่าจะเป็น ให้เราแนะนำสมมติฐาน (สมมติฐาน) เกี่ยวกับโกศที่ถูกเลือกเพื่อดึงลูกบอล
ลูกบอลสามารถดึงมาจากโกศแรก (การคาดเดา) หรือจากโกศที่สอง (การคาดเดา) หรือจากโกศที่สาม (การคาดเดา) เนื่องจากมีโอกาสเท่าเทียมกันในการเลือกโกศอันใดอันหนึ่ง .
มันเป็นไปตามนั้น
ตัวอย่างที่ 17หลอดไฟฟ้าผลิตขึ้นที่โรงงานสามแห่ง โรงงานแรกผลิตได้ 30% จำนวนทั้งหมดหลอดไฟฟ้าวินาที – 25%
และที่สาม - ส่วนที่เหลือ ผลิตภัณฑ์ของโรงงานแห่งแรกประกอบด้วยหลอดไฟฟ้าที่มีข้อบกพร่อง 1% ชิ้นที่สอง - 1.5% ชิ้นที่สาม - 2% ทางร้านรับสินค้าจากโรงงานทั้งสามแห่ง ความน่าจะเป็นที่หลอดไฟที่ซื้อในร้านค้าจะชำรุดคือเท่าไร?
สารละลาย.จะต้องตั้งสมมติฐานเกี่ยวกับโรงงานที่ผลิตหลอดไฟ เมื่อรู้เช่นนี้แล้ว เราก็จะพบความน่าจะเป็นที่จะมีข้อบกพร่องได้ ให้เราแนะนำสัญกรณ์สำหรับเหตุการณ์: ก– หลอดไฟฟ้าที่ซื้อมาชำรุด – หลอดไฟฟ้าผลิตโดยโรงงานแห่งที่ 1 – หลอดไฟฟ้าผลิตโดยโรงงานแห่งที่ 2
– โคมไฟผลิตโดยโรงงานแห่งที่สาม
เราค้นหาความน่าจะเป็นที่ต้องการโดยใช้สูตรความน่าจะเป็นทั้งหมด:
สูตรเบย์ อนุญาต เป็นกลุ่มที่สมบูรณ์ของเหตุการณ์ที่เข้ากันไม่ได้แบบคู่ (สมมติฐาน) ก– เหตุการณ์สุ่ม แล้ว,
สูตรสุดท้ายที่ช่วยให้สามารถประมาณความน่าจะเป็นของสมมติฐานใหม่หลังจากผลการทดสอบที่ทำให้เกิดเหตุการณ์ A เรียกว่า สูตรเบย์ .
ตัวอย่างที่ 18โดยเฉลี่ยแล้ว 50% ของผู้ป่วยโรคนี้จะเข้ารับการรักษาในโรงพยาบาลเฉพาะทาง ถึง, 30% – มีโรค ล, 20 % –
ด้วยความเจ็บป่วย ม- ความน่าจะเป็นของการรักษาโรคให้หายขาด เคเท่ากับ 0.7 สำหรับโรค ลและ มความน่าจะเป็นเหล่านี้คือ 0.8 และ 0.9 ตามลำดับ ผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาลก็ออกจากโรงพยาบาลตามปกติแล้ว ค้นหาความน่าจะเป็นที่ผู้ป่วยรายนี้จะเป็นโรคนี้ เค.
สารละลาย.ให้เราแนะนำสมมติฐาน: – ผู้ป่วยได้รับความทุกข์ทรมานจากโรคภัยไข้เจ็บ ถึง ล, – ผู้ป่วยได้รับความทุกข์ทรมานจากโรคภัยไข้เจ็บ ม.
จากนั้นตามเงื่อนไขของปัญหาเราจะได้ มาแนะนำกิจกรรมกัน ก– ผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาลมีสุขภาพแข็งแรงดี ตามเงื่อนไข
จากการใช้สูตรความน่าจะเป็นทั้งหมดที่เราได้รับ:
ตามสูตรของเบย์ส
ตัวอย่างที่ 19ให้มีลูกบอลห้าลูกในโกศและการเดาจำนวนลูกบอลสีขาวก็เป็นไปได้เท่ากัน สุ่มหยิบลูกบอลมาจากโกศและกลายเป็นสีขาว ข้อสันนิษฐานเกี่ยวกับองค์ประกอบเริ่มต้นของโกศน่าจะเป็นไปได้มากที่สุด?
สารละลาย.สมมุติว่าในโกศมีลูกบอลสีขาว กล่าวคือสามารถตั้งสมมติฐานได้หกข้อ จากนั้นตามเงื่อนไขของปัญหาเราจะได้
มาแนะนำกิจกรรมกัน ก– ลูกบอลสีขาวสุ่มเลือก มาคำนวณกัน เนื่องจาก จากนั้นตามสูตรของ Bayes เรามี:
ดังนั้น สมมติฐานที่เป็นไปได้มากที่สุดคือเพราะว่า
ตัวอย่างที่ 20สองในสามองค์ประกอบการทำงานที่แยกจากกันของอุปกรณ์คอมพิวเตอร์ล้มเหลว ค้นหาความน่าจะเป็นที่องค์ประกอบที่หนึ่งและสองล้มเหลว หากความน่าจะเป็นของความล้มเหลวขององค์ประกอบที่หนึ่ง ที่สอง และสาม ตามลำดับคือ 0.2 0.4 และ 0.3
สารละลาย.ให้เราแสดงโดย กเหตุการณ์ – สององค์ประกอบล้มเหลว สามารถสร้างสมมติฐานต่อไปนี้ได้:
– องค์ประกอบที่หนึ่งและสองล้มเหลว แต่องค์ประกอบที่สามยังทำงานได้ เนื่องจากองค์ประกอบต่างๆ ทำงานอย่างเป็นอิสระ ทฤษฎีบทการคูณจึงใช้:
สูตรเบย์:ความน่าจะเป็น P(H i) ของสมมติฐาน H i เรียกว่าความน่าจะเป็นแบบนิรนัย - ความน่าจะเป็นก่อนทำการทดลอง
ความน่าจะเป็น P(A/H i) เรียกว่าความน่าจะเป็นภายหลัง - ความน่าจะเป็นของสมมติฐาน H i ที่ได้รับการขัดเกลาจากประสบการณ์
ตัวอย่างหมายเลข 1 สามารถประกอบอุปกรณ์ได้จากชิ้นส่วนคุณภาพสูงและจากชิ้นส่วนคุณภาพธรรมดา อุปกรณ์ประมาณ 40% ประกอบจากชิ้นส่วนคุณภาพสูง หากอุปกรณ์ประกอบจากชิ้นส่วนคุณภาพสูงความน่าเชื่อถือ (ความน่าจะเป็นของการทำงานที่ปราศจากข้อผิดพลาด) เมื่อเวลาผ่านไป t คือ 0.95 ถ้าทำจากชิ้นส่วนคุณภาพธรรมดาความน่าเชื่อถือของมันคือ 0.7 อุปกรณ์ได้รับการทดสอบตามเวลา t และทำงานได้อย่างไม่มีที่ติ ค้นหาความน่าจะเป็นที่ทำจากชิ้นส่วนคุณภาพสูง
สารละลาย.เป็นไปได้สองสมมติฐาน: H 1 - อุปกรณ์ประกอบจากชิ้นส่วนคุณภาพสูง H 2 - อุปกรณ์ประกอบจากชิ้นส่วนคุณภาพธรรมดา ความน่าจะเป็นของสมมติฐานเหล่านี้ก่อนการทดลอง: P(H 1) = 0.4, P(H 2) = 0.6 จากผลการทดลอง พบว่ามีเหตุการณ์ A - อุปกรณ์ทำงานได้อย่างไร้ที่ติเป็นเวลา t ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์นี้ภายใต้สมมติฐาน H 1 และ H 2 เท่ากัน: P(A|H 1) = 0.95; P(A|H 2) = 0.7 การใช้สูตร (12) เราค้นหาความน่าจะเป็นของสมมติฐาน H 1 หลังการทดลอง:
ตัวอย่างหมายเลข 2 นักกีฬาสองคนแยกจากกัน ยิงไปที่เป้าหมายเดียว แต่ละคนยิงนัดเดียว ความน่าจะเป็นที่จะยิงเข้าเป้าสำหรับนักกีฬาคนแรกคือ 0.8 ส่วนครั้งที่สองคือ 0.4 หลังจากการยิงพบหนึ่งหลุมในเป้าหมาย สมมติว่านักกีฬาสองคนยิงจุดเดียวกันไม่ได้ ให้หาความน่าจะเป็นที่นักกีฬาคนแรกยิงเข้าเป้า
สารละลาย.ปล่อยให้เหตุการณ์ A - หลังจากยิงแล้วตรวจพบหนึ่งรูในเป้าหมาย ก่อนที่การยิงจะเริ่มขึ้น มีสมมติฐานที่เป็นไปได้:
H 1 - ไม่ว่าจะยิงคนแรกหรือคนที่สองก็ตาม ความน่าจะเป็นของสมมติฐานนี้: P(H 1) = 0.2 · 0.6 = 0.12
H 2 - นักกีฬาทั้งสองคนจะตี P(H 2) = 0.8 · 0.4 = 0.32
H 3 - ผู้ยิงคนแรกจะโดน แต่คนที่สองจะไม่โดน P(H 3) = 0.8 · 0.6 = 0.48
H 4 - นักกีฬาคนแรกจะไม่โดน แต่คนที่สองจะโดน P (H 4) = 0.2 · 0.4 = 0.08
ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์ A ภายใต้สมมติฐานเหล่านี้มีค่าเท่ากัน:
หลังจากการทดลอง สมมติฐาน H 1 และ H 2 เป็นไปไม่ได้ และความน่าจะเป็นของสมมติฐาน H 3 และ H 4
จะเท่ากัน:
ดังนั้นจึงเป็นไปได้มากว่าเป้าหมายจะถูกยิงโดยผู้ยิงคนแรก
ตัวอย่างหมายเลข 3 ในร้านติดตั้งจะมีมอเตอร์ไฟฟ้าเชื่อมต่อกับอุปกรณ์ มอเตอร์ไฟฟ้าจัดทำโดยผู้ผลิตสามราย คลังสินค้าประกอบด้วยมอเตอร์ไฟฟ้าจากโรงงานที่ระบุชื่อ ตามลำดับ จำนวน 19.6 และ 11 ตัว สามารถทำงานได้ไม่มีชำรุดจนสิ้นสุดระยะเวลาการรับประกัน ตามลำดับ โดยมีความน่าจะเป็น 0.85, 0.76 และ 0.71 พนักงานสุ่มเลือกมอเตอร์หนึ่งตัวและติดตั้งเข้ากับอุปกรณ์ ค้นหาความน่าจะเป็นที่มอเตอร์ไฟฟ้าติดตั้งและทำงานโดยไม่มีข้อผิดพลาดจนกระทั่งสิ้นสุดระยะเวลาการรับประกันโดยผู้ผลิตรายแรก รายที่สอง หรือรายที่สาม ตามลำดับ
สารละลาย.การทดสอบครั้งแรกคือการเลือกใช้มอเตอร์ไฟฟ้า การทดสอบครั้งที่สองคือการทำงานของมอเตอร์ไฟฟ้าในช่วงระยะเวลาการรับประกัน พิจารณาเหตุการณ์ต่อไปนี้:
เอ - มอเตอร์ไฟฟ้าทำงานโดยไม่มีความล้มเหลวจนกว่าจะสิ้นสุดระยะเวลาการรับประกัน
H 1 - ผู้ติดตั้งจะนำเครื่องยนต์ไปจากโรงงานแห่งแรก
H 2 - ผู้ติดตั้งจะนำเครื่องยนต์ไปจากโรงงานแห่งที่สอง
H 3 - ผู้ติดตั้งจะนำเครื่องยนต์มาจากการผลิตของโรงงานแห่งที่สาม
ความน่าจะเป็นของเหตุการณ์ A คำนวณโดยใช้สูตรความน่าจะเป็นทั้งหมด:
ความน่าจะเป็นแบบมีเงื่อนไขระบุไว้ในคำชี้แจงปัญหา:
เรามาค้นหาความน่าจะเป็นกัน
การใช้สูตรเบย์ (12) เราคำนวณความน่าจะเป็นแบบมีเงื่อนไขของสมมติฐาน H i:
ตัวอย่างหมายเลข 4 ความน่าจะเป็นที่ในระหว่างการทำงานของระบบที่ประกอบด้วยสามองค์ประกอบ องค์ประกอบหมายเลข 1, 2 และ 3 จะล้มเหลวอยู่ในอัตราส่วน 3: 2: 5 ความน่าจะเป็นในการตรวจจับความล้มเหลวขององค์ประกอบเหล่านี้เท่ากับ 0.95 ตามลำดับ 0.9 และ 0.6
b) ภายใต้เงื่อนไขของงานนี้ ตรวจพบความล้มเหลวระหว่างการทำงานของระบบ องค์ประกอบใดมีแนวโน้มที่จะล้มเหลวมากที่สุด?
สารละลาย.
ให้ A เป็นเหตุการณ์ที่ล้มเหลว ให้เราแนะนำระบบสมมติฐาน H1 - ความล้มเหลวขององค์ประกอบแรก, H2 - ความล้มเหลวขององค์ประกอบที่สอง, H3 - ความล้มเหลวขององค์ประกอบที่สาม
เราค้นหาความน่าจะเป็นของสมมติฐาน:
พ(H1) = 3/(3+2+5) = 0.3
พ(H2) = 2/(3+2+5) = 0.2
P(H3) = 5/(3+2+5) = 0.5
ตามเงื่อนไขของปัญหา ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์ A เท่ากับ:
P(A|H1) = 0.95, P(A|H2) = 0.9, P(A|H3) = 0.6
ก) ค้นหาความน่าจะเป็นที่จะตรวจพบความล้มเหลวในระบบ
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0.3*0.95 + 0.2*0.9 + 0.5 *0.6 = 0.765
b) ภายใต้เงื่อนไขของงานนี้ ตรวจพบความล้มเหลวระหว่างการทำงานของระบบ องค์ประกอบใดมีแนวโน้มที่จะล้มเหลวมากที่สุด?
P1 = P(H1)*P(A|H1)/ P(A) = 0.3*0.95 / 0.765 = 0.373
P2 = P(H2)*P(A|H2)/ P(A) = 0.2*0.9 / 0.765 = 0.235
P3 = P(H3)*P(A|H3)/ P(A) = 0.5*0.6 / 0.765 = 0.392
องค์ประกอบที่สามมีความน่าจะเป็นสูงสุด
กำหนดและพิสูจน์สูตรความน่าจะเป็นทั้งหมด ยกตัวอย่างการใช้งาน
หากเหตุการณ์ H 1, H 2, ..., H n เข้ากันไม่ได้แบบคู่ และเหตุการณ์เหล่านี้อย่างน้อย 1 เหตุการณ์จำเป็นต้องเกิดขึ้นระหว่างการทดสอบแต่ละครั้ง ดังนั้นสำหรับเหตุการณ์ A ใดๆ จะถือว่ามีความเท่าเทียมกันดังต่อไปนี้:
P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) – สูตรความน่าจะเป็นทั้งหมด ในกรณีนี้ H 1, H 2, …, H n เรียกว่าสมมติฐาน
การพิสูจน์:เหตุการณ์ A แบ่งออกเป็นตัวเลือก: AH 1, AH 2, ..., AH n (A มาพร้อมกับ H 1 เป็นต้น) กล่าวอีกนัยหนึ่ง เรามี A = AH 1 + AH 2 +…+ AH n เนื่องจาก H 1 , H 2 , …, H n เข้ากันไม่ได้แบบคู่ เหตุการณ์ AH 1 , AH 2 , …, AH n ก็เข้ากันไม่ได้เช่นกัน เมื่อใช้กฎการบวก เราจะพบว่า: P(A)= P(AH 1)+ P(AH 2)+…+ P(AH n) การแทนที่แต่ละเทอม P(AH i) ทางด้านขวาด้วยผลคูณ P Hi (A)P(H i) เราจะได้ความเท่าเทียมกันที่ต้องการ
ตัวอย่าง:
สมมติว่าเรามีชิ้นส่วนสองชุด ความน่าจะเป็นที่ส่วนของชุดแรกเป็นมาตรฐานคือ 0.8 และชุดที่สองคือ 0.9 ลองหาความน่าจะเป็นที่ชิ้นส่วนที่สุ่มมานั้นเป็นมาตรฐาน
P(A) = 0.5*0.8 + 0.5*0.9 = 0.85
กำหนดและพิสูจน์สูตรของเบย์ ยกตัวอย่างการใช้งาน
สูตรเบย์:
ช่วยให้คุณสามารถประเมินความน่าจะเป็นของสมมติฐานอีกครั้งหลังจากผลการทดสอบที่ส่งผลให้ทราบเหตุการณ์ A
การพิสูจน์:ปล่อยให้เหตุการณ์ A เกิดขึ้นโดยขึ้นอยู่กับเหตุการณ์ที่เข้ากันไม่ได้อย่างใดอย่างหนึ่ง H 1 , H 2 , …, H n รวมกันเป็นกลุ่มที่สมบูรณ์ เนื่องจากไม่ทราบล่วงหน้าว่าเหตุการณ์ใดจะเกิดขึ้น จึงเรียกว่าสมมติฐาน
ความน่าจะเป็นที่จะเกิดขึ้นของเหตุการณ์ A ถูกกำหนดโดยสูตรความน่าจะเป็นทั้งหมด:
P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) (1)
สมมติว่ามีการทดสอบเกิดขึ้นซึ่งเป็นผลมาจากเหตุการณ์ A ที่เกิดขึ้น ให้เราพิจารณาว่าความน่าจะเป็นของสมมติฐานมีการเปลี่ยนแปลงอย่างไรเนื่องจากเหตุการณ์ A เกิดขึ้นแล้ว กล่าวอีกนัยหนึ่ง เราจะมองหาความน่าจะเป็นแบบมีเงื่อนไข
P A (H 1), P A (H 2), ..., P A (H n)
ตามทฤษฎีบทการคูณเรามี:
P(AH i) = P(A) P A (H i) = P(H i)P สวัสดี (A)
ให้เราแทนที่ P(A) ที่นี่ตามสูตร (1) ที่เราได้รับ
ตัวอย่าง:
มีกล่องหน้าตาเหมือนกันสามกล่อง ในกล่องแรกมีลูกบอลสีขาว n=12 ลูก ในช่องที่สองมี m=4 ลูกบอลสีขาว และ n-m=8 ลูกสีดำ ในช่องที่สามมีลูกบอลสีดำ n=12 ลูก ลูกบอลสีขาวจะถูกนำมาจากกล่องที่เลือกโดยการสุ่ม ค้นหาความน่าจะเป็น P ที่ดึงลูกบอลมาจากช่องที่สอง
สารละลาย.
4) หาสูตรความน่าจะเป็นเคความสำเร็จในซีรีส์nการทดสอบตามแบบแผนเบอร์นูลลี
ให้เราตรวจสอบกรณีเมื่อมีการผลิต nการทดลองที่เหมือนกันและเป็นอิสระ ซึ่งแต่ละการทดลองมีเพียง 2 ผลลัพธ์เท่านั้น ( ก;- เหล่านั้น. ประสบการณ์บางอย่างเกิดขึ้นซ้ำแล้วซ้ำอีก nครั้ง และในการทดลองแต่ละครั้งมีเหตุการณ์บางอย่าง กอาจปรากฏขึ้นด้วยความน่าจะเป็น P(A)=qหรือไม่ปรากฏด้วยความน่าจะเป็น ป()=q-1=พี .
พื้นที่ของเหตุการณ์เบื้องต้นของการทดสอบแต่ละชุดประกอบด้วยจุดหรือลำดับของสัญลักษณ์ กและ . พื้นที่ความน่าจะเป็นดังกล่าวเรียกว่าโครงการเบอร์นูลลี ภารกิจคือเพื่อให้แน่ใจว่าสำหรับที่กำหนด เคจงหาความน่าจะเป็นนั้น ไม่มีกิจกรรมการทดลองซ้ำหลายครั้ง กจะมา เคครั้งหนึ่ง.
เพื่อความชัดเจนยิ่งขึ้น เรามาตกลงกันในแต่ละเหตุการณ์กัน กถือเป็นความสำเร็จไม่ก้าวหน้า เอ -เหมือนความล้มเหลว เป้าหมายของเราคือหาความน่าจะเป็นนั้น nการทดลองอย่างแน่นอน เคจะประสบความสำเร็จ เรามาแสดงเหตุการณ์นี้ชั่วคราวโดย บี.
เหตุการณ์ ในจะถูกนำเสนอเป็นผลรวมของชุดเหตุการณ์ - ตัวเลือกเหตุการณ์ ใน.หากต้องการบันทึกตัวเลือกเฉพาะ คุณต้องระบุจำนวนการทดสอบที่จบลงด้วยความสำเร็จ ตัวอย่างเช่น หนึ่งใน ตัวเลือกที่เป็นไปได้มี
- เห็นได้ชัดว่าจำนวนตัวเลือกทั้งหมดเท่ากับ และความน่าจะเป็นของแต่ละตัวเลือกเนื่องจากความเป็นอิสระของการทดลองเท่ากับ ดังนั้นความน่าจะเป็นของเหตุการณ์ ในเท่ากับ เพื่อเน้นการพึ่งพานิพจน์ผลลัพธ์บน nและ เคมาแสดงกันเถอะ . ดังนั้น, .
5) ใช้สูตรอินทิกรัลโดยประมาณของลาปลาซ หาสูตรสำหรับประมาณค่าความเบี่ยงเบนของความถี่สัมพัทธ์ของเหตุการณ์ A จากความน่าจะเป็น p ของการเกิดขึ้นของ A ในการทดลองครั้งเดียว
ภายใต้เงื่อนไขของโครงการ Bernoulli ที่มีค่าที่กำหนดเป็น n และ p สำหรับ e>0 ที่กำหนด เราประเมินความน่าจะเป็นของเหตุการณ์ โดยที่ k คือจำนวนความสำเร็จในการทดลอง n ครั้ง อสมการนี้เทียบเท่ากับ |k-np|£en กล่าวคือ -en £ k-np £ en หรือ np-en £ k £ np+en ดังนั้น เรากำลังพูดถึงการประมาณค่าความน่าจะเป็นของเหตุการณ์ k 1 £ k £ k 2 โดยที่ k 1 = np-en, k 2 = np+en เมื่อใช้สูตรอินทิกรัลลาปลาซโดยประมาณ เราจะได้: P( » เมื่อคำนึงถึงความแปลกของฟังก์ชันลาปลาซ เราจะได้ความเท่าเทียมกันโดยประมาณ P( » 2Ф
บันทึก : เพราะ ตามเงื่อนไข n=1 จากนั้นเราแทนที่ 1 แทน n แล้วได้คำตอบสุดท้าย
6) เอาล่ะ เอ็กซ์– ตัวแปรสุ่มแบบไม่ต่อเนื่องที่รับเฉพาะค่าที่ไม่เป็นลบและมีความคาดหวังทางคณิตศาสตร์ ม- พิสูจน์ว่า ป(เอ็กซ์≥ 4) ≤ ม./ 4 .
m= (เนื่องจากเทอมที่ 1 เป็นบวก ดังนั้นหากลบออก ก็จะน้อยลง) ³ (แทนที่ กคูณ 4 ก็จะน้อยลงเท่านั้น) ³ = =4× ป(เอ็กซ์³4) จากที่นี่ ป(เอ็กซ์≥ 4) ≤ ม./ 4 .
(แทนที่จะเป็น 4 สามารถเป็นตัวเลขใดก็ได้)
7) พิสูจน์ว่าถ้า เอ็กซ์และ ยเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องอิสระที่รับชุดค่าที่มีขอบเขตจำกัด ม(XY)=ม(X)ม(ย)
x1 | x2 | … |
หน้า 1 | หน้า 2 | … |
หมายเลขที่เรียก ม(XY)= x 1 หน้า 1 + x 2 หน้า 2 + …
ถ้าเป็นตัวแปรสุ่ม เอ็กซ์และ ยมีความเป็นอิสระ ดังนั้นความคาดหวังทางคณิตศาสตร์ของผลิตภัณฑ์จะเท่ากับผลคูณของความคาดหวังทางคณิตศาสตร์ของพวกเขา (ทฤษฎีบทของการคูณความคาดหวังทางคณิตศาสตร์)
การพิสูจน์:ค่าที่เป็นไปได้ เอ็กซ์มาแสดงกันเถอะ x1 , x2, …, ค่าที่เป็นไปได้ ป - ป 1 , ป 2, …ก หน้า ฉัน =P(X=x ฉัน , Y=y เจ). เอ็กซ์วาย ม(XY)=เนื่องจากความเป็นอิสระของปริมาณ เอ็กซ์และ ยเรามี: P(X= x ผม , Y=y เจ)= P(X=x i) P(Y=y เจ)กำหนดแล้ว P(X=x i)=r ผม , P(Y=y j)=s เจ, เราเขียนความเท่าเทียมกันนี้ใหม่ในรูปแบบ p ij = r ฉัน s j
ดังนั้น, ม(XY)- การแปลงความเท่าเทียมกันที่เกิดขึ้นเราได้รับ: ม(XY)=()() = ม(X)ม(Y) Q.E.D.
8) พิสูจน์ว่าถ้า เอ็กซ์และ ยเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่รับชุดค่าที่มีจำกัดแล้ว ม(เอ็กซ์+ย) = ม(เอ็กซ์) +ม(ย).
ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีกฎการแจกแจง
x1 | x2 | … |
หน้า 1 | หน้า 2 | … |
หมายเลขที่เรียก ม(XY)= x 1 หน้า 1 + x 2 หน้า 2 + …
ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มสองตัวจะเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์ของพจน์: M(X+Y)= M(X)+M(Y)
การพิสูจน์:ค่าที่เป็นไปได้ เอ็กซ์มาแสดงกันเถอะ x1 , x2, …, ค่าที่เป็นไปได้ ป - ป 1 , ป 2, …ก หน้า ฉัน =P(X=x ฉัน , Y=y เจ).กฎการกระจายขนาด เอ็กซ์+ยจะถูกแสดงในตารางที่เกี่ยวข้อง ม(X+ย)= . สูตรนี้สามารถเขียนใหม่ได้ดังนี้: ม(X+ย)= ผลรวมแรกของด้านขวาสามารถแสดงเป็น นิพจน์คือความน่าจะเป็นที่เหตุการณ์ใดๆ จะเกิดขึ้น (X=x i, Y=y 1), (X=x i, Y=y 2), ... ดังนั้น นิพจน์นี้จึงเท่ากับ P(X=x i) . จากที่นี่ - เช่นเดียวกัน, - เป็นผลให้เราได้: M(X+Y)= M(X)+M(Y) ซึ่งเป็นสิ่งที่จำเป็นต้องพิสูจน์
9) เอาล่ะ เอ็กซ์– ตัวแปรสุ่มแบบไม่ต่อเนื่องกระจายตามกฎการแจกแจงแบบทวินามพร้อมพารามิเตอร์ nและ ร- พิสูจน์ว่า ม(X)=nр, D(X)=nр(1-р).
ให้มันผลิตออกมา nการทดลองอิสระ ในแต่ละเหตุการณ์ A สามารถเกิดขึ้นได้ด้วยความน่าจะเป็น รดังนั้นความน่าจะเป็นของเหตุการณ์ตรงกันข้าม Ā เท่ากับ q=1-p- ลองพิจารณาสิ่งต่อไปนี้ ขนาด เอ็กซ์– จำนวนครั้งของเหตุการณ์ กวี nการทดลอง ลองจินตนาการว่า X เป็นผลรวมของตัวบ่งชี้ของเหตุการณ์ A สำหรับการทดลองแต่ละครั้ง: X=X 1 +X 2 +…+X n- ทีนี้มาพิสูจน์กัน M(X i)=พี, D(X i)=np- เมื่อต้องการทำเช่นนี้ ให้พิจารณากฎการกระจาย sl ปริมาณซึ่งมีลักษณะดังนี้:
เอ็กซ์ | ||
ร | ร | ถาม |
เห็นได้ชัดว่า ม(X)=นดังนั้นตัวแปรสุ่ม X 2 จึงมีกฎการแจกแจงเหมือนกัน D(X)=M(X 2)-M 2 (X)=р-р 2 =р(1-р)=рq- ดังนั้น, ม(X ผม)=น, D(H i)=pq- ตามทฤษฎีบทการบวกความคาดหวังทางคณิตศาสตร์ M(X)=M(X 1)+..+M(X n)=nр.เนื่องจากตัวแปรสุ่ม เอ็กซ์ ฉันมีความเป็นอิสระ จากนั้นความแปรปรวนก็รวมกัน: D(X)=D(X 1)+…+D(X n)=npq=np(1-p)
10) เอาล่ะ เอ็กซ์– ตัวแปรสุ่มแบบไม่ต่อเนื่องที่แจกแจงตามกฎของปัวซองพร้อมพารามิเตอร์ แล พิสูจน์ว่า ม(เอ็กซ์) = λ .
กฎของปัวซองได้รับจากตาราง:
จากที่นี่เรามี:
ดังนั้น พารามิเตอร์ แล ซึ่งเป็นลักษณะเฉพาะของการแจกแจงแบบปัวซองนี้ จึงไม่มีอะไรมากไปกว่าค่าคาดหวังทางคณิตศาสตร์ของค่า X
11) ให้ X เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งกระจายตามกฎเรขาคณิตด้วยพารามิเตอร์ p พิสูจน์ว่า M (X) = .
กฎการกระจายทางเรขาคณิตสัมพันธ์กับลำดับการทดลองเบอร์นูลลีจนกระทั่งเหตุการณ์ A สำเร็จครั้งแรก ความน่าจะเป็นที่จะเกิดเหตุการณ์ A ในการทดลองครั้งหนึ่งคือ p ซึ่งเหตุการณ์ตรงกันข้าม q = 1-p กฎการกระจายของตัวแปรสุ่ม X - จำนวนการทดสอบ - มีรูปแบบ:
เอ็กซ์ | … | n | … | ||
ร | ร | หน้า | … | พีคิว เอ็น-1 | … |
ชุดที่เขียนในวงเล็บจะได้มาจากการแยกความแตกต่างของความก้าวหน้าทางเรขาคณิตแบบเทอมต่อเทอม
เพราะฉะนั้น, .
12) พิสูจน์ว่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปรสุ่ม X และ Y เป็นไปตามเงื่อนไข
คำนิยาม:ค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปรสุ่มสองตัวคืออัตราส่วนของความแปรปรวนร่วมต่อผลคูณของส่วนเบี่ยงเบนมาตรฐานของตัวแปรเหล่านี้: . .
การพิสูจน์:ลองพิจารณาตัวแปรสุ่ม Z = ลองคำนวณความแปรปรวนของมันกัน เนื่องจาก ด้านซ้ายไม่เป็นลบ ดังนั้นอันที่ถูกต้องก็คือไม่เป็นลบ ดังนั้น |ρ|≤1
13) ความแปรปรวนคำนวณอย่างไรในกรณีของการแจกแจงต่อเนื่องด้วยความหนาแน่น ฉ(x- พิสูจน์สิ่งนั้นสำหรับตัวแปรสุ่ม เอ็กซ์มีความหนาแน่น การกระจายตัว ดี(เอ็กซ์) ไม่มีอยู่ และความคาดหวังทางคณิตศาสตร์ ม(เอ็กซ์) มีอยู่
ความแปรปรวนของตัวแปรสุ่มต่อเนื่องสัมบูรณ์ X พร้อมฟังก์ชันความหนาแน่น f(x) และความคาดหวังทางคณิตศาสตร์ m = M(X) ถูกกำหนดโดยความเท่าเทียมกันเดียวกันกับสำหรับ ค่าที่ไม่ต่อเนื่อง
.
ในกรณีที่ตัวแปรสุ่ม X ต่อเนื่องอย่างแน่นอนจดจ่ออยู่กับช่วงเวลา
∞ - การเบี่ยงเบนอินทิกรัลดังนั้นจึงไม่มีการกระจายตัว
14) พิสูจน์ว่าสำหรับตัวแปรสุ่มปกติ X ที่มีฟังก์ชันความหนาแน่นของการแจกแจง ค่าคาดหวังทางคณิตศาสตร์ M(X) = μ
ให้เราพิสูจน์ว่า μ คือความคาดหวังทางคณิตศาสตร์
โดยการกำหนดความคาดหวังทางคณิตศาสตร์ของ r.v. ต่อเนื่อง
เรามาแนะนำตัวแปรใหม่กันดีกว่า - จากที่นี่. โดยคำนึงถึงว่าขีดจำกัดใหม่ของการรวมระบบนั้นเท่ากับขีดจำกัดเก่าที่เราได้รับ
เทอมแรกมีค่าเท่ากับศูนย์เนื่องจากความคี่ของฟังก์ชันจำนวนเต็ม เทอมที่สองมีค่าเท่ากับ μ (อินทิกรัลปัวซอง ).
ดังนั้น, ม(X)=ไมโคร, เช่น. ความคาดหวังทางคณิตศาสตร์ของการแจกแจงแบบปกติจะเท่ากับพารามิเตอร์ μ.
15) พิสูจน์ว่าสำหรับตัวแปรสุ่มปกติ X ที่มีฟังก์ชันความหนาแน่นของการแจกแจง ความแปรปรวน D(X) = σ 2
สูตรนี้อธิบายความหนาแน่นของการแจกแจงความน่าจะเป็นแบบปกติของตัวแปรสุ่มแบบต่อเนื่อง
ลองพิสูจน์ว่านั่นคือค่าเบี่ยงเบนมาตรฐานของการกระจายตัวแบบปกติ เรามาแนะนำตัวแปรใหม่กันดีกว่า z=(x-μ)/ .จากที่นี่ . โดยคำนึงถึงว่าขีดจำกัดใหม่ของการรวมระบบนั้นเท่ากับขีดจำกัดเก่าที่เราได้รับ บูรณาการโดยส่วนการวาง คุณ=z, เราพบว่า ดังนั้น .ดังนั้น ค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติจะเท่ากับพารามิเตอร์
16) พิสูจน์ว่าตัวแปรสุ่มต่อเนื่องที่กระจายตามกฎเลขชี้กำลังพร้อมพารามิเตอร์ ค่าคาดหวังทางคณิตศาสตร์คือ
ตัวแปรสุ่ม X ซึ่งรับเฉพาะค่าที่ไม่เป็นลบ กล่าวกันว่ามีการกระจายตามกฎเอ็กซ์โปเนนเชียล หากพารามิเตอร์บวกบางตัว แล>0 ฟังก์ชันความหนาแน่นมีรูปแบบ:
ในการค้นหาความคาดหวังทางคณิตศาสตร์ เราใช้สูตร
สูตรเบย์
ทฤษฎีบทของเบย์- หนึ่งในทฤษฎีบทหลักของทฤษฎีความน่าจะเป็นเบื้องต้น ซึ่งกำหนดความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในสภาวะที่ทราบข้อมูลบางส่วนเกี่ยวกับเหตุการณ์จากการสังเกตเท่านั้น การใช้สูตรของ Bayes ทำให้สามารถคำนวณความน่าจะเป็นได้แม่นยำยิ่งขึ้น โดยคำนึงถึงข้อมูลที่ทราบก่อนหน้านี้และข้อมูลจากการสังเกตใหม่
“ความหมายทางกายภาพ” และคำศัพท์เฉพาะทาง
สูตรของเบย์ช่วยให้คุณสามารถ “จัดเหตุและผลใหม่” ได้: ตาม ความจริงที่รู้เหตุการณ์ต่างๆ ให้คำนวณความน่าจะเป็นที่เกิดจากสาเหตุที่กำหนดให้
เหตุการณ์ที่สะท้อนถึงการกระทำของ “เหตุ” ใน ในกรณีนี้มักจะเรียกว่า สมมติฐานเนื่องจากพวกเขาเป็น ถูกกล่าวหาเหตุการณ์ที่นำไปสู่สิ่งนี้ ความน่าจะเป็นแบบไม่มีเงื่อนไขของสมมติฐานที่เป็นจริงเรียกว่า นิรนัย(สาเหตุน่าจะเป็นไปได้แค่ไหน. เลย) และเงื่อนไข - โดยคำนึงถึงข้อเท็จจริงของเหตุการณ์ - หลัง(สาเหตุน่าจะเป็นไปได้แค่ไหน. กลับกลายเป็นการคำนึงถึงข้อมูลเหตุการณ์).
ผลที่ตามมา
ผลลัพธ์ที่สำคัญของสูตรของเบย์คือสูตรสำหรับความน่าจะเป็นรวมของเหตุการณ์หนึ่งๆ ขึ้นอยู่กับ หลายสมมติฐานที่ไม่สอดคล้องกัน ( และจากพวกเขาเท่านั้น!).
- ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้น บีขึ้นอยู่กับสมมติฐานหลายประการ ก ฉันหากทราบระดับความน่าเชื่อถือของสมมติฐานเหล่านี้ (เช่น วัดจากการทดลอง)ที่มาของสูตร
หากเหตุการณ์ขึ้นอยู่กับสาเหตุเท่านั้น ก ฉันแล้วถ้ามันเกิดขึ้นก็หมายความว่าต้องมีสาเหตุประการหนึ่งเกิดขึ้นคือ
ตามสูตรของเบย์ส
โดยการโอน ป(บี) ทางด้านขวาเราจะได้นิพจน์ที่ต้องการ
วิธีการกรองสแปม
วิธีการที่ใช้ทฤษฎีบทของ Bayes พบว่าการประยุกต์ใช้ในการกรองสแปมประสบความสำเร็จ
คำอธิบาย
เมื่อฝึกตัวกรองสำหรับแต่ละคำที่พบในตัวอักษร "น้ำหนัก" ของมันจะถูกคำนวณและจัดเก็บ - ความน่าจะเป็นที่ตัวอักษรที่มีคำนี้เป็นสแปม (ในกรณีที่ง่ายที่สุด - ตามคำจำกัดความคลาสสิกของความน่าจะเป็น: "ปรากฏในสแปม / การปรากฏตัวโดยรวม”)
เมื่อตรวจสอบจดหมายที่เพิ่งมาถึง ความน่าจะเป็นที่จะเป็นจดหมายขยะจะถูกคำนวณโดยใช้สูตรข้างต้นสำหรับสมมติฐานต่างๆ ในกรณีนี้ "สมมติฐาน" คือคำ และสำหรับแต่ละคำ "ความน่าเชื่อถือของสมมติฐาน" คือ % ของคำนี้ในตัวอักษร และ "การพึ่งพาเหตุการณ์กับสมมติฐาน" ป(บี | ก ฉัน) - "น้ำหนัก" ที่คำนวณไว้ก่อนหน้านี้ของคำ นั่นคือ "น้ำหนัก" ของตัวอักษรในกรณีนี้ไม่มีอะไรมากไปกว่า "น้ำหนัก" โดยเฉลี่ยของคำทั้งหมด
จดหมายถูกจัดประเภทเป็น "สแปม" หรือ "ไม่ใช่สแปม" โดยขึ้นอยู่กับว่า "น้ำหนัก" ของจดหมายนั้นเกินระดับที่กำหนดโดยผู้ใช้หรือไม่ (ปกติคือ 60-80%) หลังจากตัดสินใจเกี่ยวกับจดหมายแล้ว "น้ำหนัก" สำหรับคำที่รวมอยู่ในนั้นจะได้รับการอัปเดตในฐานข้อมูล
ลักษณะเฉพาะ
วิธีนี้ง่าย (อัลกอริธึมเป็นระดับพื้นฐาน) สะดวก (ช่วยให้คุณทำได้โดยไม่ต้อง "บัญชีดำ" และเทคนิคประดิษฐ์ที่คล้ายกัน) มีประสิทธิภาพ (หลังจากการฝึกอบรมกับตัวอย่างที่มีขนาดใหญ่เพียงพอแล้วจะตัดสแปมได้มากถึง 95-97% และ ในกรณีที่มีข้อผิดพลาดสามารถฝึกใหม่ได้) โดยทั่วไปมีข้อบ่งชี้ทั้งหมดสำหรับการใช้งานอย่างแพร่หลายซึ่งเป็นสิ่งที่เกิดขึ้นในทางปฏิบัติ - ตัวกรองสแปมสมัยใหม่เกือบทั้งหมดถูกสร้างขึ้นบนพื้นฐานของมัน
อย่างไรก็ตาม วิธีการนี้ก็มีข้อเสียเปรียบพื้นฐานเช่นกัน: ขึ้นอยู่กับสมมติฐาน, อะไร คำบางคำพบได้บ่อยในสแปม ในขณะที่คำอื่นๆ พบได้บ่อยในอีเมลทั่วไปและไม่มีผลหากสมมติฐานนี้ไม่ถูกต้อง อย่างไรก็ตาม ตามที่แสดงในทางปฏิบัติ แม้แต่บุคคลหนึ่งก็ไม่สามารถตรวจพบสแปมดังกล่าว "ด้วยตา" ได้ - เพียงแค่อ่านจดหมายและทำความเข้าใจความหมายของมันเท่านั้น
ข้อเสียเปรียบอีกประการหนึ่งซึ่งไม่ใช่พื้นฐานที่เกี่ยวข้องกับการใช้งานก็คือวิธีนี้ใช้ได้กับข้อความเท่านั้น เมื่อทราบถึงข้อจำกัดนี้ ผู้ส่งอีเมลขยะจึงเริ่มแทรกข้อมูลโฆษณาลงในรูปภาพ แต่ข้อความในจดหมายหายไปหรือไม่มีความหมาย เพื่อตอบโต้สิ่งนี้ คุณต้องใช้เครื่องมือการรู้จำข้อความ (ขั้นตอน "แพง" ใช้เมื่อจำเป็นจริงๆ เท่านั้น) หรือวิธีการกรองแบบเก่า - "บัญชีดำ" และนิพจน์ทั่วไป (เนื่องจากตัวอักษรดังกล่าวมักจะมีรูปแบบโปรเฟสเซอร์)
ดูเพิ่มเติม
หมายเหตุ
ลิงค์
วรรณกรรม
- นกกีวี. ทฤษฎีบทของบาทหลวงเบย์ส // นิตยสาร Computerra 24 สิงหาคม 2544
- พอล เกรแฮม. แผนสำหรับสแปม (ภาษาอังกฤษ) // เว็บไซต์ส่วนตัวของ Paul Graham
มูลนิธิวิกิมีเดีย
2010.
ดูว่า "Bayes Formula" ในพจนานุกรมอื่นคืออะไร: สูตรที่มีรูปแบบ: โดยที่ a1, A2,..., An เป็นเหตุการณ์ที่เข้ากันไม่ได้, รูปแบบทั่วไปของการใช้ f.v. g.: ถ้าเหตุการณ์ B สามารถเกิดขึ้นต่างกันได้ เงื่อนไขที่สมมติฐาน A1, A2, ..., An ถูกสร้างขึ้นด้วยความน่าจะเป็น P(A1), ... ที่ทราบก่อนการทดลอง
สารานุกรมทางธรณีวิทยา
ช่วยให้คุณสามารถคำนวณความน่าจะเป็นของเหตุการณ์ที่สนใจผ่านความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์นี้ภายใต้สมมติฐานของสมมติฐานบางประการ เช่นเดียวกับความน่าจะเป็นของสมมติฐานเหล่านี้ สูตร ให้เว้นช่องว่างความน่าจะเป็น และให้กลุ่มทั้งหมดเป็นคู่... ... Wikipedia
ช่วยให้คุณสามารถคำนวณความน่าจะเป็นของเหตุการณ์ที่สนใจผ่านความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์นี้ภายใต้สมมติฐานของสมมติฐานบางประการ เช่นเดียวกับความน่าจะเป็นของสมมติฐานเหล่านี้ สูตร ให้เว้นช่องว่างความน่าจะเป็น และกลุ่มเหตุการณ์ทั้งหมด เช่น... ... Wikipedia
- (หรือสูตรของเบย์) หนึ่งในทฤษฎีบทหลักของทฤษฎีความน่าจะเป็น ซึ่งช่วยให้คุณสามารถระบุความน่าจะเป็นที่เหตุการณ์บางอย่างเกิดขึ้น (สมมุติฐาน) เมื่อมีหลักฐานทางอ้อมเท่านั้น (ข้อมูล) ซึ่งอาจไม่ถูกต้อง... Wikipedia
ทฤษฎีบทของเบย์เป็นหนึ่งในทฤษฎีบทหลักของทฤษฎีความน่าจะเป็นเบื้องต้น ซึ่งกำหนดความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในสภาวะที่ทราบข้อมูลบางส่วนเกี่ยวกับเหตุการณ์ตามการสังเกตเท่านั้น การใช้สูตรของ Bayes คุณสามารถ... ... Wikipedia
Bayes, Thomas Thomas Bayes สาธุคุณ Thomas Bayes วันเกิด: 1702 (1702) สถานที่เกิด ... Wikipedia
การอนุมานแบบเบย์เป็นวิธีการอนุมานทางสถิติวิธีหนึ่ง ซึ่งใช้สูตรของเบย์เพื่อปรับแต่งการประมาณความน่าจะเป็นของความจริงของสมมติฐานเมื่อได้รับหลักฐาน การใช้การอัปเดตแบบเบย์มีความสำคัญอย่างยิ่งใน... ... Wikipedia
ควรปรับปรุงบทความนี้หรือไม่: ค้นหาและจัดเรียงในรูปแบบของลิงก์เชิงอรรถไปยังแหล่งข้อมูลที่เชื่อถือได้เพื่อยืนยันสิ่งที่เขียน หลังจากเพิ่มเชิงอรรถแล้ว ให้ระบุแหล่งที่มาที่แม่นยำยิ่งขึ้น เปเร... วิกิพีเดีย
นักโทษจะทรยศต่อกันตามผลประโยชน์อันเห็นแก่ตัวของตน หรือพวกเขาจะนิ่งเงียบอยู่จึงลดน้อยลง ระยะเวลาทั้งหมด- ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ
หนังสือ
- ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ในปัญหา: ปัญหาและแบบฝึกหัดมากกว่า 360 ข้อ Borzykh D.. คู่มือที่นำเสนอประกอบด้วยปัญหา ระดับต่างๆความซับซ้อน อย่างไรก็ตาม จุดเน้นหลักอยู่ที่งานที่มีความซับซ้อนปานกลาง โดยมีวัตถุประสงค์เพื่อส่งเสริมให้นักเรียน...