เปิด
ปิด

สูตรความน่าจะเป็นทั้งหมด สูตรเบย์ คำอธิบายง่ายๆ ของทฤษฎีบทของเบย์ส

ทฤษฎีบทของ Bayes มีการอธิบายโดยละเอียดในบทความแยกต่างหาก เป็นผลงานที่มหัศจรรย์ แต่มีความยาวถึง 15,000 คำ การแปลบทความเดียวกันจาก Kalid Azad อธิบายโดยย่อถึงสาระสำคัญของทฤษฎีบท

  • ผลการวิจัยและการทดสอบไม่ใช่เหตุการณ์มีวิธีการวินิจฉัยโรคมะเร็งและมีเหตุการณ์เกิดขึ้นคือการปรากฏตัวของโรค อัลกอริทึมจะตรวจสอบว่าข้อความมีสแปมหรือไม่ แต่เหตุการณ์ (สแปมมาถึงทางไปรษณีย์จริง ๆ ) จะต้องพิจารณาแยกต่างหากจากผลงาน
  • มีข้อผิดพลาดในผลการทดสอบบ่อยครั้งที่วิธีการวิจัยของเราเผยให้เห็นสิ่งที่ไม่มีอยู่ (ผลบวกลวง) และไม่ได้ระบุว่ามีอะไรอยู่ (ผลลบลวง)
  • ด้วยความช่วยเหลือของการทดสอบ เราจะได้รับความน่าจะเป็นของผลลัพธ์ที่แน่นอนบ่อยครั้งที่เราพิจารณาผลการทดสอบเพียงอย่างเดียวและไม่คำนึงถึงข้อผิดพลาดของวิธีการ
  • เท็จ ผลลัพธ์ที่เป็นบวกบิดเบือนภาพสมมติว่าคุณกำลังพยายามระบุปรากฏการณ์ที่หายากมาก (1 รายใน 1,000,000) แม้ว่าวิธีการของคุณจะแม่นยำ แต่มีโอกาสที่ผลลัพธ์เชิงบวกของคุณจะเป็นผลบวกลวงจริงๆ
  • สะดวกกว่าในการทำงานกับตัวเลขธรรมชาติดีกว่าที่จะพูดว่า: 100 จาก 10,000 ไม่ใช่ 1% ด้วยวิธีนี้ข้อผิดพลาดจะน้อยลง โดยเฉพาะเมื่อทำการคูณ สมมติว่าเราต้องดำเนินการกับ 1% นี้ต่อไป การใช้เหตุผลเป็นเปอร์เซ็นต์เป็นเรื่องที่งุ่มง่าม: “ใน 80% ของกรณีจาก 1% ให้ผลลัพธ์ที่เป็นบวก” ข้อมูลเข้าใจง่ายกว่ามากดังนี้: “ใน 80 กรณีจาก 100 กรณีมีการสังเกตผลลัพธ์ที่เป็นบวก”
  • แม้แต่ในทางวิทยาศาสตร์ ข้อเท็จจริงใดๆ ก็ตามเป็นเพียงผลลัพธ์ของการประยุกต์ใช้วิธีการเท่านั้นจากมุมมองเชิงปรัชญา การทดลองทางวิทยาศาสตร์เป็นเพียงการทดสอบที่อาจเกิดข้อผิดพลาดได้ มีวิธีการที่เปิดเผย สารเคมีหรือปรากฏการณ์บางอย่าง คือ เหตุการณ์นั้นเอง - การมีอยู่ของปรากฏการณ์นี้ วิธีทดสอบของเราสามารถให้ได้ ผลลัพธ์เท็จและอุปกรณ์ใดๆก็มีข้อผิดพลาดโดยธรรมชาติ
ทฤษฎีบทของเบย์เปลี่ยนผลการทดสอบให้กลายเป็นความน่าจะเป็นของเหตุการณ์
  • หากเราทราบความน่าจะเป็นของเหตุการณ์และความน่าจะเป็นของผลบวกลวงและผลลบลวง เราก็สามารถแก้ไขข้อผิดพลาดในการวัดได้
  • ทฤษฎีบทเชื่อมโยงความน่าจะเป็นของเหตุการณ์หนึ่งกับความน่าจะเป็นของผลลัพธ์ที่แน่นอน เราเชื่อมโยง Pr(A|X): ความน่าจะเป็นของเหตุการณ์ A เมื่อกำหนดผลลัพธ์ X และ Pr(X|A): ความน่าจะเป็นของผลลัพธ์ X เมื่อพิจารณาจากเหตุการณ์ A

มาทำความเข้าใจวิธีการกัน

บทความที่เชื่อมโยงในตอนต้นของบทความนี้จะตรวจสอบวิธีการวินิจฉัย (แมมโมแกรม) ที่ตรวจพบมะเร็งเต้านม ลองพิจารณาวิธีนี้โดยละเอียด
  • 1% ของผู้หญิงทั้งหมดเป็นมะเร็งเต้านม (และด้วยเหตุนี้ 99% จึงไม่ได้รับ)
  • 80% ของการตรวจแมมโมแกรมตรวจพบโรคเมื่อมีอยู่จริง (และ 20% ตรวจไม่พบ)
  • 9.6% ของการทดสอบตรวจพบมะเร็งเมื่อไม่มีเลย (และด้วยเหตุนี้ 90.4% จึงสามารถตรวจพบผลลัพธ์เชิงลบได้อย่างถูกต้อง)
ตอนนี้เรามาสร้างตารางดังนี้:

จะทำงานกับข้อมูลนี้อย่างไร?
  • ผู้หญิง 1% เป็นมะเร็งเต้านม
  • หากผู้ป่วยมีโรคให้ดูคอลัมน์แรกมีโอกาส 80% ที่วิธีนี้ให้ ผลลัพธ์ที่ถูกต้องและมีโอกาส 20% ที่ผลการทดสอบจะไม่ถูกต้อง (ผลลบลวง)
  • หากไม่สามารถระบุโรคของผู้ป่วยได้ ให้ดูคอลัมน์ที่สอง ด้วยความน่าจะเป็น 9.6% เราสามารถพูดได้ว่าผลการทดสอบเชิงบวกนั้นไม่ถูกต้อง และด้วยความน่าจะเป็น 90.4% เราสามารถพูดได้ว่าผู้ป่วยมีสุขภาพแข็งแรงอย่างแท้จริง

วิธีการมีความแม่นยำเพียงใด?

ตอนนี้เรามาดูผลการทดสอบที่เป็นบวกกัน ความน่าจะเป็นที่บุคคลนั้นป่วยจริงคือเท่าไร: 80%, 90%, 1%?

ลองคิดดู:

  • มีผลในเชิงบวก ลองดูผลลัพธ์ที่เป็นไปได้ทั้งหมด: ผลลัพธ์อาจเป็นได้ทั้งผลบวกจริงหรือผลบวกลวง
  • ความน่าจะเป็นของผลบวกที่แท้จริงจะเท่ากับ: ความน่าจะเป็นที่จะเป็นโรคคูณกับความน่าจะเป็นที่การทดสอบตรวจพบโรคจริง 1% * 80% = .008
  • ความน่าจะเป็นของผลบวกลวงเท่ากับ: ความน่าจะเป็นที่ไม่มีโรคคูณกับความน่าจะเป็นที่วิธีการตรวจพบโรคไม่ถูกต้อง 99% * 9.6% = .09504
ตอนนี้ตารางมีลักษณะดังนี้:

ความน่าจะเป็นที่บุคคลจะป่วยจริงหากได้รับการตรวจแมมโมแกรมเป็นบวกคือเท่าใด ความน่าจะเป็นของเหตุการณ์คืออัตราส่วนของจำนวนผลลัพธ์ที่เป็นไปได้ของเหตุการณ์ต่อจำนวนผลลัพธ์ที่เป็นไปได้ทั้งหมด

ความน่าจะเป็นของเหตุการณ์ = ผลลัพธ์ของเหตุการณ์ / ผลลัพธ์ที่เป็นไปได้ทั้งหมด

ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกที่แท้จริงคือ .008 ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกคือความน่าจะเป็นของผลลัพธ์ที่เป็นบวกจริง + ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกลวง

(.008 + 0.09504 = .10304)

ดังนั้น ความน่าจะเป็นของโรคที่ผลการตรวจเป็นบวกจึงคำนวณได้ดังนี้ .008/.10304 = 0.0776 ค่านี้คือประมาณ 7.8%

นั่นคือผลการตรวจแมมโมแกรมที่เป็นบวกเพียงหมายความว่าความน่าจะเป็นที่จะเป็นโรคคือ 7.8% ไม่ใช่ 80% (ค่าหลังเป็นเพียงความแม่นยำโดยประมาณของวิธีการ) ผลลัพธ์นี้ดูเหมือนเข้าใจยากและแปลกในตอนแรก แต่คุณต้องคำนึงถึง: วิธีการนี้ให้ผลลัพธ์ที่ผิดพลาดในกรณี 9.6% (ซึ่งค่อนข้างมาก) ดังนั้นจะมีผลลัพธ์ที่เป็นบวกปลอมมากมายในตัวอย่าง สำหรับ โรคที่หายากผลลัพธ์เชิงบวกส่วนใหญ่จะเป็นผลบวกลวง

ลองดูที่ตารางแล้วพยายามเข้าใจความหมายของทฤษฎีบทโดยสัญชาตญาณ หากเรามี 100 คน จะมีเพียง 1 คนเท่านั้นที่เป็นโรคนี้ (1%) สำหรับบุคคลนี้มีโอกาส 80% ที่วิธีนี้จะให้ผลลัพธ์ที่เป็นบวก ส่วนที่เหลืออีก 99% นั้น 10% จะให้ผลลัพธ์ที่เป็นบวก ซึ่งพูดคร่าวๆ ให้เราทราบคือผลบวกลวง 10 รายการจาก 100 รายการ หากเราพิจารณาผลลัพธ์ที่เป็นบวกทั้งหมด จะมีเพียง 1 ใน 11 เท่านั้นที่เป็นจริง ดังนั้น หากผลเป็นบวก ความน่าจะเป็นของโรคจะเป็น 1/11

ข้างต้นเราคำนวณว่าความน่าจะเป็นนี้คือ 7.8% นั่นคือ จริงๆ แล้วตัวเลขนั้นใกล้กับ 1/13 มากขึ้น แต่ด้วยเหตุผลง่ายๆ บางประการ เราจึงสามารถหาค่าประมาณคร่าวๆ ได้โดยไม่ต้องใช้เครื่องคิดเลข

ทฤษฎีบทของเบย์

ตอนนี้เรามาอธิบายขบวนความคิดของเราโดยใช้สูตรที่เรียกว่าทฤษฎีบทของเบย์ ทฤษฎีบทนี้ช่วยให้คุณสามารถแก้ไขผลการศึกษาตามการบิดเบือนที่เกิดจากผลลัพธ์บวกลวง:
  • Pr(A|X) = ความน่าจะเป็นของโรค (A) เมื่อให้ผลเป็นบวก (X) นี่คือสิ่งที่เราอยากรู้จริงๆ ความน่าจะเป็นของเหตุการณ์จะเป็นเท่าใดหากผลลัพธ์เป็นบวก ในตัวอย่างของเราคือ 7.8%
  • Pr(X|A) = ความน่าจะเป็นของผลบวก (X) กรณีผู้ป่วยป่วยจริงๆ (A) ในกรณีของเรา นี่คือค่าบวกที่แท้จริง - 80%
  • Pr(A) = ความน่าจะเป็นที่จะป่วย (1%)
  • Pr(ไม่ใช่ A) = ความน่าจะเป็นที่จะไม่ป่วย (99%)
  • Pr(X|ไม่ใช่ A) = ความน่าจะเป็นของผลลัพธ์ที่เป็นบวกของการศึกษาหากไม่มีโรค นี่คืออัตราผลบวกลวง - 9.6%
เราสามารถสรุปได้: เพื่อให้ได้ความน่าจะเป็นของเหตุการณ์ คุณต้องหารความน่าจะเป็นของผลลัพธ์เชิงบวกที่แท้จริงด้วยความน่าจะเป็นของผลลัพธ์เชิงบวกทั้งหมด ตอนนี้เราสามารถลดความซับซ้อนของสมการได้:
Pr(X) คือค่าคงที่การทำให้เป็นมาตรฐาน มันช่วยเราได้ดี หากไม่มีมัน ผลการทดสอบที่เป็นบวกจะทำให้เรามีโอกาส 80% ที่เหตุการณ์จะเกิดขึ้น
Pr(X) คือความน่าจะเป็นของผลลัพธ์เชิงบวกใดๆ ไม่ว่าจะเป็นผลลัพธ์เชิงบวกที่แท้จริงในการศึกษาของผู้ป่วย (1%) หรือผลลัพธ์บวกลวงในการศึกษา คนที่มีสุขภาพดี (99%).

ในตัวอย่างของเรา Pr(X) เป็นจำนวนที่ค่อนข้างมาก เนื่องจากความน่าจะเป็นของผลบวกลวงมีสูง

Pr(X) ให้ผลลัพธ์ 7.8% ซึ่งเมื่อดูเผินๆ ดูเหมือนจะขัดกับสัญชาตญาณ

ความหมายของทฤษฎีบท

เรากำลังดำเนินการทดสอบเพื่อค้นหาสถานการณ์ที่แท้จริง หากการทดสอบของเราสมบูรณ์แบบและแม่นยำ ความน่าจะเป็นของการทดสอบและความน่าจะเป็นของเหตุการณ์ต่างๆ ก็จะตรงกัน ผลลัพธ์เชิงบวกทั้งหมดจะเป็นบวกอย่างแท้จริง และผลลัพธ์เชิงลบทั้งหมดจะเป็นลบ แต่เราอยู่. โลกแห่งความจริง- และในโลกของเรา การทดสอบให้ผลลัพธ์ที่ไม่ถูกต้อง ทฤษฎีบทของเบย์อธิบายถึงผลลัพธ์ที่มีอคติ แก้ไขข้อผิดพลาด สร้างประชากรขึ้นใหม่ และค้นหาความน่าจะเป็นที่จะเป็นบวกอย่างแท้จริง

ตัวกรองสแปม

ทฤษฎีบทของ Bayes ถูกนำมาใช้อย่างประสบความสำเร็จในตัวกรองสแปม

เรามี:

  • เหตุการณ์ A - สแปมในจดหมาย
  • ผลการทดสอบ - เนื้อหาของคำบางคำในตัวอักษร:

ตัวกรองจะพิจารณาผลการทดสอบ (เนื้อหาของคำบางคำในตัวอักษร) และคาดการณ์ว่าจดหมายนั้นมีสแปมหรือไม่ ทุกคนเข้าใจดีว่า ตัวอย่างเช่น คำว่า "ไวอากร้า" มักพบในสแปมมากกว่าในตัวอักษรทั่วไป

ตัวกรองสแปมตามบัญชีดำมีข้อเสีย - มักจะให้ผลลัพธ์ที่ผิดพลาด

ตัวกรองสแปมทฤษฎีบทของ Bayes ใช้วิธีการที่สมดุลและชาญฉลาด: ใช้ได้กับความน่าจะเป็น เมื่อเราวิเคราะห์คำในอีเมล เราสามารถคำนวณความเป็นไปได้ที่อีเมลนั้นเป็นสแปม แทนที่จะตัดสินใจใช่หรือไม่ใช่ หากความน่าจะเป็นที่จดหมายมีสแปมคือ 99% แสดงว่าจดหมายนั้นมีอยู่จริง

เมื่อเวลาผ่านไป ตัวกรองจะได้รับการฝึกกับตัวอย่างที่มีขนาดใหญ่ขึ้นเรื่อยๆ และอัปเดตความน่าจะเป็น ดังนั้น ตัวกรองขั้นสูงที่สร้างขึ้นตามทฤษฎีบทของ Bayes จะตรวจสอบคำหลายคำติดต่อกันและใช้เป็นข้อมูล

แหล่งข้อมูลเพิ่มเติม:

แท็ก: เพิ่มแท็ก

แบบฟอร์มกิจกรรม เต็มกลุ่มหากอย่างน้อยหนึ่งรายการจะเกิดขึ้นอย่างแน่นอนอันเป็นผลมาจากการทดลองและเข้ากันไม่ได้แบบคู่

สมมุติว่าเหตุการณ์นั้น สามารถเกิดขึ้นได้เฉพาะกับหนึ่งในหลายเหตุการณ์ที่เข้ากันไม่ได้แบบคู่ซึ่งก่อตัวเป็นกลุ่มที่สมบูรณ์ เราจะเรียกกิจกรรม ( ฉัน= 1, 2,…, n) สมมติฐานประสบการณ์เพิ่มเติม (นิรนัย) ความน่าจะเป็นที่จะเกิดเหตุการณ์ A ถูกกำหนดโดยสูตร ความน่าจะเป็นเต็ม :

ตัวอย่างที่ 16มีโกศอยู่สามองค์ โกศแรกประกอบด้วยลูกบอลสีขาว 5 ลูกและสีดำ 3 ลูก โกศที่สองมีลูกบอลสีขาว 4 ลูกและสีดำ 4 ลูก และโกศที่สามมีลูกบอลสีขาว 8 ลูก โกศหนึ่งอันจะถูกเลือกโดยการสุ่ม (เช่น อาจหมายความว่าตัวเลือกนั้นทำจากโกศเสริมที่มีลูกบอลสามลูกหมายเลข 1, 2 และ 3) ลูกบอลจะถูกสุ่มออกมาจากโกศนี้ ความน่าจะเป็นที่จะเป็นสีดำเป็นเท่าใด?

สารละลาย.เหตุการณ์ – ลูกบอลสีดำจะถูกลบออก หากรู้ว่าลูกบอลถูกดึงมาจากโกศใด ความน่าจะเป็นที่ต้องการสามารถคำนวณได้โดยใช้คำจำกัดความดั้งเดิมของความน่าจะเป็น ให้เราแนะนำสมมติฐาน (สมมติฐาน) เกี่ยวกับโกศที่ถูกเลือกเพื่อดึงลูกบอล

ลูกบอลสามารถดึงมาจากโกศแรก (การคาดเดา) หรือจากโกศที่สอง (การคาดเดา) หรือจากโกศที่สาม (การคาดเดา) เนื่องจากมีโอกาสเท่าเทียมกันในการเลือกโกศอันใดอันหนึ่ง .

มันเป็นไปตามนั้น

ตัวอย่างที่ 17หลอดไฟฟ้าผลิตขึ้นที่โรงงานสามแห่ง โรงงานแรกผลิตได้ 30% จำนวนทั้งหมดหลอดไฟฟ้าวินาที – 25%
และที่สาม - ส่วนที่เหลือ ผลิตภัณฑ์ของโรงงานแห่งแรกประกอบด้วยหลอดไฟฟ้าที่มีข้อบกพร่อง 1% ชิ้นที่สอง - 1.5% ชิ้นที่สาม - 2% ทางร้านรับสินค้าจากโรงงานทั้งสามแห่ง ความน่าจะเป็นที่หลอดไฟที่ซื้อในร้านค้าจะชำรุดคือเท่าไร?

สารละลาย.จะต้องตั้งสมมติฐานเกี่ยวกับโรงงานที่ผลิตหลอดไฟ เมื่อรู้เช่นนี้แล้ว เราก็จะพบความน่าจะเป็นที่จะมีข้อบกพร่องได้ ให้เราแนะนำสัญกรณ์สำหรับเหตุการณ์: – หลอดไฟฟ้าที่ซื้อมาชำรุด – หลอดไฟฟ้าผลิตโดยโรงงานแห่งที่ 1 – หลอดไฟฟ้าผลิตโดยโรงงานแห่งที่ 2
– โคมไฟผลิตโดยโรงงานแห่งที่สาม

เราค้นหาความน่าจะเป็นที่ต้องการโดยใช้สูตรความน่าจะเป็นทั้งหมด:

สูตรเบย์ อนุญาต เป็นกลุ่มที่สมบูรณ์ของเหตุการณ์ที่เข้ากันไม่ได้แบบคู่ (สมมติฐาน) – เหตุการณ์สุ่ม แล้ว,

สูตรสุดท้ายที่ช่วยให้สามารถประมาณความน่าจะเป็นของสมมติฐานใหม่หลังจากผลการทดสอบที่ทำให้เกิดเหตุการณ์ A เรียกว่า สูตรเบย์ .

ตัวอย่างที่ 18โดยเฉลี่ยแล้ว 50% ของผู้ป่วยโรคนี้จะเข้ารับการรักษาในโรงพยาบาลเฉพาะทาง ถึง, 30% – มีโรค , 20 % –
ด้วยความเจ็บป่วย - ความน่าจะเป็นของการรักษาโรคให้หายขาด เคเท่ากับ 0.7 สำหรับโรค และ ความน่าจะเป็นเหล่านี้คือ 0.8 และ 0.9 ตามลำดับ ผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาลก็ออกจากโรงพยาบาลตามปกติแล้ว ค้นหาความน่าจะเป็นที่ผู้ป่วยรายนี้จะเป็นโรคนี้ เค.


สารละลาย.ให้เราแนะนำสมมติฐาน: – ผู้ป่วยได้รับความทุกข์ทรมานจากโรคภัยไข้เจ็บ ถึง , – ผู้ป่วยได้รับความทุกข์ทรมานจากโรคภัยไข้เจ็บ .

จากนั้นตามเงื่อนไขของปัญหาเราจะได้ มาแนะนำกิจกรรมกัน – ผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาลมีสุขภาพแข็งแรงดี ตามเงื่อนไข

จากการใช้สูตรความน่าจะเป็นทั้งหมดที่เราได้รับ:

ตามสูตรของเบย์ส

ตัวอย่างที่ 19ให้มีลูกบอลห้าลูกในโกศและการเดาจำนวนลูกบอลสีขาวก็เป็นไปได้เท่ากัน สุ่มหยิบลูกบอลมาจากโกศและกลายเป็นสีขาว ข้อสันนิษฐานเกี่ยวกับองค์ประกอบเริ่มต้นของโกศน่าจะเป็นไปได้มากที่สุด?

สารละลาย.สมมุติว่าในโกศมีลูกบอลสีขาว กล่าวคือสามารถตั้งสมมติฐานได้หกข้อ จากนั้นตามเงื่อนไขของปัญหาเราจะได้

มาแนะนำกิจกรรมกัน – ลูกบอลสีขาวสุ่มเลือก มาคำนวณกัน เนื่องจาก จากนั้นตามสูตรของ Bayes เรามี:

ดังนั้น สมมติฐานที่เป็นไปได้มากที่สุดคือเพราะว่า

ตัวอย่างที่ 20สองในสามองค์ประกอบการทำงานที่แยกจากกันของอุปกรณ์คอมพิวเตอร์ล้มเหลว ค้นหาความน่าจะเป็นที่องค์ประกอบที่หนึ่งและสองล้มเหลว หากความน่าจะเป็นของความล้มเหลวขององค์ประกอบที่หนึ่ง ที่สอง และสาม ตามลำดับคือ 0.2 0.4 และ 0.3

สารละลาย.ให้เราแสดงโดย เหตุการณ์ – สององค์ประกอบล้มเหลว สามารถสร้างสมมติฐานต่อไปนี้ได้:

– องค์ประกอบที่หนึ่งและสองล้มเหลว แต่องค์ประกอบที่สามยังทำงานได้ เนื่องจากองค์ประกอบต่างๆ ทำงานอย่างเป็นอิสระ ทฤษฎีบทการคูณจึงใช้:

สูตรเบย์:

ความน่าจะเป็น P(H i) ของสมมติฐาน H i เรียกว่าความน่าจะเป็นแบบนิรนัย - ความน่าจะเป็นก่อนทำการทดลอง
ความน่าจะเป็น P(A/H i) เรียกว่าความน่าจะเป็นภายหลัง - ความน่าจะเป็นของสมมติฐาน H i ที่ได้รับการขัดเกลาจากประสบการณ์

ตัวอย่างหมายเลข 1 สามารถประกอบอุปกรณ์ได้จากชิ้นส่วนคุณภาพสูงและจากชิ้นส่วนคุณภาพธรรมดา อุปกรณ์ประมาณ 40% ประกอบจากชิ้นส่วนคุณภาพสูง หากอุปกรณ์ประกอบจากชิ้นส่วนคุณภาพสูงความน่าเชื่อถือ (ความน่าจะเป็นของการทำงานที่ปราศจากข้อผิดพลาด) เมื่อเวลาผ่านไป t คือ 0.95 ถ้าทำจากชิ้นส่วนคุณภาพธรรมดาความน่าเชื่อถือของมันคือ 0.7 อุปกรณ์ได้รับการทดสอบตามเวลา t และทำงานได้อย่างไม่มีที่ติ ค้นหาความน่าจะเป็นที่ทำจากชิ้นส่วนคุณภาพสูง
สารละลาย.เป็นไปได้สองสมมติฐาน: H 1 - อุปกรณ์ประกอบจากชิ้นส่วนคุณภาพสูง H 2 - อุปกรณ์ประกอบจากชิ้นส่วนคุณภาพธรรมดา ความน่าจะเป็นของสมมติฐานเหล่านี้ก่อนการทดลอง: P(H 1) = 0.4, P(H 2) = 0.6 จากผลการทดลอง พบว่ามีเหตุการณ์ A - อุปกรณ์ทำงานได้อย่างไร้ที่ติเป็นเวลา t ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์นี้ภายใต้สมมติฐาน H 1 และ H 2 เท่ากัน: P(A|H 1) = 0.95; P(A|H 2) = 0.7 การใช้สูตร (12) เราค้นหาความน่าจะเป็นของสมมติฐาน H 1 หลังการทดลอง:

ตัวอย่างหมายเลข 2 นักกีฬาสองคนแยกจากกัน ยิงไปที่เป้าหมายเดียว แต่ละคนยิงนัดเดียว ความน่าจะเป็นที่จะยิงเข้าเป้าสำหรับนักกีฬาคนแรกคือ 0.8 ส่วนครั้งที่สองคือ 0.4 หลังจากการยิงพบหนึ่งหลุมในเป้าหมาย สมมติว่านักกีฬาสองคนยิงจุดเดียวกันไม่ได้ ให้หาความน่าจะเป็นที่นักกีฬาคนแรกยิงเข้าเป้า
สารละลาย.ปล่อยให้เหตุการณ์ A - หลังจากยิงแล้วตรวจพบหนึ่งรูในเป้าหมาย ก่อนที่การยิงจะเริ่มขึ้น มีสมมติฐานที่เป็นไปได้:
H 1 - ไม่ว่าจะยิงคนแรกหรือคนที่สองก็ตาม ความน่าจะเป็นของสมมติฐานนี้: P(H 1) = 0.2 · 0.6 = 0.12
H 2 - นักกีฬาทั้งสองคนจะตี P(H 2) = 0.8 · 0.4 = 0.32
H 3 - ผู้ยิงคนแรกจะโดน แต่คนที่สองจะไม่โดน P(H 3) = 0.8 · 0.6 = 0.48
H 4 - นักกีฬาคนแรกจะไม่โดน แต่คนที่สองจะโดน P (H 4) = 0.2 · 0.4 = 0.08
ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์ A ภายใต้สมมติฐานเหล่านี้มีค่าเท่ากัน:

หลังจากการทดลอง สมมติฐาน H 1 และ H 2 เป็นไปไม่ได้ และความน่าจะเป็นของสมมติฐาน H 3 และ H 4
จะเท่ากัน:


ดังนั้นจึงเป็นไปได้มากว่าเป้าหมายจะถูกยิงโดยผู้ยิงคนแรก

ตัวอย่างหมายเลข 3 ในร้านติดตั้งจะมีมอเตอร์ไฟฟ้าเชื่อมต่อกับอุปกรณ์ มอเตอร์ไฟฟ้าจัดทำโดยผู้ผลิตสามราย คลังสินค้าประกอบด้วยมอเตอร์ไฟฟ้าจากโรงงานที่ระบุชื่อ ตามลำดับ จำนวน 19.6 และ 11 ตัว สามารถทำงานได้ไม่มีชำรุดจนสิ้นสุดระยะเวลาการรับประกัน ตามลำดับ โดยมีความน่าจะเป็น 0.85, 0.76 และ 0.71 พนักงานสุ่มเลือกมอเตอร์หนึ่งตัวและติดตั้งเข้ากับอุปกรณ์ ค้นหาความน่าจะเป็นที่มอเตอร์ไฟฟ้าติดตั้งและทำงานโดยไม่มีข้อผิดพลาดจนกระทั่งสิ้นสุดระยะเวลาการรับประกันโดยผู้ผลิตรายแรก รายที่สอง หรือรายที่สาม ตามลำดับ
สารละลาย.การทดสอบครั้งแรกคือการเลือกใช้มอเตอร์ไฟฟ้า การทดสอบครั้งที่สองคือการทำงานของมอเตอร์ไฟฟ้าในช่วงระยะเวลาการรับประกัน พิจารณาเหตุการณ์ต่อไปนี้:
เอ - มอเตอร์ไฟฟ้าทำงานโดยไม่มีความล้มเหลวจนกว่าจะสิ้นสุดระยะเวลาการรับประกัน
H 1 - ผู้ติดตั้งจะนำเครื่องยนต์ไปจากโรงงานแห่งแรก
H 2 - ผู้ติดตั้งจะนำเครื่องยนต์ไปจากโรงงานแห่งที่สอง
H 3 - ผู้ติดตั้งจะนำเครื่องยนต์มาจากการผลิตของโรงงานแห่งที่สาม
ความน่าจะเป็นของเหตุการณ์ A คำนวณโดยใช้สูตรความน่าจะเป็นทั้งหมด:

ความน่าจะเป็นแบบมีเงื่อนไขระบุไว้ในคำชี้แจงปัญหา:

เรามาค้นหาความน่าจะเป็นกัน


การใช้สูตรเบย์ (12) เราคำนวณความน่าจะเป็นแบบมีเงื่อนไขของสมมติฐาน H i:

ตัวอย่างหมายเลข 4 ความน่าจะเป็นที่ในระหว่างการทำงานของระบบที่ประกอบด้วยสามองค์ประกอบ องค์ประกอบหมายเลข 1, 2 และ 3 จะล้มเหลวอยู่ในอัตราส่วน 3: 2: 5 ความน่าจะเป็นในการตรวจจับความล้มเหลวขององค์ประกอบเหล่านี้เท่ากับ 0.95 ตามลำดับ 0.9 และ 0.6

b) ภายใต้เงื่อนไขของงานนี้ ตรวจพบความล้มเหลวระหว่างการทำงานของระบบ องค์ประกอบใดมีแนวโน้มที่จะล้มเหลวมากที่สุด?

สารละลาย.
ให้ A เป็นเหตุการณ์ที่ล้มเหลว ให้เราแนะนำระบบสมมติฐาน H1 - ความล้มเหลวขององค์ประกอบแรก, H2 - ความล้มเหลวขององค์ประกอบที่สอง, H3 - ความล้มเหลวขององค์ประกอบที่สาม
เราค้นหาความน่าจะเป็นของสมมติฐาน:
พ(H1) = 3/(3+2+5) = 0.3
พ(H2) = 2/(3+2+5) = 0.2
P(H3) = 5/(3+2+5) = 0.5

ตามเงื่อนไขของปัญหา ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์ A เท่ากับ:
P(A|H1) = 0.95, P(A|H2) = 0.9, P(A|H3) = 0.6

ก) ค้นหาความน่าจะเป็นที่จะตรวจพบความล้มเหลวในระบบ
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0.3*0.95 + 0.2*0.9 + 0.5 *0.6 = 0.765

b) ภายใต้เงื่อนไขของงานนี้ ตรวจพบความล้มเหลวระหว่างการทำงานของระบบ องค์ประกอบใดมีแนวโน้มที่จะล้มเหลวมากที่สุด?
P1 = P(H1)*P(A|H1)/ P(A) = 0.3*0.95 / 0.765 = 0.373
P2 = P(H2)*P(A|H2)/ P(A) = 0.2*0.9 / 0.765 = 0.235
P3 = P(H3)*P(A|H3)/ P(A) = 0.5*0.6 / 0.765 = 0.392

องค์ประกอบที่สามมีความน่าจะเป็นสูงสุด

กำหนดและพิสูจน์สูตรความน่าจะเป็นทั้งหมด ยกตัวอย่างการใช้งาน

หากเหตุการณ์ H 1, H 2, ..., H n เข้ากันไม่ได้แบบคู่ และเหตุการณ์เหล่านี้อย่างน้อย 1 เหตุการณ์จำเป็นต้องเกิดขึ้นระหว่างการทดสอบแต่ละครั้ง ดังนั้นสำหรับเหตุการณ์ A ใดๆ จะถือว่ามีความเท่าเทียมกันดังต่อไปนี้:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) – สูตรความน่าจะเป็นทั้งหมด ในกรณีนี้ H 1, H 2, …, H n เรียกว่าสมมติฐาน

การพิสูจน์:เหตุการณ์ A แบ่งออกเป็นตัวเลือก: AH 1, AH 2, ..., AH n (A มาพร้อมกับ H 1 เป็นต้น) กล่าวอีกนัยหนึ่ง เรามี A = AH 1 + AH 2 +…+ AH n เนื่องจาก H 1 , H 2 , …, H n เข้ากันไม่ได้แบบคู่ เหตุการณ์ AH 1 , AH 2 , …, AH n ก็เข้ากันไม่ได้เช่นกัน เมื่อใช้กฎการบวก เราจะพบว่า: P(A)= P(AH 1)+ P(AH 2)+…+ P(AH n) การแทนที่แต่ละเทอม P(AH i) ทางด้านขวาด้วยผลคูณ P Hi (A)P(H i) เราจะได้ความเท่าเทียมกันที่ต้องการ

ตัวอย่าง:

สมมติว่าเรามีชิ้นส่วนสองชุด ความน่าจะเป็นที่ส่วนของชุดแรกเป็นมาตรฐานคือ 0.8 และชุดที่สองคือ 0.9 ลองหาความน่าจะเป็นที่ชิ้นส่วนที่สุ่มมานั้นเป็นมาตรฐาน

P(A) = 0.5*0.8 + 0.5*0.9 = 0.85

กำหนดและพิสูจน์สูตรของเบย์ ยกตัวอย่างการใช้งาน

สูตรเบย์:

ช่วยให้คุณสามารถประเมินความน่าจะเป็นของสมมติฐานอีกครั้งหลังจากผลการทดสอบที่ส่งผลให้ทราบเหตุการณ์ A

การพิสูจน์:ปล่อยให้เหตุการณ์ A เกิดขึ้นโดยขึ้นอยู่กับเหตุการณ์ที่เข้ากันไม่ได้อย่างใดอย่างหนึ่ง H 1 , H 2 , …, H n รวมกันเป็นกลุ่มที่สมบูรณ์ เนื่องจากไม่ทราบล่วงหน้าว่าเหตุการณ์ใดจะเกิดขึ้น จึงเรียกว่าสมมติฐาน

ความน่าจะเป็นที่จะเกิดขึ้นของเหตุการณ์ A ถูกกำหนดโดยสูตรความน่าจะเป็นทั้งหมด:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) (1)

สมมติว่ามีการทดสอบเกิดขึ้นซึ่งเป็นผลมาจากเหตุการณ์ A ที่เกิดขึ้น ให้เราพิจารณาว่าความน่าจะเป็นของสมมติฐานมีการเปลี่ยนแปลงอย่างไรเนื่องจากเหตุการณ์ A เกิดขึ้นแล้ว กล่าวอีกนัยหนึ่ง เราจะมองหาความน่าจะเป็นแบบมีเงื่อนไข

P A (H 1), P A (H 2), ..., P A (H n)

ตามทฤษฎีบทการคูณเรามี:

P(AH i) = P(A) P A (H i) = P(H i)P สวัสดี (A)

ให้เราแทนที่ P(A) ที่นี่ตามสูตร (1) ที่เราได้รับ

ตัวอย่าง:

มีกล่องหน้าตาเหมือนกันสามกล่อง ในกล่องแรกมีลูกบอลสีขาว n=12 ลูก ในช่องที่สองมี m=4 ลูกบอลสีขาว และ n-m=8 ลูกสีดำ ในช่องที่สามมีลูกบอลสีดำ n=12 ลูก ลูกบอลสีขาวจะถูกนำมาจากกล่องที่เลือกโดยการสุ่ม ค้นหาความน่าจะเป็น P ที่ดึงลูกบอลมาจากช่องที่สอง

สารละลาย.

4) หาสูตรความน่าจะเป็นเคความสำเร็จในซีรีส์nการทดสอบตามแบบแผนเบอร์นูลลี

ให้เราตรวจสอบกรณีเมื่อมีการผลิต nการทดลองที่เหมือนกันและเป็นอิสระ ซึ่งแต่ละการทดลองมีเพียง 2 ผลลัพธ์เท่านั้น ( ก;- เหล่านั้น. ประสบการณ์บางอย่างเกิดขึ้นซ้ำแล้วซ้ำอีก nครั้ง และในการทดลองแต่ละครั้งมีเหตุการณ์บางอย่าง อาจปรากฏขึ้นด้วยความน่าจะเป็น P(A)=qหรือไม่ปรากฏด้วยความน่าจะเป็น ป()=q-1=พี .

พื้นที่ของเหตุการณ์เบื้องต้นของการทดสอบแต่ละชุดประกอบด้วยจุดหรือลำดับของสัญลักษณ์ และ . พื้นที่ความน่าจะเป็นดังกล่าวเรียกว่าโครงการเบอร์นูลลี ภารกิจคือเพื่อให้แน่ใจว่าสำหรับที่กำหนด เคจงหาความน่าจะเป็นนั้น ไม่มีกิจกรรมการทดลองซ้ำหลายครั้ง จะมา เคครั้งหนึ่ง.

เพื่อความชัดเจนยิ่งขึ้น เรามาตกลงกันในแต่ละเหตุการณ์กัน ถือเป็นความสำเร็จไม่ก้าวหน้า เอ -เหมือนความล้มเหลว เป้าหมายของเราคือหาความน่าจะเป็นนั้น nการทดลองอย่างแน่นอน เคจะประสบความสำเร็จ เรามาแสดงเหตุการณ์นี้ชั่วคราวโดย บี.

เหตุการณ์ ในจะถูกนำเสนอเป็นผลรวมของชุดเหตุการณ์ - ตัวเลือกเหตุการณ์ ใน.หากต้องการบันทึกตัวเลือกเฉพาะ คุณต้องระบุจำนวนการทดสอบที่จบลงด้วยความสำเร็จ ตัวอย่างเช่น หนึ่งใน ตัวเลือกที่เป็นไปได้มี

- เห็นได้ชัดว่าจำนวนตัวเลือกทั้งหมดเท่ากับ และความน่าจะเป็นของแต่ละตัวเลือกเนื่องจากความเป็นอิสระของการทดลองเท่ากับ ดังนั้นความน่าจะเป็นของเหตุการณ์ ในเท่ากับ เพื่อเน้นการพึ่งพานิพจน์ผลลัพธ์บน nและ เคมาแสดงกันเถอะ . ดังนั้น, .

5) ใช้สูตรอินทิกรัลโดยประมาณของลาปลาซ หาสูตรสำหรับประมาณค่าความเบี่ยงเบนของความถี่สัมพัทธ์ของเหตุการณ์ A จากความน่าจะเป็น p ของการเกิดขึ้นของ A ในการทดลองครั้งเดียว

ภายใต้เงื่อนไขของโครงการ Bernoulli ที่มีค่าที่กำหนดเป็น n และ p สำหรับ e>0 ที่กำหนด เราประเมินความน่าจะเป็นของเหตุการณ์ โดยที่ k คือจำนวนความสำเร็จในการทดลอง n ครั้ง อสมการนี้เทียบเท่ากับ |k-np|£en กล่าวคือ -en £ k-np £ en หรือ np-en £ k £ np+en ดังนั้น เรากำลังพูดถึงการประมาณค่าความน่าจะเป็นของเหตุการณ์ k 1 £ k £ k 2 โดยที่ k 1 = np-en, k 2 = np+en เมื่อใช้สูตรอินทิกรัลลาปลาซโดยประมาณ เราจะได้: P( » เมื่อคำนึงถึงความแปลกของฟังก์ชันลาปลาซ เราจะได้ความเท่าเทียมกันโดยประมาณ P( » 2Ф

บันทึก : เพราะ ตามเงื่อนไข n=1 จากนั้นเราแทนที่ 1 แทน n แล้วได้คำตอบสุดท้าย

6) เอาล่ะ เอ็กซ์– ตัวแปรสุ่มแบบไม่ต่อเนื่องที่รับเฉพาะค่าที่ไม่เป็นลบและมีความคาดหวังทางคณิตศาสตร์ - พิสูจน์ว่า (เอ็กซ์≥ 4) ≤ ม./ 4 .

m= (เนื่องจากเทอมที่ 1 เป็นบวก ดังนั้นหากลบออก ก็จะน้อยลง) ³ (แทนที่ คูณ 4 ก็จะน้อยลงเท่านั้น) ³ = =4× (เอ็กซ์³4) จากที่นี่ (เอ็กซ์≥ 4) ≤ ม./ 4 .

(แทนที่จะเป็น 4 สามารถเป็นตัวเลขใดก็ได้)

7) พิสูจน์ว่าถ้า เอ็กซ์และ เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องอิสระที่รับชุดค่าที่มีขอบเขตจำกัด ม(XY)=ม(X)ม(ย)

x1 x2
หน้า 1 หน้า 2

หมายเลขที่เรียก ม(XY)= x 1 หน้า 1 + x 2 หน้า 2 + …

ถ้าเป็นตัวแปรสุ่ม เอ็กซ์และ มีความเป็นอิสระ ดังนั้นความคาดหวังทางคณิตศาสตร์ของผลิตภัณฑ์จะเท่ากับผลคูณของความคาดหวังทางคณิตศาสตร์ของพวกเขา (ทฤษฎีบทของการคูณความคาดหวังทางคณิตศาสตร์)

การพิสูจน์:ค่าที่เป็นไปได้ เอ็กซ์มาแสดงกันเถอะ x1 , x2, …, ค่าที่เป็นไปได้ ป - ป 1 , ป 2, …หน้า ฉัน =P(X=x ฉัน , Y=y เจ). เอ็กซ์วาย ม(XY)=เนื่องจากความเป็นอิสระของปริมาณ เอ็กซ์และ เรามี: P(X= x ผม , Y=y เจ)= P(X=x i) P(Y=y เจ)กำหนดแล้ว P(X=x i)=r ผม , P(Y=y j)=s เจ, เราเขียนความเท่าเทียมกันนี้ใหม่ในรูปแบบ p ij = r ฉัน s j

ดังนั้น, ม(XY)- การแปลงความเท่าเทียมกันที่เกิดขึ้นเราได้รับ: ม(XY)=()() = ม(X)ม(Y) Q.E.D.

8) พิสูจน์ว่าถ้า เอ็กซ์และ เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่รับชุดค่าที่มีจำกัดแล้ว (เอ็กซ์+) = (เอ็กซ์) +().

ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีกฎการแจกแจง

x1 x2
หน้า 1 หน้า 2

หมายเลขที่เรียก ม(XY)= x 1 หน้า 1 + x 2 หน้า 2 + …

ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มสองตัวจะเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์ของพจน์: M(X+Y)= M(X)+M(Y)

การพิสูจน์:ค่าที่เป็นไปได้ เอ็กซ์มาแสดงกันเถอะ x1 , x2, …, ค่าที่เป็นไปได้ ป - ป 1 , ป 2, …หน้า ฉัน =P(X=x ฉัน , Y=y เจ).กฎการกระจายขนาด เอ็กซ์+ยจะถูกแสดงในตารางที่เกี่ยวข้อง ม(X+ย)= . สูตรนี้สามารถเขียนใหม่ได้ดังนี้: ม(X+ย)= ผลรวมแรกของด้านขวาสามารถแสดงเป็น นิพจน์คือความน่าจะเป็นที่เหตุการณ์ใดๆ จะเกิดขึ้น (X=x i, Y=y 1), (X=x i, Y=y 2), ... ดังนั้น นิพจน์นี้จึงเท่ากับ P(X=x i) . จากที่นี่ - เช่นเดียวกัน, - เป็นผลให้เราได้: M(X+Y)= M(X)+M(Y) ซึ่งเป็นสิ่งที่จำเป็นต้องพิสูจน์

9) เอาล่ะ เอ็กซ์– ตัวแปรสุ่มแบบไม่ต่อเนื่องกระจายตามกฎการแจกแจงแบบทวินามพร้อมพารามิเตอร์ nและ - พิสูจน์ว่า ม(X)=nр, D(X)=nр(1-р).

ให้มันผลิตออกมา nการทดลองอิสระ ในแต่ละเหตุการณ์ A สามารถเกิดขึ้นได้ด้วยความน่าจะเป็น ดังนั้นความน่าจะเป็นของเหตุการณ์ตรงกันข้าม Ā เท่ากับ q=1-p- ลองพิจารณาสิ่งต่อไปนี้ ขนาด เอ็กซ์– จำนวนครั้งของเหตุการณ์ วี nการทดลอง ลองจินตนาการว่า X เป็นผลรวมของตัวบ่งชี้ของเหตุการณ์ A สำหรับการทดลองแต่ละครั้ง: X=X 1 +X 2 +…+X n- ทีนี้มาพิสูจน์กัน M(X i)=พี, D(X i)=np- เมื่อต้องการทำเช่นนี้ ให้พิจารณากฎการกระจาย sl ปริมาณซึ่งมีลักษณะดังนี้:

เอ็กซ์
ถาม

เห็นได้ชัดว่า ม(X)=นดังนั้นตัวแปรสุ่ม X 2 จึงมีกฎการแจกแจงเหมือนกัน D(X)=M(X 2)-M 2 (X)=р-р 2 =р(1-р)=рq- ดังนั้น, ม(X ผม)=น, D(H i)=pq- ตามทฤษฎีบทการบวกความคาดหวังทางคณิตศาสตร์ M(X)=M(X 1)+..+M(X n)=nр.เนื่องจากตัวแปรสุ่ม เอ็กซ์ ฉันมีความเป็นอิสระ จากนั้นความแปรปรวนก็รวมกัน: D(X)=D(X 1)+…+D(X n)=npq=np(1-p)

10) เอาล่ะ เอ็กซ์– ตัวแปรสุ่มแบบไม่ต่อเนื่องที่แจกแจงตามกฎของปัวซองพร้อมพารามิเตอร์ แล พิสูจน์ว่า (เอ็กซ์) = λ .

กฎของปัวซองได้รับจากตาราง:

จากที่นี่เรามี:

ดังนั้น พารามิเตอร์ แล ซึ่งเป็นลักษณะเฉพาะของการแจกแจงแบบปัวซองนี้ จึงไม่มีอะไรมากไปกว่าค่าคาดหวังทางคณิตศาสตร์ของค่า X

11) ให้ X เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งกระจายตามกฎเรขาคณิตด้วยพารามิเตอร์ p พิสูจน์ว่า M (X) = .

กฎการกระจายทางเรขาคณิตสัมพันธ์กับลำดับการทดลองเบอร์นูลลีจนกระทั่งเหตุการณ์ A สำเร็จครั้งแรก ความน่าจะเป็นที่จะเกิดเหตุการณ์ A ในการทดลองครั้งหนึ่งคือ p ซึ่งเหตุการณ์ตรงกันข้าม q = 1-p กฎการกระจายของตัวแปรสุ่ม X - จำนวนการทดสอบ - มีรูปแบบ:

เอ็กซ์ n
หน้า พีคิว เอ็น-1

ชุดที่เขียนในวงเล็บจะได้มาจากการแยกความแตกต่างของความก้าวหน้าทางเรขาคณิตแบบเทอมต่อเทอม

เพราะฉะนั้น, .

12) พิสูจน์ว่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปรสุ่ม X และ Y เป็นไปตามเงื่อนไข

คำนิยาม:ค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปรสุ่มสองตัวคืออัตราส่วนของความแปรปรวนร่วมต่อผลคูณของส่วนเบี่ยงเบนมาตรฐานของตัวแปรเหล่านี้: . .

การพิสูจน์:ลองพิจารณาตัวแปรสุ่ม Z = ลองคำนวณความแปรปรวนของมันกัน เนื่องจาก ด้านซ้ายไม่เป็นลบ ดังนั้นอันที่ถูกต้องก็คือไม่เป็นลบ ดังนั้น |ρ|≤1

13) ความแปรปรวนคำนวณอย่างไรในกรณีของการแจกแจงต่อเนื่องด้วยความหนาแน่น (x- พิสูจน์สิ่งนั้นสำหรับตัวแปรสุ่ม เอ็กซ์มีความหนาแน่น การกระจายตัว ดี(เอ็กซ์) ไม่มีอยู่ และความคาดหวังทางคณิตศาสตร์ (เอ็กซ์) มีอยู่

ความแปรปรวนของตัวแปรสุ่มต่อเนื่องสัมบูรณ์ X พร้อมฟังก์ชันความหนาแน่น f(x) และความคาดหวังทางคณิตศาสตร์ m = M(X) ถูกกำหนดโดยความเท่าเทียมกันเดียวกันกับสำหรับ ค่าที่ไม่ต่อเนื่อง

.

ในกรณีที่ตัวแปรสุ่ม X ต่อเนื่องอย่างแน่นอนจดจ่ออยู่กับช่วงเวลา

∞ - การเบี่ยงเบนอินทิกรัลดังนั้นจึงไม่มีการกระจายตัว

14) พิสูจน์ว่าสำหรับตัวแปรสุ่มปกติ X ที่มีฟังก์ชันความหนาแน่นของการแจกแจง ค่าคาดหวังทางคณิตศาสตร์ M(X) = μ

ให้เราพิสูจน์ว่า μ คือความคาดหวังทางคณิตศาสตร์

โดยการกำหนดความคาดหวังทางคณิตศาสตร์ของ r.v. ต่อเนื่อง

เรามาแนะนำตัวแปรใหม่กันดีกว่า - จากที่นี่. โดยคำนึงถึงว่าขีดจำกัดใหม่ของการรวมระบบนั้นเท่ากับขีดจำกัดเก่าที่เราได้รับ

เทอมแรกมีค่าเท่ากับศูนย์เนื่องจากความคี่ของฟังก์ชันจำนวนเต็ม เทอมที่สองมีค่าเท่ากับ μ (อินทิกรัลปัวซอง ).

ดังนั้น, ม(X)=ไมโคร, เช่น. ความคาดหวังทางคณิตศาสตร์ของการแจกแจงแบบปกติจะเท่ากับพารามิเตอร์ μ.

15) พิสูจน์ว่าสำหรับตัวแปรสุ่มปกติ X ที่มีฟังก์ชันความหนาแน่นของการแจกแจง ความแปรปรวน D(X) = σ 2

สูตรนี้อธิบายความหนาแน่นของการแจกแจงความน่าจะเป็นแบบปกติของตัวแปรสุ่มแบบต่อเนื่อง

ลองพิสูจน์ว่านั่นคือค่าเบี่ยงเบนมาตรฐานของการกระจายตัวแบบปกติ เรามาแนะนำตัวแปรใหม่กันดีกว่า z=(x-μ)/ .จากที่นี่ . โดยคำนึงถึงว่าขีดจำกัดใหม่ของการรวมระบบนั้นเท่ากับขีดจำกัดเก่าที่เราได้รับ บูรณาการโดยส่วนการวาง คุณ=z, เราพบว่า ดังนั้น .ดังนั้น ค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติจะเท่ากับพารามิเตอร์

16) พิสูจน์ว่าตัวแปรสุ่มต่อเนื่องที่กระจายตามกฎเลขชี้กำลังพร้อมพารามิเตอร์ ค่าคาดหวังทางคณิตศาสตร์คือ

ตัวแปรสุ่ม X ซึ่งรับเฉพาะค่าที่ไม่เป็นลบ กล่าวกันว่ามีการกระจายตามกฎเอ็กซ์โปเนนเชียล หากพารามิเตอร์บวกบางตัว แล>0 ฟังก์ชันความหนาแน่นมีรูปแบบ:

ในการค้นหาความคาดหวังทางคณิตศาสตร์ เราใช้สูตร

สูตรเบย์

ทฤษฎีบทของเบย์- หนึ่งในทฤษฎีบทหลักของทฤษฎีความน่าจะเป็นเบื้องต้น ซึ่งกำหนดความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในสภาวะที่ทราบข้อมูลบางส่วนเกี่ยวกับเหตุการณ์จากการสังเกตเท่านั้น การใช้สูตรของ Bayes ทำให้สามารถคำนวณความน่าจะเป็นได้แม่นยำยิ่งขึ้น โดยคำนึงถึงข้อมูลที่ทราบก่อนหน้านี้และข้อมูลจากการสังเกตใหม่

“ความหมายทางกายภาพ” และคำศัพท์เฉพาะทาง

สูตรของเบย์ช่วยให้คุณสามารถ “จัดเหตุและผลใหม่” ได้: ตาม ความจริงที่รู้เหตุการณ์ต่างๆ ให้คำนวณความน่าจะเป็นที่เกิดจากสาเหตุที่กำหนดให้

เหตุการณ์ที่สะท้อนถึงการกระทำของ “เหตุ” ใน ในกรณีนี้มักจะเรียกว่า สมมติฐานเนื่องจากพวกเขาเป็น ถูกกล่าวหาเหตุการณ์ที่นำไปสู่สิ่งนี้ ความน่าจะเป็นแบบไม่มีเงื่อนไขของสมมติฐานที่เป็นจริงเรียกว่า นิรนัย(สาเหตุน่าจะเป็นไปได้แค่ไหน. เลย) และเงื่อนไข - โดยคำนึงถึงข้อเท็จจริงของเหตุการณ์ - หลัง(สาเหตุน่าจะเป็นไปได้แค่ไหน. กลับกลายเป็นการคำนึงถึงข้อมูลเหตุการณ์).

ผลที่ตามมา

ผลลัพธ์ที่สำคัญของสูตรของเบย์คือสูตรสำหรับความน่าจะเป็นรวมของเหตุการณ์หนึ่งๆ ขึ้นอยู่กับ หลายสมมติฐานที่ไม่สอดคล้องกัน ( และจากพวกเขาเท่านั้น!).

- ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้น บีขึ้นอยู่กับสมมติฐานหลายประการ ฉันหากทราบระดับความน่าเชื่อถือของสมมติฐานเหล่านี้ (เช่น วัดจากการทดลอง)

ที่มาของสูตร

หากเหตุการณ์ขึ้นอยู่กับสาเหตุเท่านั้น ฉันแล้วถ้ามันเกิดขึ้นก็หมายความว่าต้องมีสาเหตุประการหนึ่งเกิดขึ้นคือ

ตามสูตรของเบย์ส

โดยการโอน (บี) ทางด้านขวาเราจะได้นิพจน์ที่ต้องการ

วิธีการกรองสแปม

วิธีการที่ใช้ทฤษฎีบทของ Bayes พบว่าการประยุกต์ใช้ในการกรองสแปมประสบความสำเร็จ

คำอธิบาย

เมื่อฝึกตัวกรองสำหรับแต่ละคำที่พบในตัวอักษร "น้ำหนัก" ของมันจะถูกคำนวณและจัดเก็บ - ความน่าจะเป็นที่ตัวอักษรที่มีคำนี้เป็นสแปม (ในกรณีที่ง่ายที่สุด - ตามคำจำกัดความคลาสสิกของความน่าจะเป็น: "ปรากฏในสแปม / การปรากฏตัวโดยรวม”)

เมื่อตรวจสอบจดหมายที่เพิ่งมาถึง ความน่าจะเป็นที่จะเป็นจดหมายขยะจะถูกคำนวณโดยใช้สูตรข้างต้นสำหรับสมมติฐานต่างๆ ในกรณีนี้ "สมมติฐาน" คือคำ และสำหรับแต่ละคำ "ความน่าเชื่อถือของสมมติฐาน" คือ % ของคำนี้ในตัวอักษร และ "การพึ่งพาเหตุการณ์กับสมมติฐาน" (บี | ฉัน) - "น้ำหนัก" ที่คำนวณไว้ก่อนหน้านี้ของคำ นั่นคือ "น้ำหนัก" ของตัวอักษรในกรณีนี้ไม่มีอะไรมากไปกว่า "น้ำหนัก" โดยเฉลี่ยของคำทั้งหมด

จดหมายถูกจัดประเภทเป็น "สแปม" หรือ "ไม่ใช่สแปม" โดยขึ้นอยู่กับว่า "น้ำหนัก" ของจดหมายนั้นเกินระดับที่กำหนดโดยผู้ใช้หรือไม่ (ปกติคือ 60-80%) หลังจากตัดสินใจเกี่ยวกับจดหมายแล้ว "น้ำหนัก" สำหรับคำที่รวมอยู่ในนั้นจะได้รับการอัปเดตในฐานข้อมูล

ลักษณะเฉพาะ

วิธีนี้ง่าย (อัลกอริธึมเป็นระดับพื้นฐาน) สะดวก (ช่วยให้คุณทำได้โดยไม่ต้อง "บัญชีดำ" และเทคนิคประดิษฐ์ที่คล้ายกัน) มีประสิทธิภาพ (หลังจากการฝึกอบรมกับตัวอย่างที่มีขนาดใหญ่เพียงพอแล้วจะตัดสแปมได้มากถึง 95-97% และ ในกรณีที่มีข้อผิดพลาดสามารถฝึกใหม่ได้) โดยทั่วไปมีข้อบ่งชี้ทั้งหมดสำหรับการใช้งานอย่างแพร่หลายซึ่งเป็นสิ่งที่เกิดขึ้นในทางปฏิบัติ - ตัวกรองสแปมสมัยใหม่เกือบทั้งหมดถูกสร้างขึ้นบนพื้นฐานของมัน

อย่างไรก็ตาม วิธีการนี้ก็มีข้อเสียเปรียบพื้นฐานเช่นกัน: ขึ้นอยู่กับสมมติฐาน, อะไร คำบางคำพบได้บ่อยในสแปม ในขณะที่คำอื่นๆ พบได้บ่อยในอีเมลทั่วไปและไม่มีผลหากสมมติฐานนี้ไม่ถูกต้อง อย่างไรก็ตาม ตามที่แสดงในทางปฏิบัติ แม้แต่บุคคลหนึ่งก็ไม่สามารถตรวจพบสแปมดังกล่าว "ด้วยตา" ได้ - เพียงแค่อ่านจดหมายและทำความเข้าใจความหมายของมันเท่านั้น

ข้อเสียเปรียบอีกประการหนึ่งซึ่งไม่ใช่พื้นฐานที่เกี่ยวข้องกับการใช้งานก็คือวิธีนี้ใช้ได้กับข้อความเท่านั้น เมื่อทราบถึงข้อจำกัดนี้ ผู้ส่งอีเมลขยะจึงเริ่มแทรกข้อมูลโฆษณาลงในรูปภาพ แต่ข้อความในจดหมายหายไปหรือไม่มีความหมาย เพื่อตอบโต้สิ่งนี้ คุณต้องใช้เครื่องมือการรู้จำข้อความ (ขั้นตอน "แพง" ใช้เมื่อจำเป็นจริงๆ เท่านั้น) หรือวิธีการกรองแบบเก่า - "บัญชีดำ" และนิพจน์ทั่วไป (เนื่องจากตัวอักษรดังกล่าวมักจะมีรูปแบบโปรเฟสเซอร์)

ดูเพิ่มเติม

หมายเหตุ

ลิงค์

วรรณกรรม

  • นกกีวี. ทฤษฎีบทของบาทหลวงเบย์ส // นิตยสาร Computerra 24 สิงหาคม 2544
  • พอล เกรแฮม. แผนสำหรับสแปม (ภาษาอังกฤษ) // เว็บไซต์ส่วนตัวของ Paul Graham

มูลนิธิวิกิมีเดีย

2010.

    ดูว่า "Bayes Formula" ในพจนานุกรมอื่นคืออะไร: สูตรที่มีรูปแบบ: โดยที่ a1, A2,..., An เป็นเหตุการณ์ที่เข้ากันไม่ได้, รูปแบบทั่วไปของการใช้ f.v. g.: ถ้าเหตุการณ์ B สามารถเกิดขึ้นต่างกันได้ เงื่อนไขที่สมมติฐาน A1, A2, ..., An ถูกสร้างขึ้นด้วยความน่าจะเป็น P(A1), ... ที่ทราบก่อนการทดลอง

    สารานุกรมทางธรณีวิทยา

    ช่วยให้คุณสามารถคำนวณความน่าจะเป็นของเหตุการณ์ที่สนใจผ่านความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์นี้ภายใต้สมมติฐานของสมมติฐานบางประการ เช่นเดียวกับความน่าจะเป็นของสมมติฐานเหล่านี้ สูตร ให้เว้นช่องว่างความน่าจะเป็น และให้กลุ่มทั้งหมดเป็นคู่... ... Wikipedia

    ช่วยให้คุณสามารถคำนวณความน่าจะเป็นของเหตุการณ์ที่สนใจผ่านความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์นี้ภายใต้สมมติฐานของสมมติฐานบางประการ เช่นเดียวกับความน่าจะเป็นของสมมติฐานเหล่านี้ สูตร ให้เว้นช่องว่างความน่าจะเป็น และกลุ่มเหตุการณ์ทั้งหมด เช่น... ... Wikipedia

    - (หรือสูตรของเบย์) หนึ่งในทฤษฎีบทหลักของทฤษฎีความน่าจะเป็น ซึ่งช่วยให้คุณสามารถระบุความน่าจะเป็นที่เหตุการณ์บางอย่างเกิดขึ้น (สมมุติฐาน) เมื่อมีหลักฐานทางอ้อมเท่านั้น (ข้อมูล) ซึ่งอาจไม่ถูกต้อง... Wikipedia

    ทฤษฎีบทของเบย์เป็นหนึ่งในทฤษฎีบทหลักของทฤษฎีความน่าจะเป็นเบื้องต้น ซึ่งกำหนดความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในสภาวะที่ทราบข้อมูลบางส่วนเกี่ยวกับเหตุการณ์ตามการสังเกตเท่านั้น การใช้สูตรของ Bayes คุณสามารถ... ... Wikipedia

    Bayes, Thomas Thomas Bayes สาธุคุณ Thomas Bayes วันเกิด: 1702 (1702) สถานที่เกิด ... Wikipedia

    การอนุมานแบบเบย์เป็นวิธีการอนุมานทางสถิติวิธีหนึ่ง ซึ่งใช้สูตรของเบย์เพื่อปรับแต่งการประมาณความน่าจะเป็นของความจริงของสมมติฐานเมื่อได้รับหลักฐาน การใช้การอัปเดตแบบเบย์มีความสำคัญอย่างยิ่งใน... ... Wikipedia

    ควรปรับปรุงบทความนี้หรือไม่: ค้นหาและจัดเรียงในรูปแบบของลิงก์เชิงอรรถไปยังแหล่งข้อมูลที่เชื่อถือได้เพื่อยืนยันสิ่งที่เขียน หลังจากเพิ่มเชิงอรรถแล้ว ให้ระบุแหล่งที่มาที่แม่นยำยิ่งขึ้น เปเร... วิกิพีเดีย

    นักโทษจะทรยศต่อกันตามผลประโยชน์อันเห็นแก่ตัวของตน หรือพวกเขาจะนิ่งเงียบอยู่จึงลดน้อยลง ระยะเวลาทั้งหมด- ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

หนังสือ

  • ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ในปัญหา: ปัญหาและแบบฝึกหัดมากกว่า 360 ข้อ Borzykh D.. คู่มือที่นำเสนอประกอบด้วยปัญหา ระดับต่างๆความซับซ้อน อย่างไรก็ตาม จุดเน้นหลักอยู่ที่งานที่มีความซับซ้อนปานกลาง โดยมีวัตถุประสงค์เพื่อส่งเสริมให้นักเรียน...