Bayes sætning

Bayes sætning
Natur Sætning
Opfinder Thomas bayes
Dato for opfindelsen 1763
Navngivet med henvisning til Thomas bayes
Aspekt af Statistisk
Formel

De Bayes' teorem er en af de vigtigste teoremer af sandsynlighedsteori , anvendes også i statistikken siden sin implementering , som bestemmer sandsynligheden at en hændelse kommer fra en anden begivenhed kommer rigtigt, forudsat at disse to begivenheder er afhængige af hinanden .

Med andre ord er det fra denne sætning muligt at beregne sandsynligheden for en begivenhed nøjagtigt ved at tage hensyn til både allerede kendte oplysninger og data fra nye observationer. Bayes 'formel kan afledes af de grundlæggende aksiomer for sandsynlighedsteori, især betinget sandsynlighed . Det særegne ved Bayes 'sætning er, at dets praktiske anvendelse kræver et stort antal beregninger, hvorfor Bayesianske skøn først begyndte at blive brugt aktivt efter revolutionen inden for computer- og netværksteknologier.

Dens oprindelige formulering kom fra pastor Thomas Bayes 'arbejde . Det blev uafhængigt fundet af Pierre-Simon de Laplace . Bayes 'formulering i 1763 er mere begrænset end de nye formuleringer i dag.

Udover dets sandsynlighed er denne sætning grundlæggende for Bayesian-slutning, som har vist sig at være meget nyttig i kunstig intelligens . Det bruges også på flere andre områder: inden for medicin, digitale videnskaber, geografi, demografi  osv.

For matematikeren Harold Jeffreys er formuleringerne af Bayes og Laplace aksiomer og mener også, at ”Bayes 'sætning er for sandsynlighedsteorien, hvad Pythagoras sætning er for geometri . "

Historie

Da han døde i April 1761, Thomas Bayes overlader sine ufærdige artikler til Richard Price . Det var sidstnævnte, der tog initiativet til at offentliggøre artiklen "  Et essay til løsning af et problem i lærdommen  " og sende det til Royal Society to år senere.

Ifølge Martyn Hooper er det sandsynligt, at Richard Price selv bidrog væsentligt til udarbejdelsen af ​​den endelige artikel, og at han sammen med Thomas Bayes var forfatter til sætningen kendt som Bayes 'sætning. Denne tilskrivningsfejl ville være en anvendelse af Stiglers lov om eponymi, ifølge hvilken videnskabelige opdagelser sjældent tilskrives deres første forfatter.

Formlen blev genopdaget af Pierre-Simon de Laplace i 1774.

I sin eneste artikel forsøgte Bayes at bestemme, hvad vi nu ville kalde den bageste fordeling af sandsynligheden p for en binomial fordeling . Hans arbejde er blevet offentliggjort og præsenteret posthumt (1763) af hans ven Richard Price i Et forsøg på at løse et problem inden for risikoteori ( Et essay mod løsning af et problem i læren om chancer ). Bayes 'resultater blev udvidet i et essay fra 1774 af den franske matematiker Laplace , der tilsyneladende ikke var fortrolig med Bayes' arbejde. Den ved Bayes vigtigste resultat er følgende: overvejer en ensartet fordeling af binomial parameter p og en observation O af en binomial lov , hvor m er derfor antallet af positive resultater observeret og n antallet af observerede fejl, sandsynligheden for, at p er mellem a og b at vide, at O er:

Disse foreløbige resultater antyder resultatet kendt som Bayes 'sætning , men det ser ikke ud til, at Bayes fokuserede eller insisterede på dette resultat.

Hvad der er "Bayesian" (i den nuværende forstand af ordet) i dette resultat er, at Bayes præsenterede dette som en sandsynlighed på parameteren p . Dette svarer til at sige, at vi ikke kun kan bestemme sandsynligheder ud fra observationer, der er resultatet af et eksperiment, men også parametrene, der relaterer til disse sandsynligheder. Det er den samme type analytiske beregning, der gør det muligt at bestemme de to ved slutning. På den anden side, hvis vi holder os til en hyppig fortolkning  (en) , formodes vi ikke at overveje en sandsynlighed for distribution af parameteren p og følgelig kan vi kun begrunde p med inferensræsonnering (logisk) ikke-sandsynlig.

Siden 2000 har publikationer om det ganget sig på grund af dets mange anvendelser.

Stater

Bayes sætning er et resultat af den samlede sandsynlighedssætning . Den angiver betingede sandsynligheder for flere begivenheder . For eksempel for begivenheder A og B gør det det muligt at bestemme sandsynligheden for, at A kender B , hvis vi kender sandsynlighederne for A , B og B, der kender A , forudsat at sandsynligheden for B ikke er lig med 0.

I sin formulering af 1763 blev sætningen anført:

, forudsat at , og hvor:

Det kan også skrives:

, eller:

Andre formuleringer, der integrerer sandsynlighedsfunktionen

Teoremet omformuleres også for at integrere den marginale sandsynlighedsfunktion  (en) ( sandsynlighedsfunktion, der integrerer normaliseringskonstanten  (en) ). Den er formuleret som følger:

I et univers er partitionerne af et sæt (dvs. og ) den betingede sandsynlighed for gensidigt eksklusive og udtømmende begivenheder ( ), forudsat at viden beregnes:

, eller:

Beregningen af afhænger af omfanget. I digitale videnskaber kaldes det "bevis" for at betegne den marginale sandsynlighedsfunktion og anvendt i medicin , det angiver et sandsynlighedsforhold .

Det kan også skrives:

og:

, eller:

Forklaringer

Eksempler

Hvilken urne kommer bolden fra?

Forestil dig som et eksempel to urner fyldt med bolde. Den første indeholder ti (10) sorte og tredive (30) hvide bolde; den anden har tyve (20) af hver. En af stemmesedlerne er trukket tilfældigt uden særlig præference, og i denne stemmeseddel trækkes en bold tilfældigt. Bolden er hvid. Hvad er sandsynligheden for, at denne kugle blev trukket i den første urne, vel vidende at den er hvid?

Intuitivt forstår vi, at det er mere sandsynligt, at denne kugle kommer fra den første urne end fra den anden. Så denne sandsynlighed skal være større end 50%. Det nøjagtige svar (60%) kan beregnes ud fra Bayes 'sætning.

Lad H 1 være hypotesen ”Vi tegner den første urne. "Og H 2 hypotesen" Vi tegner i den anden stemmeseddel. ". Som man trækker uden særlig præference, P ( H 1 ) = P ( H 2 ); desuden, som vi helt sikkert har tegnet i en af ​​de to stemmesedler, er summen af ​​de to sandsynligheder 1 værd: hver er 50% værd.

Lad os markere informationen med D ”Vi tegner en hvid kugle. Som vi tegner en bold tilfældigt i et af urner, sandsynligheden for D kende hypotesen H 1 udføres, er lig med:

Tilsvarende sandsynligheden for D kende hypotesen H 2 udføres, er værd:

Bayes 'formel i det diskrete tilfælde giver os derfor:

Før vi ser på boldens farve, er sandsynligheden for at have valgt den første urne en a priori sandsynlighed , P ( H 1 ) eller 50%. Efter at have kigget på bolden gennemgår vi vores vurdering og overvejer P ( H 1 | D ), eller 60%, hvilket bekræfter vores første intuition.

Ansøgninger

Denne elementære sætning (oprindeligt kaldet "sandsynligheden for årsager") har betydelige anvendelser.

Bayes 'sætning bruges i statistisk slutning til at opdatere eller opdatere estimaterne for enhver sandsynlighed eller parameter fra observationer og sandsynlighedslove for disse observationer. Der er en diskret version og en kontinuerlig version af sætningen.

  • Den Bayesiske skole bruger sandsynligheder som et middel til numerisk at oversætte en grad af viden (den matematiske teori om sandsynligheder forpligter os faktisk på ingen måde til at forbinde dem med frekvenser, som kun repræsenterer en bestemt anvendelse som følge af loven om et stort antal ). Fra dette perspektiv kan Bayes 'sætning anvendes på ethvert forslag, uanset variablernes art og uafhængigt af enhver ontologisk overvejelse.
  • Den hyppige skole bruger de langsigtede egenskaber ved observationsloven og betragter ikke en lov om parametre, ukendt men fast.

Bayesisk slutning

Reglerne for den matematiske sandsynlighedsteori gælder for sandsynligheder som sådan, ikke kun for deres anvendelse som de relative frekvenser af tilfældige begivenheder (se Begivenhed (sandsynligheder) ). Vi kan beslutte at anvende dem i grader af tro på visse udsagn. Disse grader af tro forbedres med hensyn til eksperimenter ved at anvende Bayes 'sætning.

De Cox-Jaynes Teorem dag berettiger denne tilgang meget godt, som i lang tid havde kun intuitive og empiriske fundament.

Bayesiske netværk

I The Book of Hvorfor , Judæa Pearl præsenterer Bayes' regel som et særligt tilfælde af en to-node, en-link Bayesian netværk . Bayesiske netværk er en udvidelse af Bayes 'regel til større netværk.

Monty Hall-problem

Bayesiske filtre

Anmeldelser

Sociale, juridiske og politiske aspekter

Et problem, der regelmæssigt rejses af den bayesiske tilgang, er følgende: Hvis sandsynligheden for adfærd (for eksempel kriminalitet) er stærkt afhængig af visse sociale, kulturelle eller arvelige faktorer, så:

  • på den ene side kan man undre sig over, om dette ikke indebærer en delvis reduktion af ansvaret for moralske, hvis ikke lovlige, kriminelle. Eller hvad svarer til det samme til en forøgelse af virksomhedens ansvar, som ikke vidste eller ikke kunne være i stand til at neutralisere disse faktorer, som det måske burde have gjort.
  • på den anden side ønsker vi måske at bruge disse oplysninger til bedre at orientere en forebyggelsespolitik , og vi skal se, om den offentlige interesse eller moral vil imødekomme denne de facto diskrimination af borgerne (selvom det er positivt).

Statistikkerne er blevet frembragt gentagne gange ved domstole og i nogle tilfælde involveret i væsentlige aborter af retfærdighed, som f.eks. Sally Clark eller Lucia de Berk. Bayes 'formel er enten blevet misforstået eller misbrugt. Anklagemyndigheden vurderede derfor, at sandsynligheden for, at en uskyldig person blev fundet skyldig i sådanne tilfælde, var lav eller næsten nul. Det var først efter dommen, at eksperterne protesterede og demonstrerede, at denne sandsynlighed, der blev taget i betragtning, ikke gav mening, og at det tværtimod var nødvendigt at undersøge dem for at være skyldige eller uskyldige, idet de vidste, at der havde været død. (Hvilket giver vidt forskellige tal, der giver plads til legitim tvivl). Diskret betegner vi med sophism fra anklageren disse forvekslinger mellem betingede sandsynligheder.

Medicinske "falske positive"

De falske positive er en iboende vanskelighed i hver test: ingen test er perfekt. Undertiden vil resultatet være forkert positivt, hvilket undertiden kaldes førsteordensrisiko eller alfa-risiko .

For eksempel, når du tester en person for at finde ud af, om de har en sygdom, er der en risiko, normalt minimal, for at resultatet bliver positivt, selvom patienten ikke har fået sygdommen. Problemet er så ikke at måle denne risiko i absolutte tal (inden du fortsætter med testen), det er stadig nødvendigt at bestemme sandsynligheden for, at en positiv test er forkert. Vi vil vise, hvordan den samme test, som ellers er meget pålidelig, kan føre til et klart flertal af ulovlige positive i tilfælde af en meget sjælden sygdom.

Forestil dig en ekstremt pålidelig test:

  • hvis en patient har fået sygdommen, påpeger testen den, det vil sige er positiv , næsten systematisk, 99% af gange, det vil sige med en sandsynlighed på 0,99;
  • hvis en patient er sund, er testen korrekt, det vil sige negativ i 95% af tilfældene eller med en sandsynlighed på 0,95.

Antag, at sygdommen kun rammer en ud af tusind personer, det vil sige med en sandsynlighed 0,001. Det virker måske ikke så meget, men i tilfælde af en dødelig sygdom er den betydelig. Vi har alle de oplysninger, vi har brug for for at bestemme sandsynligheden for, at en test er forkert positiv, hvilket kan forårsage overdiagnose .

Vi betegner ved A begivenheden "Patienten fik sygdommen" og ved B begivenheden "Testen er positiv". Den anden form for Bayes 'sætning i det diskrete tilfælde giver derefter:

Oversat til hverdagssprog betyder denne ligning, at "sandsynligheden for, at patienten faktisk har fået sygdommen, når testen er positiv, kun er 1,9%". At vide, at testen er positiv, er sandsynligheden for, at patienten er sund, derfor ca. værd: (1 - 0,019) = 0,981. På grund af det meget lille antal patienter faktisk

  • praktisk talt alle patienter tester positive, men også
  • næsten alle positive tests indikerer raske mennesker .

Hvis behandlingen er meget besværlig, dyr eller farlig for en sund patient, kan det være tilrådeligt at udsætte alle positive patienter for en supplerende test (som utvivlsomt vil være mere præcis og dyrere, idet den første test ikke kun har tjent for at udelukke de mest åbenlyse tilfælde).

Alligevel lykkedes det os med den første test at isolere en befolkning, der var tyve gange mindre, som praktisk taget indeholder alle patienterne. Faktisk ved at fjerne de patienter, hvis test er negativ, og som derfor formodes at være raske, har vi reduceret forholdet mellem patienter og den undersøgte population fra en ud af tusind til en ud af halvtreds ( P (A | B) er tæt på 1/50). Ved at udføre andre tests kan man håbe at forbedre påvisningens pålidelighed.

Bayes 'sætning viser os, at i tilfælde af lav sandsynlighed for den søgte sygdom har risikoen for at blive forkert erklæret positiv en meget stærk indvirkning på pålideligheden. Screening for en sjælden sygdom, såsom kræft, kan forårsage overdiagnose .

Denne intuitive, almindelige estimeringsfejl er en kognitiv bias kaldet "at glemme basislinjefrekvensen " .

Noter og referencer

Bemærkninger

Referencer

  1. Harold Jeffreys , videnskabelig inferens , Cambridge University Press ,1973( ISBN  978-0-521-18078-8 ) , s.  31
  2. (i) Martyn Hooper , "  Richard Price, Bayes'teorem, and God  " , Betydning , bind.  10, n o  1,Februar 2013( DOI  10.1111 / j.1740-9713.2013.00638.x , læs online )
  3. (in) Christian Robert , "  Price's theorem  "xianblog (Christian Robert blog) ,16. marts 2013(adgang 16. marts 2013 )
  4. "  Findes der en universel matematisk formel?"  », Frankrig Kultur ,9. november 2012( læs online , konsulteret den 17. september 2018 )
  5. koordineret af E. Barbin & J.-P. Lamarche, Historier om sandsynligheder og statistikker: [konference, Orléans, 31. maj og 1. juni 2002] , Paris, Ellipses ,2004, 296  s. ( ISBN  2-7298-1923-1 ) , s.  204
  6. Habibzadeh F, Habibzadeh P. Sandsynlighedsforholdet og dets grafiske repræsentation. Biochem Med (Zagreb). 2019; 29 (2): 020101. doi: 10.11613 / BM.2019.020101
  7. A. Stuart og K. Ord , Kendall Advanced Theory of Statistics: Bind I - Fordeling Teori , Edward Arnold ,1994, §8.7
  8. (da) Newman TB og Kohn MA, "  Evidence-Based Diagnosis  " , Cambridge University Press , New York,2009( DOI  10.1017 / CBO9780511759512 , læs online )
  9. (in) A. Stuart og K. Ord , Kendall's Advanced Theory of Statistics: Volume I-Distribution Theory , Edward Arnold,1994.
  10. Bussab og Morettin 2010 , s.  116.
  11. Bussab og Morettin 2010 , s.  111.
  12. (i) Charles S. Bos, "  En sammenligning af Marginal Likelihood beregningsmetoder  " , Tinbergen Institute Working Paper , Ingen knogler  2002-084 / 4,20. august 2002( DOI  10.2139 / ssrn.332860 , læs online )
  13. (da) Judea Pearl; Dana Mackenzie, The Book of Why: The New Science of Cause and Effect , New York, Penguin,2. maj 2019, 432  s. ( ISBN  978-0-14-198241-0 ) , antag at en fyrre-årig kvinde får et mammogram for at kontrollere brystkræft, og det kommer positivt tilbage. Hypotesen, D (for "sygdom"), er, at hun har kræft. Beviset, T (for "test"), er resultatet af mammografiet. Hvor stærkt skal hun tro på hypotesen? Skal hun opereres? Vi kan besvare disse spørgsmål ved at omskrive Bayes regel som følger: (Opdateret sandsynlighed for D) = P (D | T) = (sandsynlighedsforhold) × (tidligere sandsynlighed for D) (3.2) hvor det nye udtryk “ sandsynlighedsforhold ”er givet af P (T | D) / P (T). Det måler, hvor meget mere sandsynligt den positive test er hos mennesker med sygdommen end i den almindelige befolkning.
  14. (i) Judæa Pearl , The Book of Hvorfor: The New Science om årsag og virkning , Penguin Books ,2019, 432  s. ( ISBN  978-0-14-198241-0 og 0141982411 ) , s.  112-113.
  15. (i) Retlige sager, der involverer Bayes
  16. (i) Bayes og loven Januar 27, 2015

Se også

Bibliografi

  • (da) T. Bayes (1763), "Et essay til løsning af et problem i læren om chancer", Philosophical Transactions of the Royal Society of London , 53: 370-418.
  • (da) T. Bayes (1763/1958) “Undersøgelser i sandsynlighedshistorien og statistikker: IX. Thomas Bayes essay mod løsning af et problem i læren om chancer ”, Biometrika 45: 296-315 (Bayes essay i moderniseret notation)
  • (da) T. Bayes "" Et essay mod løsning af et problem i læren om chancer "" (version af 26. januar 2019 på internetarkivet ) (Bayes essay i den originale notation)
  • (en) Richard Price , "  En demonstration af den anden regel i essayet mod løsning af et problem i doktrinerne om chancer  " , Philosophical Transactions , bind.  54,1964, s.  296-325
  • (da) PS Laplace (1774) "Memoir om sandsynligheden for årsager ved begivenheder", Strange Scientists 6: 621-656 eller Complete Works 8: 27-65.
  • (in) GA Barnard. (1958) “Undersøgelser i historien om sandsynlighed og statistik: IX. Thomas Bayes essay mod løsning af et problem i læren om chancer ”, Biometrika 45: 293-295 (biografiske bemærkninger)
  • (en) SM Stigler (1982) "Thomas Bayes 'Bayesian Inference", Journal of the Royal Statistical Society , serie A, 145: 250-258 (Stigler argumenterer for en revideret fortolkning af essayet - anbefales)
  • (en) A. Papoulis (1984), Probability, Random Variables, and Stochastic Processes , anden udgave. New York: McGraw-Hill.
  • (en) SM Stigler (1986), "Laplace's 1774-erindringsbog om invers sandsynlighed," Statistisk videnskab , 1 (3): 359-378.
  • (da) SE Fienberg (2005) Hvornår blev Bayesian Inference "Bayesian"? Bayesian-analyse, s.  1-40
  • (da) Sharon Bertsch McGrayne , Teorien der ikke ville dø: Hvordan Bayes 'styre knækkede enigmakoden , jagte russiske ubåde og kom triumferende ud af to århundreders kontrovers , Yale University Press ,2011
  • (da) Jeff Miller Tidligst kendte anvendelser af nogle af matematikens ord (B) ( meget informativ - anbefales )
  • (da) D. Covarrubias "Et essay mod løsning af et problem i læren om chancer" ( ArkivWikiwixArchive.isGoogle • Que faire? ) (en oversigt og redegørelse for Bayes's essay)
  • (in) Bradley Efron , "  Bayes 'sætning i det 21. århundrede  " , Science , bind.  340, nr .  6137,Juni 2013, s.  1177-1178 ( DOI  10.1126 / science.1236536 )
  • Myron Tribus , rationelle beskrivelser, beslutninger og design . Kapitel 3 Bayes-ligningen, Pergamon 1969 (fransk oversættelse: Rationelle beslutninger i usikker , kapitel 3: Bayes-ligning og rationelle fradrag, Masson, 1972)
  • Lê Nguyên Hoang , 'The Formula of Knowledge', EDP Sciences,14. juni 2018
  • (pt) Wilton de O. Bussab og Pedro A. Morettin , Estatística Básica , São Paulo, Saraiva,2010, 540  s.

Relaterede artikler

eksterne links

Radioprogram <img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">