Udtrykket sandsynlighed har flere betydninger: historisk kommer fra det latinske sandsynlighed , det betegner det modsatte af begrebet sikkerhed; det er også en vurdering af den sandsynlige karakter af en begivenhed , det vil sige at en værdi gør det muligt at repræsentere dens grad af sikkerhed; for nylig er sandsynlighed blevet en matematisk videnskab og kaldes sandsynlighedsteori eller mere simpelt sandsynlighed ; endelig bærer en doktrin også navnet sandsynlighed .
Sandsynligheden for en begivenhed er et reelt tal mellem 0 og 1. Jo større antal, jo større er risikoen eller chancen for , at begivenheden finder sted. Den videnskabelige undersøgelse af sandsynligheden er relativt nyere i matematikens historie. Studiet af sandsynlighed har set mange udviklingen siden XVIII th århundrede gennem studiet af tilfældighed og uforudsigelighed af visse fænomener, især gambling. Disse førte matematikere til at udvikle en teori, som derefter havde implikationer på så forskellige områder som meteorologi , økonomi eller kemi .
Oprindeligt, i Aristoteles oversættelser , betegnede ordet "sandsynlighed" ikke en kvantificering af tilfældighed af en kendsgerning, men opfattelsen af, at en idé er almindeligt accepteret af alle. Det var først i middelalderen , da renæssancen , omkring de efterfølgende kommentarer og unøjagtigheder i oversættelsen af Aristoteles 'arbejde , at dette udtryk oplevede et semantisk skifte for at ende med at betegne sandsynligheden for en idé.
Fremkomsten af begrebet "risiko" , forud for studiet af sandsynlighed, kun dukkede op i XII th århundrede, til vurdering af kommercielle kontrakter med traktaten kontrakter Peter Olivi , og s 'er udviklet i XVI th århundrede, med den spredning af søforsikringskontrakter. Bortset fra nogle elementære overvejelser ved Gerolamo Cardano i den tidlige XVI th århundrede, og ved Galileo i begyndelsen af XVII th århundrede, den egentlige begyndelse af sandsynlighed teori dato for korrespondance mellem Pierre de Fermat og Blaise Pascal i 1654.
Det var i anden halvdel af det XVII th århundrede, efter arbejde Blaise Pascal , Pierre de Fermat og Christian Huygens på problemet med punkter , udtrykket "sandsynlighed" er efterhånden tager sin nuværende betydning, med udviklingen af den matematiske behandling af emnet af Jakob Bernoulli .
I det XVIII th århundrede, Gabriel Cramer gav et kursus om probabilistisk logik , der vil blive en base i artikel sandsynlighed for leksikon over Diderot , skrevet i slutningen af dette århundrede. Dette er samtidig i det XIX th århundrede, at dette kan betragtes som den moderne teori om matematisk sandsynlighed.
Beregningen af sandsynligheder tager en ny udvikling i begyndelsen af XX E århundrede med aksiomatikken fra Kolmogorov ; derefter begynder teorien om sandsynlighed . Sandsynligheden bliver en videnskab og en teori som en gren af matematik.
Der er således flere begreber, som vi vil specificere i de følgende afsnit:
Den første brug af ordet sandsynlighed vises i 1370 med oversættelsen af de etiske til Nicomaques af Aristoteles ved Oresme , og derefter betegner "karakter af, hvad der er sandsynligt". Begrebet sandsynlig i Aristoteles (ενδοξον, på græsk) er således defineret i emner :
"Er sandsynlige de meninger, der modtages af alle mennesker, eller af de fleste af dem, eller af de kloge og blandt de sidstnævnte, enten af alle eller af de fleste, eller endelig af de mest bemærkelsesværdige og mest berømte"
Det, der muliggør en mening i Aristoteles, er hans generelt accepterede karakter; det er kun oversættelse af Ciceros i de emner af Aristoteles, som oversætter probabilis eller verisimilis at begrebet sandsynlighed er forbundet med den for "sandsynlighed", hvilket vil have en indvirkning i løbet af middelalderen og renæssancen , med successive kommentarer til Aristoteles 'arbejde .
En sætning, situation eller proposition er sand eller falsk. Dens sandsynlighed er "åbenbar viden om sandheden eller falskheden i en proposition" . Begrebet usikkerhed er for sin del en mangel ved denne viden. For et forslag er der så tre tilfælde:
Denne repræsentation udviklet af Cramer gør det muligt at afsløre en måde at måle begrebet usikkerhed eller sandsynlighed på. Han giver derefter følgende definition af sandsynlighed:
Definition (Gabriel Cramer) - Da fuld sikkerhed opstår ved forsikringen om, at man har eksistensen af alle de betingelser, der kræves for visse sandheder, og sandsynligheden for den viden, man har om eksistensen af nogle - Under en af disse betingelser, vi se på sikkerhed som helhed og sandsynligheden som en del. Den korrekte grad af sandsynlighed for et forslag vil derfor være nøjagtigt kendt, når vi kan sige og bevise, at denne sandsynlighed stiger til halv sikkerhed eller til tre fjerdedele af hele sikkerheden, eller kun til en tredjedel af sikkerheden osv.
Som tidligere angivet gør begrebet sandsynlighed det muligt at kvantificere tilfældigheden. Den formalisering af den tidlige XX th århundrede er nu almindeligt anvendt. (se fx bogen af Jacod og Protter for dette afsnit)
Sandsynligheden for en bestemt begivenhed A , bemærket , knytter en værdi mellem 0 og 1, at begivenheden finder sted. Når begivenheden siges at være næsten sikker (eller næsten sikker), det vil sige at den har "enhver chance" for at ske. Omvendt hvis , A siges at være ubetydelig (eller næsten umuligt), det vil sige, at det har en nul chance for at forekomme.
Sandsynligheden for en begivenhed A kan opnås på en hyppig måde, især når det er muligt at udføre et eksperiment flere gange og at tælle antallet af succeser med eksperimentet. Faktisk, hvis vi udfører et eksperiment n gange uafhængigt, og at i n A- tiderne af tilfældene, realiseres begivenheden A , så er sandsynligheden for A givet ved: . Mere sandsynligt, når antallet af mulige resultater af eksperimentet er endeligt, og disse resultater er lige så sandsynlige, opnås sandsynligheden for A ved: .
Matematisk er begivenhed A en delmængde af et sæt Ω, der repræsenterer alle mulige eventualiteter. For at opnå en teori blev aksiomer foreslået af Kolmogorov : sandsynligheden skal verificere:
Takket være denne beskrivelse kan flere begreber skrives på en matematisk måde.
To hændelser siges at være uafhængige, hvis det at vide sandsynligheden for den første begivenhed ikke hjælper os med at forudsige sandsynligheden for den anden og omvendt. Matematisk er denne skriftlige: . For eksempel er sandsynligheden for at få et es på det første terningkast og få et ess på det andet terningkast multiplikationen af de to sandsynligheder og er lig med 1/36.
Det er muligt at overveje sandsynligheden for en begivenhed (betegne den A ) betinget af en anden ( betegne B ). Når de to begivenheder er ikke uafhængige, det faktum af at kende sandsynligheden for en indflydelse på sandsynligheden for den anden ved formlen: . For eksempel er sandsynligheden for at få summen af de to terninger lig med 12, når den første matrice er 6, lig med 1/6.
Der findes formler for at kunne beregne enhver form for sandsynlighed. Dette er tilfældet med formlen for Poincare , loven om total sandsynlighed og Bayes sætning .
Opmuntret af Pascal udgav Christian Huygens De ratiociniis in ludo aleae (ræsonnement om terningsspil) i 1657. Denne bog er det første store arbejde om sandsynlighed. Han definerer forestillingen om håb og udvikler flere problemer med at dele gevinster under spil eller trækker i stemmesedler. To grundlæggende værker skal også bemærkes: Ars Conjectandi af Jacques Bernoulli (posthum, 1713), der definerer begrebet tilfældig variabel og giver den første version af loven om store tal , og teori om sandsynlighed af Abraham de Moivre (1718), som generaliserer brugen af kombinatorik .
Teorien om klassisk sandsynlighed tager kun virkelig fart med forestillingerne om mål og målbare sæt, som Émile Borel introducerede i 1897. Denne opfattelse af mål afsluttes af Henri Léon Lebesgue og hans integrationsteori . Den første moderne version af den centrale grænsesætning blev givet af Alexander Liapunov i 1901, og det første bevis på den moderne sætning blev givet af Paul Lévy i 1910. I 1902 introducerede Andrei Markov Markov- kæderne for at foretage en generalisering af loven om store antal til en række oplevelser afhængigt af hinanden. Disse Markov-kæder kender mange applikationer, blandt andet til modellering af distribution eller til indeksering af websteder på Google.
Det var først i 1933, at teorien om sandsynlighed opstod fra et sæt forskellige metoder og eksempler og blev en reel teori, aksiomatiseret af Kolmogorov .
Kiyoshi Itô opstiller en teori og et lemma, der bærer hans navn i 1940'erne. Disse giver mulighed for at forbinde den stokastiske beregning og de delvise differentialligninger og dermed skabe sammenhængen mellem analyse og sandsynligheder. Matematikeren Wolfgang Doeblin havde for sin del skitseret en lignende teori, før han begik selvmord efter bataljonens nederlag iJuni 1940. Hans værker blev sendt til Videnskabsakademiet i en forseglet kuvert, som først blev åbnet i 2000.
AxiomaticI begyndelsen af XX th århundrede Kolmogorov definerer matematiske aksiomer for at undersøge ulykken. Således konstruerer han pladsen til muligheder, kaldet universet , som indeholder alle mulige chancer, han forsyner det med et sæt, der indeholder universets undergrupper, kaldet stamme , og med et sandsynlighedsmål, der gør det muligt at beregne den tilsvarende sandsynligheder. Det således konstruerede rum opfylder de tre aksiomer af sandsynligheder:
For at være i stand til bedre at håndtere tilfældigheder er det praktisk at bruge en tilfældig variabel . Det kan være ægte , men det kan også være flerdimensionelt eller endda mere generelt. Denne reelle variabel er i teorien en anvendelse: at enhver fare kombinerer eksperimentets resultater .
Denne variabel har en fordeling af dens værdier givet ved dens lov om sandsynlighed , som er et mål. Sidstnævnte kan repræsenteres på mange måder, hvor den mest almindelige er ved hjælp af fordelingsfunktionen , sandsynlighedsdensiteten (hvis den findes) eller massefunktionen , hvis relevant. Mange egenskaber ved sandsynlighedslove og derfor tilfældige variabler kan studeres: forventning , øjeblikke , uafhængighed mellem flere variabler osv.
Konvergens- og begrænsningssætningerDet er muligt at overveje et uendeligt antal tilfældige variabler . Er der i dette tilfælde en mulig grænse? Spørgsmålet om forestillingen om tilfældig konvergens opstår derefter. Der er flere typer konvergenser: konvergens i loven, som er konvergensen af variabelens lov (som et mål), konvergens i sandsynlighed , næsten bestemt konvergens eller endda konvergens i gennemsnit .
Der findes mange grænsesætninger. De bedst kendte er: loven om store tal, der meddeler, at gennemsnittet af de første n tilfældige variabler konvergerer mod det teoretiske gennemsnit af den almindelige lov for tilfældige variabler; den centrale grænsesætning , som giver den korrekte renormalisering af summen af tilfældige variabler for at have en ikke-triviel grænse.
Den stokastiske beregning er studiet af fænomener, der udvikler sig tilfældigt over tid. Tiden kan modelleres på en diskret måde, det vil sige ved heltalsværdierne :, i dette tilfælde er fænomenet repræsenteret af en (uendelig) sekvens af tilfældige variabler :, det er en tilfældig gang . Tiden kan også modelleres kontinuerligt, dvs. efter reelle værdier, eller så er det en stokastisk proces .
Flere egenskaber er derefter knyttet til den stokastiske beregning: Markov-ejendommen meddeler, at den fremtidige bevægelse af fænomenet kun afhænger af den nuværende tilstand og ikke af den tidligere bevægelse; den gentagelse og flygtighed en Markovkæde sikre en tilbagevenden eller den unikke passage i en given tilstand; en martingale er en sådan proces, at den fremtidige tilstand i gennemsnit bestemmes af den nuværende tilstand osv.
Læren af sandsynlighed, også kendt probabilisme , er en kristen etik, der er udviklet i løbet af XVI th århundrede, under indflydelse, blandt andre, Bartolomé de Medina og jesuitter . Med fremkomsten af læren om sandsynlighed, vil dette udtryk se en semantisk skift til sidst udpege midten af XVII th århundrede, den sandsynlige karakter af en idé.
Sandsynligheden for en udtalelse så betegner midten af XVII th århundrede, er sandsynligheden for, at en sand mening. Det var først i slutningen af XVII th århundrede, med fremkomsten af matematiske sandsynlighed, at begrebet sandsynlighed vil kun vedrøre flere meninger og ideer, men også fakta, og vil nærme begrebet chance for, at vi kender i dag.
Når man studerer et tilfældigt fænomen, er der flere måder at nærme sig forestillingen om sandsynlighed relateret til dette fænomen.
Derefter vises en filosofisk opfattelse: Da vi kun kender naturen og verden omkring os gennem vores erfaring og vores synspunkt, kender vi den kun subjektivt og kan ikke nøjagtigt estimere de objektive love, der styrer dem.
Den IPCC anvender en kalibreret naturligt sprog for sammendrag for beslutningstagere i sine rapporter.
“Følgende kvalifikationer er blevet brugt til at indikere den vurderede sandsynlighed for et resultat: næsten sikker (99-100% sandsynlighed), meget sandsynlig (90-100%), sandsynlig (66-100%), omtrent så sandsynlig som ikke (33 til 66%), usandsynligt (0 til 33%), meget usandsynligt (0 til 10%), usædvanligt usandsynligt (0 til 1%). Den vurderede sandsynlighed er angivet med kursiv: for eksempel meget sandsynlig ... Andre kvalifikationer kan også bruges, hvor det er relevant: ekstremt sandsynligt (95 til 100%), mere sandsynligt end ikke (> 50 til 100%), mere usandsynligt end sandsynligt ( 0 til <50%) og yderst usandsynligt (0 til 5%). Endelig bruger denne rapport også udtrykkene "sandsynligt interval" og "meget sandsynligt interval", hvilket betyder, at den vurderede sandsynlighed for et resultat er i området fra 17 til 83% eller 5 til 95%. "
Spil er den mest naturlige anvendelse af sandsynlighed, men der er mange andre områder, der er afhængige af eller bruger sandsynlighed. Disse inkluderer blandt andet:
Der er flere måder at nærme sig sandsynligheder på: a priori beregning og a posteriori beregning . (se afsnittet om fortolkning af sandsynligheder ovenfor). Beregningen af de a posteriori sandsynligheder svarer til en tilskrivning af værdierne for de ukendte sandsynligheder takket være Bayes sætning .
For at estimere sandsynlighederne anvendes statistiske estimatorer for bedre at tilnærme den ønskede variabel. En estimator er en værdi beregnet ud fra en stikprøve af den samlede undersøgelsespopulation. En estimator er velvalgt, dvs. det vil give et godt estimat af de ønskede værdier, hvis det er en upartisk og konvergerende estimator; det vil sige, det empiriske gennemsnit nærmer sig det teoretiske gennemsnit, og estimatoren konvergerer til den korrekte tilfældige variabel, når stikprøvestørrelsen stiger. Den maksimale sandsynlighedsmetode gør det muligt at vælge en god estimator.
Ved disse metoder er det muligt at finde de ukendte parametre for en sandsynlighedslov, der er forbundet med det undersøgte fænomen.
Bayesisk revision er en anden metode til beregning af posteriore sandsynligheder . Dette gøres takket være Bayes 'sætning : I denne formel repræsenterer hypotesen, hvad vi antager a priori om det tilfældige fænomen, beviset er en del af det fænomen, som vi kender, og som vi kan måle. Udtrykket kaldes sandsynlighed . På denne måde er det muligt at måle den efterfølgende sandsynlighed for den hypotese, vi sætter under hensyntagen til beviset .
Eksempel 1Den empiriske frekvens bruges til at estimere sandsynlighederne. I en stikprøve på n individer er det tilstrækkeligt at tælle antallet af gange, individet hører til kategorien A, der søges. Ved at bemærke dette tal blandt n- tegningerne er frekvensen tæt på den ønskede sandsynlighed . Ved 400 mønt kaster, hvis det viser sig 198 gange siden ansigt , så følger det, at sandsynligheden for at opnå ansigt er ca. . Dette er et specielt tilfælde af loven om store antal . 0,495 er den anslåede værdi af .
Eksempel 2En liste over værdier er kendt, det antages at have en normalfordeling, hvis gennemsnit m er kendt. Spørgsmålet er at finde standardafvigelsen σ for normalfordelingen. Den statistik T defineret ved en estimator af σ , dvs. den tendens til at o som n går mod uendelig.
Eksempel 3Vi spekulerer på, hvordan vejret bliver i morgen, vejrudsigten giver yderligere oplysninger. Nogle data er kendt: sandsynligheden for, at den forventede gode vejr at vide, at han rent faktisk vil være fint: sandsynligheden for, at den forventede gode vejr at vide, at det vil regne: .
Der vælges en hypotese: for eksempel , det vil sige, vi anser på forhånd , at der er en ud af to chance for, at vejret bliver godt i morgen.
Det er så muligt at beregne sandsynligheden for, at vejrudsigten meddeler godt vejr: det vil sige, at vejrudsigten meddeler godt vejr i 55% af tilfældene. Sandsynligheden for, at det bliver solskin i morgen, vel vidende at vejrudsigten har meddelt godt vejr, er derefter givet af:
Det er derefter muligt at revidere antagelsen om, at vejret vil være fint igen, ved at se på en anden vejrrapport fra en anden kilde. Vi tager derefter som en ny hypotese den nyberegnede sandsynlighed for godt vejr.