Hoeffding ulighed
I sandsynlighedsteori er Hoeffdings ulighed en ulighed i koncentration vedrørende summen af uafhængige og afgrænsede tilfældige variabler . Det stammer fra den finske matematiker og statistiker Wassily Hoeffding . Der er en mere generel version af denne ulighed, der vedrører en sum af stigninger i martingaler , igen begrænsede stigninger: denne mere generelle version er undertiden kendt under navnet Azuma-Hoeffding ulighed .
Stater
Hoeffding ulighed - Lad være en sekvens af uafhængige reelle tilfældige variabler, der tilfredsstiller, for to sekvenser af reelle tal, således at (xk)1≤k≤ikke {\ displaystyle \ (X_ {k}) _ {1 \ leq k \ leq n} \}
(påk)1≤k≤ikke, {\ displaystyle \ (a_ {k}) _ {1 \ leq k \ leq n}, \}
(bk)1≤k≤ikke {\ displaystyle \ (b_ {k}) _ {1 \ leq k \ leq n} \}
påk<bk, {\ displaystyle \ a_ {k} <b_ {k}, \}
∀k,P(påk≤xk≤bk)=1.{\ displaystyle \ forall k, \ qquad \ mathbb {P} (a_ {k} \ leq X_ {k} \ leq b_ {k}) = 1.}
Vi udgør
Sikke=x1+x2+⋯+xikke.{\ displaystyle S_ {n} = X_ {1} + X_ {2} + \ prikker + X_ {n}.}
Så for alt t>0, {\ displaystyle \ t> 0, \}
P(Sikke-E[Sikke]≥t)≤eksp(-2t2∑jeg=1ikke(bjeg-påjeg)2),P(Sikke-E[Sikke]≤-t)≤eksp(-2t2∑jeg=1ikke(bjeg-påjeg)2),P(|Sikke-E[Sikke]|≥t)≤2eksp(-2t2∑jeg=1ikke(bjeg-påjeg)2).{\ displaystyle {\ begin {array} {rl} \ mathbb {P} \ left (S_ {n} - \ mathbb {E} [S_ {n}] \ geq t \ right) & \ leq \ exp \ left ( - {\ frac {2 \, t ^ {2}} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2}}} \ højre), \\ \ mathbb {P} \ left (S_ {n} - \ mathbb {E} [S_ {n}] \ leq -t \ right) & \ leq \ exp \ left (- {\ frac {2 \, t ^ { 2}} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2}}} til højre), \\\ mathbb {P} \ venstre (\ venstre | S_ {n} - \ mathbb {E} [S_ {n}] \ right | \ geq t \ right) & \ leq 2 \ exp \ left (- {\ frac {2 \, t ^ {2}} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2}}} højre). \ end {array}}}
Antag at
P(xk=1)=1-P(xk=0)=s.{\ displaystyle \ mathbb {P} (X_ {k} = 1) = 1- \ mathbb {P} (X_ {k} = 0) = p.}
Derefter følger binomialfordelingen af parametrene n og p . Den Bienayme-Chebyshev ulighed og Hoeffding ulighed henholdsvis giver Sikke {\ displaystyle \ S_ {n} \}
∀x>0{\ displaystyle \ forall x> 0}
P(|Sikke-E[Sikke]|≥xikke)≤s(1-s)x2,P(|Sikke-E[Sikke]|≥xikke)≤2eksp(-2x2).{\ displaystyle {\ begin {array} {rl} \ mathbb {P} \ left (\ left | S_ {n} - \ mathbb {E} [S_ {n}] \ right | \ geq x {\ sqrt {n }} \ højre) & \ leq {\ frac {p (1-p)} {x ^ {2}}}, \\\ mathbb {P} \ left (\ left | S_ {n} - \ mathbb {E } [S_ {n}] \ right | \ geq x {\ sqrt {n}} \ right) & \ leq 2 \ exp \ left (-2 \, x ^ {2} \ right). \ Afslut {array} }}
Vi ser, at Hoeffding-uligheden i dette tilfælde (og det er ret repræsentativ for den generelle situation) er meget mere præcis for tilstrækkelig stor.
x {\ displaystyle \ x \}![\ x \](https://wikimedia.org/api/rest_v1/media/math/render/svg/b8870480257369121bf218c4814f88d4f5c43108)
Demonstration
Indledende ulighed
Beviset bruger følgende forslag:
Proposition -
Lad være en afgrænset og centreret reel tilfældig variabel (verificering ). Lad to reelle tal være sådan, og sådan, at derefter for alle reelle tal Y {\ displaystyle \ Y \}
E[Y]=0 {\ displaystyle \ \ mathbb {E} [Y] = 0 \}
vs.,d {\ displaystyle \ c, \, d \}
vs.<d {\ displaystyle \ c <d \}
P(vs.≤Y≤d)=1. {\ displaystyle \ \ mathbb {P} (c \ leq Y \ leq d) = 1. \}
s>0, {\ displaystyle \ s> 0, \}
E[esY]≤eksp(s2(d-vs.)2/8).{\ displaystyle \ mathbb {E} \ left [e ^ {sY} \ right] \ leq \ exp \ left (s ^ {2} (dc) ^ {2} / 8 \ right).}
For det første kan vi antage c <0 og d > 0 . Faktisk, hvis , så er Y en næsten-sikker positiv tilfældig variabel med nul forventning, er Y = 0 næsten-sikkert, og propositionen er indlysende; begrundelsen er analog for Ved konveksitet af den funktion, vi har, forvs.≥0{\ displaystyle c \ geq 0}
d≤0.{\ displaystyle d \ leq 0.}
x↦esx, {\ displaystyle \ x \ mapsto e ^ {sx}, \}
vs.≤Y(ω)≤d, {\ displaystyle \ c \ leq Y (\ omega) \ leq d, \}
esY(ω)≤d-Y(ω)d-vs. esvs. + Y(ω)-vs.d-vs. esd.{\ displaystyle e ^ {sY (\ omega)} \ leq {\ frac {dY (\ omega)} {dc}} \ e ^ {sc} \ + \ {\ frac {Y (\ omega) -c} { dc}} \ e ^ {sd}.}
Gå videre til håb, da vi udleder det
P(vs.≤Y≤d)=1, {\ displaystyle \ \ mathbb {P} (c \ leq Y \ leq d) = 1, \}![\ {\ mathbb {P}} (c \ leq Y \ leq d) = 1, \](https://wikimedia.org/api/rest_v1/media/math/render/svg/a6dd94240ece2c440bc3eb6d49135508d67dfd14)
E[esY]≤f(s)=dd-vs. esvs. + -vs.d-vs. esd.{\ displaystyle \ mathbb {E} [e ^ {sY}] \ leq f (s) = {\ frac {d} {dc}} \ e ^ {sc} \ + \ {\ frac {-c} {dc }} \ e ^ {sd}.}
Vi udgør
(d-vs.)s=uln(f(s))=ψ(u),-vs.d-vs.=s,1-s=dd-vs..{\ displaystyle {\ begin {array} {rl} (dc) s & = u \\\ ln (f (s)) & = \ psi (u), \\ {\ frac {-c} {dc}} & = p, \ quad 1-p = {\ frac {d} {dc}}. \ end {array}}}
Da c <0 og d > 0 , har vi derfor relevansen af notationen. Den følger det
s∈[0,1]{\ displaystyle p \ in [0,1]}![{\ displaystyle p \ in [0,1]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/33c3a52aa7b2d00227e85c641cca67e85583c43c)
ψ(u)=-su+ln(1-s+seu).{\ displaystyle \ psi (u) \, = \, - pu + \ ln \ left (1-p + pe ^ {u} \ right).}
Vi bemærker derefter, at
derudover
ψ(0)=ψ′(0)=0. {\ displaystyle \ \ psi (0) = \ psi ^ {\ prime} (0) = 0. \}![\ \ psi (0) = \ psi ^ {{\ prime}} (0) = 0. \](https://wikimedia.org/api/rest_v1/media/math/render/svg/5b5c677bce79806968fc3d1eaee3ca0b44c2af04)
ψ′′(u)=(1-s)seu(1-s+seu)2=aβ(a+β)2≤14.{\ displaystyle \ psi ^ {\ prime \ prime} (u) = {\ frac {\ left (1-p \ right) pe ^ {u}} {\ left (1-p + pe ^ {u} \ right ) ^ {2}}} = {\ frac {\ alpha \ beta} {(\ alpha + \ beta) ^ {2}}} \ leq {\ frac {1} {4}}.}
Derefter i kraft af Taylor-Lagrange-formlen i rækkefølge 1,
ψ(u)=ψ(0)+ψ′(0)u+R2(u)≤u28.{\ displaystyle \ psi (u) = \ psi (0) + \ psi ^ {\ prime} (0) u + R_ {2} (u) \ leq {\ frac {u ^ {2}} {8}} .}
Bevis for Hoeffdings ulighed
Vi anvender derefter Markov-uligheden . Til dette udgør vi:
Yjeg=xjeg-E[xjeg],vs.jeg=påjeg-E[xjeg],djeg=bjeg-E[xjeg],{\ displaystyle {\ begin {array} {rl} Y_ {i} & = X_ {i} - \ mathbb {E} [X_ {i}], \\ c_ {i} & = a_ {i} - \ mathbb {E} [X_ {i}], \ quad d_ {i} = b_ {i} - \ mathbb {E} [X_ {i}], \ end {array}}}
og det bemærker vi
P(vs.jeg≤Yjeg≤djeg)=1,djeg-vs.jeg=bjeg-påjeg,Sikke-E[Sikke]=Y1+Y2+⋯+Yikke.{\ displaystyle {\ begin {array} {rl} \ mathbb {P} (c_ {i} \ leq Y_ {i} \ leq d_ {i}) & = 1, \\ d_ {i} -c_ {i} & = b_ {i} -a_ {i}, \\ S_ {n} - \ mathbb {E} [S_ {n}] & = Y_ {1} + Y_ {2} + \ dots + Y_ {n}. \ end {array}}}
For alt har vi derfor i kraft af en følge af Markovs ulighed af uafhængigheden af og derfor af og af det foregående forslag:
s>0, {\ displaystyle \ s> 0, \}
xjeg, {\ displaystyle \ X_ {i}, \}
Yjeg, {\ displaystyle \ Y_ {i}, \}![\ Y _ {{i}}, \](https://wikimedia.org/api/rest_v1/media/math/render/svg/94b16e5fcc568afb77bf5e165d4a5bea214ef288)
P(Sikke-E[Sikke]≥t)≤E[es(Sikke-E[Sikke])]e-st=E[es(Y1+Y2+⋯+Yikke)]e-st=e-st ∏jeg=1ikkeE[esYjeg]≤eksp(-st+s2 ∑jeg=1ikke(bjeg-påjeg)28).{\ displaystyle {\ begin {array} {rl} \ mathbb {P} \ left (S_ {n} - \ mathbb {E} [S_ {n}] \ geq t \ right) & \ leq \ mathbb {E} \ left [e ^ {s (S_ {n} - \ mathbb {E} [S_ {n}])} \ right] e ^ {- st} \\ & = \ mathbb {E} \ left [e ^ { s (Y_ {1} + Y_ {2} + \ prikker + Y_ {n})} \ højre] e ^ {- st} \\ & = e ^ {- st} \ \ prod _ {i = 1} ^ {n} \ mathbb {E} \ left [e ^ {sY_ {i}} \ right] \\ & \ leq \ exp \ left (-st + {\ frac {s ^ {2} \ \ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2}} {8}} \ højre). \ Afslut {array}}}
Uligheden gælder især for
s0=4t∑jeg=1ikke(bjeg-påjeg)2,{\ displaystyle s_ {0} = {\ frac {4t} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2}}},}
som realiserer minimumet af den højre bundet, hvilket viser den første ulighed. Den anden ulighed demonstreres ved at erstatte ved og ved i den foregående beregning ved at stille
Yjeg {\ displaystyle \ Y_ {i} \}
Yjeg′=E[xjeg]-xjeg, {\ displaystyle \ Y_ {i} ^ {\ prime} = \ mathbb {E} [X_ {i}] - X_ {i}, \}
Sikke-E[Sikke] {\ displaystyle \ S_ {n} - \ mathbb {E} [S_ {n}] \}
E[Sikke]-Sikke, {\ displaystyle \ \ mathbb {E} [S_ {n}] - S_ {n}, \}![\ {\ mathbb {E}} [S _ {{n}}] - S _ {{n}}, \](https://wikimedia.org/api/rest_v1/media/math/render/svg/8d9005d8a6ae20b8f413cd496e212955e0a5d5a9)
vs.jeg′=E[xjeg]-bjeg,djeg′=E[xjeg]-påjeg,{\ displaystyle {\ begin {array} {rl} c_ {i} ^ {\ prime} & = \ mathbb {E} [X_ {i}] - b_ {i}, \\ d_ {i} ^ {\ prime } & = \ mathbb {E} [X_ {i}] - a_ {i}, \ end {array}}}
og bemærker det
P(vs.jeg′≤Yjeg′≤djeg′)=1,djeg′-vs.jeg′=bjeg-påjeg,E[Sikke]-Sikke=Y1′+Y2′+⋯+Yikke′.{\ displaystyle {\ begin {array} {rl} \ mathbb {P} (c_ {i} ^ {\ prime} \ leq Y_ {i} ^ {\ prime} \ leq d_ {i} ^ {\ prime}) & = 1, \\ d_ {i} ^ {\ prime} -c_ {i} ^ {\ prime} & = b_ {i} -a_ {i}, \\\ mathbb {E} [S_ {n}] -S_ {n} & = Y_ {1} ^ {\ prime} + Y_ {2} ^ {\ prime} + \ prikker + Y_ {n} ^ {\ prime}. \ Afslut {array}}}
Den tredje ulighed er en direkte konsekvens af de to første.
Erklæring "til enhver tid"
I sit papir fra 1963 gav Hoeffding en lidt mere generel erklæring om sin ulighed ved hjælp af Doobs ulighed . Mere præcist under de samme antagelser for alle t>0, {\ displaystyle \ t> 0, \}
P(∃m≤ikke, Sm-E[Sm]≥t)≤eksp(-2t2∑jeg=1ikke(bjeg-påjeg)2),P(∃m≤ikke, Sm-E[Sm]≤-t)≤eksp(-2t2∑jeg=1ikke(bjeg-påjeg)2),P(∃m≤ikke, |Sm-E[Sm]|≥t)≤2eksp(-2t2∑jeg=1ikke(bjeg-påjeg)2).{\ displaystyle {\ begin {array} {rl} \ mathbb {P} \ left (\ exist m \ leq n, ~ S_ {m} - \ mathbb {E} [S_ {m}] \ geq t \ right) & \ leq \ exp \ left (- {\ frac {2 \, t ^ {2}} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2} }} \ højre), \\\ mathbb {P} \ venstre (\ eksisterer m \ leq n, ~ S_ {m} - \ mathbb {E} [S_ {m}] \ leq -t \ højre) & \ leq \ exp \ left (- {\ frac {2 \, t ^ {2}} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2}}} \ højre), \\\ mathbb {P} \ left (\ exist m \ leq n, ~ \ left | S_ {m} - \ mathbb {E} [S_ {m}] \ right | \ geq t \ right) & \ leq 2 \ exp \ left (- {\ frac {2 \, t ^ {2}} {\ sum _ {i = 1} ^ {n} (b_ {i} -a_ {i}) ^ {2} }} \ right). \ end {array}}}
Se også
Tilknyttede sider
Bibliografi
- C. McDiarmid, om metoden med begrænsede forskelle. I Surveys in Combinatorics , London Math. Soc. Readings Noter 141, Cambridge Univ. Press, Cambridge 1989, 148–188.
- W. Hoeffding, "Sandsynlighedsuligheder for summer af afgrænsede tilfældige variabler", J. Amer. Statistik. Assoc. 58, 13-30, 1963
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">