Rayleigh kvotient
I matematik , for en Hermitian- matrix A og en ikke-nul- vektor x , er Rayleigh-kvotienten det skalære udtryk defineret af
R(PÅ,x)=x∗PÅxx∗x{\ displaystyle R (A, x) = {\ frac {x ^ {*} Ax} {x ^ {*} x}}}![R (A, x) = {\ frac {x ^ {{*}} Axe} {x ^ {{*}} x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db32183f389d9ebda6cd086b4f34e4842affc5ea)
hvor x * angiver den tilgrænsende vektor af x . For en symmetrisk matrix med koefficienter reel , vektoren x * er simpelthen dens transponerede x T .
I begge tilfælde giver Rayleigh-kvotienten en reel værdi, der giver information om matrixens spektrum ved hjælp af følgende to grundlæggende egenskaber:
Disse to egenskaber kan udnyttes til numerisk at bestemme værdier, vektorer og egenrum for en hermitisk eller symmetrisk operator .
Rayleigh-kvotienten, hvis ekstreme egenskab kan relateres til princippet om minimal potentiel energi i mekanik , blev først undersøgt af Rayleigh (1877).
Walter Ritz tog ideen op i 1909 for at gøre det til grundlaget for en variabel tilnærmelsesmetode.
Ejendomme
Fra en respektiv hermitisk symmetrisk matrix (hvis egenværdier er reelle) tilfredsstiller Rayleigh-kvotienten følgende egenskaber:
- Det er en homogen funktion af grad 1, da R ( A , cx ) = R ( A , x ) for enhver skalar c .
- For x ikke nul, hvor og er selve ekstreme A . En ligestilling nås, hvis og kun hvis x er en egenvektor for den tilsvarende ekstreme egenværdi.λmin≤R(PÅ,x)≤λmaks{\ displaystyle \ lambda _ {\ min} \ leq R (A, x) \ leq \ lambda _ {\ max}}
λmin{\ displaystyle \ lambda _ {\ min}}
λmaks{\ displaystyle \ lambda _ {\ max}}![\ lambda _ {\ max}](https://wikimedia.org/api/rest_v1/media/math/render/svg/957584ae6a35f9edf293cb486d7436fb5b75e803)
- Hvis x 0 er en ikke-ekstrem egenværdige egenvektor, har R ( A , x ) et sadelpunkt i nærheden af x 0 .
Begrundelse
Bevis for ejerskab 2
I det virkelige tilfælde er den symmetriske matrix diagonaliserbar i den forstand, at der findes en ortogonal matrix O (hvis kolonner er egenvektorer) og en diagonal matrix D, hvis koefficienter er egenværdierne såsom
λjeg{\ displaystyle \ lambda _ {i}}![\ lambda _ {{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/72fde940918edf84caf3d406cc7d31949166820f)
PÅ=ODOT.{\ displaystyle A = ODO ^ {T}.}![A = ODO ^ {{T}}.](https://wikimedia.org/api/rest_v1/media/math/render/svg/90456f5179db497dcfed21d9cbf2d5ff5dffeb63)
I det komplekse tilfælde kan Hermitian-matrixen diagonaliseres ved hjælp af en enhedsmatrix, og ræsonnementet er identisk.
PÅ=UDU∗{\ displaystyle A = UDU ^ {*}}![A = UDU ^ {{*}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3ef144012b04ddf7d0c21b61126c9f6ac99ad6e7)
Ændringen af variabel bevarer den euklidiske norm og dermed
y=OTx{\ displaystyle y = O ^ {T} x}![y = O ^ {T} x](https://wikimedia.org/api/rest_v1/media/math/render/svg/afc001e7128d4113c1de3767d648a10c8df48c60)
R(PÅ,x)=Φ(y) med Φ(y)=∑jegλjegyjeg2∑jegyjeg2.{\ displaystyle R (A, x) = \ Phi (y) {\ tekst {med}} \ Phi (y) = {\ frac {\ sum _ {i} \ lambda _ {i} y_ {i} ^ { 2}} {\ sum _ {i} y_ {i} ^ {2}}}.}![R (A, x) = \ Phi (y) {\ tekst {med}} \ Phi (y) = {\ frac {\ sum _ {{i}} \ lambda _ {{i}} y _ {{i }} ^ {{2}}} {\ sum _ {{i}} y _ {{i}} ^ {{2}}}}.](https://wikimedia.org/api/rest_v1/media/math/render/svg/265259b4490b9976d2608f91ebd84fb3033fbddc)
I variablerne y i er Rayleigh-kvotienten et vægtet gennemsnit af egenværdierne, som retfærdiggør egenskab 2.
Bevis for ejerskab 3
Det antages, at egenværdierne er forskellige fra hinanden; i modsat tilfælde er det nok at samle udtrykkene for of ( y ) efter grupper med flere egenværdier.
Vi kontrollerer, at gradienten og den hessiske matrix af henholdsvis Φ ( y ) er skrevet
∂Φ(y)∂yjeg=2‖y‖2yjeg(λjeg-Φ(y)).{\ displaystyle {\ frac {\ partial \ Phi (y)} {\ partial y_ {i}}} = {\ frac {2} {\ left \ | y \ right \ | ^ {2}}} \, y_ {i} \, (\ lambda _ {i} - \ Phi (y)).}
H(Φ(y))=2‖y‖2(J+2‖y‖2S){\ displaystyle H (\ Phi (y)) = {\ frac {2} {\ left \ | y \ right \ | ^ {2}}} (J + {\ frac {2} {\ left \ | y \ højre \ | ^ {2}}} S)}
hvor J er en diagonal matrix:
Jjegjeg=λjeg-Φ(y){\ displaystyle J_ {ii} = \ lambda _ {i} - \ Phi (y)}
Sjegj=yjegyj(2Φ(y)-λjeg-λj).{\ displaystyle S_ {ij} = y_ {i} \, y_ {j} \, (2 \, \ Phi (y) - \ lambda _ {i} - \ lambda _ {j}).}
Med forskellige egenværdier forsvinder gradienten, hvis og kun hvis alle y i er nul undtagen en. Ved vilkårligt at vælge et indeks k og ved at stille ( Kronecker-symbol ) udledes vi:
yjeg=δjegk{\ displaystyle y_ {i} = \ delta _ {ik}}![y _ {{i}} = \ delta _ {{ik}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8e198ebdbd5977a30d4a9aacad128a7c5feb3ad3)
Φ(y)=λk,{\ displaystyle \ Phi (y) = \ lambda _ {k},}
Jjegjeg=λjeg-λk og Sjegj=0,{\ displaystyle J_ {ii} = \ lambda _ {i} - \ lambda _ {k} {\ text {and}} S_ {ij} = 0,}
H(Φ(y)){\ displaystyle H (\ Phi (y))}![H (\ Phi (y))](https://wikimedia.org/api/rest_v1/media/math/render/svg/2b98b5e954db9310ced897e060483bf7ef448bbb)
er diagonalt med
Hjegjeg=2(λjeg-λk).{\ displaystyle H_ {ii} = 2 (\ lambda _ {i} - \ lambda _ {k}).}
Langt om længe
- Hvis y k er en af de to ekstreme egenværdier, er det faktisk en ekstremum af Φ ( y ), fordi elementerne i H har det samme tegn.
- Ellers ændrer diagonale udtryk for H tegn, og det er et sadelpunkt.
Bemærk: H kk = 0 afspejler den homogene karakter af Φ ( y ) .
En anden tilgang
Normen for x, der ikke har nogen effekt af egenskab 1, vi kan også formulere problemet ved metoden for Lagrange-multiplikatorer ved at finde x, som maksimerer (eller minimerer) x T A x under begrænsningen x T x = 1 Det er således et spørgsmål om overvejer funktionen
Ψ(x,μ)=xTPÅx+μ(1-xTx){\ displaystyle \ Psi (x, \ mu) = x ^ {T} Ax + \ mu (1-x ^ {T} x)}![\ Psi (x, \ mu) = x ^ {{T}} Ax + \ mu (1-x ^ {{T}} x)](https://wikimedia.org/api/rest_v1/media/math/render/svg/ae68405a3244ac80a4236ba1ad747626efa3a3b5)
og find x og μ, som annullerer differencen på Ψ ( x , μ) . Løsningen gives ved følgende nødvendige (men ikke tilstrækkelige generelle) betingelser:
PÅx=μx{\ displaystyle Axe = \ mu x}
xTx=1.{\ displaystyle x ^ {T} x = 1.}
Kombineret med min-max sætningen af Current - Fischer gør kvotienten af Rayleigh det muligt at bestemme en matrixs egenværdier for en matrix. Det kan også bruges til at beregne en omtrentlig værdi af en egenværdi ud fra en tilnærmelse af en egenvektor. Disse ideer danner også grundlaget for algoritmen til iteration Rayleigh .
Særligt tilfælde af positive selvtilstødende matricer
De positive selvtilstødende matricer (dvs. positive semi-definitive) har positive eller nul egenværdier, og Rayleigh-kvotienten forbliver således altid positiv eller nul. Dette er især tilfældet for kovariansmatricer, og denne egenskab er grundlaget for hovedkomponentanalyse og kanoniske korrelationer .
Rayleigh-Ritz metode
Den Sturm-Liouville teori angår virkningen af lineære
L(y)=1w(x)(-ddx[s(x)dydx]+q(x)y){\ displaystyle L (y) = {\ frac {1} {w (x)}} \ left (- {\ frac {\ mathrm {d}} {\ mathrm {d} x}} \ left [p (x ) {\ frac {\ mathrm {d} y} {\ mathrm {d} x}} \ right] + q (x) y \ right)}![L (y) = {\ frac {1} {w (x)}} \ left (- {\ frac {{\ mathrm d}} {{\ mathrm d} x}} \ left [p (x) {\ frac {{\ mathrm d} y} {{\ mathrm d} x}} \ right] + q (x) y \ right)](https://wikimedia.org/api/rest_v1/media/math/render/svg/f8dd8b186ed70d41cdf927e5483440519efb0a93)
på præ-Hilbert rummet af funktioner y ( x ) tilfredsstiller randbetingelser specifikke for x = a og b , der er udstyret med den skalarproduktet : .
⟨y1,y2⟩=∫påbw(x)y1(x)y2(x)dx{\ displaystyle \ langle {y_ {1}, y_ {2}} \ rangle = \ int _ {a} ^ {b} {w (x) y_ {1} (x) y_ {2} (x)} \ mathrm {d} x}![\ langle {y_ {1}, y_ {2}} \ rangle = \ int _ {a} ^ {b} {w (x) y_ {1} (x) y_ {2} (x)} {\ mathrm d } x](https://wikimedia.org/api/rest_v1/media/math/render/svg/a2f531d8200466ee10fe1a728fdc955854194f99)
I dette tilfælde er Rayleigh-kvotienten det
ρ(x)=⟨y,Ly⟩⟨y,y⟩=∫påby(x)(-ddx[s(x)dydx]+q(x)y(x))dx∫påbw(x)y(x)2dx.{\ displaystyle \ rho (x) = {\ frac {\ langle {y, Ly} \ rangle} {\ langle {y, y} \ rangle}} = {\ frac {\ int _ {a} ^ {b} {y (x) \ left (- {\ frac {\ mathrm {d}} {\ mathrm {d} x}} \ left [p (x) {\ frac {\ mathrm {d} y} {\ mathrm { d} x}} \ right] + q (x) y (x) \ right)} \ mathrm {d} x} {\ int _ {a} ^ {b} {w (x) y (x) ^ { 2}} \ mathrm {d} x}}.}![\ rho (x) = {\ frac {\ langle {y, Ly} \ rangle} {\ langle {y, y} \ rangle}} = {\ frac {\ int _ {a} ^ {b} {y ( x) \ left (- {\ frac {{\ mathrm d}} {{\ mathrm d} x}} \ left [p (x) {\ frac {{\ mathrm d} y} {{\ mathrm d } x}} \ højre] + q (x) y (x) \ højre)} {\ mathrm d} x} {\ int _ {a} ^ {b} {w (x) y (x) ^ {2 }} {\ mathrm d} x}}.](https://wikimedia.org/api/rest_v1/media/math/render/svg/9d3ce58ab8f7ac21449ba6c83a9c028e429985e0)
Det præsenteres undertiden i en ækvivalent form, opnået ved at opdele tællerens integral og integrere med dele :
ρ(x)=⟨y,Ly⟩⟨y,y⟩=∫påby(x)(-ddx[s(x)y′(x)])dx+∫påbq(x)y(x)2dx∫påbw(x)y(x)2dx{\ displaystyle \ rho (x) = {\ frac {\ langle {y, Ly} \ rangle} {\ langle {y, y} \ rangle}} = {\ frac {\ int _ {a} ^ {b} {y (x) \ left (- {\ frac {\ mathrm {d}} {\ mathrm {d} x}} \ left [p (x) y '(x) \ right] \ right)} \ mathrm { d} x + \ int _ {a} ^ {b} {q (x) y (x) ^ {2}} \ mathrm {d} x} {\ int _ {a} ^ {b} {w (x ) y (x) ^ {2}} \ mathrm {d} x}}}
=-y(x)[s(x)y′(x)]|påb+∫påby′(x)[s(x)y′(x)]dx+∫påbq(x)y(x)2dx∫påbw(x)y(x)2dx{\ displaystyle = {\ frac {-y (x) \ left [p (x) y '(x) \ right] | _ {a} ^ {b} + \ int _ {a} ^ {b} {y '(x) \ venstre [p (x) y' (x) \ højre]} \ mathrm {d} x + \ int _ {a} ^ {b} {q (x) y (x) ^ {2} } \ mathrm {d} x} {\ int _ {a} ^ {b} {w (x) y (x) ^ {2}} \ mathrm {d} x}}}
=-s(x)y(x)y′(x)|påb+∫påb[s(x)y′(x)2+q(x)y(x)2]dx∫påbw(x)y(x)2dx.{\ displaystyle = {\ frac {-p (x) y (x) y '(x) | _ {a} ^ {b} + \ int _ {a} ^ {b} \ left [p (x) y '(x) ^ {2} + q (x) y (x) ^ {2} \ højre] \ mathrm {d} x} {\ int _ {a} ^ {b} {w (x) y (x ) ^ {2}} \ mathrm {d} x}}.}
At bestemme en omtrentlig opløsning af ligningen
y¯(x){\ displaystyle {\ bar {y}} (x)}![{\ bar y} (x)](https://wikimedia.org/api/rest_v1/media/math/render/svg/4ad68d9d68b4605703d4b348417d8f71c558dca1)
-ddx[s(x)dydx]+q(x)y=0{\ displaystyle - {\ frac {\ mathrm {d}} {\ mathrm {d} x}} \ left [p (x) {\ frac {\ mathrm {d} y} {\ mathrm {d} x}} \ højre] + q (x) y = 0}![- {\ frac {{\ mathrm d}} {{\ mathrm d} x}} \ left [p (x) {\ frac {{{\ mathrm d} y} {{\ mathrm d} x}} \ højre] + q (x) y = 0](https://wikimedia.org/api/rest_v1/media/math/render/svg/d5535ee434291d26838ea90b5696767359442dc4)
kontrol af randbetingelser, vælger vi en række funktioner tjekker sig selv randbetingelserne, og vi søger den omtrentlige løsning som en lineær kombination af p-tilstande valgt: . De ukendte koefficienter opnås ved at skrive Rayleigh-kvotientens stationaritet :,
som bestemmer p lineære ligninger af ukendteu1,u2,...,us{\ displaystyle u_ {1}, u_ {2}, ..., u_ {p}}
y¯(x)=∑jeg=1sajegujeg(x){\ displaystyle {\ bar {y}} (x) = \ textstyle \ sum _ {i = 1} ^ {p} \ alpha _ {i} u_ {i} (x)}
ajeg{\ displaystyle \ alpha _ {i}}
∂ρ∂ajeg=0{\ displaystyle {\ tfrac {\ partial \ rho} {\ partial \ alpha _ {i}}} = 0}
(ajeg)jeg=1,...,s{\ displaystyle (\ alpha _ {i}) _ {i = 1, ..., p}}
Generalisering
Vi kan udvide begrebet Rayleigh-kvotient til to virkelige positive bestemte symmetriske matricer ( A , B ) og til en ikke-nul-vektor x ifølge:
R(PÅ,B;x): =xTPÅxxTBx.{\ displaystyle R (A, B; x): = {\ frac {x ^ {T} Axe} {x ^ {T} Bx}}.}![R (A, B; x): = {\ frac {x ^ {T} Axe} {x ^ {T} Bx}}.](https://wikimedia.org/api/rest_v1/media/math/render/svg/b906c0dfe3d5eb8b30e87dfd81ef856adbf5ba4a)
Denne "generaliseret Rayleigh kvotient" reduceres til den Rayleigh kvotienten R ( D , Cx ) ved forarbejdning hvor C er Cholesky faktorisering af matrix B .
D=VS-TPÅVS-1{\ displaystyle D = C ^ {- T} AC ^ {- 1}}![D = C ^ {{- T}} AC ^ {{- 1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/72e8c84333dc311d2d0ccd32614a28dedfdd54da)
Noter og referencer
(fr) Denne artikel er helt eller delvist hentet fra den
engelske Wikipedia- artikel med titlen
" Rayleigh quotient " ( se listen over forfattere ) .
-
Se f.eks Ciarlet 2006 , s. 12-13.
Bibliografi
- Philippe Ciarlet , Introduktion til numerisk matrixanalyse og optimering , Masson, koll. “Matematik. Appl. for mesteren ",2006, 5 th ed. , 279 s. ( ISBN 978-2-10-050808-2 )
-
Patrick Lascaux og Raymond Théodor, numerisk analyse af matrix anvendt på ingeniørkunst , t. 1: Direkte metoder [ detaljerede udgaver ], § 1.4 ("Associeret hermitisk form ...")
- (en) John William Strutt Rayleigh , The Theory of Sound , vol. Jeg, McMillan Co.,1877( repr. 1945) ( ISBN 0-486-60292-3 , læs online ) , kap. IV ("Vibrationssystemer generelt") , s. 106-129
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">