Rayleigh kvotient

I matematik , for en Hermitian- matrix A og en ikke-nul- vektor x , er Rayleigh-kvotienten det skalære udtryk defineret af

hvor x * angiver den tilgrænsende vektor af x . For en symmetrisk matrix med koefficienter reel , vektoren x * er simpelthen dens transponerede x T .

I begge tilfælde giver Rayleigh-kvotienten en reel værdi, der giver information om matrixens spektrum ved hjælp af følgende to grundlæggende egenskaber:

Disse to egenskaber kan udnyttes til numerisk at bestemme værdier, vektorer og egenrum for en hermitisk eller symmetrisk operator .

Rayleigh-kvotienten, hvis ekstreme egenskab kan relateres til princippet om minimal potentiel energi i mekanik , blev først undersøgt af Rayleigh (1877). Walter Ritz tog ideen op i 1909 for at gøre det til grundlaget for en variabel tilnærmelsesmetode.

Ejendomme

Fra en respektiv hermitisk symmetrisk matrix (hvis egenværdier er reelle) tilfredsstiller Rayleigh-kvotienten følgende egenskaber:

  1. Det er en homogen funktion af grad 1, da R ( A , cx ) = R ( A , x ) for enhver skalar c .
  2. For x ikke nul, hvor og er selve ekstreme A . En ligestilling nås, hvis og kun hvis x er en egenvektor for den tilsvarende ekstreme egenværdi.
  3. Hvis x 0 er en ikke-ekstrem egenværdige egenvektor, har R ( A , x ) et sadelpunkt i nærheden af x 0 .
Begrundelse Bevis for ejerskab 2

I det virkelige tilfælde er den symmetriske matrix diagonaliserbar i den forstand, at der findes en ortogonal matrix O (hvis kolonner er egenvektorer) og en diagonal matrix D, hvis koefficienter er egenværdierne såsom

I det komplekse tilfælde kan Hermitian-matrixen diagonaliseres ved hjælp af en enhedsmatrix, og ræsonnementet er identisk.

Ændringen af ​​variabel bevarer den euklidiske norm og dermed

I variablerne y i er Rayleigh-kvotienten et vægtet gennemsnit af egenværdierne, som retfærdiggør egenskab 2.

Bevis for ejerskab 3

Det antages, at egenværdierne er forskellige fra hinanden; i modsat tilfælde er det nok at samle udtrykkene for of ( y ) efter grupper med flere egenværdier.

Vi kontrollerer, at gradienten og den hessiske matrix af henholdsvis Φ ( y ) er skrevet

hvor J er en diagonal matrix:

Med forskellige egenværdier forsvinder gradienten, hvis og kun hvis alle y i er nul undtagen en. Ved vilkårligt at vælge et indeks k og ved at stille ( Kronecker-symbol ) udledes vi:

er diagonalt med

Langt om længe

Bemærk: H kk = 0 afspejler den homogene karakter af Φ ( y ) .

En anden tilgang

Normen for x, der ikke har nogen effekt af egenskab 1, vi kan også formulere problemet ved metoden for Lagrange-multiplikatorer ved at finde x, som maksimerer (eller minimerer) x T A x under begrænsningen x T x = 1 Det er således et spørgsmål om overvejer funktionen

og find x og μ, som annullerer differencenΨ ( x , μ) . Løsningen gives ved følgende nødvendige (men ikke tilstrækkelige generelle) betingelser:

Kombineret med min-max sætningen af Current - Fischer gør kvotienten af ​​Rayleigh det muligt at bestemme en matrixs egenværdier for en matrix. Det kan også bruges til at beregne en omtrentlig værdi af en egenværdi ud fra en tilnærmelse af en egenvektor. Disse ideer danner også grundlaget for algoritmen til iteration Rayleigh .

Særligt tilfælde af positive selvtilstødende matricer

De positive selvtilstødende matricer (dvs. positive semi-definitive) har positive eller nul egenværdier, og Rayleigh-kvotienten forbliver således altid positiv eller nul. Dette er især tilfældet for kovariansmatricer, og denne egenskab er grundlaget for hovedkomponentanalyse og kanoniske korrelationer .

Rayleigh-Ritz metode

Den Sturm-Liouville teori angår virkningen af lineære

præ-Hilbert rummet af funktioner y ( x ) tilfredsstiller randbetingelser specifikke for x = a og b , der er udstyret med den skalarproduktet  : .

I dette tilfælde er Rayleigh-kvotienten det

Det præsenteres undertiden i en ækvivalent form, opnået ved at opdele tællerens integral og integrere med dele  :

At bestemme en omtrentlig opløsning af ligningen

kontrol af randbetingelser, vælger vi en række funktioner tjekker sig selv randbetingelserne, og vi søger den omtrentlige løsning som en lineær kombination af p-tilstande valgt: . De ukendte koefficienter opnås ved at skrive Rayleigh-kvotientens stationaritet :, som bestemmer p lineære ligninger af ukendte

Generalisering

Vi kan udvide begrebet Rayleigh-kvotient til to virkelige positive bestemte symmetriske matricer ( A , B ) og til en ikke-nul-vektor x ifølge:

Denne "generaliseret Rayleigh kvotient" reduceres til den Rayleigh kvotienten R ( D , Cx ) ved forarbejdning hvor C er Cholesky faktorisering af matrix B .

Noter og referencer

(fr) Denne artikel er helt eller delvist hentet fra den engelske Wikipedia- artikel med titlen Rayleigh quotient  " ( se listen over forfattere ) .
  1. Se f.eks Ciarlet 2006 , s.  12-13.

Bibliografi

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">