Kullback-Leibler divergens

I sandsynlighedsteori og informationsteori er Kullback-Leibler (eller KL-divergens eller relativ entropi ) et mål for ulighed mellem to fordelinger af sandsynligheder. Det skylder sit navn Solomon Kullback og Richard Leibler , to amerikanske kryptanalytikere. Ifølge NSA , var det i 1950'erne, mens de arbejdede for dette agentur, at Kullback og Leibler opfandt denne foranstaltning. Det ville også have tjent NSA i sin kryptanalyseindsats for Venona-projektet .

Introduktion og baggrund

Overvej to sandsynlighedsfordelinger P og Q. Typisk repræsenterer P data, observationer eller en nøjagtigt beregnet sandsynlighedsfordeling. Distribution Q betegner typisk en teori, en model, en beskrivelse eller en tilnærmelse af P . Kullback-Leibler-divergensen fortolkes som den gennemsnitlige forskel i antallet af bits, der er nødvendige for at kode for prøver af P ved hjælp af en kode optimeret til Q i stedet for den kode, der er optimeret til P .

Definition

Der er flere definitioner afhængigt af antagelserne om sandsynlighedsfordelingerne.

Første definitioner

For to diskrete sandsynlighedsfordelinger P og Q defineres Kullback-Leibler-divergensen af P med hensyn til Q ved

.

Til kontinuerlige P- og Q- distributioner bruger vi en integral

hvor p og q er de respektive densiteter af P og Q .

Med andre ord er Kullback-Leibler-divergensen forventningen om forskellen mellem logaritmerne P og Q, idet sandsynligheden P tages for at beregne forventningen.

Generelle definitioner

Vi kan generalisere de to særlige tilfælde ovenfor ved at overveje P og Q to mål defineret på et sæt X , absolut kontinuerligt i forhold til et mål  : Radon-Nikodym-Lebesgue-sætningen sikrer eksistensen af ​​tæthederne p og q med og vi derefter spørge

forudsat at den rigtige mængde findes. Hvis P er absolut kontinuerlig i forhold til Q , (hvilket er nødvendigt, hvis det er endeligt), så er Radon-Nikodym-derivatet af P med hensyn til Q, og vi får

,

hvor man anerkender entropien af P med hensyn til Q .

Tilsvarende, hvis Q er absolut kontinuerlig med hensyn til P , har vi det

I begge tilfælde ser vi, at Kullback-Leibler-divergensen ikke afhænger af foranstaltningen

Når logaritmerne med disse formler tages i base 2, måles informationen i bits ; når basen er nul , er enheden nat .

Eksempel

Kullback giver følgende eksempel (tabel 2.1, eksempel 2.1). Lad P og Q være fordelingen i tabellen og figuren. P er fordelingen på venstre side af figuren, det er en binomial fordeling med N = 2 og p = 0,4. Q er fordelingen af ​​højre side af figuren, en diskret ensartet fordeling med tre værdier x = 0, 1 eller 2, hver med sandsynlighed p = 1/3.

To distributioner for at illustrere Kullback - Leibler divergens

0 1 2
Fordeling P 0,36 0,48 0,16
Q fordeling 0,333 0,333 0,333

KL-afvigelsen beregnes som følger. Vi bruger den naturlige logaritme.

Ejendomme

Bevis (diskret sag)

Nu er logaritmen strengt konkav og bruger derfor Jensens ulighed :

Med lighed er iff konstant næsten overalt . (på grund af den strenge konkavitet) I dette tilfælde kan konstanten kun være lig med 1, da de to funktioner P og Q er sandsynligheder. Derfor egenskaberne.

Diskussion

Selvom den ofte opfattes som en afstand , opfylder den ikke betingelserne: den er ikke symmetrisk og respekterer ikke den trekantede ulighed.

Kullback-Leibler-afvigelsen falder ind i den større kategori af f- forskelle, der blev introduceret uafhængigt af Csiszár i 1967 og af Ali og Silvey i 1966. Ved at tilhøre denne familie respekterer den egenskaberne ved bevarelse af information: invarians, monotonicitet.

Supplerende er Kullback-Leibler-divergensen også en Bregman-divergens , der er forbundet med den potentielle funktion . Konsekvensen er, at denne divergens ved Legendre transformation af er forbundet med en dobbelt moment koordinatsystem for at repræsentere de fordelinger af den eksponentielle familie .

Noter og referencer

  1. Kullback og Leibler 1951 .
  2. Kullback 1959 .
  3. S. Kullback , Informationsteori og statistik , John Wiley & Sons ,1959. Genudgivet af Dover Publications i 1968; genoptrykt i 1978: ( ISBN  0-8446-5625-9 ) .
  4. Amari og Nagaoka 2000 .
  5. Csiszár 1967 .
  6. Ali og Silvey 1967 .
  7. Amari 2010 .
  8. Bregman 1967 .

Tillæg

Bibliografi

Se også

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">