Jensen-egyenlőtlenség

A Wikipédiából, a szabad enciklopédiából

A Jensen-egyenlőtlenség elegáns közös kiterjesztését adja számos matematikai egyenlőtlenségnek.

Ha egy (véges vagy végtelen) I intervallumon az f függvény konvex, , nem negatív számok, amikre teljesül , akkor

Ha f szigorúan konvex, akkor egyenlőség csak az esetben teljesül.

Ha f konkáv, akkor az állítás fordított irányú egyenlőtlenséggel teljesül.

Például az függvény szigorúan konvex a valós számok halmazán, így ha tetszőleges, akkor

ami a számtani és négyzetes közép közötti egyenlőtlenség. Egyenlőség akkor és csak akkor áll fenn, ha

Hasonlóképpen a konkáv x log x függvényt használva azt kapjuk, hogy pozitív számokra

Mivel a jobb oldal logaritmusa, a számtani és mértani közép közötti egyenlőtlenséget kapjuk.

Jensen egyenlőtlensége[szerkesztés]

A matematikában Jensen egyenlőtlensége, amit a dán matematikusról, Johan Jensenről, neveztek el, összefüggésbe hozza egy integrál egy konvex függvény értékét a konvex függvény integráljával. Azt 1906-ban bizonyította Jensen. Az általánosságára tekintettel az egyenlőtlenség megjelenik sok alakban, ami a kontextustól függ, és aminek egy része az alábbiakban kerül bemutatásra.

Az egyenlet véges képlete volt a logója a Matematikai Tudományok Intézetének a Koppenhágai Egyetemen 2006-ig.

Állítások[szerkesztés]

Jensen egyenlőtlenségének a klasszikus képlete magába foglal különféle számokat és súlyokat. Az egyenlőtlenséget ki lehet fejezni eléggé általánosságban használva a mértékelméletet vagy egyenértékű valószínűségszerű jelölést. Ebben a valószínűség szerinti felállításban az egyenlőtlenséget tovább lehet általánosítani a teljes érvényességéig.

A véges képlet[szerkesztés]

Ha egy konvex φ függvény egy I=R valós intervallumon, ahol x_i–k az intervallum elemei és a_i-k a súlyok, Jensen egyenlőtlenségét ki lehet fejezni:

és az egyenlőtlenség nyilvánvalóan megfordított, ha φ konkáv.

Konkrét eset, ha az ai súlyok mind egyenlőek az eggyel, akkor:

Konkáv log(x) függvény (megjegyzés: használhatjuk Jensen egyenlőtlenséget a függvény konvexitásának vagy konkávitásának bizonyítására, valós intervallumon.) Behelyettesítve -et az előző képletbe a számtani és mértani közép közötti egyenlőtlenséget kapjuk:

Ha a változó x egy másik t változó függvénye xi = g(ti). Általánosan a következőt kapjuk: ai–ket felváltja egy nem negatív integrálható f(x)függvény, mint például egy valószínűségi eloszlás, a szummákat pedig integrálok.

Az elméleti mértéktér és a valószínűség szerinti képlet[szerkesztés]

Legyen (Ω,A,μ) egy mértéktér μ(Ω) = 1. Ha g egy valós értékű függvény, ami μ szerint integrált φ pedig egy mérhető konvex függvény, akkor:

Valószínűségelméletben legyen egy valószínűségtér , X egy integrált valós értékű változó és φ egy mérhető konvex függvény. Akkor:

Ekkor a valószínűségelméletben, a mértéknek (μ) megfeleltethető egy valószínűség , μ-nek egy várható érték , és g a függvénynek egy véletlen változó X.

Általánosan az egyenlőtlenség egy valószínűség szerint[szerkesztés]

Általánosan legyen T egy valós vektortér, X egy T értékű integrálható véletlen változó. Az integrálhatóság azt jelenti, hogy bármely T elem számára T: , z eleme T létezik egy T elem, úgy hogy . Ekkor minden mérhető konvex φ függvényre és minden σ-algebra-rára :

Ez a kijelentés általánosítja az előzőt, amikor a T vektortér a tengely és a triviális σ-algebra .

Bizonyítások[szerkesztés]

Jensen graph.png

A Jensen egyenlőtlenség grafikus bizonyítása egy lehetséges esetben. A szaggatott görbe az X tengely mentén X feltételezett eloszlása, míg a szaggatott görbe az Y tengely mentén a megfelelő eloszlású Y értékek. Vegyük észre, hogy X egyre növekedő értékei mellett Y(X) egyre jobban növeli az eloszlást.

Jensen egyenlőtlenségének bizonyítása különféle módon történhet, és három különböző fent említett, különböző állításoknak megfelelő bizonyítás ajánlott. Ám mielőtt megkezdenénk ezeket a matematikai bizonyításokat, érdemes elemezni a grafikus bizonyítást a valószínűség szerinti eset alapján, ahol X egy valós szám, (lásd az ábrát). Elfogadva az X értékeknek egy feltételezett eloszlását, azonnal azonosíthatjuk az és a képe értéket a grafikonon. Észrevehetjük a megfelelő értékek eloszlása egyre inkább nő az X növekedő értékeik mellett, és az Y eloszlása szélesebb, az X > X0 intervallumban, és keskenyebb X <X0 intervallumban bármilyen X0 számára; különösen igaz ez esetére. Következésképpen beláttuk, hogy Y mindig el fog mozdulni felfelé, tekintettel pozíciójára. Ezzel bebizonyítottuk az egyenlőtlenséget, azaz:

Egyenlőség akkor áll fenn, amikor nem szigorúan konvex, például amikor ez egy egyenes. A bizonyításokat ez az intuitív elképzelés a következőkben fogalmazza meg:

Bizonyítás 1 (véges képlet)[szerkesztés]

Ha λ1 és λ2 két tetszőleges pozitív valós számok, melyekre λ1 + λ2 = 1, akkor konvexitása miatt:

-re.

Általánosan: ha λ1 , λ2 , …, λn pozitív valós számok, melyekre λ1 + … + λn = 1, akkor

bármennyi x1 , …, xn számára. A Jensen egyenlőtlenségének ezt a véges képletét teljes indukcióval bizonyíthatjuk be. Ha n = 2 az állítás igaz. Tegyük fel, hogy n-re igaz az állítás, és bizonyítsuk n + 1-re. Ha legalább egy λi λ>0 például λ> 1 ; akkor konvexitás miatt:

Mivel , felhasználva feltevésünket a képlet utolsó kifejezésében megkapjuk az eredményt, név szerint a Jensen-féle véges képletű egyenlőtlenséget.

Azért, hogy megkapjuk az általános egyenlőtlenséget ebből a véges képletből, használjunk egy sűrűségérvet. A véges képletet újra fel lehet írni úgy, mint:

ahol μn egy mérték, amit a Dirac delták egy tetszőleges kombinációja ad:

Mivel a konvex függvények folytonosak, és mivel a Dirac delták kombinációi gyengén sűrűek az általános állítást egyszerűen megkapjuk.

Bizonyítás 2 (elméleti-határ képlet)[szerkesztés]

Legyen g egy valós értékű μ-integrálható függvény egy Ω mértéktérben, és legyen φ, egy konvex függvény a valós számok halmazán. Határozzuk meg φ jobb oldali deriváltját:

Mivel φ konvex, a jobb oldali hányados ahogy a t közelíti a 0-t jobbról, egyre csökken és alulról korlátos.

Ha t < 0, a határértéke mindig létezik.

Legyen:

Akkor minden x -re ax + b ≤ φ(x). Ha x > x0 , és t = x − x0 > 0. Akkor,

Tehát,

ahogyan azt bizonyítani akartuk. x < x0 esetében hasonlóan bizonyíthatjuk. Ha ax + b = φ(x0).

φ(x 0 ) akkor átírhatjuk a képletet

- alakúra.

De mivel μ(Ω) = 1, tehát minden valós k számra

Így:

Bizonyítás 3 (általános egyenlőtlenség egy valószínűség szerint)[szerkesztés]

Legyen X egy integrálható valószínűségi változó, az értéket egy valós T vektortérből veszi. Mivel konvex, minden -re

ahogy θ megközelíti a 0+ -t, ez az érték csökken. φ deriváltja X szerint az Y irányába:

Látható, a differenciál lineáris y-ban van és mivel korábban beláttuk, hogy a jobb oldal infimuma kisebb mint az értéke a θ = 1 –nél.

Egy tetszőleges sub-σ-algebrára az utolsó egyenlőtlenség szerint, ha fennáll, akkor

Ebből következve megkapjuk az eredményt, mivel:

Alkalmazások és speciális esetek[szerkesztés]

Képlet, amely magában foglal egy valószínűség szerinti sűrűség függvényt[szerkesztés]

Tételezzük fel, hogy Ω egy valós sorozat mérhető alhalmaza és f(x) egy nem negatív függvény, melyre:

Probabilisztikus nyelvben, f egy valószínűségi sűrűség-függvény.

Jensen egyenlőtlensége a következő állítássá válik:

Bármilyen g valós értékű függvény és φ konvex a g tartománya fölött, akkor

Ha g(x) = x, akkor az egyenlőtlenségnek ez a formája redukálódik egy általában használt speciális esetre:

Alternatív véges képlet[szerkesztés]

Ha Ω véges halmaz , és ha μ egy megszámlálható mérték az Ω-án, akkor az általános alak redukálódik egy összegekről szóló állításra:

feltéve ha

Van egy képlet Ω –re is.

Statisztikus fizika[szerkesztés]

Jensen egyenlőtlensége a statisztikai fizikában különös fontosságú akkor, amikor a konvex függvény exponenciális. Adva van:

ahol a zárójel a várható értékekre utal tekintettel néhány valószínűségi eloszlásra a véletlenszerű X változóban.

A bizonyítás ebben az esetben nagyon egyszerű (cf. Chandler, Sec. 5.5). A következő egyenlőtlenséget alkalmazva:

Kapjuk a végső exponenciális egyenlőtlenséget:

Információelmélet[szerkesztés]

Ha p(x) x valószínűségi változó valódi eloszlás, és q(x) másik eloszlás, akkor Jensen egyenlőtlenségét alkalmazva Y(x) = q(x)/p(x)-re a véletlen változóra, a függvény legyen φ(y) = −log(y) így a Gibbs egyenlőtlenséget kapjuk.

Ez megmutatja, hogy az átlagos üzenethossz minimalizált, amikor kódokat jelölnek ki valódi valószínűségek alapján. Az a nemnegatív mennyiség, (q-nak távolsága p-től) a Kullback-Leibler távolság.

Rao-Blackwell tétel[szerkesztés]

Ha L egy konvex függvény, akkor Jensen egyenlőtlenségéből, megkapjuk, hogy:

Tehát ha δ(X) torzítatlan becslés θ paraméterre T(X) egy elégséges statisztika θ-ra, egy kisebb várt veszteség birtokában L, számolás útján elérhető. Megadható olyan L becslés, mely hatásosabb mint δ(X).

torzítatlan θ-ra, és X függvénye.

Ezt az eredményt a Rao-Blackwell tételként ismerik.

Lásd még[szerkesztés]

Források[szerkesztés]

  • Walter Rudin (1987): Valós és komplext elemzés. McGraw-Hill. ISBN 0-07-054234-1
  • David Chandler (1987): Bevezetés a modern statisztikus mechanikába. Oxford. ISBN 0-19-504277-8
  • Jensen, Johan Ludwig William Valdemar (1906): "Sur les fonctions* convexes* et les inégalités* entre* les valeurs* moyennes*". Acta Mathematica 30: 175-193

További információk[szerkesztés]

  • Eric W Weisstein: Jensen egyenlőtlenség - A matematika világa
  • Jensen egyenlőtlensége logóként szolgált a Koppenhágai Egyetem Matematikai Szakosztálya számára.