Túlélés-analízis

A Wikipédiából, a szabad enciklopédiából

A valószínűség-számítás elméletében és a statisztika területén a túlélés analízis az a részterület, mely biológiai organizmusok és műszaki rendszerek élettartamával foglalkozik.

A túlélés analízist a mérnöki tudományokban megbízhatósági elméletnek vagy megbízhatósági analízisnek, megbízhatósági modellezésnek hívják.

A közgazdaságban és a szociológiában időtartam/futamidő analízisnek is hívják. A túlélés analízis egy esemény időbeli folyamatát modellezi, és ebben a kontextusban az analizált esemény végének illetve meghibásodásának vizsgálatát jelenti, és általában egy - és nem több - esemény történésével foglalkozik.

Az úgynevezett ‘számolási folyamat elmélet’-ben több koncepció is ismert, mely rugalmasságot ad az analízisnek azzal, hogy lehetővé tesz több egyidejű vagy sorrendi esemény vizsgálatát. Ilyen modellben a szignifikáns esemény nem vet véget az életútnak, vagy a vizsgált tárgynak; például ilyen eset, amikor egy ember többször is börtönbe kerül, vagy egy visszaeső alkoholista, vagy aki többször is elválik és újra házasodik.

A túlélés analízis, és ehhez kapcsolódó ‘számolási folyamat elmélet’ nem csak emberekkel kapcsolatos eseményekre vonatkozik, hanem elektronikus, mechanikus rendszerekre, készülékekre is. Például a túlélés analízis megpróbál választ adni a következőkre is: a népesség mekkora része él túl egy adott időtartamot,; a túlélők milyen arányban halnak meg vagy betegednek meg egy adott időn belül, milyen mértékben okoznak halált vagy meghibásodást többszörös okok. Hogyan befolyásolják partikuláris körülmények a túlélést, úgy embereknél , mind műszaki eszközöknél.

Ahhoz, hogy az ilyen kérdésekre válaszolni lehessen,szükséges definiálni az élettartam fogalmát.

Biológia területén a halál egyértelmű végállapot, a mechanikai megbízhatóságot tekintve, a hiba sokféle lehet: a hiba lehet olyan, hogy csak egy bizonyos mértékig befolyásolja az eszköz működést, javítható és nem okozza a berendezés működésének végleges megszűnését, de lehet olyan mértékű, amikor a javítás szóba sem jöhet.

Biológia rendszereknél is lehet többféle “meghibásodás”, például egy szívroham,melyből szerencsés esetben teljesen fel lehet épülni, de nem szerencsés esetben végzetes lehet.

Az itt tárgyalt elmélet jól definiált eseményeket feltételez, más esetekben a különféle modellek segítségével lehet eredményt elérni. A feltételezett események egyszer fordulnak elő. Amikor egyes események többször is előfordulhatnak, azt a rendszermegbízhatósági vizsgálatok során lehet értékelni.

Ez a szócikk elsődlegesen a biológiai túlélés fogalmával foglalkozik, de ez csak az egyszerűbb tárgyalás miatt van. A mechanikai hibásodásra érvényes ekvivalens formulákat megkaphatjuk, ha behelyettesítjük a hibákat a halál helyére.


A túlélés függvény[szerkesztés | forrásszöveg szerkesztése]

A túlélés függvényt S-sel jelöljük:

S(t) = \Pr(T > t)

ahol t egy bizonyos idő, T egy valószínűségi változó, mely a halál idejét jelöli, a Pr a valószínűséget jelzi. Ez azt jelenti, hogy a túlélés függvény annak a valószínűségét mutatja, hogy a halál később , mint a t idő következik be. A túlélés függvényt nevezik a túlélő függvényének vagy a túlélhetőség függvényének is, mechanikai túlélési problémák tárgyalásánál ez a megbízhatósági függvény.

Ez utóbbi esetben a megbízhatósági függvény: R(t). Rendszerint feltételezzük, hogy S(0) = 1, habár ez kisebb mint 1, ha van reális lehetőség az azonnali halálra vagy meghibásodásra.

A túlélés függvény nem lehet növekedő: S(u) ≤ S(t) ha ut. Ez a tulajdonság közvetlenül F(t) = 1 - S (t) egyenletből következik, mivel az integrál nem negatív függvény.

Ez azt jelenti, hogy a túlélés idősebb évekre csak akkor lehetséges, ha a korábbi - fiatal - éveket túléltük.

A túlélés függvény feltételezhetően a zéróhoz közelít, amint az évek múlnak. azaz: S(t) → 0 as t → ∞, habár a határérték nagyobb lehetne mint zéró, ha az örök élet lehetséges lenne.

Például a túlélés analízist alkalmazhatjuk a szén izotópokra is. Az instabil izotópok előbb vagy utóbb elbomlanak, de a stabil izotópok határozatlan ideig tartanak.

Időtartam eloszlás és esemény sűrűség[szerkesztés | forrásszöveg szerkesztése]

A kapcsolódó mennyiségek a túlélés függvényében határozhatók meg. Az időtartam eloszlás függvény, konvencionálisan F, a túlélés függvény komplementereként határozható meg:

F(t) = \Pr(T \le t) = 1 - S(t)

és az F deriváltja, mely az időtartam eloszlás sűrűség függvénye (f):

f(t) = F'(t) = \frac{d}{dt} F(t).


Az f függvényt néha esemény sűrűségnek is hívják, ez a haláleset vagy a hiba esetek időegységre eső rátája. A túlélés függvényt gyakran eloszlás- és sűrűség függvényben kifejezve adják meg.

S(t) = \Pr(T > t) = \int_t^{\infty} f(u)\,du = 1-F(t).


Hasonlóképpen, a túlélési esemény függvény meghatározható:

s(t) = S'(t) = \frac{d}{dt} S(t) = \frac{d}{dt} \int_t^{\infty} f(u)\,du = \frac{d}{dt} [1-F(t)] = -f(t).


Hazárd függvény és a kumulatív hazárd függvény[szerkesztés | forrásszöveg szerkesztése]

A hazárd függvény, konvencionálisan \lambda, t időben az események aránya, feltéve ha túlélés t-ig, vagy tovább tart (azaz, Tt),

\lambda(t)\,dt = \Pr(t \leq T < t+dt\,|\,T \geq t) = \frac{f(t)\,dt}{S(t)} = -\frac{S'(t)\,dt}{S(t)}.

A “halálozási erő” szinonimája a hazárd függvénynek, mely fogalmat különösen a demográfiában és a biztosítási matematikai tudományban használják, és \mu.-vel jelölik.

A hazárd ráta/arány egy másik használatos szinonima. A hazárd függvény nem lehet negatív ( λ(t) ≥ 0), és az integrálja a [0, \infty] tartományban végtelen kell hogy legyen, máskülönben semmi korlátozás sincs, azaz lehet csökkenő, növekvő, monoton vagy szakaszos. Egy példa a fürdőkádgörbe hazárd függvény, mely nagy, kis t értékeknél, csökken egy bizonyos minimumig, majd újra nő. Ez modellezheti néhány mechanikus rendszer tulajdonságát a meghibásodás folyamatát tekintve az egész életúton át. A hazárd függvényt a kumulatív hazárd függvény kifejezéseivel is lehet megjeleníteni (ez konvencionálisan \Lambda).

\,\Lambda(t) = -\log S(t)

ebből:

\,S(t) = \exp(-\Lambda(t))


vagy differenciálással:

\frac{d}{dt} \Lambda(t) = -\frac{S'(t)}{S(t)} = \lambda(t).


A „kumulatív hazárd függvény” származtatható:

 \Lambda(t) = \int_0^{t} \lambda(u)\,du


mely a hazárdok ‘akkumulációja’ a teljes időn keresztül

A \Lambda(t) definicójából látható, hogy az határok nélkül nő, ahogy t tart a végtelenhez (feltéve, hogy S(t) pedig tart a zéróhoz). Ez azt jelenti, hogy a \Lambda(t) nem nőhet túl gyorsan, mivel, definíció szerint, a kumulatív hazárdnak divergálnia kell. Például \exp(-t) nem bármely túlélés eloszlás hazárd függvénye, mert ennek integrálja az 1-hez konvergál.


A túlélés eloszlásból levezethető mennyiségek[szerkesztés | forrásszöveg szerkesztése]

Egy adott  t_0 időpontban a jövőbeli élettartam, az az idő, mely a halál idejéig tart. Így ez, a jelen jelőlésekkel: T - t_0.

A várható jövőbeli élettartam a jövőbeli élettartam várható értéke. A halál beálltának a valószínűsége t + t_0 időben vagy előtte, adott t_0 túlélés idővel:

P(T \le t_0 + t | T > t_0) = \frac{P(t_0 < T \le t_0 + t)}{P(T > t_0)} = \frac{F(t_0 + t) - F(t_0)}{S(t_0)}.

Ezért a jövőbeli élettartam valószínűség sűrűsége:

\frac{d}{dt}\frac{F(t_0 + t) - F(t_0)}{S(t_0)} = \frac{f(t_0 + t)}{S(t_0)}

és a várható jövőbeli élettartam:

\frac{1}{S(t_0)} \int_0^{\infty} t\,f(t+t_0)\,dt = \frac{1}{S(t_0)} \int_{t_0}^{\infty} S(t)\,dt,

Ahol a második kifejezés az integrál átalakításából származik.

Megbízhatósági problémáknál a várható élettartamot a meghibásodásig eltelő átlagos időnek hívják és a várható jövőbeli élettartamot az átlagos megmaradó élettartamnak hívják.

Egy egyén túlélésének valószínűsége egy t ideig vagy tovább: S(t), A túlélők várható száma t időben (korban) egy kezdő n újszülött népességből: n × S(t), feltéve, hogy minden egyénnek hasonló a túlélés függvénye.

Így a túlélők várható aránya S(t).

Ha a különböző egyének túlélése független egymástól, a túlélők száma t időben egy binomiális eloszlású lesz, n és S(t) paraméterekkel, és a túlélők szórásnégyzete: S(t) × (1-S(t))/n

Az az idő (kor), amikor a túlélők egy része megmarad, a következő egyenlet megoldásából adódik: S(t) = q for t, ahol q a kérdéses kvantilis.

Tipikusan érdekes lehet a medián élettartam (élettartam középérték), q = ½-nél, vagy más kvantiliseknél, mint q = 0.90 vagy q = 0.99.

Lehet még komplexebb következtetéseket is levonni a túlélés eloszlásból. Mechanikai megbízhatósági problémáknál, a költség-orientált megfontolások sokat jelentenek, melyek a javításokkal és a cserékkel kapcsolatosak. Ez vezet a felújítási elmélethez és a öregedés és tartósság megbízhatósági elmélethez.


Cenzorálás[szerkesztés | forrásszöveg szerkesztése]

Az cenzorálás a hiányzó adatok problémája, mely eléggé általános a túlélés analízisben.

Ideális esetben a születés és a halál ideje ismert.

Ha csak az ismert, hogy a halál mi után következett be, akkor jobbra-cenzorálásról beszélünk. Jobbra-cenzorálás fordul elő akkor is, amikor a születési időt ismerjük, de az egyén még él, és elveszítjük a követését, amikor a vizsgálat befejeződik.

Ha az élettartam kevesebb, mint egy bizonyos időtartam, akkor az élettartam balra-cenzorált.

Előfordulhat, hogy az élettartam kisebb a határértéknél, de nem figyelték meg; ezt csonkításnak nevezik.

A csonkítás különbözik a balra-cenzorálástól, mivel egy balra-cenzorált dátumnál tudjuk, hogy az alany létezik, de egy csonkított dátum esetén, nem tudjuk. A csonkítás eléggé általános, alanyokat egyáltalán nem követik, csak ha elérnek egy bizonyos kort. Vannak csoportok, ahol az iskola előtti élettartam ismeretlen. A balra-cenzorált adatok általánosak a biztosítási területen, ahol életbiztosítással és nyugdíjjal foglalkoznak.

Általában jobbra-cenzorált adatokkal találkozunk. Balra-cenzorált adatokkal találkozhatunk, ha az egyén túlélési ideje nem teljesen ismert, a baloldali követési hiányosságok miatt.

Például, követhetünk egy pácienst attól az időtől, amikor egy fertőzési teszt pozitív eredményt mutatott ki, de nem tudhatjuk meg a fertőzés valódi idejét. .[1]


Paraméterek illesztése az adatokhoz[szerkesztés | forrásszöveg szerkesztése]

Jó közelítés, amikor a túlélési modelleket, rendes regressziós modellnek tekintjük, ahol a válasz-változó az idő. Azonban a valószínűség függvény számítása komplikált a cenzorálással. A túlélés modell valószínűség függvénye cenzorált adat esetén a következőképpen határozható meg.

Definíció szerint a valószínűség függvény a modell paraméterei által kapott adatok feltételes valószínűsége. Az kötelező, hogy feltételezzük,hogy a paraméterekből származó adatok függetlenek. Így a valószínűség függvény minden egyes dátum valószínűségének a szorzata. Kényelmes az adatok particionálása négy kategóriába: cenzorálatlan, balra-cenzorált, jobbra-cenzorált és szakaszosan cenzorált.

Ezeket az alábbi egyenletekben a következőképpen jelöljük: "unc.", "l.c.", "r.c.", and "i.c."


 L(\theta) = \prod_{T_i\in unc.} \Pr(T = T_i|\theta)
  \prod_{i\in l.c.} \Pr(T < T_i|\theta)
  \prod_{i\in r.c.} \Pr(T > T_i|\theta)
  \prod_{i\in i.c.} \Pr(T_{i,l} < T < T_{i,r}|\theta) .


Cenzorálatlan esetben, ahol T_i egyenlő a halál idejével:


 \Pr(T = T_i|\theta) = f(T_i|\theta) .

Balra-cenzorált esetben, ahol a halál ideje kisebb mint T_i

 \Pr(T < T_i|\theta) = F(T_i|\theta) = 1 - S(T_i|\theta) .

Jobbra-cenzorált esetben, ahol a halál ideje nagyobb mint T_i:

 \Pr(T > T_i|\theta) = 1 - F(T_i|\theta) = S(T_i|\theta) .

Szakaszosan cenzorált esetben, ahol a halál ideje kisebb mint T_{i,r} és nagyobb, mint T_{i,l},:

 \Pr(T_{i,l} < T < T_{i,r}|\theta) 
 = S(T_{i,l}|\theta) - S(T_{i,r}|\theta) .


Nem parametrikus megközelítés[szerkesztés | forrásszöveg szerkesztése]

Nelson–Aalen esztimátor alkalmazásával lehet nem parametrikus esetben megbecsülni a kumulatív hazard ráta függvényt.


Túlélés analízisnél használatos eloszlások[szerkesztés | forrásszöveg szerkesztése]

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • David Collett: Survival Data in Medical Research, Second Edition. (hely nélkül): Chapman & Hall/CRC. 2003. ISBN 9781584883258  
  • Regina Elandt-Johnson and Norman Johnson: Survival Models and Data Analysis. (hely nélkül): New York: John Wiley & Sons.. 1999. ISBN 9781584883258 (első kiadás: 1980)  
  • J. D. Kalbfleisch and Ross L. Prentice: The statistical analysis of failure time data. (hely nélkül): New York: John Wiley & Sons.. 1980. ISBN 9780471363576  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. Singh R, Mukhopadhyay K. Survival analysis in clinical trials: Basics and must know areas. Perspect Clin Res [serial online] 2011 [cited 2011 Nov 1];2:145-8. Available from: http://www.picronline.org/text.asp?2011/2/4/145/86872