- Támogathatsz minket -
No menu items!

Hosszú és unalmas: A koronavírus és az adatok

A legyőzött, de legalábbis kézben tartott járványokat az orvostudomány eredményei mellett a matematika segítségével tartjuk kézben. Ameddig a koronavírussal kapcsolatban nincsenek rendben a számok, nem mondhatjuk azt, hogy legyőztük. De van remény is: olyan adatfeldolgozási módszerek állnak az emberiség rendelkezésére, amelyek egy korábbi járvány esetében sem.

Többször biztattam már az olvasókat arra, hogy nézzék meg az Országos Epdiemológiai Központ (átszervezték ezt is, nem tudom most hogy hívják őket) adatait az influenza terjedéséről. Azt fogjuk találni, hogy van kidolgozott módszertan és vannak megfelelő sűrűségben adatfelvételi pontok. Az orvostudomány ismeri az influenza kórlefolyását, tudja, hogy mit lehet valószínű influenzás megbetegedésként diagnosztizálni, és ennek, illetve a pozitív teszteknek az arányából, illetve az orvoshoz el nem jutó látens esetek szintén pontosan becsülhető számából használhatóan pontos becslést lehet adni arra, hogy hány influenzás van az országban.

Ilyen megfigyelő hálózatok a világon mindenütt működnek, az Economist például az amerikai ugyanilyen megfigyelőhálózat adatairól írt. A cikk rövid lényege, hogy az “Influenza-like Illness” (ILI) esetek aránya az amerikai háziorvosoknál úgy tűnik, hogy korrelál az adott terület koronavírus-érintettségével. Az ILI-k oka, akárcsak nálunk, vagy bárhol máshol a világon, többféle lehet. Influenza A-B, adenovírus, RSV és még sok más szerepelhet a kórokok között. Az például egy nagyon fontos kérdés a járvány leküzdésében, hogy az amerikaiak által észlelt korreláció (tehát emelkedő esetszám a simán náthás-lázas-nagyonrosszulvan emberekből és kb. ugyanekkor, ugyanígy emelkedő esetszám a koronavírusból) mennyire szoros és pontosan mi az oka? A korreláció szorosságát a több és jobb adat fogja megállapítani (ezért kell rengeteget tesztelni, hogy kiderüljön, hogy az emelkedő ILI-k közül mennyi az enyhe lefolyású koronavírus) az okát pedig az orvostudománynak kell megadni. Felmerülnek olyan kérdések, hogy az influenza A-B és társai “puhítják” a népességet és ezért tud terjedni a COVID-19 vagy éppen ellenkezőleg, ezek rovására terjeszkedik, új “alfahímként” a koronavírus?

Ezek a vizsgálatok alapvetően átírhatnak mindent, amit a vírus terjedéséről tudunk. Az “exponenciális görbe” kifejezéssel rengetegen ismerkedtünk meg mostanában (illetve természetesen mindenki ismeri a középiskolából, még az “ismét egy nap amikor semmire sem használtam az exponenciális függvényt” mémek szerzői is) és felmerülnek vele kapcsolatban kérdések. Kérdés, hogy mit kell kezdeni az ILI-esetek számaival. Ezek laposíthatják a görbét mert lehet, hogy jóval régebben itt van a vírus, mint bárki gondolta, csak az enyhe eseteket nem szűrte a rendszer, a kezdeti 0,5-1% közötti halott időst és beteget pedig betudták a szokásos veszteségbe. Vagyis az exponenciális függvényben az exponens (kitevő) lehet hogy kisebb, mint gondoljuk. Viszont az csak annyit jelent, hogy az a görbe jóval később kezd meredeken felfelé kanyarodni, de az alakja ugyanaz marad, vagyis jön a “spike” amikor hirtelen túlterhelődik a rendszer és megugrik a mortalitás is. Lehet, sőt valószínű, hogy a probléma egyik fontos oka a nagyon nagy látencia, vagyis az, hogy a vírusfertőzést követően eleve hosszú lappangási idő után jelennek meg tünetek, és sok erős immunrendszerű vagy egyszerűen csak szerencsés embernél nem okoznak heveny betegséget.

Ez elvezet a mortalitás kérdéséhez. Itt ez a tanulmány a tekintélyes Lancet folyóirattól, amely amellett érvel, hogy a halálozási statisztikát korrigálni kell úgy, hogy 14 napos kórlefolyást vélelmezve a mai halálozásokat a 14 nappal korábbi fertőzöttek számához kell arányosítani, és így nézve az valóban sokkal, nagyságrenddel magasabb, mint 0,5%-1%. Ez a módszer valóban segít abban, hogy az alábecslést elkerüljük, azonban érdemes megnézni az így kalkulált eredményeket. Az a kérdés biztosan felmerül, hogy ha a betegség Wuhanban 20%-os mortalitású, Kínában kb. 5,5% világszerte 15,2% akkor itt vagy nem ugyanarról a vírusról van szó, vagy valami nem jó az adatokkal.

További, az orvostudományra váró kérdések is vannak. Ilyen az immunitás kérdése. Ismert, hogy a COVID-19 rokonai, az emberiséget náthássá tevő egyéb koronavírusok elleni védettség a fertőzést követő egy-két éven belül elmúlik. Ha ez a COVID-19 esetében is így van, akkor meghatározott időnként (1-5 éves ciklusokban) kell fellángolásokkal számolni. Ha ellenben tartós védettségről beszélünk, akkor sokkal ritkábban. Kérdés a vakcina hatásossága, vagyis hány évente és hány embert és milyen korosztályban érdemes végigoltani a vírus ellen. Az infektológia és az epidemológia elég jól felkészült az ilyen kérdések megválaszolására, azonban adatra van szükségük, és adat még egy darabig nem lesz, az ugyanis csak retrospektív tud lenni, vagyis a már lefolyt járvány adait kell elemezni a jövőbeni járványok modellezéséhez.

Ezért lenne fontos, hogy mint annyi más járvány esetében, a koronavírusnál is világszerte egységes protokoll szerint és nagyon sok ponton vegyenek fel, addig ugyanis a tudományos hitelesség egyik etalonja, a Lancet is olyanokat fog leírni, hogy az egyik városban minden ötödik fertőzött meghal a betegségben, a másikban meg minden huszadik. Ezzel kapcsolatban rengeteg nagyon nagy probléma van. A kínaiak hozzáállása alighanem kritizálható, de Európában széttekintve is bőven láthatunk gyanús eseteket. Az olaszok iszonyatosan nagy számainál nem tudom (ha van erre forrás, várjuk a kommenteket) hogy azoknak a számoknak milyen a viszonya az idősek körében egyébként is gyakori tüdőgyulladásos esetekkel. Azt viszont tudjuk, hogy a teszteltek átlagéletkora magas. A “kiváló” német eredményeknél tudni kell, hogy a teszteltek átlagéletkora jóval alacsonyabb, a halálozásoknál pedig szigorúan a bizonyított eseteket veszik bele a statisztikába. A francia adatok egy jó darabig nem számoltak az idősotthonokkal (mi meg még csak nem is teszteltük őket). Egy csomó országnál (például nálunk) olyan kevés a teszt, hogy a (szerintem) leginkább komolyan vehető nyilvános modellezésben a tízszeres látenciát is elképzelhetőnek tartja a becslés készítője.

A WHO, de ha ők nem lépnek, legalább az EU nagyon fontos feladata lenne, hogy ilyen ne legyen, vagyis ha lehet még a mostani járványra, de legkésőbb őszre uniós szintű kötelező szabályozás lenne a tesztekre, tesztelési rezsimre, ehhez eszközöket és forrást biztosítva. Ha komolyan vesszük az egységes belső piacot és az azon belüli négy szabadságot, akkor azt bizony EU-s hatáskör megvédeni. Ehhez képest nemzeti vezetők játsszák, saját közönségük igénye szerint a fővezért. Ilyen szempontból nincs különbség Orbán “jónapotkívánok” festőruhás villámlátogatásai és Merkel tévében elmondott osztályfőnöki órája között. Persze ezekre szükség van, a nép azért választ vezetőt, hogy az baj esetén erőt és magabiztosságot sugározva jelen legyen az életében.

Ugyanakkor viszont az Unióban komoly népmozgások (idénymunkások) vannak, az Unióban van a világ nagy tengeri és légi kikötőiből több is. Itt nem tud lenni nemzetállami megoldás. A tesztelési és a karantén-protokollnak egységesnek kell lenni. Ez hozza magával a következő problémát. Ha koronavírus ellen egységesek a szabályok, miért ne lennének minden másra is azok? Az epideomológia ráadásul az egyszerű döntések világa. A doktor bácsi azt mondja, hogy a kupleráj két hétre bezár, akkor a kupleráj két hétre bezár. Az epidemológiai vészhelyzetek rendkívüli helyzetek, amelyekkel vissza lehet élni, amint azt Orbán Viktor bemutatja. Útban levő, túl független egészségügyi vezetőket cserélget le, egész ágazatokat taccsra tevő törvényeket nyom át, mert, amint azt cinikusan maga a Fidesz-kommunikáció jelentette be, úgyse tud összeülni az Európai Néppárt.

Attól viszont nemcsak Orbán tart, hanem minden kollégája az EU-ban, hogy bevezetnek egy szigorú, közös járványügyi rezsimet. Hiszen az egységes járványügyi rezsim nincs egységes orvosi igazgatás nélkül. Az egységes EU-tisztifőorvos csak akkor tud működni, ha nemcsak a járvány idején parancsol a Nyíregyházi Jósa András Kórháznak vagy a gelsenkircheni Elisabeth-Krankenhausnak. Hanem monitoroz “békeidőben” is, és esetleg meg találja említeni, hogy egy magyar kórházban ez a közellátásra nincs MRI, de ugyanazon a gépen 60.000.- Ft. leszurkolása mellett még aznap megcsinálják, ez valójában EU ügyészségért kiált, jelenti a megfelelő EU-pályázati hatóságnak…csupa kellemetlenség. Nincs tehát szigetszerű szupranacionalitás, ha a tagállamok egészségügyébe mélyen belenyúlnak, az szükségszerűen el kell hogy vezessen az integráció sokkal magasabb fokához. Ugyanezt láthatjuk egyébként a pénzügyi rendezésnél is, erről itt írtam korábban. Vagyis a COVID-19 az EU-t is választás elé állítja, megmutatja, hogy akut kihívásokra csak közös válasz van, és bizony nemcsak olyan, ahol várunk egy fél évet, mire Olaf Scholz és Szijjártó Péter is rábólint, és mindkettőnek a kedvéért beleírunk még öt oldalt, amelynek az a lényege, hogy nem muszáj megcsinálni, de jó lenne.

Vannak olyanok, akiknek fontos az EU-s belső piac, és a globális szállítási láncolatok. Na nem a globalizáció ellen ájfónnal a kézben küzdőkre gondolok, hanem például az ájfón előállítási láncára, amelyben szilícium-völgyi programozó ugyanúgy van, mint belső-mongóliai színesfém-bánya és sencseni összeszerelő üzem.

Ezek a vállalatok nagyon sajátos helyzetben vannak. Ugyanis a fentiekből már elég biztosan levonható az a következtetés, hogy a járvány jobb ismeretében az ilyen katasztrófák, mint a mostani, elkerülhetők. A COVID-19 valószínűleg nem a semmiből ugrik elő, 3-4 naponta duplázódó fertőzött számmal, az egészségügyet sújtó túlterheléses támadással, vannak neki előjelei.

Ezek a cégek toppanthatnának is a lábukkal, hogy a nemzeti és nemzetközi statisztikai hivatalok csinálják a dolgukat, és jelezzék előre. Igenám, de nem biztos, hogy erre ők elengendők. Mert itt a big data. A big data, amely soha korábban nem vett részt betegség elleni harcban, és amelynek ereje felér egy csodavakcináéval.

Az EU és az egész világ már régen észrevette, hogy az interneten keletkező iszonyatos mennyiségű adat használata micsoda lehetőségeket rejt. Átalakított számtalan tudományágat, például külön kutatócsoportok foglalkoznak nagy űrtávcsövek adathalmazainak újraelemzésével és találnak meg komplett csillagokat, amelyeket korábban egyszerűen nem kerestek. De van árnyoldal is, a facebook vagy a twitter adatbányászainak nem okoz különösebb gondot megmondani, hogy a felhasználói közül ki az enyhe alkoholista, a látens homoszexuális vagy ki esett teherbe vagy ki az aki influenzás, csak még nem tud róla. A GDPR pontosan azt szolgálja, hogy az adataink ilyen kezelése átlátható és szabályozható legyen.

A big data a mesterséges intelligencia hajnala. Az emberi elme előfeltételezéseket állít fel, majd mintázatokat keres, majd a mintázatokra magyarázatokat ad. A mintázatok mögött felfedezett logika alapján jósol (újabb feltételezések) amelyekhez mintát keres és így ismétlődik a folyamat addig, amíg olyan adatokat nem talál, amelyek nem felelnek meg a feltételezéseknek. Ezeket az adatokat eleinte kiszűri, majd amikor ezek az adatok elérnek egy kritikus tömeget, akkor lecseréli a korábbi előfeltevéseket, és felállít egy olyan modellt, amelybe már az új adatok is beleillenek. Aki ezt kevésbé konyhanyelven szeretné olvasni, annak figyelmébe ajánlom Thomas S. Kuhn alapművét a témában.

A big data elemzések alapja az, hogy nincs prekoncepció és nincs mintázat-keresés, hanem korreláció van. A gépi agynak nincs szocializációja, vagyis nem kap 15-20 év alatt egy mintakészletet, amely gondolkodását egész életére meg fogja határozni. Ennek vannak persze veszélyei (ld. a világ sci-fi irodalma) azonban megvan az az előnye, hogy az iszonyatos mennyiségű adatban nem mintázatokat keres, hanem korrelációt. A korrelációval a legfőbb probléma a “post hoc ergo propter hoc” hiba előfordulása. Vagyis két adat egymással párhuzamos változása nem feltétlenül jelenti azt, hogy a két adatnak köze is van egymáshoz. Azonban ennek a hibának a valószínűségét (tehát azt, hogy egy véletlent szabálynak vélünk) a növekvő adatmennyiség arányosan csökkenti.

A minta nélküli korreláció-keresés előnye pedig az, hogy a Kuhnnál leírt paradigmaváltások nincsenek vagyis nem ignorál korrelációkat azért, mert azok az elvárásainak nem felelnek meg.

Amit eddig ebben a cikkben a COVID-19-ről írtuk, vegyük észre, hogy előfeltételezéseken alapul. Felhozzuk a spanyolnáthát, a hong-kongi influenzát, a SARS, MERS vírusokat, vagyis keressük a mintákat, amelyeknek vagy egyben megfelel az új vírus, vagy amelyiket módosítani lehet. Ez részben nagyon hasznos, hiszen korábbi védekező mechanizmusokat fogunk átalakítani, amikor megvédjük magunkat az új koronavírustól. Ugyanakkor jelenleg a sötétben tapogatózunk akkor, amikor azt kellene eldönteni, hogy mi “triggerelje” a jelzőrendszert, mikor és hogyan kell intenzív tesztelési, vagy akár karantén rezsimeket életbe léptetni? Erre pedig nagyon hatékony választ adhat a big data. Egyes kereskedelmi cégek észlelhetik, hogy bizonyos területeken, egyszer csak elkezd több só fogyni, majd ennek eredményeként több üdítőital. (ez eddig csak egy adat). Majd megugrik ugyanott a COVID-19 pozitív tesztek száma. (ez is egy adat, amelyik korrelál a másikkal). Ha mondjuk a kettő között véletlenül 12-18 nap telik el, akkor lehet gondolkodni. Ha a COVID-19 fertőzés tünete az ízérzékelés romlása, akkor feltételezhető hogy a Mekiben a krumplit agyonsózók, majd a kólát kétszer utántöltők épp tünetmentes szuperfertőzők. Ha ezt az adatot sikerül valamilyen célzott méréssel validálni, akkor voila itt van egy early warning system, amelynek jelzésére el lehet rendelni az öregotthonok látogatási tilalmát, meg egyéb első lépcsős intézkedéseket.

De ez azért rengeteg kérdést felvet. Ezeket az adatokat egyébként üzleti haszonszerzésre használják és nagyon nem szívesen hozzák nyilvánosságra. Viszont az meg nem megy, hogy van egy korlátozott nyilvánosságra hozatal (“megmutatjuk a kormánynak”) a kormány meg dönt valamit. Jólétünk egyik alapja ugyanis az, hogy a kormány néhány alapos okból (ilyen alapos ok Magyarországon sajnos a “csak”) titkossá tett dolgon kívül csak nyilvános információból dolgozik. Viszont ha a McDonalds nyilvánosságra hozza a sófogyasztását, azzal a konkurenciát is adathoz juttatja, amit nyilván nem akar megtenni. Kezdődhet is a jogalkotási bokszmeccs.

Talán látszik ebből, hogy a COVID-19 elleni küzdelem egyáltalán nem reménytelen, de olyan helyeken is fertőz, ahol az “alapbetegség” a társadalomé, nem pedig a lélegeztetett haldoklóké. Viszont a másik oldalon meg olyan lehetőségeink vannak a leküzdésére, hogy a társadalmi tünetek kezelése okán, gyorsan kezelhetővé tud válni.

Kapcsolódhat

Két hét sincs az iskolakezdésig, de még mindig tárgyalnak a tanév rendjéről

A Fidesz kormányzóképességét az alábbi példa segítségével lehet a legjobban megérteni...

Több mint kétszer annyi külföldit vonz a Sziget, mint a közpénznyelő atlétikai vébé

A piaci alapon szervezett rendezvény népszerűbb, mint a hiúsági/lopodai alapon szervezett. Van olyan, aki ezen meglepődött?

“3+1 új információt szereztem a Fudan alapítványról.”

Hopp, ott repül hat milliárdocska!

Már több mint 124 ezer magyar dolgozik Ausztriában

Méghogy nincs migránsprobléma...
- Hírdetés -