Válaszok az élet nagy kérdéseire

Adatbányászat: megelőzhető krízisek, járványik

Ma a Föld nagy részén szerverek milliói tárolnak olyan mennyiségű adatot, amelynek az érzékeltetésére már szavunk sincsen. Hogy ez mire jó?

2008.08.14 19:18ZONA

A technológia fejlődésével az adatok begyűjtését átvették a gépek, de a feldolgozásukkal, a hasznos információ kimazsolázásával a tudományban, az üzleti életben vagy az informatikában is gyorsan sikeres lehet valaki. Míg az adathalászat bűnügyi kategória, az adatbányászat a társadalmi elismertség magas fokára repítheti művelőjét. 

Ide is guglizzon! 

Miután rendes technológiai témájú cikkből nem maradhat ki a Google, legyünk túl rajta. Az óriási adatmennyiségek kezelésére kifejlesztett megoldás a MapReduce, amely teljesen más irányból közelít, mint a szokásos megoldások. Itt nincs szükség előre felcímkézett, kategorizált adatbázisra, sem atomerőmű-kapacitású számítógépre. Az adatokat, legyenek bár szöveg, kép vagy más formátumúak, a megadott szempont alapján a számítási feladatot egy alkalmi szerverpark, vagyis néhány kapcsolódó idegen számítógépből álló hálózat között osztja el. 

Ezek egyenként megoldják a maguk részét (például hogy egyes szövegekben milyen gyakran szerepelnek bizonyos szavak), majd az eredményt a helyi merevlemezen tárolják. A MapReduce ezek után összegyűjti az eredményeket, és elvégzi az összevetést, majd a végső számítást. Az immár jóval kisebb adatcsomagot a célnak megfelelő kérdéssel lehet felcímkézni, így „készre csomagolva” pedig bármikor elő lehet húzni – például csajozáskor – egy olyan infót a tarsolyból, hogy „hányszor ivott whiskyt Jockie Ewing a Dallas-összes alatt”.


A köz javára 

Akik azonban ennél is profibban művelik, azok a múlt és a jövő részleteibe egyaránt belelátnak. Jól jön ez például a politikában, ahol az adathalmazok segítségével akár a választás végkimenetelét is megjósolhatják. Ehhez persze sok apró lépés kell: az egyre növekvő mennyiségű byte-okból egyre kisebb célpontokra lehet célozni. Amit Mark Penn, Bill és Hillary Clinton választási tanácsadója évek óta hajtogat, vagyis hogy a jövő a mikrotrendeké, az ebben a ciklusban végre beérik. 

A mostani jelöltek már egészen pontosan megtudhatják például, hogy melyik választókörzetben hány olyan házas, republikánus érzelmű, fehér férfi él, akinek főiskolai diplomája van, és évi 80 ezer dollárnál többet keres. Talán még inkább a köz javát szolgálja azoknak a járványkutatóknak a vállalkozása, akik a kor tempóját felvéve, az adatbányászat segítségével próbálnák megelőzni a kitörni készülő járványokat. Legyen az egy természetes, de egyelőre láthatatlan folyamat része, vagy terroristák által előkészített biológiai fegyver támadása, a siker mindig a gyors reakción múlik. 

Az orvoscsoport elképzelése szerint a kórházak és a doktorok által bevitt adatokat a rendszerük nem a diagnózis, vagyis a betegségek, hanem általános tünetek alapján csoportosítaná. A lényeg pedig járványügyi szempontból az, hogy ezek a hasonló tünetek hol, mikor és milyen számban fordulnak elő. Ha minden a tervek szerint megy, a mostani napok helyett órák alatt kialakulhatnak azok a jellemző minták, amelyek alapján a járvány korai stádiumban felismerhető és megállítható. További részletek a Zónában!

Figyelem! A cikkhez hozzáfűzött hozzászólások nem a ma.hu network nézeteit tükrözik. A szerkesztőség mindössze a hírek publikációjával foglalkozik, a kommenteket nem tudja befolyásolni - azok az olvasók személyes véleményét tartalmazzák.

Kérjük, kulturáltan, mások személyiségi jogainak és jó hírnevének tiszteletben tartásával kommenteljenek!

Amennyiben a Könyjelző eszköztárába szeretné felvenni az oldalt, akkor a hozzáadásnál a Könyvjelző eszköztár mappát válassza ki. A Könyvjelző eszköztárat a Nézet / Eszköztárak / Könyvjelző eszköztár menüpontban kapcsolhatja be.