A magyar csapat eredményei:
Aranyérem
6
Ezüstérem
7
Bronzérem
6
Vágólapra másolva!
Merész dologra vállalkozott a Nature, a rangos tudományos hetilap: terjedelmes összeállítást közölt arról, milyen helyzetben lesz a számítástudomány 2020-ban. Az egyre növekvő adatáradat és a rendszerszintű tudomány egyaránt támaszt igényeket a hardver, szoftver, algoritmusok és az elmélet területén. 2020-ra ennek több következménye lesz, de az már ma is látható, hogy az internet sebessége nem tart lépést az adatmennyiség bővülésével. A megosztott számítások viszont új, megoldandó kérdéseket vetnek fel a biztonságot, a szabad hozzáférést és a költségviselést illetően.
Vágólapra másolva!

A tudományos kutató a laboratóriumi jegyzőkönyvben rögzíti a kísérleti eljárást és a megfigyeléseket, ezek alapján elemzi az eredményeket és publikációi, feljegyzései ismeretében mások is megismételhetik a kísérletet. Így dolgozott Galilei, Mendel és Darwin, de a jövőben más megoldásokat kell keresni, írja Alexander Szalay (Szalay Sándor, a Magyar Tudományos Akadémia rendes tagja, Johns Hopkins Egyetem, Baltimore) és Jim Gray (Microsoft Research, San Francisco) a Nature egy másik cikkében. A modern tudomány legtöbb területén az adatmennyiség évente megduplázódik, az elemzés egyre bonyolultabbá válik. A jegyzetfüzetet felváltotta az asztali számítógép. A számítógépben rögzítik az adatokat, a számítógépen keresztül jutnak el a szakirodalomhoz, elektronikus levelekkel tartanak kapcsolatot együttműködő partnereikkel. Az adatok elemzését is számítógépek végzik, de a mai szoftverek nem képesek igazán nagy adatmennyiségeket kezelni. A terabájt nagyságrendű adathalmazok elemzése nagy kihívás. A közeljövőben pedig már az ennél is ezerszer nagyobb petabájt nagyságrenddel kell számolnunk. A már említett Large Synoptic Survey Telescope évente több petabájt információt fog termelni. Az adatbázis-kezelés a tudományos munka szerves részévé vált.

A számítógépek a kísérleti eszközök integráns részévé váltak, az adatgyűjtésben is fontos szerepet kaptak. A kísérleti eszközök egyre több adatot ontanak, az elemzés egyre bonyolultabb, egyre nehezebb az eljárásokat, az adatokat megfelelően dokumentálni. Ma egy DNS-szekvenáló automata az eredményeket összeveti egy adatbankkal, és egy szoftverrel elemzi. Húsz év múlva más lesz a szoftver, más lesz az adatbank, nagyon nehéz, a szerzők szerint csaknem lehetetlen lesz a mai eljárást megismételni. Minden lehetségest meg kell tenni a munkafolyamat, az eszközök, eljárások és mérések évtizedek múlva is felhasználható dokumentálása érdekében.

A tudományos kutatásban egyre gyakoribb több kutatócsoport és többféle szakterület együttműködése. Az internettel összekötött kollaborátorok csak szabványok, standardok alapján tudnak együttműködni egymással. Standardizálni kell az adatok formáját, hogy mindenki használhassa mások adatait, és standardizálni kell a használt szaknyelvet is, hogy ne legyen félreértés.

A cikk szerzői is egy komplex adatgyűjtő rendszer kidolgozásában vesznek részt, amely a környezetnek a talaj biodiverzitására gyakorolt hatását méri majd. Az érzékelők hálózatának méréseit hidrológiai, időjárási, biodiverzitási, biogeokémiai adatokkal kell integrálni. Adataik csak akkor lesznek mások számára is hasznosak, ha az információkat standardizált formában teszik közzé.

Az adatbankok aranybányák. Egyre több szakember nem is végez kísérleteket, hanem mások méréseiből összeállított adatbankokban keres új összefüggéseket, felfedezéseket. Az internet sebessége azonban nem tartott lépést az adatmennyiség bővülésével. Gigabájtos adatmennyiséget még átmásolhatunk az adatbankból saját gépünkre, de petabájtokkal ez már nem fog menni. A jövő: a számítási feladatot küldjük el az adatbankba, nem az adatokat másoljuk saját gépünkbe. A megosztott számítások új, megoldandó kérdéseket vetnek fel a biztonságot, a szabad hozzáférést és a költségviselést illetően.

A tudományos közlemények mind nagyobb hányadban elektronikus formában jelennek meg, de a nagy adatmennyiségek közlésének standardjai még nem születtek meg. Egyes szakterületeken már létrehozták a nagy archívumokat, ilyen a GenBank és a csillagászok nemzetközi archívuma.

Meddig nőhet exponenciálisan a tudományos adatok mennyisége? A szerzők 2011-re a mainál tízszer több adatra számítanak. A több milliárd dollár befektetésével épített nagy berendezések, pl. a genfi CERN-ben épülő Large Hadron Collider részecskegyorsító adattermelése hatalmas, a már említett petabájt nagyságrendű lesz, de nem fog évről-évre nőni. Ezzel párhuzamosan a kis eszközök, műszerek, szenzorok egyre olcsóbbá válnak, egyre több helyen fogják alkalmazni ezeket. 2020-ban is exponenciálisan bővül a tudományos adathalmaz.

Google News
A legfrissebb hírekért kövess minket az Origo Google News oldalán is!