Šiais metais žmonija turėtų sugeneruoti daugiau nei du trilijonus gigabaitų informacijos. Pažvelkime, iš kur atsiranda šie astronominiai duomenų kiekiai ir kokias naujas galimybes jie atveria.
Ar žinojote, kad visa žmonija iki šių metų pradžios turėjo sukurti apie 1,8 zetabaito informacijos? Tokią prognozę pernai paskelbė tarptautinė rinkos tyrimų ir analitikų kompanija “International Data Corporation” (IDC), tirianti informacinių technologijų bei telekomunikacijų sritis. Jos parengtoje studijoje “Digital Universe” apibrėžiamas iki šiol žmonijos sugeneruotas informacijos kiekis bei jo didėjimo prognozės artimiausiame dešimtmetyje.
Turbūt ne kiekvienam mūsų paprasta įsivaizduoti tokius informacijos kiekius – juk vienas zetabaitas talpina trilijoną (tūkstantį milijardų) gigabaitų. Kad būtų lengviau suvokti mastus, prisiminkime, jog viename gigabaite vidutiniškai telpa vienas įprastos raiškos filmas arba 200 MP3 dainų, apie 250 geros kokybės nuotraukų arba 500 elektroninių knygų, keli tūkstančiai įprastų teksto dokumentų arba apie 6000 paprastų interneto svetainių.
Pabandykime įsivaizduoti, kaip šis informacijos tvanas atrodytų fiziniame pasaulyje. Tarkime, jei visus iki 2011-ųjų žmonių sukurtus duomenis pabandytume įrašyti į įprastus DVD diskus ir jų dėžutes (1 cm storio) sudėtume vieną ant kitos, gautume apie 4,5 mln. km aukščio bokštą, kuris sudarytų apie dešimtadalį atstumo nuo Žemės iki Marso. Tad 1,8 zetabaito – tikrąja to žodžio prasme astronominis duomenų kiekis.
Įdomiausia, kad šį informacijos tvaną mums atsiuntė ne kokia nors dievybė, o jį sukūrėme patys – IDC tyrimo duomenimis, apie tris ketvirtadalius viso duomenų srauto sukuria paprasti vartotojai. Nieko keista, juk apie pusė pasaulio gyventojų naudojasi mobiliaisiais telefonais, kurie tampa nedideliais informacijos upeliais. O ką jau kalbėti apie išmaniuosius įrenginius, kurių kasmet padaugėja penktadaliu – jie generuoja daug didesnius duomenų srautus nei įprasti mobilieji.
Žinoma, daugiausiai duomenų sukuria paprasti internautai, juk pavyzdžiui, į žymųjį portalą “YouTube” kas minutę įkeliama po daugiau nei 24 val. filmuotos medžiagos, o apie 900 mln. socialiniame tinkle “Facebook” registruotų vartotojų per dieną vidutiniškai įkelia 250 mln. nuotraukų.
Be to, kasdien mus supa vis daugiau įvairiausių prietaisų, kuriuose įmontuoti jutikliai irgi generuoja informacijos srautą.
Remiantis IDC prognozėmis, šio dešimtmečio pabaigoje žmonija bus sugeneravusi apie 35 zetabaitus informacijos. Pasirodo, kad jos kiekio didėjimą galima aprašyti tuo pačiu eksponentiniu Moore’o dėsniu, kuris galioja ir daugeliui kitų IT sričių – kas aštuoniolika mėnesių pasaulyje sukuriamų duomenų padvigubėja. Ir jei šiandien kartais manome, kad įvairi informacija mus tuoj paskandins, tada įsivaizduokime, kas bus 2020 m., kai kiekvienam mūsų teks susidurti su 50 kartų daugiau duomenų.
Šiuose gigantiškuose duomenų srautuose slypi didžiulės galimybės tiems, kurie sugebės pirmieji perprasti, kaip visą informaciją panaudoti. Tuo pat metu į galvą ateina Jorge’s Luiso Borgeso trumpasis apsakymas “Apie tikslumą moksle”. Jame pasakojama apie imperiją, kurios kartografai buvo taip apsėsti tikslumo, jog sukūrė tokį tikslų ir išsamų žemėlapį, kad juo padengė pačios imperijos teritoriją. Tad žvilgtelėkime, kaip šiuolaikinis informacijos tvanas keičia mokslo, verslo bei asmeninio žmonių gyvenimo žemėlapį.
Mokslas – žinoti, bet nesuprasti
Šiuolaikinis mokslas kasdien surenka tokius kiekius duomenų, kurių jau nebeįmanoma paprastai suvokti ir apibendrinti universaliomis teorijomis.
Tarkime, prieš gerus 150 metų planetos klimato pokyčius fiksavo tik keliolika meteorologinių stotelių, o šiandien jų priskaičiuojama tūkstančiais. O kur dar Žemės orbitoje besisukančių palydovų, vandenyne plūduriuojančių daviklių bei kitų pasaulio klimatą stebinčių prietaisų kas minutę surenkama informacija.
Anksčiau meteorologinių stotelių duomenys buvo surenkami kartą per dieną, o šiandien informacija apie temperatūrą, kritulius, slėgį, anglies dvideginio kiekį, vėjo greitį, debesų judėjimą ir net Saulės aktyvumą atnaujinama kas kelios minutės.
Be klimatologų, gana gausiai informacijos aruodus papildo ir astronomai. Iki šiol dauguma teleskopų stebi tik nedidelį dangaus lopinėlį, tačiau naujausios technologijos jau leidžia padidinti mastus. Po kelerių metų turėtų pradėti veikti didžiausias pasaulyje optinis teleskopas “Large Synoptic Survey Telescope”, kuris kas kelios dienos galės nufotografuoti visą dangaus skliautą – tai yra pateiks terabaitus duomenų kas naktį.
Praeitais metais pradėjęs veikti ALMA radijo teleskopų projektas Čilėje per dieną sugeneruoja apie 40 terabaitų grynų duomenų, kuriuos mokslininkai turi apdoroti. “Per pastaruosius kelis dešimtmečius išmokome statyti 30 kartų didesnius teleskopus, kurių jutikliai yra apie 3000 kartų jautresni nei iki tol”, – lygina astrofizikas Alberto Conti.
Tačiau turbūt dažniau nei klimato tyrėjai ar astronomai su didžiuliais duomenų srautais susiduria biologai. Štai tarptautinė organizacija “Global Biodiversity Information Facility”, renkanti informaciją apie planetoje gyvenančias gyvybės formas – nuo bakterijų iki gyvūnų – šiandien turi sukaupusi daugiau nei 300 mln. skirtingų faktų.
O ką jau kalbėti apie genetikus, šifruojančius organizmų genomą, ar naują mokslo sritį – sistemų biologiją, kuri tiria, kaip ląstelės reaguoja į pačius įvairiausius dirgiklius bei kaip jos bendradarbiauja tarpusavyje.
Kitaip tariant, mokslo principas paprastas – stebėdamas atskirus faktus, mokslininkas po truputį juose įžvelgia universalią teoriją, kuri tiksliai gali numatyti faktų aplinkybes. Tarkime, prieš keturis šimtus metų žymusis astronomas Johannesas Kepleris tol žiūrėjo į lenteles su planetų orbitomis, kol jo galvoje susiformavo teorija, tinkama aprašyti bet kurios planetos buvimo vietą bet kuriuo metu.
Tačiau šiandien galima įvardyti daugybę mokslo sričių, kuriose surenkamų duomenų (faktų) kiekis jau seniai viršija mokslininko sugebėjimą aprėpti šią informaciją.
Dėl šios priežasties laipsniškai keičiasi žinojimo ir supratimo paradigma – šiandienos informacijos kiekiuose susigaudyti tegali galingi superkompiuteriai ir jiems sukurtos modeliavimo programos. Ir nors jomis gaunami virtualių eksperimentų atsakymai yra teisingi, tačiau mokslininkams vis sudėtingiau suvokti visus duomenis ir sugeneruoti juos apibendrinančias teorijas, dėsnius.
Štai tarkime, Kornelio universiteto mokslininkai Hodas Lipsonas ir Michaelis Schmidtas sukūrė programą “Eureqa”, kuriai pateikiami įvairūs mokslinių stebėjimų duomenys, o ji bando rasti matematines lygtis, kuo tiksliau aprašysiančias tą informaciją. Mokslininkai jas gauna, bet, deja, programa nepaaiškina, kodėl šie reiškiniai vyksta būtent taip.
Duomenų mobilizacija verslui
Grįžtant iš kosmoso ir biologijos platybių reikia pabrėžti, kad internete ar kasdieniame gyvenime šiandien mes patys paliekame labai daug informacijos.
Štai kad ir socialiniai tinklai – juk tai tikras lobynas verslininkui, žinančiam, ko ieškoti. Prieš daugiau nei mėnesį didžiausias JAV prekybos tinklas “Walmart” nusipirko nedidelę IT kompaniją “Social Calendar”, kuri “Facebook” tinkle yra sukūrusi vieną populiariausių kalendoriaus programėlių. Joje savo asmeninius užrašus laiko apie 15 mln. vartotojų, taigi prekybos tinklas galės informaciją sutikslinti su savo turimais duomenimis apie klientus.
“Turėdamos pakankamai duomenų, įžvalgų ir skaičiavimo galios, korporacijos ir šalių vyriausybės šiandien jau gali “sujungti taškus” tokiais būdais, kuriuos anksčiau yra aprašę tik fantastikos rašytojai” , – įspėja Alexanderis Howardas, “O’Reilly Media” korespondentas.
Ir, regis, korporacijos įvairiais duomenimis jau naudojasi. Pavyzdžiui, vienas Mineapolio vyras, kad nepilnametė jo duktė laukiasi, sužinojo ne iš jos pačios, o per prekybos tinklą “Target”. Pasirodo, jog nors ji labai stengėsi nuslėpti tiesą nuo aplinkinių ir tėvų, tačiau prekybos tinklo pirkėjų pirkimo įpročius stebinti programa merginos pirkinių sąraše neretai pastebėjo prekių, kurias renkasi nėščiosios, ir todėl jai į namus buvo išsiųsti pigesniam kūdikių maistui ir drabužėliams įsigyti skirti kuponai. Radęs juos pašto dėžutėje apie naujieną sužinojo ir nepilnametės tėtis.
Kitas akivaizdus pavyzdys apie tyvuliuojantį didžiulį informacijos vandenyną – tai socialinis tinklas “Facebook”, kurio prognozuojama vertė siekia apie 100 mlrd. dolerių. Tai suprantama, juk jame registruotiems žmonėms tinkamai pateikiant reklamą, galima nemažai užsidirbti.
Tačiau šiandien verslininkams jau nebepakanka paprastų statistinių duomenų – nurodyta lytis, amžius, pomėgiai ar gyvenamoji vieta nepakankamai pasako apie potencialų vartotoją. Todėl šiandien jau veikia tuzinas kompanijų, kurios sijoja kitus duomenis: pokalbius, žinutes, įrašus ant sienos, nuotraukas, elgesio modelius. Jie apie žmones pasako kur kas daugiau. “DataXu”, “AppNexus”, “Invite Media”, “Medi Math”, “Turn” – tai tik keletas tokiu verslu užsiimančių kompanijų.
Vyriausybės taip pat jau pradeda galvoti apie tai, kaip panaudoti internete ir valstybinių institucijų duomenų bazėse surinktą informaciją apie savo piliečius. Čia pirmiausia į galvą ateina mokesčių surinkimo, sveikatos apsaugos ir socialinės pagalbos institucijos, kurios deramai panaudojusios savo turimus duomenis gali padidinti pajamas ar sumažinti išlaidas.
Pavyzdžiui, Vokietijos federalinė darbo agentūra, detaliai išanalizavusi duomenis apie savo klientus, sugebėjo iš pašalpų per trejus metus sutaupyti apie 10 mlrd. eurų bei sutrumpinti vidutinį laiką, kai žmogus būna be darbo. “McKinsey Global Institute” verslo ir vadybos konsultacijų kompanijos praeitais metais išleistoje ataskaitoje teigiama, kad tinkamai apdorojusios turimus duomenis visos ES valstybės galėtų sutaupyti apie 250 mlrd. eurų viešojo sektoriaus išlaidų.