Kaip Big Data keičia mokslą, pramonę ir miestus bei ateitį

Kaip Big Data keičia mokslą, pramonę ir miestus bei ateitį

Rūta Jankauskienė Rūta Jankauskienė . Komentarai

5 Minutės

Skaitmeninis pėdsakas. Jis paliekamas kiekviename mūsų žingsnyje — užklausoje, pirkinių krepšelyje, GPS trajektorijoje ar išmaniojo sensoriaus duomenyse. Tačiau kas nutinka, kai šis pėdsakas susijungia į žemėlapius, kurie nebetelpa į tradicinius duomenų stalčius? Tada kalbame apie didžiuosius duomenis, tikrą šiuolaikinių technologijų akmenį anglių krūvoje: nematomas, bet ugnies karštas ir gebantis pakeisti viską nuo ligoninės palatos iki miesto gatvių.

Kas yra didieji duomenys ir kodėl jie skiriasi

Terminas „didieji duomenys“ apibūdina labai didelius, daugiabriaunius ir nuolat kintančius duomenų rinkinius, kuriuos sunku apdoroti naudojant tradicines duomenų bazes. Ne tik dydis svarbus. Svarbiausia — įvairovė ir greitis: tekstai, vaizdai, vaizdo įrašai, sensorių „srautas“, socialinių tinklų pranešimai ir palydovų telemetryja – visa tai teka kartu. Ši įvairovė lemia, kad įprasti įrankiai nebetinka.

Mokslininkai dažnai naudodami „3 V“ modelį — Volume (apimtis), Velocity (greitis) ir Variety (įvairovė) — paaiškina problemos mastą. Pastaraisiais metais prie šių trijų jis išsiplėtė: Veracity (patikimumas) ir Value (vertė) tapo esminėmis charakteristikomis. Duomenų kiekis be kokybės — tik triukšmas; greitis be prasmės — tik reakcija.

Kaip veikia infrastruktūra ir technologijos

Vieta vienoje mašinoje? Retai. Didieji duomenys dažniausiai saugomi ir apdorojami paskirstytose sistemose — keli serveriai, keliomenų centrai, kartais debesų paslaugos ir edge computing sluoksnis arti sensoriaus. Ši paskirstyta architektūra leidžia paraleliai apdoroti milžiniškus kiekius informacijos ir greičiau sugrąžinti rezultatus.

Surenkimas, paruošimas, analizė, interpretacija — taip trumpai galima apibūdinti duomenų srauto kelią. Duomenys dažnai būna netvarkingi: trūkstami laukai, triukšmas, dublikatai. Todėl valymas ir transformacija yra ne prabangos, o būtinybė. Toliau ateina pažangios analizės įrankiai: statistika, mašininis mokymasis, ir dirbtinis intelektas, kurie išskiria paslėptus modelius, atpažįsta anomalijas ir prognozuoja reiškinius.

Technologijos, kurios leidžia šią magiją, apima paskirstytus failų sistemas, realaus laiko apdorojimo karkasus (stream processing), duomenų srauto platformas ir neuroninius modelius. Be to, IoT ir palydovų duomenys — pavyzdžiui, žemės stebėsenai ar klimato modeliavimo tarpe — integruojami su operaciniais verslo duomenimis, sukuriant „duomenų ekosistemą“.

Taikymo sritys: nuo ligoninės iki satelitų

Didieji duomenys nėra tik IT specialistų žaidimas. Jų poveikis jaučiama medicinoje, finansuose, gamyboje, miesto valdyme ir net kosminių misijų analitikoje. Sveikatos sektoriuje analizė iš medicininių įrašų, genomikos ir nešiojamų sensorių leidžia greičiau diagnozuoti ir pritaikyti gydymą individualiai pacientui. Finansų rinkose realaus laiko analizė padeda aptikti sukčiavimą anksčiau nei padaroma žala.

Miestuose duomenys iš eismo jutiklių, viešojo transporto telemetrijos ir mobiliųjų telefonų signalų suteikia galimybę optimizuoti srautus, sumažinti spūstis ir mažinti emisijas. Gamyklose jutiklių duomenys palaiko prognozuojamąją priežiūrą: gedimą galima nuspėti dienomis ar net savaitėmis anksčiau, taupant laiką ir pinigus.

Ir dar žvilgsnis į dangų: palydovų telemetryja, Erdvinės stebėsenos vaizdai ir klimato modeliai generuoja neįtikėtinus duomenų kiekius. NASA, ESA ir kitos institucijos naudoja pažangias duomenų apdorojimo technologijas, kad atskleistų Žemės ir kosmoso procesų dinamiką — nuo orų prognozės iki planetų geologijos.

Rizikos, etika ir gebėjimų trūkumas

Su galia ateina ir atsakomybė. Privatumas ir saugumas — nuolatinės temos. Kai organizacijos kaupiasi asmeninę informaciją, kyla grėsmė nutekėjimams arba neteisėtam panaudojimui. Kitas iššūkis — duomenų kokybė: netikslūs ar šališki duomenys atveda prie klaidingų išvadų ir net kenksmingų sprendimų.

Be technologijų, trūksta žmogiškojo kapitalo: duomenų inžinierių, analitikų, etikos specialistų. Ir, svarbiausia, reikia aiškaus reguliavimo bei skaidrumo mechanizmų, kad automatizuoti sprendimai būtų sąžiningi ir patikimi.

Eksperto komentaras

„Didieji duomenys — tai ne vien technologija, tai pokyčio įrankis,“ sako dr. Inga Petrauskaitė, duomenų mokslininkė, dirbusi su IoT ir satelitinių duomenų analizės projektais. „Kai sujungiate skirtingų šaltinių duomenis ir taikote mašininį mokymąsi atsakingai, gaunate ne tik prognozes, bet ir naujas hipotezes, kurios anksčiau buvo nematomos. Tačiau be duomenų kokybės ir aiškių etikos gairių rezultatas gali būti klaidingas arba net kenksmingas.“

Kas laukia ateityje

Technologijų pažanga — edge computing, kol kas dar eksponentiškai augantis AI potencialas ir spartėjantis IoT — reikš, kad duomenų srautas tik didės. Tačiau tikrasis vertės matas bus ne kiekybė, o gebėjimas atsakingai interpretuoti rezultatus ir integruoti juos į operacijas ar politinius sprendimus. Autonominės sistemos, galinčios veikti be nuolatinio žmogaus priežiūros, taps įprastos, bet jos turi turėti įmontuotą atsakomybę.

Galiausiai, supratimas, kaip Big Data veikia mūsų kasdienybę, tampa esminis įgūdis — ne tik programuotojams ar duomenų mokslininkams, bet ir sprendimų priėmėjams, politikams bei visuomenei. Kaip tai darysime: laisvės vardan, saugumo vardan ar pelno vardan? Tai klausimas, kuris formuos technologijų ateitį.

Jei norite sekti toliau — analizuokite šaltinius, užduokite kritinius klausimus ir reikalaukite skaidrumo: duomenys žada daug, bet jų prasmė priklauso nuo mūsų sprendimų.

Labas! Aš – Rūta, mėgstu gilintis į technologijas ir paprastai paaiškinti sudėtingus dalykus. Mano straipsniai – tiek pradedantiesiems, tiek pažengusiems.

Palikite komentarą

Komentarai