Mi az a Big Data, és mi köze az InfóTükörhöz?

Közismert, hogy a nagy tömegű adatok, a BIG DATA korában élünk. Gépekkel mérjük és számszerűsítjük magunkat, a környezetünket, a tevékenységeinket, más gépek eltárolják őket, megint más gépek pedig napestig elemzik az adatokat, hogy még újabbakhoz jussanak. Első olvasásra úgy tűnik, öncélú adatbabrálás az egész, ennél azonban sokkal többről van szó. És nem is olyan haszontalan, mint gondolnánk!

Már az előző évezred végén látszódott a trend, akkor kapta a nevét, de igazából úgy egy évtizede vált érezhetővé az átlagember számára. Berobbantak az okostelefonok, tonnaszám jelentek meg rájuk a letölthető alkalmazások, megsokasodtak a letölthető videók, már nem csak az online rádióadókat volt érdemes neten hallgatni, hanem élvezhető minőségben jöttek a filmek is, és mindezzel lépést tartott az otthoni internetes sávszélességünk. (Akkor alig egy évtizede hagytuk a hátunk mögött a jó kis 56k-s modemeket. Néhányan még emlékeznek a hangjára.)

 

Mindegy, milyen megközelítésből vizsgáljuk a nagy tömegben keletkező adatokat, legyen szó akár

  • a világon legyártott tárolókapacitások mennyiségéről (évi … zetabájt)
  • az adatközpontokban mérhető adatforgalom bővüléséről (havi … petabájt)
  • az adatbányászati piac alakulásáról (évi … milliárd dollár)
  • kölkökről, akik úgy gondolják, másokat is érdekel az ő játékmenetük (heti … millió szomszéd kisfiú),

olyan grafikonokat látunk, amilyeneket a befektetési és életbiztosítási ügynökök rajzolnak a papírra: a vonalak jobb oldali vége erősen felfelé kunkorodik.

A gyorsulás mértékét egy 2012-es cikk mutatja meg legszemléletesebben. Azt állították, hogy a világon addig létrejött összes adatmennyiség 90%-a az utolsó két évben keletkezett. Érdemes itt kicsit elidőzni, és elgondolkozni a lehetséges következményeken. A növekedés üteme pedig azóta tovább gyorsult.

A Seagate megbízásából az IDC tavaly felmérést készített az adatmennyiségnek a következő 7 évben várható változásáról. 2025-ig szóló előrejelzésükből idézünk néhány érdekes megállapítást.


Az előállított adatok mennyisége 2025-ben a 2017-es mennyiség tízszeresére, 163 zettabájtra nő. Ebből a mennyiségből 5,2 zettabájtot vetnek alá elemzésnek, ami ötvenszeres bővülést jelent.

Míg korábban a létrehozott adatok nagyobb része a fogyasztóktól származott, 2025-re a vállalatok állítják majd elő a teljes mennyiség 60%-át.

Az intelligens épületekben, a padlóburkolatokban, a vezető nélküli autókban stb. található beágyazott eszközök száma a jelentés összeállításakor átlagosan nem érte el az 1-et, de 10 év alatt ez a szám 4 fölé emelkedik.

8 éven belül egy átlagfelhasználó naponta 4800-szor fog adatot cserélni valamilyen netre csatlakoztatott eszközzel.

2025-re a lakosság 75 százaléka csatlakozik a hálózathoz, adatokat hoz létre és cserél.

Az új forrásokból származó adatok magánjellegű és érzékeny információi  új kockázati tényezőt fognak jeleni. 2025-re a globálisan létrehozott adatok közel 90 százaléka bizonyos fokú védelmet igényelne, ennek ellenére a felénél is kisebb hányadát fogják védeni.

Végezetül egy meghökkentő jóslat: a globálisan keletkező adatok 20 százaléka a mindennapi életünk szempontjából kritikus lesz.


A körülöttünk gomolygó, velünk kapcsolatba lépő adatokat, információkat, impulzusokat három csoportba sorolhatjuk aszerint, hogyan viszonyulunk hozzájuk.

1. MINKET ÉRDEKELNEK.

Talán eddig nem tudatosult, hogy ontjuk magunkból az adatokat. Hála az egyre barátságosabb tarifacsomagoknak, a telefonunk folyamatosan kommunikál: a leveleinket, sms-einket letölti, a várható időjárást megmutatja, a gps-ével navigálunk. A tartózkodási helyünket is figyeli, és bár ezt nem verik nagy dobra, időről-időre fel is tölti azt ismeretlen szerverekre, hogy tech cégek adatelemzéssel következtetéseket vonhassanak le rólunk. Egészségünk megőrzése érdekében pulzust figyelő csuklópántot hordunk, mért életjeleinket adatbázisok tárolják. A gyerekünk osztályozónaplója már nem csak a fogadóórák alkalmával megtekinthető kultikus könyv, hanem elektronikus, online, bármikor hozzáférhető digitális dokumentum, minden egyes bejegyzést név szerint naplózva, jó esetben biztonsági másolatokkal, többszörösen eltárolva.

A családi videóink kevés számú, de egyenként méretes fájl tárolását teszik szükségessé. Kezdetben a kamera/telefon kártyáján, később átmásolva a számítógép merevlemezére, esetleg a felhőbe. Amikor még negatívra fotóztunk, előhívás és nagyítás után készült el a papírkép. Pénzbe került minden ellőtt kocka, ezért kétszer meggondoltuk, mielőtt exponáltunk.

Adattárolás régen és most. Mi magunk vagyunk a robbanás okozói. (John Blanding/The Boston Globe via Getty Image)

Ma már – kis túlzással – egy közepesen sikerült tojásrántottát is lefényképezünk, hadd menjen Instára, Fészre!

Ide sorolhatjuk még a régi, jól ismert érzékelőinkből, pl. külső/belső hőmérőkből, páratartalom-mérőkből, barométerekből, nyitás- és mozgásérzékelőkből, betörésjelzőkből származó adatokat. Mérjük és leolvassuk őket, majd megtesszük a szükséges teendőket: indulás előtt esernyőt veszünk magunkhoz, pulcsit húzunk, vagy becsukjuk a nyitva felejtett ablakot.
Érzékelőink száma is bővül. Szénmonoxid-érzékelőt kötünk a riasztóba, biztonsági kamerákat a ház köré, a vízóraakna aljába és a kazán vagy a víztartály helyiségének padlójára nedvességszenzort, autónkba guminyomásmérőt…

 

2. A GÉPEINKET ÉRDEKLIK. MINKET NEM, BÁR MIATTUNK KELETKEZNEK.

Régen elég volt fát tenni a tűzre, ha fáztunk. Később már szobatermosztát kapcsolgatta a fűtést, a mai rendszerek pedig páratartalmat is mérnek, harmatpontot számolnak azért, hogy ne csorogjon a víz az ablakon – végső soron annak érdekében, hogy még kényelmesebben éljünk. Tudnunk kell, hogy adott körülmények között a szobában mi a harmatpont értéke? Nem. Elég, ha a fűtési rendszerünk tudja.

Ha 30 éve vásároltam a sarki zöldségesnél, harmadnapra nem maradt nyoma sem a tranzakciónak, sem a zöldségnek. Manapság neten vásárolunk egy csomó mindent. Nem is gondolnánk, mekkora digitális lábnyommal jár! Rögzítik a vásárlás részleteit a webboltban, a keletkezett adóügyi bizonylatot az adóhatóságnál, a kártyás tranzakció adatait a bankokban, a kiszállítást a speditőr cégnél, és ezek az adatok a GDPR-ben szabályzott ideig és módon visszakereshetők maradnak, tehát évekig tárolni kell őket. Igaz, hogy egyenként apró adatokról van szó, de rengeteg van belőlük.

Az autók elektronikája viharos gyorsasággal fejlődik. A tolatáshoz sokáig a visszapillantót használtuk vagy megpróbáltunk deréktájban elcsavarodni.

Később besegített a tolatóradar, mára a tolatókamera vált általánossá, de évek óta léteznek a parkolást teljesen automatizáló rendszerek. Működésük közben rengeteg elektronikus kommunikáció zajlik az autón belül és kívül. Mifélék? Nem mindegy? Csak álljon be, és ne húzza meg a kocsi oldalát! Sejtelmünk sincs, holnap kivel-mivel fog egyeztetni a járgányunk annak érdekében, hogy rükvercben megtegyen 8 métert…

 

3. NEM ÉRDEKELNEK SE MINKET, SE A GÉPEINKET. EGYESEK MÉGIS EZT SZERETNÉK.

Míg az eddig taglalt információkra szükségünk van, a harmadik csoportbelieket mások akarják ránk tukmálni. Vannak köztük szépek, ízlésesek, kívánatosak, de harsányak, erőszakosak, tolakodóak is. Hogy micsodák? Minden, ami a viselkedésünkben és főleg vásárlásainkban akar befolyásolni minket. Összefoglaló nevükön a reklámok, a legváltozatosabb megjelenésben, életünk minden területén. A Red Crow Marketing 2015-ben felmérést végzett arról, hogy a legtöbb amerikait napi hány hirdetési impulzus éri. Tippeld meg, mennyit számoltak össze!

Ne legyenek illúzióink, minket sem ér sokkal kevesebb. A figyelmünkért (és a pénzünkért) versengenek a boltban kapható termékek a csomagolásukkal, a kihelyezéssel, az akciókkal. Ugyanez a versenyfutás vezetett a hangerőháborúhoz, a metropoliszok óriási fényreklámjaihoz.

Times Square (International Center of Photography, AP)

Összehangoltan dől a reklám a tévéből, rádióból, a telefonunk hirdetéseket dobál fel, az utcán hirdetőtáblák, plakátok, cégnevek, logók jönnek szembe, a postaládánk tömve reklámújsággal. A böngészőnk pedig tele lenne hirdetéssel… ha nem használnánk blokkolót. De sokszor még így is túljárnak az eszünkön, mert megszakítják a nézett videót, a Fészen a hírfolyamba rejtik a fizetett hirdetést, a nyomtatott sajtó oldalain és az online újságokban egyaránt beléjük ütközünk. Nem mi kértük, mégis az arcunkba tolják őket.

 

Az információból egyre több van, ráadásul egyre gyorsabban van egyre több. Ma még talán kezelhető a mennyiség, de a trendet figyelembe véve nagyon hamar maga alá temethet minket a rengeteg impulzus. Fontos, hogy tudatában legyünk ennek a nem túl közismert változásnak, és felkészüljünk rá. Cikkünk következő részében az első csoporttal, a minket érdeklő adatokkal fogunk foglalkozni, és azzal, hogyan segít bennünket az információáradatban az InfóTükör.

 

Források:

– Statista 2019: Big data – Statistics & Facts (https://www.statista.com/topics/1464/big-data/)
– Information-Age.com 2017: The value of data: forecast to grow 10-fold by 2025 (https://www.information-age.com/data-forecast-grow-10-fold-2025-123465538/)
– Seagate/IDC 2017: Enormous Growth in Data is Coming — How to Prepare for It, and Prosper From It (https://blog.seagate.com/business/enormous-growth-in-data-is-coming-how-to-prepare-for-it-and-prosper-from-it/)
– IBM 2017: 10 Key Marketing Trends for 2017 and Ideas for Exceeding Customer Expectations (https://www.ibm.com/downloads/cas/XKBEABLN)
– Red Crow Marketing 2015: How Many Ads Do You See in One Day? (https://www.redcrowmarketing.com/2015/09/10/many-ads-see-one-day/)
– BDMS 2014: Exciting facts and findings about Big Data you should know (http://bigdata-madesimple.com/exciting-facts-and-findings-about-big-data/)
– DATAVERSITY 2012: Looking for Data Scientists from Within – Start with Marketing (https://www.dataversity.net/looking-for-data-scientists-from-within-start-with-marketing/)
– Wikipedia: “Dial up modem noises” (https://en.wikipedia.org/wiki/File:Dial_up_modem_noises.ogg)

 

FacebooktwitterredditpinterestlinkedintumblrmailFacebooktwitterredditpinterestlinkedintumblrmail

Vélemény, hozzászólás?