Newsroom

Big Data - dé technologiebuzz van de laatste jaren - is niets meer dan een verzamelnaam voor alle digitale gegevens die wereldwijd opgeslagen zijn. Een verzameling die dermate groot is geworden, dat het efficiënt samenbrengen, zoeken, delen, analyseren, visualiseren en opslaan ervan de mogelijkheden van de mens en technologie overtreft. Een zegen voor slimme bedrijven die klanten aan zich willen binden; een opportuniteit voor overheden die efficiëntie voorop stellen; een goudmijn voor technologiebedrijven die leven van opslag en analyse; maar ook een potentiële nachtmerrie voor de consument.

 

Eerst even kaderen

Elke digitale handeling wordt ergens opgeslagen. Elke update van Facebook, elke betaling bij de slager, elk bezoek aan het ziekenhuis, je belastingaangiftes bij tax-on-web, je telefoneergedrag, elk abonnement, elke online aankoop, elke lening, elke email. Tel daarbij alle gegevens van en door bedrijven, organisaties en overheden, en we klopten 2011 af met een vermoedelijke 1,8 zettabyte aan wereldwijd beschikbare digitale informatie (bron: Digital Universe onderzoek van EMC en IDC, 2011, nieuwe gegevens beschikbaar binnen enkele weken). In cijfers uitgedrukt:1.800.000.000.000.000.000.000 bytes. Of plastischer uitgedrukt: plaats al deze data op tablets van 32 gigabyte (pakweg de gemiddelde iPad) en je kan er een muur mee bouwen van 6 meter hoog rondom Zuid-Afrika, of een berg die ruim 10 keer hoger is dan de Mount Everest. En we staan nog maar in de kinderschoenen van de datagroei. De content die we creëren, uitwisselen en opslaan komt pas echt goed op gang, zeker nu verwacht wordt dat in 2012 het aantal mobiele toestellen groter zal worden dan de wereldbevolking.

Het Walhallah voor bedrijven

Ik herinner mij nog levendig hoe de slagkracht van bedrijven werd geoptimaliseerd door middel van spreadsheets en marktonderzoeken. We gingen de straat op, ondervroegen de potentiële of actuele klant, en correleerden de resultaten ervan met verkoopcijfers en simulaties. Vandaag werkt elk zichzelf respecterend bedrijf met gespecialiseerde data-analisten, die de Big Data chaos structureren met Business Intelligence tools en het sociale medialandschap doorgronden met cluster-, semantische en sentimentanalyses.

De antwoorden op 10 vragen van het straatinterview zijn definitief vervangen door een microscopisch gedetailleerde weergave van het gedrag van de klant. Slimme bedrijven weten immers exact wat je wel of niet koopt, welke je interesses zijn, hoe groot je budget, hoeveel je twijfelt en wat je overhaalt. Ze kennen ook je kredietkaartgegevens, de samenstelling van je familie, of je al dan niet leningen lopen hebt, de gegevens op je digitale identiteitskaart, tot zelfs de maat van je ondergoed. Big Data wordt vaak als een zorgenkind voor bedrijven aanzien (tekort aan goede analisten, opslagcapaciteitsproblemen, kennisdeficit, enz), maar eens het bedrijf erin slaagt de nodige resources en kennis op te bouwen, is het vooral een feestmaal met bijzonder uitgebreid buffet. Nooit eerder hadden bedrijven toegang tot zo’n weelde aan bedrijfskritische informatie.

De top van snelst groeiende technologiebedrijven bevat niet toevallig vooral bedrijven gelinkt aan sociale media (waar het persoonlijke gedrag van consumenten een goudmijn is) en toeleveranciers voor beveiligings-, opslag-, netwerk- en analyseoplossingen (die bedrijven toelaten zo efficiënt mogelijk data op te slaan, te analyseren en om te zetten in een lucratief business model).

De oplossing voor overheden

Ook de overheden zien hun brood in de gigantische beschikbaarheid van informatie. Onze eID pass transfereert onze persoonsgegevens in één seconde. Er is een Kruispuntbank van de Sociale Zekerheid en ook een van de Ondernemingen. Ziekenhuizen krijgen toegang tot Rijksregistergevens, bedrijven tot de lijst van wanbetalers. Het aantal databanken met onze gegevens op lijkt eindeloos, maar ze worden bovendien steeds vaker aan elkaar gekoppeld, zodat de fiscus kan zien dat je met een dure wagen rijdt ondanks een laag inkomen, en dat je belastingformulier al helemaal is ingevuld in jouw plaats. Makkelijk. Daar worden we allemaal samen beter van, zo klinkt het: efficiëntere fraudebestrijding, vlotter ondernemen, minder administratie, en ga zo maar door.

En de consument?

Zowel op nationaal als Europees niveau wordt druk gewerkt aan duidelijke wetten rond de bescherming van de persoonlijke levenssfeer, codes rond dataopslag en -verwerking, bescherming van de online consument, enz. Maar het Internet ligt niet enkel in België, en de servers al helemaal niet. Sommige landen, zoals Duitsland, verplichten bedrijven wel om persoonsgegevens in eigen land op te slaan, maar een beetje IT expert weet dat aardig te omzeilen - zelfs binnen de wetgeving.

Bij dataproblemen denken we dan ook vooral aan malafide praktijken, zoals datacenters die ‘uit beveiligingsoverwegingen’ gedupliceerd worden in de Bahama’s (waar andere wetten gelden), hackers of georganiseerde internetmisdaad. Maar het gevaar ligt véél dichter bij huis: we zijn er grotendeels zelf de oorzaak van. We beheren nauwelijks onze gegevens; we leggen ons leven open en bloot op Facebook; we gebruiken overal hetzelfde paswoord. En vooral: we accepteren zonder verpinken de ‘algemene voorwaarden’ bij elke aankoop, inschrijving of dienst. Met dat ene ‘vinkje’ geven we steevast expliciet toestemming om onze gegevens op te slaan, ze te gebruiken voor commerciële doeleinden of interne analyse én om ze door te verkopen aan derden.

Het grote probleem is dat onze data verspreid zit over heel de wereld. Zelfs al ga je als consument erg secuur het Internet op, na enkele jaren hebben honderden servers een stukje van jouw persoonlijke leven op schijf staan. De wetgeving voorziet dat je inzage hebt in die gegevens en dat je ze kan laten aanpassen of verwijderen Maar niet één van ons weet nog waar hij gegevens heeft achtergelaten, laat staan dat het realistisch is om elk bedrijf en organisatie individueel te contacteren.

Gecontroleerd en transparant

Verwacht wordt dat binnen 10 jaar de hoeveelheid informatie met factor 75 zal stijgen (800 Mount Everests!). Als je weet dat vandaag 75% van de Big Data door onszelf wordt gecreëerd (user-generated content) en dat 80% ervan wordt opgeslagen en beheerd door bedrijven, denk ik dat het hoog tijd is om de groei en verspreiding gecontroleerd en transparant te laten verlopen. De consument moet de mogelijkheid krijgen om gecentraliseerd gegevens aan te passen en up-to-date te houden. Niet alleen ter bescherming van zichzelf, maar ook ten behoeve van bedrijven en overheden, die enkel op basis van gefundeerde en volledige informatie hun data-mining activiteiten kunnen uitvoeren met succes. Want de grootste bedreiging van Big Data is niet de hoeveelheid, maar wel de onvolledigheid en geslotenheid. Of we het nu willen of niet, democratisering van Big Data is het enige verweer tegen misverstanden, manipulatie en misbruik. Maar of we morgen alle bedrijven bereid gaan vinden hun duur verzamelde data vrij te geven, is nog maar de vraag.

http://opinie.deredactie.be/2012/08/14/big-data-of-big-brother

Share now