07 sep 2018

Ongestructureerde data

Door Hans Cordfunke, directeur BECIS
Organisaties ontvangen, genereren en verzenden steeds meer data. Dit betreft allerlei soorten data die in de basis een weergave zijn van het handelen van de organisatie. In feite is alles wat op één of andere manier iets zegt over het handelen van een organisatie te beschouwen als data. Data bestaan daarbij in gestructureerde en in ongestructureerd vorm. Van gestructureerde data is sprake als de gegevens geordend, gerubriceerd en eenvoudig traceerbaar zijn opgeslagen in een database. Data die nog ‘verstopt’ zitten in bestanden, documenten, berichten, beelden of geluid, worden daarentegen aangeduid als ongestructureerde data.

 

Ongestructureerde data zijn data die geen vastgesteld datamodel hebben en niet zijn geordend op een vastgestelde, vooraf vastgelegde manier. Ongestructureerde data zijn daarom ook sterk gelinkt aan de drie V’s van Big Data:

  • Volume: ongestructureerde data vereisen meestal meer opslagruimte dan gestructureerde data.
  • Velocity: de hoeveelheid ongestructureerde data groeien sneller dan de hoeveelheid gestructureerde data.
  • Variety: ongestructureerde data worden gegenereerd vanuit databronnen die niet eerder benut zijn, wat kan leiden tot erg persoonlijke klantinformatie.

 

Kort zou ik willen stilstaan bij deze ongestructureerde data. Een aandachtsgebied dat binnen informatiemanagement nog redelijk onbekend is, maar gelukkig steeds meer aandacht krijgt. Volgens Gartner neemt de hoeveelheid ongestructureerde data de komende jaren met 800% toe. Vanuit dat onderzoek is tevens naar voren gekomen dat 80% van de data in het zakenleven en 95% van de data in het dagelijks leven ongestructureerd is. We hebben het hier dus over een bron aan gegevens die ingezet kan worden om organisaties in de uitvoer van hun processen te ondersteunen.

Data hebben altijd een reden van ontstaan. Echter zonder dat er structuur in deze data wordt aangebracht en zonder deze in een context te plaatsen, kunnen deze data niet omgezet worden tot bruikbare informatie. Pas nadat de context, betekenis en samenhang helder is, kunnen (ongestructureerde) data geïnterpreteerd worden en omgezet naar bruikbare en vooral ook betrouwbare informatie. Betrouwbare data, op het juiste moment in het juiste proces zijn randvoorwaardelijk ter ondersteuning van de primaire processen en het kunnen nemen van de juiste besluitvorming. Zie hier ons vakgebied!

Dus verdiep je eens in alle vage e-mails, onoverzichtelijke tekstbestanden en vele PDF’s die de organisatie ontvangt waar je werkzaam voor bent, en wie weet kom je achter een heel verrassend resultaat!