Data Mining

Data Mining

Intro

Dankzij de digitalisering van de samenleving vergaren bedrijven en organisaties tegenwoordig steeds gemakkelijker en steeds meer informatie over jou als klant. Je kunt hierbij denken aan de producten die je online koopt, de muziek en films die je streamt en de berichten die je op sociale media ‘leuk’ vindt. Deze enorme hoeveelheid aan data, ook wel big data genoemd, is vaak nog onbruikbaar. Wat kun je met deze ruwe data en hoe zorg je ervoor dat je dit kunt gebruiken om betere resultaten te behalen? Hier komt Data Mining om de hoek kijken. Wil je meer te weten komen over data mining, lees dan nu verder!

Wat is Data Mining?

Zoals de Engelse term Mining al aangeeft gaat het om het ‘graven’ naar iets waardevols, in dit geval in een grote hoop met gegevens. Het is een proces waarbij complexe verbanden en niet voor de hand liggende patronen in grote datasets worden opgespoord. Dit kan leiden tot nieuwe inzichten en zelfs het voorspellen van bepaald gedrag. Data mining is hierdoor dan ook een essentieel onderdeel van kunstmatige intelligentie, ook wel artificial intelligence (AI) genoemd. De voorspellende algoritmen, voortkomend vanuit data mining, vormen de basis voor Kunstmatige Intelligentie.

Wil je meer te weten komen over kunstmatige intelligentie? Lees dan hier mijn blog over artificial intelligence.

Waarom is Data Mining belangrijk?

De enorme hoeveelheid big data blijft in grote getallen toenemen. Zo wordt er in 2020 iedere dag zo’n 2,5 triljoen (dat zijn 18 nullen!) bytes aan data geproduceerd. Data mining biedt daarom een oplossing om snel en gemakkelijk grote hoeveelheden data door te spitten, opzoek naar relevante en nieuwe inzichten. Hierdoor kunnen er snellere en betere beslissingen worden genomen.

Voorbeelden van Data Mining

Om de term data mining wat concreter te maken geef ik hieronder een tweetal voorbeelden van data mining uit de praktijk.

Eigen ervaring met Data Mining

Tijdens mijn stage bij een grote platenmaatschappij heb ik het voorrecht gehad om met eigen ogen (de resultaten van) data mining in actie te kunnen zien. Platenmaatschappijen hebben tegenwoordig een enorme schat aan streaming data tot hun beschikking vanuit de verschillende streamingdiensten zoals Spotify, Apple Music en Deezer. Het bedrijf waar ik stage heb gelopen heeft een tool ontwikkeld om, doormiddel van data mining, op een vroeg stadium Top 40-hits te kunnen signaleren. Deze tool geeft ieder nummer op basis van verschillende factoren een bepaalde score mee. Hoe hoger de score, des te meer potentie het nummer heeft om een grote hit te worden. In plaats van nummers te promoten op onderbuik gevoel, geeft dit de platenmaatschappij de mogelijkheid om snel de juiste nummers de gepaste prioriteit te geven. Wellicht het beste voorbeeld van het succes van een data mining tool zoals hierboven beschreven is het nummer Zoutelande van BLØF, welke hierdoor al in een vroeg stadium werd gesignaleerd en uiteindelijk de grootste Nederlandstalige hit ooit werd.

Walmart en Data Mining

Een andere case die ik ben tegengekomen, die al wat ouder is maar wel een goed voorbeeld is voor de potentie van data mining, is het succesverhaal van de Amerikaanse supermarktketen Walmart. Dankzij data mining ontdekte zij dat op vrijdagavonden de producten bier en luiers vaak samen worden gekocht. Wat blijkt: werkende mannen worden op pad gestuurd om luiers te halen en vinden dat ze wel een biertje hebben verdiend. Met deze onwaarschijnlijke combinatie is Walmart aan de slag gegaan door de schappen van deze twee producten naast elkaar te zetten, met als resultaat een stijging in verkopen voor beide producten. Zonder Data Mining had je dit gedrag niet kunnen voorspellen.

Nadelen van Data Mining

Na de succesverhalen van Zoutelande en Walmart is het goed om ook nog even te kijken naar de nadelen van data mining en de dingen waar je op moet letten. Zo komen met het verzamelen en opslaan van data ook bepaalde voorwaarden en kosten kijken. Het verzamelen van data moet namelijk wel aan de benodigde privacy en veiligheidsnormen voldoen. Zo moet de data geanonimiseerd en veilig opgeslagen worden. Daarnaast is het van groot belang dat de kwaliteit van de data op peil wordt gehouden. Het grote nadeel van data mining tools is namelijk dat ze zo goed zijn als de data die erin wordt gestopt. De data mining tools analyseren data zonder de betekenis ervan te kennen. De uitkomsten zijn op zichzelf dus niet zinvol, maar pas nadat deze door een data analist zijn beoordeeld. Verder moet je genoeg data tot je beschikking hebben om tot representatieve uitkomsten te komen. Mocht je op basis van niet-representatieve gegevens bepaalde besluiten nemen, dan kan dit nadelige gevolgen hebben voor de resultaten van je bedrijf of organisatie.

Conclusie

In tijden waarin we steeds meer data genereren wordt het ook steeds moeilijker om de informatie te vinden die echt relevant is. Hiervoor biedt data mining de ultieme oplossing om je data analyses naar een hoger niveau te tillen. Aan de andere kant is het hierbij wel van groot belang dat er goed wordt gekeken naar de opslag en kwaliteit van de beschikbare data voordat je met data mining aan de slag gaat.

Ben jij net als ik ook zo enthousiast geworden over Data Mining? Wij bij mark@ing zijn nog opzoek naar klanten waarbij we Data Mining kunnen gaan toepassen! Mocht je geïnteresseerd zijn, neem dan contact met ons op zodat we samen kunnen kijken naar de mogelijkheden voor jouw bedrijf.

Ben je nog niet zover op het gebied van data, maar klinkt dit wel als (toekomst)muziek in je oren? Ook in dat geval denk wij graag mee over het verzamelen en opslaan van jouw data.

Summary
Article Name
Blog: Data Mining
Description
Wat is Data Mining en waar wordt het voor gebruikt? Inclusief praktijkvoorbeelden
Author
Publisher Name
mark@ing
Publisher Logo
Wouter van Zelst
wouter@markating.nl
Geen reactie's

Geef een reactie