Data Science | Tools voor Data Science | 100% Datawetenschappen
Passionned Group is dé specialist in datagedreven werken. Onze bevlogen en ervaren consultants helpen grotere en kleinere organisaties bij de kanteling naar een intelligente, datagedreven organisatie. Om het jaar organiseren wij de prestigieuze prijs voor de Slimste organisatie van Nederland.

Hoe het Data Science management vraagstuk aan te pakken?

Data Science is een vakgebied dat in een stroomversnelling is geraakt. Het gaat kort samengevat over het vinden van complexe patronen in grote stromen data. Die je met het blote oog en traditionele analysetools onmogelijk kan vinden. Je bouwt een model om die patronen op te sporen, te analyseren en te valideren. Daarmee kun je proactief ingrijpen in operationele stuurprocessen of voer je innovaties door in jouw organisatie.

Waardevolle informatie genereren uit die onmetelijke hoeveelheid data die we met z’n allen elke dag genereren. Daar gaat het om bij deze datawetenschappen. Je ontwikkelt nieuwe oplossingen om te kunnen blijven concurreren op alle fronten. Maar dat doe je niet zomaar, want:

  • Hoe pak je het Data Science management-vraagstuk aan in jouw organisatie?
  • Welke concrete voorbeelden kunnen als inspiratie dienen?
  • Zijn er al betrouwbare tools op de markt die je kunt inzetten?
  • Welke vaardigheden (opleidingen) zijn vereist om data science te implementeren?
  • Hoe kun je hierin toekomstbestendige keuzes maken?

Ook nieuwsgierig naar dit nieuwe vakgebied van Data Science? Onze data scientists helpen je graag deze nieuwe wereld met succes binnen te stappen.

Definitie Data Science

In de definitie van data science zie je ook de belangrijkste vaardigheden terug.

Data Science is het vermogen om de juiste data te selecteren, te begrijpen, te verwerken, de waarde uit de data te halen, die te visualiseren en de inzichten te communiceren. Dit wordt de komende decennia een ontzettend belangrijke competentie voor organisaties.

We gebruiken hier de definitie van Hal Varian. Hij is een gerespecteerd econoom bij Google en emeritus professor aan Berkeley, de universiteit van Californië.

De grote databedrijven geven het voorbeeld

Bedrijven zoals Google, Facebook, LinkedIn en Netflix zijn de absolute koplopers in Data Science. Die weten als geen ander hoe je uit verkregen interne en externe data nieuwe waardevolle informatie kan maken. Zij zijn producenten van allerlei informatieproducten. Die creëren ze uit de data die al hun gebruikers hen (gratis) toevertrouwen.

Ook Amazon bewaart van elke aankoop de kopersinformatie. Ze weten daardoor waar nieuwe klanten waarschijnlijk nog meer naar op zoek zijn. Nog voordat die het zelf weten. Ze combineren al die interesses tot een dataprofiel per bezoeker. Een klant is een dataproduct dat continu nieuwe data genereert. En niet alleen mensen genereren data. Ook voorwerpen generen die bij de vleet. Camera’s registreren auto’s, we volgen postpakketjes wereldwijd met slimme tags en traceren mobiele telefoons continu.

De hoeveelheid data die voorwerpen genereren, is inmiddels velen malen groter dan de menselijke productie. De grote uitdaging bij Data Science is daar waarde uit te halen binnen de kaders van wet- en regelgeving.

Het is bijna science fiction wat we doen

"Het is bijna science fiction wat we met BI doen"Maar ook dichter bij huis levert Data Science management baanbrekende resultaten op. “Elie van Strien is commandant van het Brandweerkorps Amsterdam-Amstelland. Twee jaar geleden werd zijn korps tot Slimste Organisatie van Nederland gekozen, dankzij een baanbrekende BI-innovatie: Brandweer Intelligence. Dit jaar neemt Van Strien zitting in de jury van de verkiezing van de Slimste Organisatie van Nederland. Commandant Van Strien voelt zich een jongetje in de speelgoedwinkel van BI.” Lees verder…

Hoe creëer je waarde met Data Science?

De massa van al maar groeiende data heeft waarde. Veel waarde. Om die te verzilveren, ga je de verschillende datamassa’s op een slimme manier combineren en analyseren. Daarmee kun je dan nieuwe, waardevolle dataproducten of datadienstverlening creëren. Dat is in een notendop de uitdaging waar je met Data Science voor staat. Of het nu om aankopen gaat, of sensordata, zoekopdrachten, slimme meters of geluidsopnames van telefoongesprekken. Klanten en machines zie je een belangrijk onderdeel worden van een datageneratie-proces. We kunnen de omvang en impact ervan nog nauwelijks bevatten. Maar door het mixen van die verschillende interne en externe gegevensbronnen kan je komen tot compleet nieuwe en onverwachte inzichten.

Welke Data Science tools zijn er?

Tools voor Data ScienceWelk Data Science tools staan tot je beschikking om die nieuwe en soms onverwachte inzichten te maken? Waarmee kun je op dit moment kwantitatieve methoden als statistiek, machine learning en datamining toepassen?

Open source wordt steeds meer mainstream

In de opensourcewereld zijn veel ontwikkelingen op dit gebied gaande. Er wordt veel tijd gestoken in de verdere ontwikkeling van programmeertalen als R, Python en tools en platforms als Hadoop en RapidMiner.

  • R biedt vele verschillende statistische en grafische technieken zoals lineaire regressie en niet-lineaire modellen, klassieke statistische tests, tijdreeksanalyse, classificatie, clustering, et cetera. Het is redelijk eenvoudig uitbreidbaar ook door de objectgeoriënteerde opzet van R.
  • Python is een objectgeoriënteerd uitbreidbare programmeertaal met krachtige bibliotheken voor datamanipulatie en analyse.
  • Zowel R als Python kun je inzetten in combinatie met Hadoop en haar MapReduce routines.
  • RapidMiner is een platform waarvan slechts de kern open source is. Het biedt een geïntegreerde omgeving voor machine learning, text minig, datamining en predictive analytics.

Wie zijn de grote BI-spelers?

Ook de grote BI-spelers proberen zich te onderscheiden in deze nieuwe wereld van Data Science. Zo hebben SAS, IBM, Oracle, Microsoft en SAP allen statistische en datamining oplossingen en extensies in de markt gezet. SAS met EnterpriseMiner en Visual Analytics en IBM met SPSS en Watson Analytics zijn spelers om in de gaten te blijven houden.

Waarin onderscheidt een goede Data Scientist zich?

Wat maakt (of breekt) een goede Data Scientist?Allereerst verwacht je van een data scientist uiteraard de zogenoemde “harde vaardigheden”. Denk dan aan kwantitatieve vaardigheden als statistiek, machine learning en datamining. Maar ook de soft skills moeten wel degelijk aanwezig zijn.

1. Harde vaardigheden bij Data Science

Een data scientist heeft begrip van de wet van de hele grote getallen. Hoe groter de dataset, hoe kleiner de invloed zal zijn van vreemde uitschieters. Hij of zij heeft ook technisch inzicht en beschikt over een uitstekend begrip van het ontwerp en gebruik van databases en data lakes. Hij of zij heeft de attitude van een goede programmeur en hacker, vasthoudend, met oog voor detail. Hij of zij is in staat om te programmeren.

2. Zachte vaardigheden bij Data Science

Ook heeft de data scientist een juist begrip van de business. Hij of zij ziet de uitdagingen van zijn organisatie en welke rol data science daarbij kan spelen. Bij het selecteren van de optimale kwantitatieve techniek, moet je als data scientist rekening houden met de specifieke kenmerken van het business-probleem.

3. Analytische modellen selecteren

Typische eisen voor analytische modellen zijn:

  • actievermogen: in hoeverre kan het analytisch model het business-probleem oplossen?
  • prestaties: wat zijn de statistische prestaties van het analytisch model?
  • interpretatievermogen: kan je de werking van het analysemodel makkelijk verklaren aan beslissers?
  • operationele efficiëntie: hoeveel inspanning is nodig voor het opzetten, bouwen, evalueren en monitoren van het analytische model?
  • naleving van de regelgeving: is het model in lijn met de regelgeving en de ethiek?
  • economische kosten: wat zijn de kosten van het opzetten, bouwen, en het onderhouden van het model?

Met deze combinatie van eisen moet de data scientist in staat zijn de beste analytische techniek te selecteren om het business-probleem op te lossen.

4. Communicatieve vaardigheden

Daarnaast beschikt een goede data scientist over veelzijdige communicatievaardigheden. Hij of zij is een absolute teamplayer en heeft een aangeboren nieuwsgierigheid voor het verkennen en experimenteren met data science.

5. Complexe zaken vertalen voor gewone mensen

Hij of zij is in staat moeilijke complexe zaken te vertalen voor ‘gewone mensen’. Hij of zij slaat de brug tussen analytische modellen en de eindgebruiker. Data scientists maken adequaat gebruik van heldere datavisualisaties. Deze mensen hebben ook de neiging om sceptische en vasthoudende mensen te zijn. Ze stellen een heleboel vragen over de levensvatbaarheid van een bepaalde oplossing en of het wel echt zal werken. Nieuwsgierigheid en creativiteit zorgen ervoor dat de data scientist niet voor één gat te vangen is. Hij of zij bouwt uiteraard mee aan het snel ontwikkelende kennisgebied.

Bedenk een toepassing voor jouw datawetenschap

Net als bij Big Data is de belangrijkste stap het bedenken van een data science-toepassing. Je moet weten hoe je betere of snellere beslissingen (automatisch) kan nemen op basis van predictive analytics en datawetenschappen. Te vaak ligt hierbij de focus op de data en niet op wat het moet gaan opleveren. De eerder genoemde zachte vaardigheden in het Data Sciences-team moeten ervoor zorgen dat je deze valkuil kan vermijden.

Ook aan de slag met Data Science?

Wij hebben een flink aantal adviseurs en experts aan boord die veel ervaring hebben met Data Science en datawetenschap. Neem contact met ons op voor een oriënterende afspraak. Of informeer naar de mogelijkheden voor een Business Analytics opleiding of onafhankelijk advies.

neem contact met ons op

Plaats review

Geef je mening over dit product of deze dienst

Dit veld is verplicht!
Dit veld is verplicht! optioneel
Dit veld is verplicht! optioneel
Dit veld is verplicht! optioneel
Dit veld is verplicht!
Review verzendenHet formulier bevat fouten.

Een selectie van onze klanten

Word nu ook klant

Wil je ook klant bij ons worden? Wij helpen je maar wat graag verder met data science (tools voor data science) of andere zaken waar je slimmer van wordt.

Daan van Beek, Eindbaas Passionned Group

DAAN VAN BEEK MSc

Eindbaas Passionned Group

neem contact met mij op

Fact sheet

Aantal organisaties geholpen
3703
Aantal trainingen & workshops
3704
Aantal deelnemers opgeleid
3705
Gemiddelde klantervaring
8,9
Aantal consultants & docenten
3706
Aantal kantoren
3
Aantal jaren actief
14