Blogs
5 december 2024

Het schaap met de vijf poten

Blogs

Dit is een oude blog van ons, geschreven door Pleuni Burg (2019). We vonden het echter een leuk onderwerp, nog steeds relevant. Dus nog een keer geplaatst.

“Heb jij een Master of PhD diploma op het gebied van data science en breng jij uitstekende verbindende communicatieve vaardigheden mee? Dan zijn wij op zoek naar jou! We zoeken iemand met minstens 5 jaar ervaring, en die de weg kent in Spark, Hadoop, Hive, Pig, SQL, Python, R, Tensorflow, NLP én machine learning technieken. Daarnaast moet je gestructureerd kunnen werken in multidisciplinaire teams en creatief kunnen omgaan met organisatieveranderingen.” Een typische vacature voor een data scientist. Maar is dit niet wat teveel gevraagd?

Data scientist werd een aantal jaar geleden door Harvard Business Review uitgeroepen tot het meest sexy beroep. Sindsdien is de populariteit van de data scientist gestegen, zo laat ook google trends zien. Een oorzaak hiervan kan zijn dat de ontwikkelingen op het gebied van data science zo snel gaan, waardoor het tekort aan geschoolde data scientisten alleen maar groter en groter wordt. Met als gevolg: werkgevers zijn op zoek naar een data scientist, maar kunnen deze maar lastig vinden. En werknemers willen een data scientist zijn, maar hebben de kwaliteiten niet. Ook het onvermijdelijke gat tussen opleiding en arbeidsmarkt – waar de inhoud van de opleiding niet nauw genoeg aansluit op de inhoud van het bedrijfsleven – draagt niet bij aan het opvullen van dit tekort [2]. De data scientist is het schaap met de vijf poten geworden. Hij moet de functie van een geheel team van ethische hackers, engineers en analisten in zijn eentje vervullen.

De cijfers geven de zoekinteresse op Google aan op de zoekterm “data scientist” ten opzichte van het hoogste punt in het diagram voor de afgelopen 5 jaar. Een waarde van 100 is de piekpopulariteit voor deze zoekterm. Een waarde van 50 betekent; half zo populair.

Een organisatie zou zich goed moeten afvragen waarom zij een data scientist wil inhuren of werven. Is dit louter voor een korte tijd -dus voor een enkel project- of is dit voor een structurele probleemvraag. Ten tweede zal een werkgever nauwkeurig moeten afbakenen over welke kwaliteiten de data scientist moet beschikken. Om die vraag te beantwoorden zal de werkgever exact moeten weten hoe de functie bekleed moet worden. Vaak wordt er door een organisaties gezocht naar een data scientist die voldoet aan het volledige profiel, met zoveel kwalificaties waar niemand aan kan voldoen [2]. Hierdoor kunnen veel goede mogelijke sollicitanten afvallen.

Een andere reden wat het inhuren of werven van een data scientist complex maakt, is het feit dat de goede, ervaren data scientisten al zijn weggekaapt door de grote bedrijven. Welke ook nog eens een hoog salaris kunnen bieden. Volgens Paysa gaat het gros van de generatie data scientisten die van de universiteiten afkomt, werken voor grote bedrijven zoals Google, Microsoft of Amazon [3]. Er blijven dus maar weinig potentiële, ervaren werknemers over voor de wat minder grote bedrijven.

Een ander opmerkelijk gegeven is dat een gemiddelde senior functie al start bij 3 jaar werkervaring. Om tot expert benoemd te worden, wordt bij de meeste andere senior functies toch minstens 5 jaar werkervaring verwacht. Waaruit je zou op kunnen opmaken dat óf data scientisten zich kwalitatief sneller ontwikkelen dan in welk ander vakgebied dan ook. Óf dat door het tekort aan ervaren data scientisten de functie-eisen naar beneden zijn gesteld. De laatste lijkt mij meer plausibel.

Het werk van een data scientist kan in globale lijnen opgedeeld worden in beschrijvende statistiek; het vinden van relaties tussen meerdere variabelen en het creëren van (zelflerende) algoritmes. Wat over het algemeen niet bij de werkzaamheden van een data scientist hoort, zijn data engineering, data architectuur, projectmanagement en IT implementatie onderdelen. Desalniettemin zijn deze disciplines wel op bijna ieder data vraagstuk van toepassing en dat is tevens de reden waarom een data scientist niet in zijn eentje kan opereren, maar zich thuis voelt in een team.

Daarnaast is er ook een wezenlijk verschil tussen een data scientist en een BI specialist. Een BI specialist is namelijk over het algemeen gefocust op het generen van management informatie en het visualiseren van data om dit vervolgens te rapporteren aan het management. De conclusies zijn gebaseerd op het verleden en niet op de toekomst, waar een data scientist gebruik van maakt.

Er is geen gouden standaard voor het profiel van een data scientist. Een data scientist is in de eerste plaats een wetenschapper, zoals de naam al zegt. Daarnaast moet hij of zij kennis hebben van programmeertalen, statistisch vaardig zijn en het kunnen ontwikkelen van voorspellende modellen en algoritmes. Hoe dit profiel precies moet worden ingevuld, is per organisatievraagstuk verschillend. Er zijn veel verschillende programmeertalen en er is veel keuze uit technieken en tools die ingezet kunnen worden. Verwacht dus ook niet dat iedere data scientist ervaring heeft met dezelfde technieken en tools. Aan de andere kant kunnen veel tools en technieken gemakkelijk worden aangeleerd, mits de basiskennis aanwezig is.

Waar ik zelf tegen aanliep toen ik opzoek was naar een baan als data scientist, was hetgeen dat ik niet voldeed aan het volledig gezochte profiel. Ik werd een aantal keer afgewezen omdat hun gezochte plaatje – met de waslijst aan kwaliteiten – niet matchte met mijn ervaring en vaardigheden. Nu, twee jaar later, word ik regelmatig – soms wel wekelijks – benaderd door recruiters en headhunters die mij maar al te graag willen wegkapen. Zij vinden mij via LinkedIn, en hopen dat ik wil werken door heel Nederland tegen maar al te fijne arbeidsvoorwaarden. Ik sta hier licht sceptisch tegenover; weten zij wel waar de desbetreffende organisatie naar op zoek is, en weten zij wat te verwachten van mij?

Naast het hebben van de juiste kwaliteiten, moet een organisatie ook voorbereid zijn op het plaatsen van een data scientist. Het CBS stelt dat slechts een klein deel van het midden- en kleinbedrijf (mkb) klaar zijn voor het toepassen van big data in hun bedrijfsprocessen [4]. Als een mkb hier nog niet voor klaar is, dan betekent dat vaak dat er eerst nog een digitalisatie omslag plaats moet vinden, of dat er weinig ruimte is voor innovatie. Wanneer dit laatste het geval is, kan er getoetst worden bij een extern bedrijf of er waarde zit in de beschikbare data. Dit scheelt enorm veel in investeringen voor het aannemen van een geheel team, waardoor er uiteindelijk een hoop geld bespaard kan worden.

Wanneer een organisatie op zoek is naar een data scientist, vergeet dan niet dat deze niet alleen kan opereren, de vraag groot is en het aanbod klein is en dat je goed moet weten naar wie je opzoek bent en waarom. Het data science schaap met de vijf poten vinden, is zoeken naar een speld in een hooiberg.

[1] Davenport, T.H. & Patil, D.J. (2012) Data Scientist: The Sexiest Job of the 21st century. Harvard Business Review, 70-76.

[2] Yap, A.Y. & Drye, S.L. (2018). The Challenges of Teaching Business: Analytics: Finding Real Big Data for Business Students. Information Systems Education Journal (ISEDJ), 16(2), 41-50.

[3] Paysa Team (2017). Top colleges in tech. https://www.paysa.com/blog/top-colleges-in-tech/

[4] CBS. (2016). Is het mkb klaar voor big data? https://www.cbs.nl/nl-nl/onze-diensten/innovatie/project/is-het-mkb-klaar-voor-big-data-%20

Meer blogs

Blogs
23 januari 2025

ISO-certificering: waarborgen van kwaliteit en informatiebeveiliging bij TwentyNext

Cases
23 januari 2025

Hoe innovatieve technologie bijdraagt aan een gezond begin: meten van schedel-deformatie

Cases
10 januari 2025

Microsoft Copilot, een AI-gestuurde assistent die voor je klaar staat om je te ondersteunen en je werk te verlichten

Samen uw project realiseren?

Twentynext is expert op gebied van Data Engineering, Data Science, Business Intelligence en Artificial Intelligence. Wij zijn niet uniek in wat we doen, wel in hóe we het doen.
Bij TwentyNext zijn we altijd klaar voor een nieuwe uitdaging. Neem vrijblijvend contact met ons op!
Martijn van Grieken
Director AI Development

Naam
Partner up

Samen jouw project realiseren?

Twentynext is expert op gebied van Data Science en AI. Wij zijn niet uniek in wat we doen, wel in hóe we het doen.
Bij TwentyNext zijn we altijd klaar voor een nieuwe uitdaging. Neem vrijblijvend contact met ons op!
Martijn van Grieken
Director AI Development

Naam

Contact

088-2762345
KVK: 61854859
BTW: NL854518046B01

Locatie

Kennedytoren
Kennedyplein 246
5611 ZT Eindhoven