Welkom in de Digitale Wereld

Tegenwoordig kun je digitaal alles met iedereen delen. Als Young Professionals van Breinstein en Trainee.nl worden wij daar erg blij van! Maar we maken ons ook zorgen... want dat dit ook nadelen met zich meebrengt is duidelijk.
Het zijn uitdagingen waar iedereen - bedrijf of individu - mee te maken heeft. Op dit platform delen wij onze kennis. Je leest hier alles over data science, cyber security, informatiemanagement en de nieuwste tools & apps.

Hét platform omtrent
data science
cyber security
tools & apps
informatiemanagement
Data Science
Corona in Nederland: de huidige cijfers -Dashboard

Gedurende deze corona-crisis wordt over de gehele wereld allerlei data bijgehouden. Denk maar aan verspreiding, aantal geïnfecteerd, aantal doden etc. Ook in Nederland is hier veel over te vinden. Om een duidelijk overzicht te krijgen  van de cijfers in Nederland is hier een dashboard voor gecreëerd. Verschillende grafieken geven de huidige cijfers betreffende corona in Nederland overzichtelijk weer.

Het dashboard bevat:
• De algemene sterfte en infectie cijfers.
• Aantal mensen positief getest op corona per leeftijdsgroep in Nederland.
• Man/Vrouw verdeling positief getest op corona.
• Corona gevallen per provincie.
• Corona verspreiding per gemeente.
• De verspreiding in de maand maart (eerste maand) per gemeente per aantal en per 100.000 inwoners.

Klik hier voor het dashboard.

Verder lezen

Laatste topics

Bij de Digitale Wereld informeren we je graag over alle trends en ontwikkelingen waar digitaal werkend Nederland mee bezig is. Omdat we tijdens onze traineeships dagelijks met digitale middelen aan het werk zijn, gebruiken we onze eigen ervaringen om het laatste nieuws met jou te delen. Wat speelt er momenteel als gaat om data science? Met welke cyber bedreigingen moeten we rekening houden? Wat zijn de laatste ontwikkelingen op het gebied van informatiemanagement? En welke nieuwe tools & apps mag je absoluut niet missen? Hier houden we je continu op de hoogte!

Bekijk alle artikelen
Cyber Security
Baseline Informatiebeveiliging Overheid (BIO)

De Baseline Informatiebeveiliging Overheid (BIO) is een baseline voor overheidsorganisaties waarin een basisniveau voor informatiebeveiliging wordt gesteld. Het doel van de BIO is om de beveiliging van informatie(systemen) bij alle bestuursorganen van de overheid te bevorderen. Hiermee beoogt de BIO een vertrouwen te creëren dat alle onderdelen van de overheid onderling uitgewisselde gegevens in lijn zijn met de wet- en regelgeving en dus correct beveiligd zijn. Het basisniveau geeft een ondergrens aan, waarbij alle maatregelen uit de baseline moeten worden geïmplementeerd om aan deze ondergrens te voldoen.

Ontstaan van de BIO

De BIO komt voort uit een aantal sectorale baselines, waaraan specifieke bestuurslagen van de overheid zich moesten houden. Zo bestond er een Baseline voor het Rijk (Baseline Informatiebeveiliging Rijk), een baseline voor provincies (Interprovinciale Baseline Informatiebeveiliging), een baseline voor gemeenten (Baseline Informatiebeveiliging Gemeenten) en een baseline voor Waterschappen (Baseline Informatiebeveiliging Waterschappen). Voorheen had iedere overheidslaag dus een eigen baseline, maar met de BIO is een begin gemaakt aan een centrale baseline voor de gehele overheid. Door een centrale baseline kunnen verschillende keten van overheden en andere partijen betere afstemming vinden en betere aansluiting bij internationale regelgeving.

Structuur van de BIO

De BIO is opgedeeld in drie delen. Het eerste deel beschrijft het uitgangspunt van de overheid omtrent informatiebeveiligingskaders de structuur van het document, de basis beveiligingsniveaus (BBN) en verantwoording van de BIO in overheidsorganisaties. In dit deel van de BIO is het voor organisaties voornamelijk van belang om de basisbeveiligingsniveaus te begrijpen. Het eerste basisbeveiligingsniveaus (BBN1) beschrijft wat er minimaal verwacht wordt van overheidssystemen op het gebied van informatiebeveiliging. Echter neemt de BIO BBN1 niet als uitgangspunt, maar BBN2. BBN2 vormt een aanvulling op BBN1. Zo moet nog steeds worden voldaan aan de BBN1, maar zal in het geval van BBN2 nog aanvullende maatregelen genomen moeten worden. Deze BBN2 is aan de orde als:

  • Er vertrouwelijke informatie wordt verwerkt;
  • Mogelijke incidenten leiden tot bestuurlijke commotie;
  • De veiligheid van andere systemen afhankelijk is van de veiligheid van het eigensysteem.

BBN3 gaat nog een stap verder en is aan de orde als:

  • Verlies van informatie een grote impact heeft, waarvan niet uit te leggen is als deze niet gerubriceerd is en beschermd wordt op BBN3;
  • Informatie met een rubricering (niet zijnde BBN2) wordt geleverd door derden;
  • Aansluiting op een infrastructuur BBN3 is vereist om informatie te kunnen verwerken op deze infrastructuur (bijvoorbeeld om al op de infrastructuur aanwezige gerubriceerde informatie niet in gevaar te brengen).

Het tweede deel van de BIO beschrijft hoe een BBN-toets kan plaatsvinden. Deze toets is bedoeld om het juiste basisbeveligingsniveau (BBN) te bepalen en wordt voor ieder bedrijfsproces uitgevoerd. In de BIO wordt BBN2 als uitgangssituaties gebruikt en daarom is de eerste stap om te bestuderen of BBN2 voldoende is. Na het bepalen van de BBN wordt bestudeerd welke controls moeten worden doorlopen en per control wordt bepaald welke aanvullende maatregelen nodig zijn. De BIO houdt de nummering van de ISO 27002 aan om het zo overzichtelijk mogelijk te houden voor overheidsorganisaties en andere betrokken partijen die hiermee te maken hebben.

Het derde en laatste deel is een addendum, waarin alle eisen genoemd worden die specifiek en verplichtend zijn voor een bepaalde overheidslaag. Tevens worden hierin andere aanvullingen gemaakt die elders in de BIO niet goed paste. Dit deel geldt dus voor de meeste overheidsorganisaties niet.

Toekomst van de BIO

In de toekomst moet er worden nagedacht over de hoe de BIO in de praktijk wordt gebruikt en functioneert. De BIO moet namelijk geen doel op zichzelf worden. De BIO vormt een middel om het doel van een veilige omgang met informatie bij alle bestuursorganen van de overheid te bewerkstelligen. Wanneer organisaties een risico-analyse uitvoeren en hieruit blijkt dat bepaalde aspecten uit de BIO niet noodzakelijk zijn voor deze organisatie, moet er ook de mogelijkheid blijven om deze niet na te streven. In de huidige praktijk kan het voorkomen dat organisaties bezig zijn met risicomanagement en concrete maatregelen hiervoor nemen, maar nog steeds worden afgestraft omdat zij niet alle maatregelen uit de BIO volgen.

Verder lezen
Judith van Veen
11/20/2020
Leestijd:
10 minuten
Data Science
Waarom wordt data belangrijk in het voetbal?   

Door de jaren heen is er wereldwijd steeds meer data beschikbaar. De afgelopen jaren heeft data ook zijn intrede gedaan in de sportwereld en de waarde hiervan mag niet worden onderschat. Tien jaar geleden waren er nog geen apps zoals Runkeeper om je hardlooprondes in kaart te brengen of activity trackers waarmee we onze stappen tellen. Tegenwoordig volgen camerasystemen de posities van spelers in het veld, dragen topsporters sensoren onder hun sportkleding en worden er applicaties ontwikkeld om inzicht te krijgen in blessurerisico’s. Wanneer je al deze data tot je beschikking hebt, kan dat natuurlijk in je voordeel werken. Echter bereik je dit voordeel alleen als de beschikbare data waardevol wordt gebruikt door het op de juiste manier te interpreteren en analyseren. De vraag naar sportanalisten bij sportclubs neemt daarom toe. Er worden vandaag de dag steeds vaker afdelingen opgezet bij sportclubs die gericht zijn op het analyseren van statistieken en data om zo concurrentievoordeel te behalen ten opzichte van andere clubs.  

De opkomst van data in sporten

Dat de wereld van data en sport steeds meer naar elkaar toe groeit blijkt uit het toenemende aantal initiatieven. De eerste initiatieven van data in de sport laten veelbelovende resultaten zien. Zo liep bijvoorbeeld de Keniaan Eliud Kipchoge de snelste marathontijd ooit door het juiste parcours uit te zetten om geen snelheid te verliezen en uit de wind te blijven. Of wat dacht je van de voetbalclub FC Midtjylland? Deze club werd met behulp van data kampioen van Denemarken. Bij dit laatste initiatief moet je misschien al snel denken aan de film ‘Moneybal’, waar de eigenaar van de Oakland Athletics met een beperkt budget op basis van statistieken een honkbalteam van ondergewaardeerde spelers bij elkaar koopt. Tegen alle verwachtingen in wonnen ze dat jaar de competitie. Deze initiatieven laten zien dat data kan worden gebruikt bij onder andere het kopen van spelers en de samenstelling van teams waardoor je de prestaties van een team en individuele sporters kunt verbeteren.  

Tracking systemen  

Om data te verzamelen wordt er in de voetbalwereld gebruik gemaakt van tracking systemen om gegevens van spelers te verzamelen. Deze statistieken worden vervolgens gebruikt om de presentaties van zowel het team als individuele spelers te verbeteren en ontwikkelen. De eerste tracking-systeem-methode heet optical tracking. Bij deze methode worden camera’s langs de voetbalvelden geplaatst en worden alle bewegingen vastgesteld. Iedere 10 seconden wordt de locatie van een speler en de bal op de x- en y-as van het veld gemeten. Dat levert per wedstrijd zo’n 2 tot 3 miljoen datapunten op waarmee sportanalisten aan de slag kunnen. Met deze ingewonnen data wordt event data vastgelegd. Hierin worden alle doelpunten, assists, doelpogingen, tackles, passes, dribbels en balveroveringen in kaart gebracht. De tweede methode heet LPM (local position measurement). Spelers dragen onder hun shirt een zender om de looplijnen, de ruimtes tussen de spelers en het aantal afgelegde meters in het veld vast te leggen. Dit systeem wordt niet alleen in het voetbal gebruikt, maar ook bij het schaatsen om de bewegingen van schaatsers vast te leggen. Een groot voordeel van deze manier van meten is dat je ook de mogelijke blessurerisico’s kunt inschatten.  

Data mining en algoritmes 

Door middel van eerdergenoemde tracking systemen is bergen aan data verzameld in het voetbal. Er ligt echter een uitdaging om met deze data aan de slag te gaan. Voetbal is in vergelijking met bijvoorbeeld honkbal een veel complexere sport. Er gebeuren namelijk ontzettend veel dingen tegelijk op het veld: de posities zijn flexibel, balbezit is niet beschermd en er wordt veel minder gescoord. Maar toch kun je statistieken gebruiken in het voetbal en daarom is de techniek ‘data mining’ een logische stap. Door gebruik te maken van deze techniek kan een computer vaststellen waar in de data interessante patronen opduiken. Door met algoritmes te werken, kan er continu worden afgewogen welke combinaties lijken te werken, maar ook of die vaak genoeg voorkomen om relevant te zijn. Tactische verbeteringen kunnen doorgevoerd worden in het spel dankzij deze informatie. Echter, de context waarin dit wordt toegepast blijft belangrijk. Het patroon kan bijvoorbeeld overduidelijk aangeven dat de bal in de hoeken van het speelveld moet komen. Maar wat de computer met deze patronen ontdekt, is geen spontane spelsituatie: het zijn corners. Ondanks dat deze informatie weinig toevoegt, bevestigt het wel dat het algoritme werkt.   

Sport-dataplatforms  

Door de opkomst van grote hoeveelheden aan data in de sport, moet men waken voor een overload aan informatie. Het is belangrijk om hier de relevante inzichten uit te halen. Hier komen sport-data platforms aan bod die het mogelijk maken om data integraal te verzamelen, slim te analyseren en te delen met anderen. Deze data kan gevisualiseerd worden aan de hand van dashboards. Door middel van een tool zoals soccerlab kunnen coaches, sportteams en sporters zelf data inzien en dit gebruiken om slimmer te sporten, bruikbare feedback te verkrijgen en prestaties te verbeteren. 

Het belang van data in het voetbal

De ontwikkelingen op het gebied van data-analyse hebben niet stilgestaan. Kunstmatige intelligentie (AI), data science en machine learning hebben hun intrede gemaakt in de sportwereld. Door gebruik te maken van deze technieken kunnen onzichtbare ontdekkingen worden gedaan en voorspellingen worden gemaakt. Deze ontwikkelingen zorgen voor verbeteringen in:  

  • De prestaties van spelers;
  • De speelkwaliteit van een team; 
  • De individuele risico’s voor blessures;
  • Waardoor concurrentievoordeel behaald kan worden.

Iedereen kan data verzamelen, maar als men niet in staat is om de betekenis uit te leggen achter hoe dit een speler, het team of de club kan helpen verbeteren, dan is de data nutteloos.  

Verder lezen
Michiel van der Lee
11/30/2020
Leestijd:
5 minuten
Tools Apps
Het kiezen van de juiste online cursus – tips en valkuilen

Als er iets is wat de coronacrisis nu al heeft bewezen is het dat fysieke aanwezigheid lang niet altijd nodig is om verbonden te blijven met de wereld, met name als het gaat om werk en productiviteit. En als we kijken welke digitale middelen ons thuis net zo productief maken als op kantoor, staat de online cursus (ook wel distance education of E-learning) zeker hoog op deze lijst. De eerste echte online cursus met vrije en ongelimiteerde deelname (massive open online course of MOOC) werd in 2008 gegeven en sindsdien is er keuze uit duizenden van dit soort cursussen, op tientallen websites. Het is makkelijk om in dit immense aanbod te verdwalen; daarom volgt hier een korte gids voor het vinden van jouw ideale platform.

Figuur 1. Een overzicht van een aantal bekende online learning platforms. Bron: DataCamp (https://www.datacamp.com/community/blog/datacamp-reason-why)

De eerste golf

Om te beginnen zijn er de klassieke aanbieders van MOOC’s, die veelal zijn ontstaan vanuit (of in nauwe samenwerking met) universiteiten en (hoge) scholen, en die hun aanbod opgezet hebben zoals het bestaande academisch curriculum. Bekende voorbeelden zijn Coursera, Udacity en EdX, allen begonnen met het aanbieden van cursussen in 2012, tijdens de eerste golf van online education (1,2). Deze platformen hebben veel cursussen (de genoemde voorbeelden anno 2020 elk zo’n 2,000-3,000) die elk domein omspannen die je op een fysieke onderwijsinstelling kan vinden; van filosofie tot biologie, en natuurlijk ook datawetenschappen of het leren van verschillende programmeertalen. Wat mij vooral opvalt op dit soort platformen is dat wanneer je zoekt naar bijvoorbeeld een cursus Python, ik vaak veel zoekresultaten kreeg. Dit lijkt gunstig, maar ik kwam er al snel achter dat dit veel cursussen zijn van verschillende universiteiten en er mede daardoor veel overlap bleek te zitten in het getoonde aanbod. Ik zag door de bomen het bos niet meer en vroeg me constant af of ik wel met de juiste cursus bezig was.

Waar ik verder geen rekening mee had gehouden is dat de cursussen die je zult vinden in sommige gevallen bedoeld zijn om over meerdere weken of maanden te volgen. Net zoals de ‘analoge’ tegenhanger van zo’n cursus, dien je je vaak aan te melden (enrolling) en soms zul je nog een tijdje moeten wachten op de start van de cursus, of het volgende ‘college’. Als je in een korte tijd een specifieke vaardigheid wilt leren zou dit wel eens lastig kunnen worden, tenzij je genoegen kunt nemen met meer gedateerde cursussen die je (deels) moet volgen. In mijn ervaring hebben veel cursussen op online platformen uit deze eerste golf weinig interactie tussen de aanbieder en student, en is de moeilijkheidsgraad van de cursussen vrij uiteenlopend en vooraf niet makkelijk te bepalen. Of dit een probleem is ligt natuurlijk aan de student, maar het kan ervoor zorgen dat mensen overweldigd raken of juist hun tijd aan het verdoen zijn met te makkelijke opdrachten.

De tweede golf

Veel websites die later zijn ontstaan behoren tot de tweede golf van online lesgeven en nemen een meer verticale aanpak – minder domeinen om uit te kiezen maar met een groter aanbod van cursussen binnen een domein, die meer de diepte in gaan en vaak meer up-to-date zijn dan de eerdergenoemde cursussen (3). Duidelijke voorbeelden hiervan zijn DataCamp voor datawetenschappen, en Codecadamy en Sololearn voor programmeren. Met name Sololearn laat zien wat de verticale aanpak inhoudt, de lesstof is (net zoals bij het bekende Duolingo) als een verticale ‘boom’ gepresenteerd waarbij je met het behalen van een vaardigheid pas de volgende les kunt ontgrendelen. Je hoeft je nu niet meer druk te maken of je de juiste cursus kiest.

Veel platformen hebben ook een app (zowel Android als iOS) die niet alleen zorgt voor een mobiele manier om cursussen te volgen maar je ook een herinnering geeft als het tijd is om een bepaalde vaardigheid te oefenen, om er zo voor te zorgen dat je de informatie niet vergeet. En ook al lijkt het soms wat kinderachtig, in mijn ervaring is het belangrijk om zo’n app te hebben. Samen met een mogelijkheid om de voortgang te kunnen volgen, bijvoorbeeld door het behalen van een certificaat of het verdienen van punten (experience) voor het goed hebben van een antwoord of het maken van een project, zorgen ze voor een betere binding met de lesstof.

Om mij goed voor te bereiden op het traineeship heb ik uiteindelijk vooral gebruik gemaakt van DataCamp. Er zijn een aantal redenen waarom deze aanbieder voor mij goed heeft gewerkt, namelijk;

  • Een erg compleet aanbod van cursussen binnen de datawetenschappen zonder veel onderlinge overlap, waardoor onnodige herhaling weinig voorkomt.
  • Bijna alle cursussen duren 4-6 uur en het is duidelijk welke vaardigheden je in die tijd zult leren.
  • Uitdagende oefeningen met vaak interessante casussen.
  • Alle software is geïntegreerd in de website en je hoeft niets te installeren op je eigen PC. Dus R, Python en SQL werken naadloos in je browser en als je een cursus Power BI begint, krijg je toegang tot een virtuele Windows installatie om dit programma te draaien.  

Bij andere aanbieders ging het vaak mis voor mij. Sommige cursussen miste bijvoorbeeld diepgang en uitdaging in de oefeningen (e.g. Sololearn), waar anderen er niet in slaagden om specifieke vaardigheden aan te leren in kortere tijd, vooral doordat de cursussen vrij algemeen bleven (e.g. Coursera).

Door het grote aanbod is het moeilijk om alle aanbieders inhoudelijk te beoordelen; je zult immers weinig mensen vinden die meer dan een handjevol langdurig hebben geprobeerd, laat staan een goed overzicht hebben van de kwaliteit van de tientallen verschillende data science cursussen die online te vinden zijn. Veel mensen die willen beginnen met online cursussen zullen mede hierdoor geneigd zijn om te kijken naar de prijs. En hoewel de betaalde diensten er waarschijnlijk meer gelikt uitzien en soepeler werken, is het niet gezegd dat ze inhoudelijk beter zijn of – misschien nog belangrijker – aansluiten bij jouw wensen en niveau! Wel interessant om te zien is dat waar traditionele MOOC’s doorgaans een slagingspercentage van zo’n 5-15% hebben (4,5), dit bij Codecademy rond de 28% ligt en bijvoorbeeld DataCamp erin slaagt om 30-80% van de studenten hun cursussen te laten afronden (6). De variatie in deze laatste percentages zit hem in het feit dat betaalde cursussen doorgaans een veel hoger slagingspercentage hebben dan gratis varianten. Want hoewel je op veel platformen gratis kunt beginnen met leren, zul je in de regel moeten betalen voor bijvoorbeeld certificaten, (het afmaken van) meer geavanceerdere cursussen en toegang tot de helpdesk.

Voordat je begint

Mijn tip voor iedereen die op zoek is naar het beste online platform om te leren programmeren, vraag jezelf het volgende af: Vind je het fijn om meer traditioneel onderwijs te volgen met colleges en vele uren aan lesstof verspreid over meerdere weken? Ga dan voor de meer traditionele aanbieders uit de eerste golf. Bepaal je liever je eigen tempo, en vind je het fijn om ook tussendoor af en toe een korte opdracht of oefening te maken en zo in korte tijd een vaardigheid te leren? Kijk dan naar de wat nieuwere platformen uit de tweede golf, die vaak ook meer zijn toegespitst op de datawetenschappen. En heb je al ervaring in een bepaald gebied? Kijk dan vooral naar de mogelijkheid om je kennis te toetsen (e.g. assessment of shortcuts) om op een hoger niveau in te stromen bij een bepaalde cursus. Succes!

Bronnen:

Verder lezen
Friso Dekker
9/30/2020
Leestijd:
10 minuten