Datavisualisatie
8 min leestijd

De 5 stappen van datavisualisatie

Menno Huisman

Digital director / Partner

De complexiteit van de wereld neemt in rap tempo toe. Mensen worden geacht om steeds meer te begrijpen in minder tijd. Niet in de laatste plaats komt dit door de overvloed aan data die dagelijks onze maatschappij binnenstroomt. En niet voor niets zijn er daarom steeds meer data-analisten nodig die zich vastbijten in deze data, op zoek naar informatie die leidt tot nieuwe inzichten voor specifieke vraagstukken. Maar bij data-analyse alleen houdt het niet op. Vaak vraagt de ontvangende kant dat data simpeler wordt gerepresenteerd, zodat men sneller inzicht krijgt in een bepaald vraagstuk, probleem of situatie. En dit is waar datavisualisatie om de hoek komt kijken. Het is de brug tussen data en design, en gaat over het maken van beslissingen wat te laten zien uit een dataset en hoe dit te laten zien. Bij Clarify hebben we een methode ontwikkeld waarmee we in 5 stappen tot goede datavisualisaties komen, die we in dit artikel graag uiteenzetten.

1. Informatieanalyse

Elke goede datavisualisatie begint met jezelf onderdompelen in de uitdaging: voor wie maak je het? Welke boodschap moet er overgebracht worden? Binnen welke context vindt dit plaats? Vervolgens is het tijd om de data te ontleden. Hiervoor is enige kennis van statistiek nodig. Tijd voor een opfriscursus!

Constantes vs. variabelen

Data bestaat uit constantes en variabelen. Constantes blijven, de naam zegt het al, constant door de tijd (bv. de netspanning in Nederland of het kookpunt van water). Variabelen echter kunnen wel degelijk veranderen (bv. temperatuur of snelheid). Door dit verschil te detecteren, kun je keuzes maken welke data meer of minder aandacht te geven in je visualisatie.

Kwalitatieve vs. kwantitatieve variabelen

Binnen variabelen kun je vervolgens kwalitatieve en kwantitatieve data onderscheiden. Kwalitatieve data zeggen iets over de kwaliteit van iets (bv. kleur of diersoort), terwijl kwantitatieve data iets zeggen over de hoeveelheid van iets (bv. temperatuur of snelheid). Dit geeft je houvast hoe je zaken kan weergeven in je visualisatie: in woorden of getallen, en wel of niet ondersteund met beeld.

Discrete vs. continue kwantitatieve variabelen

Binnen kwantitatieve variabelen zijn er discrete en continue variabelen te onderscheiden. Waar continue variabelen elk denkbaar getal kunnen aannemen, kunnen discrete dat alleen in stapjes (bv. aantal medewerkers binnen een bedrijf, er zijn immers geen halve medewerkers mogelijk ;) Ook dit geeft je een indicatie hoe je zaken kan weergeven: in absolute getallen, of toch beter turven?

Nominaal meetniveau vs. ordinaal meetniveau

Tot slot zijn er binnen datavisualisatie 2 verschillende meetniveaus voor variabelen mogelijk, een nominaal en een ordinaal meetniveau. Waar er bij een nominaal niveau geen onderlinge ordening te detecteren is tussen waarden van variabelen (bv. nationaliteit of bloedgroep), is dat er bij een ordinaal niveau wel degelijk (bv. junior, medior, senior). Bij variabelen met een ordinaal meetniveau zou je kunnen besluiten om een bepaalde hiërarchie te visualiseren, of ze in een bepaalde leesrichting achter elkaar te plaatsen.

Bij Clarify maken wij hier uiteindelijk een informatieanalyse van, die vaak bestaat uit een geordend datadocument.

"Datavisualisatie is de brug tussen data en design, en gaat over het maken van beslissingen wát te laten zien uit een dataset en hóe dit te laten zien."

2. Structuurschema

Na de informatieanalyse zet je de eerste stap naar een visuele opzet, het structuurschema. Dit is het skelet van de datavisualisatie waarin we dmv. ‘zoning’ bepalen wat waar komt te staan. Het structuurschema geeft inhoudelijk en visueel structuur en vormt de basis voor de stappen daarna.

Een leidraad voor het structuurschema is de 3-trapsraket Angle, Framing, Focus. Eerst bepaal je de invalshoek van je datavisualisatie (Angle). Dit is het meest persoonlijke deel: wat vind jij belangrijk om te laten zien? Welk accent wil je leggen? Vervolgens bedenk je hoe je de boodschap wil brengen (Framing). Met welke tekst en welke visuals? Tot slot bepaal je op welke delen van de visualisatie je de aandacht wil vestigen (Focus). Wat moeten mensen echt niet missen? En wat is ondersteunend, en kan daarom wat meer op de achtergrond staan?

3. Data-elementen

Nu de inhoud via een structuurschema vastligt, kun je aan de slag met de verdere invulling van de datavisualisatie. Met behulp van brainstormtechnieken zoals Mindmapping en Braindrawing stellen we onszelf de creatieve vraag hoe zaken het beste weergegeven kunnen worden (Framing). Ook denken we in deze fase de verhaallijn verder uit en bepalen de leesrichting van de datavisualisatie. Deze zijn belangrijk om je lezer gedoseerd door de data heen te leiden, zodat dit beter kan indalen en er uiteindelijk meer begrip ontstaat.

In de toolbox van datavisualisatie spelen wij doorgaans met de volgende data-elementen:

Getallen

Het meest voorkomende element in datavisualisaties, vooral geschikt voor continue kwantitatieve variabelen. In het juiste lettertype en grootte kun je getallen op een aantrekkelijke manier tonen in je datavisualisatie.

Lengte

Een alternatieve manier om kwantitatieve variabelen weer te geven is door middel van lengte. Een staafdiagram is hier het meest klassieke voorbeeld van, maar in feite kunnen alle soorten lijnen met of zonder krommingen dienen om waardes weer te geven. Door lengte als visueel element in te zetten zijn verschillende waardes sneller met elkaar te vergelijken.

Schaal

Naast lengte zijn kwantitatieve variabelen ook weer te geven als oppervlakken. Hoe hoger de waarde van de variabele, hoe groter het oppervlak in je datavisualisatie. Door schaal als visueel element in te zetten zijn verschillende waardes sneller met elkaar te vergelijken. In plaats van oppervlakken kun je ook iconen schalen om de waardes mee te tonen, waardoor je een nog aantrekkelijkere visualisatie maakt.

Turven

Turven leent zich vooral bij discrete kwantitatieve variabelen. Hiermee kun je in 1 oogopslag verschillende hoeveelheden tussen variabelen laten zien. En in plaats van turfstreepjes kun je ook iconen gebruiken, die aangeven welke variabele er wordt getoond.

Percentages

Heb je te maken met breukdelen, dan geef je dat doorgaans weer in percentages. Net als getallen kun je percentages aantrekkelijk tonen door het kiezen van het juiste lettertype en grootte. Ook kunnen percentages middels figuren zoals cirkeldiagrammen worden weergegeven.

Oppervlakken

Een bijzondere vorm van percentages in datavisualisaties zijn oppervlakken. Net als met percentages laat je hiermee breukdelen zien, waarbij alle vlakken samen 100% vormen. Het grote voordeel van deze weergave is dat het voor de lezer direct duidelijk is wat de onderlinge verhoudingen zijn tussen verschillende waardes.

Volgorde

Het simpelweg in volgorde zetten van verschillende waardes is ook een manier van datavisualisatie, voornamelijk bij variabelen met een ordinaal meetniveau. Door ze te rangschikken krijgt de lezer informatie over de hiërarchie tussen de waardes.

Kleur

Waardes van variabelen kun je ook met behulp van kleurcodering duidelijk maken. Vaak is er dan een legenda nodig om uit te leggen wat elke kleur betekent. Hou er wel rekening mee dat kleur altijd een dominante factor is in datavisualisaties. Bedenk daarom goed op welke data je de focus wilt leggen, en welke wellicht wat meer op de achtergrond kunnen staan.

Iconen

Iconen zijn breed inzetbaar binnen datavisualisatie, vooral daar waar er geen concrete getallen beschikbaar zijn (zoals bij kwalitatieve variabelen). Veel van de hiervoor genoemde visuele elementen kun je in dergelijke gevallen niet gebruiken, terwijl iconen hier direct de variabelen kunnen representeren of ondersteunen.

Netwerken

Een bijzondere vorm van datavisualisatie zijn netwerken. Hierbij visualiseer je niet zozeer waardes van variabelen, maar onderlinge verbanden tussen entiteiten (vaak constantes). Door deze entiteiten weer te geven als stippen of iconen, en daartussen lijnen te trekken, visualiseer je hoe ze zich tot elkaar verhouden en vormt het geheel een netwerk.

4. Visueel ontwerp

In deze fase werk je de datavisualisatie uit in de gekozen visuele stijl. Waar je in de vorige stap bezig was met de Framing van je datavisualisatie, richt je je bij het visueel ontwerp op het Focus-aspect. Door middel van vorm, grootte en kleurgeving van je visuele elementen bepaal je waar de focuspunten komen te liggen. Hiermee heb je ook nog een zekere invloed op de leesrichting van je datavisualisatie.

In deze fase komt doorgaans ook de ‘branding’ van je klant om de hoek kijken. Ben je gebonden aan bepaalde typografie, kleuren en andere huisstijlelementen? Dan is dit het moment om deze te implementeren, waarbij je de balans bewaart tussen een functionele leesbare datavisualisatie en een esthetisch eindresultaat dat past bij de klant.

5. Interactiviteit

In het geval van een interactieve datavisualisatie wordt het ontwerp vervolgens omgezet naar front-end code. Deze omvat alle zichtbare elementen van de datavisualisatie en zorgt ervoor dat de gebruiker hiermee kan interacteren. Het grote voordeel van het toevoegen van interactiviteit is dat de data nóg gedoseerder kan worden getoond. Zo kun je bijvoorbeeld met behulp van toggles, radio buttons, checkboxes, dropdowns, tabbladen en zoekvelden de gebruiker de keuze geven welke data wel en niet wordt getoond. Feitelijk fungeren ze allemaal als een filter op de data. Deze manier van ‘zoeken’ in de data wordt ook wel ‘faceted search’ genoemd. Hierdoor kan de gebruiker zelf ‘spelen’ met de data, waardoor de data beter indaalt en begrepen wordt. Dus heb je de mogelijkheid en middelen om je datavisualisatie interactief te maken, ga er dan voor! Uiteraard kunnen wij je hierbij ook helpen.

Happy data viz!

"Door interactiviteit toe te voegen kan de gebruiker zelf ‘spelen’ met de data, waardoor deze de data beter tot zich neemt en doorgrondt."

Meer weten over datavisualisatie?

Wij leggen er graag meer over uit en bekijken samen hoe je dit het beste voor jouw project in kunt zetten.

Neem contact op