Het verzamelen, bewerken en opslaan van gegevens is essentieel om deze data in jouw business te kunnen toepassen. Wij helpen organisaties met het kiezen van de juiste architectuur

Data Architecture

Ontdek hoe

Wil je beter inzicht verkrijgen in de resultaten van je bedrijf of marketinginspanningen? Een goede Data Architecture kan je daarbij helpen. De architectuur richt zich op het toepassen van de juiste tools en services, de Data Technology Stack, om data te kunnen verzamelen uit diverse bronnen en deze vervolgens te kunnen combineren, structureren en organiseren, zodat het gebruikt kan worden in Dashboards, Analyses en Science.

i-spark helpt bij het maken van de juiste keuze voor en het implementeren van de juiste tool(s), afgestemd op de doelen van jouw organisatie. Heb je al een tool of platform gekozen en wil je hulp bij de inrichting? Ook daarvoor ben je bij ons aan het juiste adres!

“Het verzamelen en vervolgens bewerken van data is erg belangrijk. Schone, betrouwbare data vanuit diverse bronnen is nodig om goede inzichten te kunnen geven. Een op maat gemaakte Data Stack is daar voor de fundering.”

— Jeroen

Wat is een Data Architecture?

Het belangrijkste doel van een data stack is ervoor te zorgen dat de data, afkomstig uit vele bronnen, accuraat en consistent is zodat de resultaten van analyses en visualisatie betrouwbaar zijn. De Stack bestaat uit diverse lagen, waarbij op maat gekozen tools en platformen van belang zijn om data van de bron naar eindresultaat te laten stromen volgens de requirements van jouw data vraag. Het aantal in te zetten tools is eindeloos, zie ook de afbeelding hieronder. Binnen i-spark maken we veelal gebruik van een voorkeur aan tools en platformen, maar dit is zeker niet gelimiteerd tot deze tools. Zie ook Inrichting & Implementatie

Data Technology Stack
De gelaagdheid van een Data Stack en een selectie van tools/platformen in de lagen

Data Storage & Platforms

De onderste laag van de stack is de opslag van data zelf. Dit is de ruwe data die opgeslagen zit in allerlei bronnen zoals bijvoorbeeld SQL en NoSQL databases, datawarehouses en data lakes. Deze bronnen bevinden zich veelal in de cloud (zoals AWS) of natuurlijk bij de klant zelf. De data uit deze bronnen kunnen worden ontsloten door directe koppelingen op bijvoorbeeld databases, maar ook via bijvoorbeeld API’s. In het geval van online marketing kun je de data uit je e-mailpakket, CRM, Google Analytics en Facebook (Ads) beschouwen als bron op dit niveau van de stack.

Data Collection & ETL

De volgende laag in de stack zijn de tools voor het verzamelen en bewerken van data. Het klinkt misschien raar, maar data is over het algemeen rommelig en nooit in het juiste format wanneer je deze uit diverse bronnen probeert te combineren. ETL (Extract, Transform, Load) of ELT is het proces van ophalen van de data uit bronnen, deze opschonen, samenvoegen en daarmee voor te bereiden voor analyse. Enkele bekende ETL tools zijn Matillion, Fivetran, Alteryx en Tableau Prep. Voor het ophalen van data uit bijvoorbeeld e-commerce websites maken we veelal gebruik van Snowplow Analytics en Google Tag Manager.

Data Analyse & Data Science

Nadat de data geschikt gemaakt is voor analyse, kunnen wij met behulp van SQL, R of SAS ad-hoc vragen gaan beantwoorden. Sommige dashboarding tools, zoals Looker, hebben een eigen ontwikkelde programmeertaal die data consultants in staat stellen om de analyse direct in de visualisatie tool te maken. Dit is ook de laag waar Machine Learning in allerlei vormen thuishoort. De uitkomsten kunnen direct gedeeld worden of worden gebruikt in de volgende laag van de stack. Overigens is deze laag niet altijd van toepassing op elke use case.

Dashboarding

Deze tools vormen de ‘the last mile’ in data analyse:

  • In veel use cases is deze laatste stap een BI of visualisatie tool zoals Klipfolio, Looker of Tableau. Met behulp van deze tools worden de resultaten van een analyse of informatie uit een of meerdere bronnen visueel gemaakt zodat deze actionable inzichten creëren.
  • In andere use cases kan het zijn dat de output van deze laag als input voor andere systemen dient. Bijvoorbeeld enhanced ecommerce data uit je webshop dat via Google Tag Manager naar Google Analytics gestuurd wordt voor visualisatie van de verkopen. Maar ook product feeds naar platformen zoals bijvoorbeeld Google Shopping, bol.com of Amazon.