Data architectuur

De architectuur richt zich op het toepassen van de juiste tools en services, de Data Technology Stack, om data te kunnen verzamelen uit diverse bronnen en deze vervolgens te kunnen combineren, structureren en organiseren, zodat het gebruikt kan worden in Dashboards, Web Analytics en Analyse.

Een goede inrichting en aansluiting van de architectuur noodzakelijk om inzicht te kunnen bieden in je bedrijfsdoelen, je strategie. i-spark helpt bij het maken van de juiste keuze voor en het implementeren van de juiste tool(s) en de aansluiting, afgestemd op de doelen van jouw organisatie. 

Heb je al een tool of platform gekozen en wil je hulp bij de inrichting? Ook daarvoor ben je bij ons aan het juiste adres!

Wat is een Data Architectuur?

Het belangrijkste doel van een data stack is ervoor te zorgen dat de data, afkomstig uit vele bronnen, accuraat en consistent is zodat de resultaten van analyses en visualisatie betrouwbaar zijn. De Stack bestaat uit diverse lagen, waarbij op maat gekozen tools en platformen van belang zijn om data van de bron naar eindresultaat te laten stromen volgens de requirements van jouw data vraag. Het aantal in te zetten tools is eindeloos. Binnen i-spark maken we veelal gebruik van een voorkeur aan tools en platformen, maar dit is zeker niet gelimiteerd tot deze tools.

De onderste laag van de stack is de opslag van data zelf. Dit is de ruwe data die opgeslagen zit in allerlei bronnen zoals bijvoorbeeld SQL en NoSQL databases, datawarehouses en data lakes. Deze bronnen bevinden zich veelal in de cloud (zoals AWS) of natuurlijk bij de klant zelf. De data uit deze bronnen kunnen worden ontsloten door directe koppelingen op bijvoorbeeld databases, maar ook via bijvoorbeeld API’s. In het geval van online marketing kun je de data uit je e-mailpakket, CRM, Google Analytics en Facebook (Ads) beschouwen als bron op dit niveau van de stack.
De volgende laag in de stack zijn de tools voor het verzamelen en bewerken van data. Het klinkt misschien raar, maar data is over het algemeen rommelig en nooit in het juiste format wanneer je deze uit diverse bronnen probeert te combineren. ETL (Extract, Transform, Load) of ELT is het proces van ophalen van de data uit bronnen, deze opschonen, samenvoegen en daarmee voor te bereiden voor analyse. Enkele bekende ETL tools zijn Matillion, Fivetran, Alteryx en Tableau Prep. Voor het ophalen van data uit bijvoorbeeld e-commerce websites maken we veelal gebruik van Snowplow Analytics en Google Tag Manager.
Nadat de data geschikt gemaakt is voor analyse, kunnen wij met behulp van SQL, R of SAS ad-hoc vragen gaan beantwoorden. Sommige dashboarding tools, zoals Looker, hebben een eigen ontwikkelde programmeertaal die data consultants in staat stellen om de analyse direct in de visualisatie tool te maken. Dit is ook de laag waar Machine Learning in allerlei vormen thuishoort. De uitkomsten kunnen direct gedeeld worden of worden gebruikt in de volgende laag van de stack. Overigens is deze laag niet altijd van toepassing op elke use case.

Deze tools vormen de ‘the last mile’ in data analyse:

In veel use cases is deze laatste stap een BI of visualisatie tool zoals Klipfolio, Looker of Tableau. Met behulp van deze tools worden de resultaten van een analyse of informatie uit een of meerdere bronnen visueel gemaakt zodat deze actionable inzichten creëren.

In andere use cases kan het zijn dat de output van deze laag als input voor andere systemen dient. Bijvoorbeeld enhanced ecommerce data uit je webshop dat via Google Tag Manager naar Google Analytics gestuurd wordt voor visualisatie van de verkopen. Maar ook product feeds naar platformen zoals bijvoorbeeld Google Shopping, bol.com of Amazon.

Data Engineering

Met de juiste Data Stack ben je in staat om data te verzamelen, bewerken en op te slaan voor data analyse, data science en dashboarding. Door gebruik te maken van Cloud Platformen (PaaS) zoals Amazon Web Services (AWS) of Google Cloud Platform (GCP) is de opslag en verwerking van data veilig, de toepassing schaalbaar en tegen lagere kosten dan een eigen on-premise infrastructuur . 

Bij i-spark hebben we een sterke voorkeur voor AWS vanwege de onafhankelijke positie ten opzichte van Microsoft, IBM en Google. Daarnaast biedt AWS een grote verscheidenheid aan tools voor de verwerking en opslag van Big Data.

i-spark
E: hallo@i-spark.nl
T: +31(0)594 855888

A: Oostindischewijk 1b, 9354 TS Zevenhuizen

i-spark B.V. is ingeschreven bij de KvK Noord-Nederland te Groningen onder nummer 73401587

i-spark B.V. is registered at the Chamber of Commerce in Groningen with number 73401587