Data zijn de levensader van iedere moderne organisatie. Geen wonder dat organisaties zich razendsnel willen digitaliseren met moderne Artificial Intelligence (AI) oplossingen. AI en digitalisering biedt immers enorm veel voordeel voor bedrijven. Denk hierbij aan het genereren van nieuwe inkomstenstromen, oplossingen om slimmer te adverteren en processen efficiënter te laten verlopen.
Er is dan ook sprake van een data explosie. Tegen 2025 zal, volgens IDC, deze wereldwijde datacreatie een duizelingwekkende 180 zettabytes bereiken. Echter zullen organisaties die te snel willen moderniseren met AI tegen problemen aanlopen omdat ze er niet in slagen om hun data goed te beheren. Het is niet voldoende om alleen veel data te verzamelen, als je succesvol wilt zijn met AI zal de data naadloos moeten aansluiten op de informatie-architectuur (IA).
Veel organisaties lopen tegen deze uitdaging aan omdat ze afhankelijk zijn van verouderde data-architecturen waarin wordt getracht om ongelijksoortige databronnen in silo’s te consolideren via datawarehouses of data lakes. Dergelijke consolidatiebenaderingen maken het datalandschap nog complexer omdat er gebruik wordt gemaakt van ETL-procedures (extract, transform and load), zodat gegevens naar één dataopslag kunnen worde gekopieerd. Het gevolg is dat datawetenschappers worstelen met langdurige datavoorbereidingscycli en moeite hebben met het ordenen van de data om AI succesvol toe te passen. Het is daarom belangrijk om een robuuste en veilige IA te hebben voordat je begint met AI.
Een robuuste en veilige data infrastructuur creëren
Om een dergelijk IA te realiseren voor AI, zullen organisaties rekening moeten houden met drie elementen.
- Creëer toegankelijkheid - Gezien het groeiende volume aan data hebben organisaties behoefte aan snelle toegang tot gegevens die verspreid zijn over complexe hybride Cloud omgevingen;
- Houd rekening met governance - Het is belangrijk dat de data in de juiste context wordt geplaatst en op een goede manier wordt geclassificeerd. Op deze manier krijgen organisaties relevante informatie van hoge kwaliteit;
- Tenslotte speelt privacy en compliance een grote rol - Organisaties moeten immers persoonlijke en vertrouwelijke informatie identificeren en beschermen en tegelijkertijd zorgen voor naleving van de regelgeving. Hierdoor kan ook gevoelige data veilig worden gebruikt voor AI en analytics.
Data in goede banen leiden middels een data fabric benadering
Om deze elementen in goede banen te leiden en data waarde te geven passen sommige organisaties een nieuwe benadering toe, namelijk een data fabric architectuur. Datafabric kan het transformatietraject van bedrijven versnellen, waardoor ze een grote stap voorwaarts zetten om de concurrentiepositie te verbeteren. Deze nieuwe benadering betekent een paradigmaverschuiving in de manier waarop bedrijven hun data gebruiken. Het abstraheert de technologische complexiteit die nodig is voor zaken als dataverplaatsing, datatransformatie en data-integratie, om alle data in de hele onderneming beschikbaar te maken voor alle gebruikers. Door data via één gemeenschappelijk platform te benaderen, biedt de data fabric-oplossing één enkel beeld van gegevens die voorheen in afzonderlijke data lakes en warehouses waren ondergebracht. Organisaties kunnen hierdoor verbinding maken en toegang krijgen tot silodata, op locatie of in meerdere Clouds, zonder deze te hoeven kopiëren of verplaatsen. Dit biedt een vertrouwd niveau van beheer en privacy, waardoor bedrijven ‘waarde’ uit hun data kunnen halen.
Een self-service platform verandert de manier waarop datadeskundigen data pipelines kunnen maken en gebruiken. In tegenstelling tot een gecentraliseerd model wordt de content en data in een self-service omgeving gecreëerd door de medewerkers zelf. Hierdoor worden inspanningen voor datamanagement geautomatiseerd. Hierdoor kunnen data scientists zich richten op het sturen van inzichten en het creëren van ML & AI modellen die in applicaties kunnen worden ingebed, in plaats van het grootste deel van hun tijd te besteden aan data preparatie.
Om een data fabric benadering te realiseren zullen organisaties moeten voldoen aan een aantal elementen. Ze zullen de elasticiteit moeten hebben om te evolueren als het datalandschap veranderd. Daarnaast is het verstandig om gebruik te maken van open standaarden, zodat partners en interne afdelingen eenvoudiger verbinding kunnen maken om de datastructuur te koppelen aan data binnen de gehele organisatie. Tenslotte is het belangrijk dat de data voortdurend wordt beheerd. Op deze manier kunnen organisaties compliance zijn en garanderen dat de data accuraat en veilig is.
Kortom, een solide datastructuur is de sleutel voor digitale transformatie en vormt de basis voor succes met AI. Het is daarom noodzakelijk dat organisaties in het hart van hun digitale transformatietraject nadenken over het ontwerpen van hun IA om hun AI-initiatieven te ondersteunen. AI kan immers niet succesvol zijn zonder IA!