De markt van producten voor data-integratie is al decennialang het domein van dezelfde groep leveranciers. In 2010 dook voor het eerst de naam van een nieuwkomer op in de bekende rapportages van Gartner: Talend. Dit van oorsprong Franse bedrijf kreeg van de onderzoekers een plaats bij de ‘visonairs’. Daar bleef het echter niet bij. In 2016 verwierf het bedrijf de status van ‘leader’, en het einde van de stijgende lijn lijkt nog niet in zicht. Wat is daarvoor de reden? Mike Tuchen, CEO van Talend, geeft zijn visie daarop en op clouddata-integratie in het algemeen.

Bij zijn aantreden in 2013 belandde Tuchen midden in een discussie over een aantal kritieke strategische keuzes. Daar lagen vier observaties aan ten grondslag. “We zagen de hele wereld naar de cloud verhuizen. Als tweede viel het op dat de meeste bedrijven en instellingen kozen voor een big-databenadering met een data lake-model. Onze derde waarneming was dat steeds meer organisaties accepteerden dat medewerkers directe interactie hebben met data, en dat het onderzoeken en analyseren ervan steeds meer een selfservicemodel was. En de vierde constatering was dat realtime niet langer een keuze was, maar een must. We besloten ons volledig te gaan richten op het oplossen van de problematiek rond die speerpunten. Het is de basis geworden van onze strategie sinds 2013.”

Open source

Belangrijkste gevolg van de nieuwe strategie was de gang naar de cloud van Talend in 2015. “Na de lange periode van terughoudendheid is het vertrouwen in de veiligheid van de cloud enorm gegroeid. Als gevolg daarvan brengen ondernemingen steeds meer data naar de cloud. Wij zitten dus waar de data zit.”

Het portfolio van Talend bestaat uit een wat Tuchen ‘één suite met data-integratie en data-integriteit-apps’ noemt, waarbinnen de oplossingen met elkaar werken op een samenhangende manier. De commerciële producten zijn zelf ontwikkeld boven op de oorspronkelijke open-source-oplossing van Talend, die uit de tijd van de oprichting dateert en altijd een inspiratie is gebleven voor nieuwe ontwikkelingen. “Het is dus géén proprietory model”, beklemtoont Tuchen. “We maken gebruik van technologie die al beschikbaar is in de markt. Daardoor hoeven we niet voortdurend zelf te innoveren, maar kunnen we meevaren met de ontwikkelingen in de markt.”

Talend is in feite een codegenerator (JAVA, SQL, Spark), die vooral wordt aangeboden als de cloudvariant met een maandelijks abonnement. De opensource-versie, Open Studio geheten, kan kosteloos gebruikt worden.

Machine learning

Datakwaliteit en data governance zorgen nog steeds voor problemen, constateert Tuchen. “Vraag waar ter wereld een CIO of hij zijn data volkomen vertrouwt, en het antwoord luidt bijna altijd: nee. Bedrijven hebben tientallen systemen waar dubbele data in zit – en elk systeem doet iets anders met die data. Als je die data weer gaat gebruiken in een ander systeem komen de mutaties en fouten die erin geslopen zijn gewoon mee. Je zult daarin diepgaand inzicht moeten zien te krijgen. Wat heeft elk systeem met de data gedaan? En vooral: hoe kan ik alle correcte data vinden en diezelfde data door alle systemen laten gebruiken? Dat is een van de meest uitdagende onderwerpen in de datawereld.”

Talend lost dat op met een datacatalogus die helder maakt waar welke data zich bevindt en of deze data voldoet aan de vooraf gestelde standaarden. De datakwaliteit wordt getest met behulp van machine-learning. Uitzonderingen worden door gebruikers afgehandeld (Crowd Sourced), waarbij rekening wordt gehouden met de AVG. Deze handmatige handelingen worden op vervolgdatasets toegepast als nieuw datareceipt.

Data scientists

Steeds meer ondernemingen stellen data scientists aan. Maar er bestaat een discrepantie tussen wat de data scientist wil en wat de CIO wil. “Data scientists kijken het liefst op een ad-hocmanier naar ruwe data en verschillende stadia van transformatie en processing van de data. Ze hebben een onderzoekend karakter, ze bouwen een model, bedenken hypotheses, bewijzen of verwerpen die en proberen inzichten te creëren uit data. Maar het wordt gedaan met een unieke pre-dataset. Terwijl het IT-team wil systematiseren, schalen en consistente processen wil draaien. Het is het verschil tussen een onderzoekende, verkennende aanpak en een die om productie gaat. Beide vragen een volledig verschillend pakket wensen en eisen”, aldus Tuchen.

Talend ziet datascientists als een van de verschillende self service-rollen. “Self service biedt ze de mogelijkheid om datapreparatie te doen in hun eigen veilige omgeving, terwijl data governance automatisch wordt toegepast. Als het uiteindelijke preparatiemodel aan een productie-integratie wordt gekoppeld, zal het eerst onderworpen worden aan de testen van het IT-team.”

Cloudintegratieoplossingen

Talend is gespecialiseerd in ‘dealing with data’, zoals Tuchen zegt. Het brengt zelf geen analytische of reportingtools op de markt. “‘Dealing with data’ is een heel diepgaand en complex probleem. Daar hebben we onze handen vol aan. Dus ons begeven in andere uiterst competitieve gebieden, zoals analytics, zou niet slim zijn. In plaats daarvan hebben we ervoor gekozen een best-of-breedoplossing te bieden voor het beheren van data. Integratie, integriteit en kwaliteit: daar richten we ons helemaal op.”


Talend is in 2005 opgericht in Frankrijk, en is nog steeds een succesvolle speler in deze markt. Sinds de oprichting heeft de organisatie een groei doorgemaakt wat heeft geresulteerd in kantoren door heel Europa; ook is het bedrijf gevestigd in Amerika. Sinds 2016 heeft Talend een notering aan de NASDAQ. Vandaag de dag heeft Talend vestigingen over de hele wereld, inclusief Nederland, en wordt het bedrijf gekenmerkt door een sterke groei. De omzet van Talend was in 2010 zo’n 20 miljoen dollar, de omzet in 2019 zal ongeveer uitkomen op 204 miljoen dollar.

Arnoud van Gemeren is hoofdredacteur van CIO Magazine, Boardroom IT en voormalig hoofdredacteur van TITM (Tijdschrift IT Management) en Outsource Magazine. Hij heeft een lange staat van dienst in de Nederlandse IT-mediawereld. Na een start bij een redactiebureau, was hij als hoofdredacteur van 1996 tot 2001 bij uitgeverij Array Publications verantwoordelijk voor diverse IT-vakbladen. In 2001 sloot hij zich aan bij een adviesbureau op het gebied van marketingcommunicatie, Beatrijs Media Group. Vanuit dit bureau bleef hij als hoofdredacteur actief, onder meer voor Sdu Uitgevers.

REAGEREN

Plaats je reactie
Je naam