On entend beaucoup parler du métier de datascientist, pourriez-vous nous en donner une définition précise ?
Antoine D : Un datascientist est un expert de la donnée qui cherche à connecter les flux d’informations des entreprises et à valoriser le volume de données brutes qu’elles ont accumulées et souvent délaissées. Il interprète l’ensemble des informations pour faire de la prédiction et de la visualisation de données pour chaque domaine d’activité d’une société.
Quel est la plus-value pour une entreprise d’avoir un datascientist ?
Antoine D : Pour simplifier, un data scientist permet à une entreprise de modéliser l’ensemble de ses données pour anticiper et gérer ses besoins clients et éventuellement ses flux logistiques.
Grâce à sa double compétence de développeur et de mathématicien, le data scientist a une vision macroéconomique de l’entreprise. En mettant les mains dans le code, le data scientist s’approprie les problématiques techniques et en tant que mathématicien il développe des modèles et des algorithmes pour valoriser l’ensemble des flux d’informations. Un data scientist est une vraie plus-value pour une entreprise, d’autant que ses compétences peuvent être mises à profit pour élaborer des stratégies de croissance innovantes.
Auparavant vous étiez développeur, pourquoi s’être dirigé vers la datascience ?
Antoine D : Au cours de ma thèse en reconnaissance d’empreintes digitales, j’ai été confronté à la fois à la recherche, en traitement d’image et en structures de données, et au développement, avec l’implémentation et l’optimisation systématiques de mes algorithmes. Je souhaitais retrouver un poste avec cette double casquette mêlant à la fois recherche et développement. Le métier de datascientist me permet de retrouver cet équilibre à la croisée de deux mondes. Ce qui m’offre un vrai défi intellectuel.
Quelles sont les compétences requises pour devenir un bon datascientist ?
Antoine D : Le métier de datascientist nécessite des compétences mathématiques pour faire de la modélisation. Des vraies connaissances en code puisque le datascientist manipule au quotidien les bases de données métiers. On y pense moins, mais également un bon relationnel puisque il doit aller à la rencontre de tous les métiers et de toutes les parties prenantes de la chaîne d’information.
Quels sont vos domaines d’intervention ?
Antoine D : En premier lieu, le marketing. Ce service a besoin d’identifier quel client achète quel produit. Ce même service pourra déterminer quelles sont les informations produits à envoyer à ce même client, une offre promotionnelle par exemple. A terme, nous pourrons potentiellement suivre toute la vie d’un produit, savoir où il est, où il va et pour quel type de client. Ensuite, la logistique : en étudiant les flux d’informations nous pouvons suivre le cycle de vie d’un produit et optimiser un grand nombre d’étapes redondantes ou trop lentes.
Actuellement en mission chez un grand compte de Novencia dans le secteur media et numérique, pourriez-vous nous expliquer en quoi consiste votre mission ?
Antoine D : Je commence par connecter toutes les sources d’informations d’un même produit, puis je les normalise. Une fois ce flux de données mis en place et normalisé, je construis des algorithmes de prédiction et d’analyse. La première étape est souvent la plus longue, car il faut identifier tous les flux d’informations de l’entreprise et réussir à les connecter, en gérant un historique de processus interne parfois lourd.La deuxième étape c’est le cœur de métier du data scientist, elle consiste à extraire l’information pertinente de toutes ces données et d’y mettre de l’intelligence et de la prédiction grâce à des algorithmes que nous créons. A terme, les nouvelles générations de data scientists seront sûrement amenées à travailler avec des outils entièrement packagés qui accéléreront considérablement l’étape initiale de regroupement de la donnée.
Vous êtes donc un passionné de Data ?
Antoine D : Ce qui m’intéresse ce ne sont pas tant les données métiers mais la data au sens large : j’aime comprendre comment les systèmes sont structurés. A mon sens, data scientist est une étiquette nouvelle pour désigner un regroupement de métiers qui existaient depuis des années : business intelligence, machine learning au sens large, etc. Le changement radical cependant, c’est que la demande pour ces métiers a décuplé. Je crois que le plus plaisant dans ce job aujourd’hui c’est l’ouverture du champ des possibles : le matériau de travail, la data, est désormais surabondant, les outils techniques rendent la manipulation de ces volumes possible, les entreprises sont prêtes à investir massivement, mais tout est encore à défricher !
A moyen terme, quel est votre objectif professionnel ?
Antoine D : Dans quelques années, les besoins du domaine auront explosé. Selon moi, notre métier sera automatisé par des algorithmes, de l’intelligence artificielle et des robots. Des outils autonomes compileront la donnée, automatiseront la connexion des flux et les data scientists se concentreront presque exclusivement sur l’analyse de données et la modélisation.
Mon objectif à moyen et long terme est de contribuer à ce mouvement et de développer ces outils : pouvoir proposer aux entreprises le déploiement de DSI entièrement automatisées d’un clic !