Thomas Gerbaud, d’Oceandata : « Expliquer des trucs ch***, ça a été mon travail pendant 10 ans »

OceanData existe depuis 2015 et propose « des prestations de développement informatique en science des données, algorithmie et apprentissage automatique ».

Et en français, svp.

Pour résumer, OceanData valorise les données des entreprises, de préférence massives (les données – et les entreprises aussi, d’ailleurs) et conçoit des programmes pour réaliser ces analyses, avec de « vrais morceaux de maths et d’algorithmes dedans ».

Thomas Gerbaud, son fondateur, est data scientist : il récolte, traite et fait parler de grandes quantités de données diverses et variées. On peut le dire, il fait partie des précurseurs de ce métier qui n’existait pas il y a encore 5 ans – un métier situé à mi-chemin entre l’informatique, les mathématiques appliquées et les statistiques.

Son parcours ? C’est celui d’un ingénieur centralien (Lyon, 2005) qui s’est consacré neuf ans à la physique des plasmas (CEA 2005-2008, Oxford 2008-2011) et à l’informatique scientifique (computer science, CEA 2011-2014), pour ensuite se lancer dans « le grand bain du commerce » en 2015, en créant sa propre structure.

Thomas Gerbaud-OceanData

Aujourd’hui, OceanData compte 4 collaborateurs et est déjà intervenu auprès d’une quinzaine de clients dans des domaines aussi variés que la banque (Crédit Agricole, Compte-Nickel), l’industrie, le retail (ERAM), la monétisation de données (Dawex, Manageo), quelques institutionnels ou presque (Orange, BVA, BNF, ADEME) et de nombreuses startups (Budget Insight, LyfPay)…

Et vu les prédictions du rapport ” The Big Data Market: 2018 – 2030 – Opportunities, Challenges, Strategies, Industry Verticals & Forecasts ” de SNS Telecom & IT, estimant que les investissements Big Data à l’échelle mondiale 2018 pourraient représenter 65 milliards de dollars, ils ne sont pas prêts d’être au chômage technique.

« C’est clair qu’on a du taf. » commente-t-il.

Et vu qu’il est résident chez Morphoburo, on a décidé de lui poser toutes ces questions qu’on se pose nous, sur la data, et auxquelles il a déjà dû répondre un nombre incalculable de fois en conférence et lors de dîners en famille :-)

Dans certaines de vos interview vidéo vous dites que la big data utilise 4/5 grands algorithmes à des fins de segmentation, de profilage pour les entreprises. Mais, par exemple, Google Analytics fait déjà ça très bien pour les sites ou les applications mobile, et les réseaux sociaux sont déjà de véritables mines d’or. 

Quels problèmes réglez-vous et sous quelle forme ?

Thomas Gerbaud, fondateur d’OceanData

Google Analytics ne montre aucune forme d’intelligence. C’est du bête classement (=segmentation) selon différents critères, rendu possible par un suivi précis des connexions des utilisateurs (=tracking).

OceanData (qui est en train de muter en alt-gr.tech) conçoit et développe des outils informatiques intelligents et rusés, habiles et performants.

Notre travail, c’est de comprendre le besoin exprimé (ou suggéré) par un client non-technique. Nous bâtissons ensuite des programmes de valorisation et d’analyse de données en se basant sur des algorithmes de maths appliquées plus ou moins complexes : statistiques, mathématiques et aussi apprentissage automatique (=machine learning).

Les gens qui aiment synthétiser et les néophytes appellent ça IA (=intelligence artificielle).

Plutôt que de compter les principaux algorithmes utilisés, je préfère dire qu’on peut se restreindre à quelques grandes fonctions opérationnelles : classer, trier, explorer, décrire, grouper, prédire, détecter

Et en quelques semaines de dev [développement, NDLR], on peut sortir des programmes efficaces et utiles. Pas besoin de compter en milliers de jours/homme.

Sur votre site, on peut lire « Oceandata s’efforce de démystifier la transformation numérique ». Effectivement, on ne peut que remarquer votre effort de pédagogie.

À ce sujet, êtes-vous obligé de faire beaucoup d’évangélisation pour trouver des clients ou est-ce que vos clients savent déjà pourquoi ils viennent vers vous ?

Thomas Gerbaud, fondateur d’OceanData

Je suis scientifique – tout du moins, j’étais scientifique. Donc essayer d’ « expliquer des trucs chiants pour intéresser les gens, ça a été mon travail pendant 10 ans ».

Aujourd’hui, si je continue de le faire, c’est (beaucoup) par gout de rendre compréhensibles les sujets qui m’intéressent, et par souci de clarté vis-à-vis de mes clients ou partenaires.

Il y a beaucoup de remue-ménage autour de la data, des algorithmes et de l’IA, et il convient de calmer la houle, filtrer l’écume pour ne pas se noyer dans ces océans de concepts techniques, qui nous mènent, si on n’y prête pas attention, à des abîmes de bêtises. Sans parler de blockchain.

Les gens qui répondent favorablement à nos actions commerciales veulent innover avec la data, réduire leurs coûts de fonctionnement ou augmenter leur efficacité opérationnelle.

Les clients ne viennent pas seuls, évidemment. Il faut se faire connaitre … d’où nos nombreux efforts de communication technique et (espérons-le) accessibles !

La « big data » est un mot qui fait encore peur au grand public, comme en témoigne cette chronique ironique sur Viva Tech, le salon de la data auquel vous avez participé. On se demande comment sont collectées les données, si nos informations personnelles ne nous échappent pas.

C’est pour cette raison que l’Union européenne a mis en place une réglementation pour protéger les données personnelles, le fameux règlement RGPD. Honnêtement, est-ce que c’est une contrainte supplémentaire pour votre métier ?

Thomas Gerbaud, fondateur d’OceanData

Guillaume Meurice se moque, et il a raison.

Nous sommes naturellement les interlocuteurs innovation, data, algorithmes, maths, base de données … bref, #data, de nos clients ou partenaires. Le règlement RGPD [règlement de protection des données personnelles des utilisateurs valable pour toute entreprise opérant dans l’Union Européenne, NDLR] est un sujet important qui concerne directement les entreprises.

Ce sujet est souvent traité d’un point de vue légal, mais c’est une question technique (base de données) et une opportunité de communication. Ça ne me pose pas vraiment de problème, mais c’est une contrainte sur les contrats : il faut ajouter pas mal de détails sur les données, leur provenance et les traitements afférents. En tant que data processor selon le GDPR, nous sommes responsables.

La data est partout, comme vous dites sur votre site. En ce qui concerne les particuliers, il est désormais possible de connaître leur âge, leur niveau d’études mais aussi leur état de santé comme l’explique cet article de LeBigData.fr.

La collecte et le traitement de la data deviennent alors des sujets sensibles, selon le projet du donneur d’ordre et le but de leur exploitation.  Vous dites sur votre site prendre «  très au sérieux [votre] rôle citoyen », et vous ajoutez « Un data scientist a une responsabilité sociale, voire éthique ».

Vous êtes-vous fixé des limites ?

A contrario, est-ce qu’à titre personnel, en dehors de votre activité professionnelle, vous vous servez de vos compétences en faveur d’une cause ?

Thomas Gerbaud, fondateur d’OceanData

Science sans conscience n’est que ruine de l’âme. On ne travaille pas pour accroitre le malheur du monde, clairement.

On n’a pas vraiment refusé de contrats, puisque juste à présent, le filtrage s’est fait avant : j’ai longtemps mené les démarches commerciales seul, et les projets qui ne me plaisaient pas vraiment n’ont pas abouti. Ça s’est fait naturellement. Vu mon caractère …

Si la question est de savoir si on a travaillé pour l’armée, les labos de médicaments ou des trucs un peu limites, la réponse est non.

En terme de responsabilité, la nôtre est grande en tant que technicien. Mais que les gens se rassurent, il y a suffisamment de choses à faire avant de devoir accepter de bosser sur des trucs chelous.

Quelle est selon vous l’utilisation idéale de la big data ? Dans quel contexte, pour quel objectif, dans quelles conditions pensez-vous que la data pourrait améliorer la société ?

Êtes-vous, comme Cédric Villani, favorable au partage des données ?

Thomas Gerbaud, fondateur d’OceanData

Minority Report, c’est n’importe quoi. La seule innovation crédible du film, c’est l’IHM [Interaction Homme-Machine, NDLR] assez folle. La donnée est objective, ou, au moins, représente une certaine forme d’objectivité, de neutralité, qui ne dépend que de la captation : si je ne mesure que ce qui se passe entre 0 et 1, je ne peux rien dire sur ce qu’il se passe avant 0 et après 1. Ce qui introduit des biais, ce sont les interprétations ou les choix humains.

Certains diront par exemple que les poulpes à pois rouges sont par nature plus agressifs que les poulpes à poids bleus, alors que d’autres chercheront des variables cachées permettant d’expliquer socialement ces différences.

C’est ici que la méthode scientifique entre en jeu : les conclusions issues d’un jeu de données ne sont valables que pour ce jeu de données. La question de savoir si ce jeu de données représente une réalité plus vaste ou si c’est un problème à part entière et demeure difficilement explicable à partir uniquement du jeu de données.

Popper explique cela très bien.

Tout ça pour dire qu’il est évidemment totalement idiot de laisser des gens sans aucune formation scientifique faire des statistiques sérieuses.

La smart-city, au-delà du buzz, c’est regrouper, croiser et exploiter des données relatives aux espaces publics pour améliorer la vie des citoyens. Enfin, dans ma tête, c’est ce que ça devrait être. Et ça me va bien.

Si au final, on finit par installer des caméras pour fliquer les gens, alors ça ne me plaira pas. Il en résulte, comme toujours, une forte responsabilité du politique … ce n’est pas parce que c’est faisable que ça doit être fait, évidemment.

 Enfin, vous êtes résident chez Morphoburo depuis quelques temps maintenant. Pourquoi avoir choisi d’y installer OceanData ? Est-ce que vous avez testé d’autres centres d’affaires ou coworking avant ?

Qu’est-ce que vous avez trouvé chez Morphoburo et qui manquait aux autres ?

Thomas Gerbaud, fondateur d’OceanData

On est bien chez Morpho.

Je n’ai pas vraiment essayé ailleurs, j’étais habitant d’Eguilles donc je ne me suis pas posé de questions. Ça va faire bientôt deux ans, et j’y suis bien.

Tellement bien qu’on va quasi tripler notre surface et installer deux autres bureaux !

Ma future structure, AltGR, y aura ses bureaux aixois – en plus d’un bureau chez notre accélérateur Zebox à Marseille, et un autre à Station F, à Paris.

About Jean-Marc

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *