Romain Mathonat

Je suis un
Internet m’a beaucoup aidé dans mon travail, j’apporte donc ma pierre à l’édifice à travers différentes publications en accès libre. Je m’interesse à tout ce qui tourne autour de la tech et de la data (engineering & science)

Experiences

Lead Data Engineer

Projet Mise en place et amélioration des pipelines de données de mobilité

Contexte L’entité Michelin Mobility Intelligence (MMI) a pour mission de rendre les infrastructures routières plus sûres, de meilleure qualité, et plus écologique. Pour ce faire, des données de mobilités sont collectées et stockées dans le data warehouse, pour être ensuites transformées et utilisées par divers algorithmes de machine learning pour fournir de la prédiction et de l’analytique au client.

Missions

  • Mise en place de data pipelines à haut volume (~100 milliards/mois)
  • Amélioration de la CI/CD (performance / facilité d’usage)
  • Modernisation du système de dépendances python, refonte du stockage et du build des wheels
  • Formation de l’équipe aux bonne pratiques / outils (TDD, archi hexa, pdm, ruff, wsl, vsCode)
  • Etat de l’art (data sharing)
  • Développement librairie de monitoring de performance interne
  • Dashboarding et dataviz

Environnement technique

Snowflake, snowpark (equivalent pyspark), SQL, python, CI/CD, pytest, Microsoft Azure, Databricks, Grafana, Streamlit, Gitlab

Janvier 2024 - Octobre 2024 | Lyon, Clermont-Ferrand
Data Engineer / Scientist

Projet Mise en place et amélioration des pipelines de données de mobilité

Contexte L’entreprise Infologic est une PME qui fournit un ERP dans le monde agro-alimentaire. Dans ce contexte, de nombreuses données sont disponibles, aussi bien de comportement utilisateur que des données techniques de fonctionnement des serveur. Celles-ci sont sous-exploitées, il a donc fallu créer une architecture permettant de les stocker pour ensuite les utiliser pour divers besoins: maintenance préventive, détection de problèmes d’ergonomie, suivi utilisateur, etc.

Missions

  • Data modeling et mise en place du data warehouse
  • Formation aux bonnes pratiques pour les data scientists
  • Sécurisation et installation des solutions sur les machines (devops)
  • Mise en place des datas pipelines
  • Développement d’une solution de monitoring in-house
  • Etat de l’art sur sujets scientifiques (clustering, LLM)
  • Vulgarisation et communication au business

Environnement technique

Python, SQL, Clickhouse, ElasticSearch, Bare metal, notebooks, Jupyter Hub, java

Octobre 2020 - Decembre 2023| Lyon
Data Engineer

Projet Mise en place et amélioration des pipelines de données de mobilité

Contexte En collaboration avec une startup: FUL. Le business model était de faire pousser des végétaux dans des environnements de pousse contrôlés: faire pousser des melon au japon devient possible. Ma mission était alors de récolter des données de fonctionnement de cette ferme urbaine, afin de consolider la donnée pour pouvoir entraîner des algorithmes de prédiction de pousse des végétaux

Missions

  • Collecte de données (ETL)
  • Data visualisation
  • Mise en place d’un modèle de prédiction de la consommation électrique
  • Participations aux comités de pilotage
  • Mise en place d’un modèle “human in the loop” d’amélioration des recettes de pousses de végétaux

Environnement technique

Python, SQL, Linux, pytest, Git, SQLite, Grafana

septembre 2017 - aout 2020| Lyon
Doctorat Data Mining

Projet Recherche, invention d’algorithmes de découvertes de règles interprétables pour données séquentielles, appliquées au e-sport

Contexte Cette thèse a porté sur la création de nouveaux algorithmes permettant de faire de la fouille de données sur des données séquentielles et temporelles. J’ai appliqué ces travaux à des séquences d’inputs et d’information 3D du jeu “Rocket League”. Ceci a mener à diverses publications, ainsi que la possibilité de détecter des comportements utilisateurs jusque là indétectables, qui ont notamment intéressé divers acteurs du milieu (startups, Ubisoft).

Missions

  • Etat de l’art scientifique
  • Auto-Formation
  • Création de nouveaux algorithmes
  • Communication et Vulgarisation de mes travaux
  • Enseignement

Environnement technique

Python, SQL, Linux, Git, Pytest, notebooks

septembre 2017 - aout 2020| Lyon

Projets

music streaming app
Market Technical Analysis Lab

Analyse des marchées financiers et cryptomonnaies, backtesting de nombreuses stratégies

Accomplishments
  • Analyse et automatisation de stratégies de trading automatisées (technical analysis) sur actions, cryptos
  • Retrotests de stratégies passives: 4 weathers et variations
  • Recupération de données via API
  • Algorithmes de semi automatisation pour la gestions active de portefeuille



music streaming app
VirtualGuessr

Jeu dans le navigateur d'exploration de mondes virtuels

Accomplishments
  • Experimentation utilisation LLM (claude) pour s'auto former au developpement front end
  • Marketing et build in public
  • Experience "solopreneur"



music streaming app
VulgaireDev

Publications d'articles de vulgarisation scientifique et technique

music streaming app
Rocket League skill detection

Algorithme de machine learning inédit pour la détection automatique de skills ("figure") in game

Accomplishments
  • Accuracy d'environ plus de 80% pour un problème inédit et difficile
  • Collecte de données homemade (sniffer)
  • Publication et communications diverses



Formation

Docteur en Data Mining

Algorithmes de découverte automatique de règles prédictrices pour données séquentielles, application au e-sport et à l'analyse de données de jeux vidéos (Rocket League)

Contact