Vulgaire Developpeur

VS Code python

Date 26 octobre 2023 Catégories Developpement par VulgaireDev

Here are my settings to configure vs code to be efficient with python

Git Cheatsheet

Date 16 octobre 2023 Catégories Developpement par adminVulgaireDev

A little list of common operations I have to perform

FastAPI et exposition de services IA

Date 5 décembre 2022 Catégories Developpement par VulgaireDev

9 projets "data science" sur 10 ne finissent pas en production. Une des raisons est la difficulté ainsi que le manque de normes pour passer d'un notebook à un produit fonctionnel réellement utile. Dans ce tuto nous allons voir, à travers un cas simple, comment utiliser fastAPI pour créer une API permettant d'exposer des services IA, qui pourra ensuite être requêtée depuis n'importe quelle brique logicielle, en HTTP. Plus précisément, nous allons ici récupérer des données d'utilisations d'un logiciel présent sur un parc de machines, stockées dans elasticsearch, que nous allons raffiner afin d'en extraire des sessions (clustering selon l'axe du temps uniquement).

Erreurs et manipulations en temps d'épidémie

Date 2 juillet 2021 Catégories Divers / "Maths" par VulgaireDev

Le sujet polarise énormément, je vais donc essayer de m'en tenir au fond pour tenter d'y voir plus clair parmi plusieurs erreurs ou manipulations que j'ai pu voir ces derniers temps. En particulier, un article a récemment été publié sur le blog de mediapart (il n'engage donc pas la rédaction). Il a été rédigé par Laurent Mucchielli, directeur de recherche au CRNS en sociologie, qui s'exprime donc en dehors de son domaine de compétence. D'autres auteurs, visiblement issus du monde scientifique et de la recherche (en pharmacie, médecine, informatique), ont co-signé l'article. A première vue, on peut donc se dire qu'on va avoir à faire à de la vraie connaissance scientifique. Voyons plus en détail.

Clustering: présentation de HDBSCAN

Date 1 juillet 2021 Catégories Algorithmique / "Maths" par VulgaireDev

Le clustering est une tâche qui consiste à automatiquement grouper des objets similaires. On cherche à minimiser la distance inter-groupement et à maximiser la distance entre les groupements (les definitions varient légèrement selon les papiers cependant). Les algorithmes de clustering sont très utiles pour faire de l'analyse de données exploratoire, c'est à dire pour étudier un dataset et le faire parler sans connaissance à priori dessus.

Analyse propagation COVID-19 au 14/03/2020

Date 14 mars 2020 Catégories "Maths" par VulgaireDev

J'ai voulu analyser la propagation du COVID-19 en modélisant le phénomène avec une simple loi exponentielle. Le nombre de personnes atteintes est probablement d'un facteur 1000 au dessus du nombre de cas diagnostiqués.

Applied Data Science: Subgroup Discovery on Mushrooms

Date 16 octobre 2019 Catégories Divers par VulgaireDev

My last publication was on Subgroup Discovery for Sequences. However, in Data Science community, a lot of people are not aware of what "Subgroup Discovery" or "Pattern Mining" is. So let's have a quick pratical example on how to use it in a practical exemple: knowing if Mushrooms are poisonous.

TDD en python pour débutants

Date 12 septembre 2019 Catégories Developpement par VulgaireDev

J'ai fait une activité de découverte du Test-Driven Development. Ca servira peut-être à d'autres personnes, notamment des profs pour le nouveau programme d'informatique au Lycée, donc je le met en accès libre ici.