Show cover

Dans cet épisode, Balthazar Mehus, Data Scientist au parcours résolument atypique : de l'école militaire à la data science, en passant par les maths sup, l'ingénierie et le cloud. Touche-à-tout, curieux et pragmatique, il aborde la donnée comme un terrain à conquérir avec méthode et rigueur.


On y explore un sujet souvent sous-estimé : comment transformer les données d'internet en valeur business, depuis leur collecte jusqu'à la valeur délivrée au métier.

Au programme de cet échange vivant et sans détour :

  • Le scraping démystifié : ce que c'est vraiment, ce que ça permet, et les limites à respecter pour ne pas franchir la ligne rouge.

  • De la donnée brute à la connaissance : comment nettoyer, structurer et donner du sens à des données hétérogènes et non structurées issues du web.

  • Les pièges concrets : structure HTML qui change du jour au lendemain, données similaires mais de sens différents, alertes à mettre en place pour éviter les ruptures silencieuses.

  • L'IA au service de l'analyse : comment les LLM changent la donne pour interpréter des données textuelles complexes, et pourquoi ça a un coût qu'il faut savoir arbitrer.

  • Le critère de réussite comme boussole : à travers un cas concret de trading algorithmique enrichi par l'analyse de sentiment, Balthazar illustre pourquoi poser la bonne question au métier est plus précieux que la meilleure des solutions techniques.

Un épisode pour tous ceux qui veulent aller chercher la donnée là où elle se cache, sans perdre de vue ce qui compte vraiment : l'impact business.


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

    Show cover

    Dans cet épisode, Balthazar Mehus, Data Scientist au parcours résolument atypique : de l'école militaire à la data science, en passant par les maths sup, l'ingénierie et le cloud. Touche-à-tout, curieux et pragmatique, il aborde la donnée comme un terrain à conquérir avec méthode et rigueur.


    On y explore un sujet souvent sous-estimé : comment transformer les données d'internet en valeur business, depuis leur collecte jusqu'à la valeur délivrée au métier.

    Au programme de cet échange vivant et sans détour :

    • Le scraping démystifié : ce que c'est vraiment, ce que ça permet, et les limites à respecter pour ne pas franchir la ligne rouge.

    • De la donnée brute à la connaissance : comment nettoyer, structurer et donner du sens à des données hétérogènes et non structurées issues du web.

    • Les pièges concrets : structure HTML qui change du jour au lendemain, données similaires mais de sens différents, alertes à mettre en place pour éviter les ruptures silencieuses.

    • L'IA au service de l'analyse : comment les LLM changent la donne pour interpréter des données textuelles complexes, et pourquoi ça a un coût qu'il faut savoir arbitrer.

    • Le critère de réussite comme boussole : à travers un cas concret de trading algorithmique enrichi par l'analyse de sentiment, Balthazar illustre pourquoi poser la bonne question au métier est plus précieux que la meilleure des solutions techniques.

    Un épisode pour tous ceux qui veulent aller chercher la donnée là où elle se cache, sans perdre de vue ce qui compte vraiment : l'impact business.


    Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

      Déclic data