Livres audio et plus | Votre premier livre est gratuit!

Épisodes

Episode 225 : La guerre des agents SDK

Nov 4 2025

Dans cet épisode du BigData Hebdo, Vincent Heuschling et Paul Peton explorent les dernières annonces d'OpenAI, d’Anthropic et de Google concernant les agents AI et leur monétisation. Au programme les SDK, les workflows, etc...

**A retenir dans cet épisode**
- Les dernières annonces d'OpenAI, Anthropic, et Google.
- Les agents ont de l’argent, il commencent à être monétisés.
- OpenAI vise à concurrencer Google et l'App Store d'Apple.
- Les SDK sont essentiels pour le développement d'agents AI.
- La capacité de prise de décision des agents est cruciale pour leur efficacité.
- La tarification des gros modèles AI est démesurée.
- Les navigateurs AI soulèvent des questions éthiques.
- La connectivité des agents est un enjeu majeur.

**Le BigdataHebdo** Le BigdataHebdo est le podcast Francophone de la Data et de l'IA.
Retrouvez plus de 200 épisodes https://bigdatahebdo.com
Rejoignez la communauté sur le Slack https://join.slack.com/t/bigdatahebdo/shared_invite/zt-a931fdhj-8ICbl9dbsZZbTcze61rr~Q
Voir plus Voir moins

55 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 224 : Données non structurées et modern OCR

Oct 28 2025

Dans cet épisode on explore les défis et les évolutions du RAG (Retrieval-Augmented Generation) dans le contexte de l'IA. L'équipe du Bigdata Hebdo discute des promesses des éditeurs, des difficultés rencontrées par les utilisateurs, et des mécanismes d'IA nécessaires pour traiter efficacement les documents.

On parle des enjeux liés à l'OCR, au chunking, et à l'importance des modèles d'embeddings.

00:00 Introduction
03:06 La promesse des éditeurs
08:05 Comprendre le RAG et son fonctionnement
11:06 Difficultés liées à l'OCR et à l'extraction de données
19:05 Recommandations pour l'optimisation des documents
28:46 Mistral Document AI et ses fonctionnalités
33:49 Chunking et gestion des documents
40:55 Fine-tuning des modèles d'embeddings
43:00 Formats de documents et leur pérennité
47:23 Conclusion et perspectives

Notes et ressources
https://bigdatahebdo.com/podcast/episode-224-donnees-non-structurees-et-modern-ocr
Voir plus Voir moins

51 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 223 : Aerospike

Oct 16 2025

Dans cet épisode du Big Data Hebdo, Vincent Heuschling et Nicolas Wlodarczyk discutent des caractéristiques et des avantages de la base de données NoSQL Aerospike. Nicolas partage son parcours dans le domaine de l'IT et explique comment Aerospike se distingue par sa rapidité et sa scalabilité, et sa capacité à optimiser les infrastructures.

Chapitres
00:00:00 Introduction
00:01:42 Présentation d'Aerospike
00:21:03 Use-Cases
00:27:25 Réduction de l'Infrastructure et Efficacité
00:30:22 Intégration et Interopérabilité avec d'autres Systèmes
00:41:53 Modèles de Consommation et Licensing
00:49:12 Transactions et cohérence
00:58:43 Ressources

Notes et ressources
https://bigdatahebdo.com/podcast/episode-223-aerospike

Voir plus Voir moins

1 h et 3 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 222 - Chemise hawaienne et GPT5 qui flop

Oct 10 2025

Dans cet épisode du Big Data Hebdo, Vincent Heuschling, Paul Peton, et Jérôme Mainaud discutent des événements marquants de l'été 2025 dans le domaine de l'IA et du Big Data, notamment le drama autour de Luc Julia, du lancement raté de GPT5, de l'importance des modèles open source, et les initiatives européennes en matière de souveraineté technologique.
Voir plus Voir moins

53 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 221 : Data vibe coding avec NAO

Aug 6 2025

Avec Christophe Blefari (aka Blef) on discute des défis actuels des équipes data et de la réponse apportée par NAO.

Comment le “Data vide coding” peut accélérer la productivité des projets data ?

On évoque aussi le passage par YC qui a eu un impact significatif sur le produit et la société.

On termine cet épisode avec le regard averti de Christophe sur le marché de la Data, et l’impact des LLM.

Plus sur :
https://bigdatahebdo.com/podcast/episode-221-data-vibe-coding-avec-nao
Voir plus Voir moins

1 h et 6 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 220 : Databricks Data and AI Summit 2025

Jul 25 2025
Dans cet épisode du Big Data Hebdo, Vincent Heuschling et Quentin Ambard reviennent sur le Data and AI Summit 2025 de Databricks.

En autres on parle de :
L'acquisition de Néon pour avoir une BDD au dessus du Lakehouse
Lakeflow Designer pour avoir une approche low-code
L'intégration de l'IA
Databricks One pour rendre l'interface plus accessible
Les améliorations du moteur SQL de Databricks
Agent Bricks qui simplifie le développement d'agents AI.
La data-gouvernance avec Unity Catalog.
Le Vector Search au dessus du lakehouse
Les inevitables troll envers Snowflake 🤣🤣🤣
Voir plus Voir moins
1 h et 7 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 219 : Format Table Iceberg, Delta et Ducklake

Jul 11 2025

Dans cet épisode du Big Data Hebdo, on regarde l'évolution des formats de fichiers Table, en se concentrant sur Parquet, Delta Lake, Iceberg et Duck Lake. On évoque la gestion des metadata et les catalogues pour la gouvernance des données.

Voir plus Voir moins

55 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement
Episode 218 : Agents IA

Jul 2 2025

(00:00:00) Episode 218 : Agents IA
(00:02:58) Définition d'un agent IA
(00:09:49) Agents et outils
(00:10:30) TAO & ReAct
(00:39:50) Frameworks

Dans cet épisode thématique, on explore les agents IA, dernière itération de l'IA Générative.
Qu'est ce qui distingue un agent d’un chatbot ou d’un simple prompt ?
On parle aussi de la relation entre agents, outils (tools) et modèles LLM.
Quels sont les frameworks les plus matures pour construire des agents?
Voir plus Voir moins

59 min

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Écouter gratuitement

Épisodes

Episode 225 : La guerre des agents SDK

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 224 : Données non structurées et modern OCR

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 223 : Aerospike

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 222 - Chemise hawaienne et GPT5 qui flop

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 221 : Data vibe coding avec NAO

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 220 : Databricks Data and AI Summit 2025

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 219 : Format Table Iceberg, Delta et Ducklake

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episode 218 : Agents IA

Échec de l'ajout au panier.

Échec de l'ajout à la liste d'envies.

Échec de la suppression de la liste d’envies.

Échec du suivi du balado

Ne plus suivre le balado a échoué