IA & automatisationJuin 20266 min de lecture

RAG en entreprise : par où commencer

Le RAG ne tient pas ses promesses quand on se précipite sur le modèle. Le vrai travail est en amont, sur vos données.

Par le studio yesnat6 min de lecture

RAG, pour Retrieval-Augmented Generation : on récupère les bons passages de vos documents, puis on demande au modèle de répondre à partir d'eux. Sur le papier, c'est simple. En pratique, la qualité de la réponse dépend à 90% de ce qu'on récupère, pas du modèle qui rédige.

Nettoyer avant d'indexer

Des PDF mal scannés, des doublons, des versions périmées : un corpus sale produit des réponses fausses, avec aplomb. Avant toute chose, on trie, on dédoublonne et on date. C'est ingrat, c'est décisif.

Découper au bon endroit

Un document coupé n'importe comment perd son sens. On découpe par unité logique, section, paragraphe ou procédure, pas tous les 500 caractères. Le bon découpage, c'est la différence entre un passage utile et un passage mutilé.

Un LLM ne corrige pas une mauvaise récupération. Il la met en forme, et la rend crédible.

Une fois ces bases posées, brancher le modèle devient la partie facile. On évalue ensuite sur de vraies questions métier, et on itère sur l'indexation, pas sur le prompt.

Tous les articles

RAG en entreprise : par où commencer

Nettoyer avant d'indexer

Découper au bon endroit

Automatiser sans tout casser

Mesurer un agent IA en production

Brancher l'IA sur vos outils existants

Prêt à construire quelque chose qui compte ?