IA & automatisationJuin 20266 min de lecture
RAG en entreprise : par où commencer
Le RAG ne tient pas ses promesses quand on se précipite sur le modèle. Le vrai travail est en amont, sur vos données.
RAG, pour Retrieval-Augmented Generation : on récupère les bons passages de vos documents, puis on demande au modèle de répondre à partir d'eux. Sur le papier, c'est simple. En pratique, la qualité de la réponse dépend à 90% de ce qu'on récupère, pas du modèle qui rédige.
Nettoyer avant d'indexer
Des PDF mal scannés, des doublons, des versions périmées : un corpus sale produit des réponses fausses, avec aplomb. Avant toute chose, on trie, on dédoublonne et on date. C'est ingrat, c'est décisif.
Découper au bon endroit
Un document coupé n'importe comment perd son sens. On découpe par unité logique, section, paragraphe ou procédure, pas tous les 500 caractères. Le bon découpage, c'est la différence entre un passage utile et un passage mutilé.
Un LLM ne corrige pas une mauvaise récupération. Il la met en forme, et la rend crédible.
Une fois ces bases posées, brancher le modèle devient la partie facile. On évalue ensuite sur de vraies questions métier, et on itère sur l'indexation, pas sur le prompt.