Question 1

Qu'est-ce qu'un RAG, en termes simples ?

Accepted Answer

RAG signifie Retrieval-Augmented Generation : génération augmentée par la recherche. Concrètement, au lieu de demander à un LLM de répondre depuis sa mémoire (où il invente parfois), on lui fournit d'abord les extraits pertinents de VOS documents, puis on lui demande de répondre uniquement à partir de ça, avec citation des sources. Le résultat : un assistant qui connaît votre documentation interne et qui ne raconte pas n'importe quoi.

Question 2

Combien coûte un chatbot RAG pour mon entreprise ?

Accepted Answer

Le budget d'un POC ou d'un projet complet dépend du périmètre ; je devise sur mesure, devis gratuit sous 48 h après notre échange. Voir ma page Tarifs pour les ordres de grandeur.

Question 3

Mes documents confidentiels partent-ils dans le cloud US ?

Accepted Answer

Non. Vos documents et leurs représentations vectorielles sont stockés dans une base Postgres hébergée en France, sur infrastructure souveraine, à l'abri du Cloud Act américain. Pour la génération de réponses, je privilégie Mistral hébergé en France ou un modèle Ollama auto-hébergé pour les cas sensibles. Si vous acceptez Claude ou GPT, c'est avec un contrat entreprise (DPA, pas d'entraînement sur vos données) — et je vous explique clairement le compromis.

Question 4

Un chatbot RAG est-il conforme RGPD ?

Accepted Answer

Il peut l'être, mais pas par défaut. Si vous envoyez des données clients à ChatGPT US, vous violez probablement le RGPD (transfert hors UE, Cloud Act). Les architectures conformes : Postgres en France pour le stockage, Mistral hébergé en France ou Ollama auto-hébergé pour la génération, ou un contrat DPA solide sur une offre entreprise. Je conçois le chatbot RGPD-native dès le départ, pas en rustine.

Question 5

Faut-il une base vectorielle dédiée type Pinecone ?

Accepted Answer

Rarement, pour une PME. Postgres avec l'extension pgvector suffit largement jusqu'à plusieurs centaines de milliers de documents, et vous gardez une seule base à administrer — celle que vous avez déjà. ParadeDB est une bonne option si vous avez besoin de recherche hybride avancée. Je ne bascule vers une base vectorielle dédiée que si le volume le justifie réellement : pas de surcouche inutile.

Question 6

Le chatbot se met-il à jour quand mes documents changent ?

Accepted Answer

Oui, c'est prévu dans l'industrialisation. On met en place un pipeline d'indexation : quand un document est ajouté ou modifié dans votre source (SharePoint, dossier réseau, GED), il est automatiquement ré-indexé. Le chatbot reste donc à jour sans intervention manuelle. Le POC peut démarrer sur une indexation ponctuelle, l'automatisation arrive à l'étape de mise en production.

RAG & chatbot d'entreprise : interrogez vos documents sans livrer vos données

Le problème : la connaissance de l'entreprise est introuvable

Pourquoi le RAG plutôt qu'un chatbot classique

Ce que je construis concrètement

La stack RAG souveraine que j'utilise

Conformité RGPD : pensée dès le départ

Questions fréquentes

Tester un assistant RAG sur vos propres documents