La règle des 80 %
L’erreur classique avant un déploiement IA, c’est de croire que la qualité des réponses dépend du modèle utilisé. Elle dépend en réalité, et de très loin, de la qualité de la documentation que l’assistant a reçue.
Sur un assistant correctement configuré, une documentation propre amène 85 à 95 % de réponses justes. Une documentation moyenne plafonne à 60 %. Une documentation chaotique reste à 30 %. Le modèle, lui, est le même.
Un bon assistant n’est pas un cerveau qui sait. C’est une mémoire qui retrouve. Si la mémoire est en désordre, le retour est en désordre.
Auditer ce que vous avez (avant de toucher quoi que ce soit)
Demi-journée à passer avec deux ou trois personnes qui connaissent vraiment vos sources. On liste, sans rien jeter encore :
- Sources vivantes (documents mis à jour dans les 12 derniers mois)
- Sources de référence (procédures stables, contrats-type, doctrine)
- Sources archivées (vieux dossiers, comptes-rendus, e-mails)
- Sources obsolètes (versions remplacées, décisions abandonnées)
Le piège : tout charger d’un coup. Les sources obsolètes pourrissent les réponses — l’assistant ne sait pas qu’elles sont périmées. À ingérer en priorité : vivant + référence. Le reste, plus tard.
Nettoyer, sans réécrire
Trois passes mécaniques avant l’ingestion :
- Dédoublonnage par hash du contenu. Sur un NAS de dix ans, comptez 30 à 40 % de doublons inutiles.
- Tri par date de dernière modification. Tout ce qui a plus de 5 ans et n’est pas marqué “doctrine” passe en archive secondaire.
- Conversion des illisibles. Scans flous, .docx corrompus, fichiers protégés sans mot de passe — à part, à traiter au cas par cas.
Ce qu’il ne faut pas faire : réécrire les documents. C’est la promesse d’un projet à deux ans. Un assistant IA ingère ce que vous avez, pas ce que vous aimeriez avoir.
Structurer le minimum vital
Trois éléments à ajouter à chaque document avant l’ingestion :
- Une date dans le nom de fichier ou dans l’en-tête (AAAA-MM-JJ).
- Un statut : actif, archive, brouillon, périmé.
- Un propriétaire métier (qui peut répondre si l’assistant doute).
Si votre documentation a déjà ces trois métadonnées, vous êtes prêts. Si elle ne les a pas, ajoutez-les sur les 200 documents les plus consultés en priorité — pas sur les 5 000.
Maintenir, sans surinvestir
Une fois l’assistant en production, la documentation doit rester vivante — sans devenir une corvée. Trois routines simples :
- Revue trimestrielle : un référent métier valide ou archive les documents marqués “à statuer”.
- Synchro automatique : connectez la GED à l’assistant pour qu’il voie les nouveaux documents sans intervention.
- Boucle de retour : les utilisateurs signalent les réponses fausses, vous remontez à la source pour la corriger ou l’archiver.
Cas particulier des cabinets EC
Pour un cabinet d’expertise comptable, trois familles documentaires comptent plus que les autres :
- La doctrine (réponses techniques, mémos, jurisprudence) — doit être nettoyée en premier, c’est le cœur de la valeur.
- Les dossiers clients — sensibles, à étanchéifier par client si l’assistant est partagé entre collaborateurs.
- Les procédures internes (cadrage de mission, méthodologies) — utiles surtout aux nouveaux arrivants.
Pas-à-pas dans Cabinets EC : trois assistants à monter avant l’été. Voir aussi notre page cabinets d’expertise comptable.
Vingt minutes sur un échantillon de votre base. On regarde la qualité réelle, on identifie les passages à nettoyer en priorité, on chiffre l’effort.
Réserver une démo→