LOADING
LOADING
Un mandat à prix fixe avec harnais, évaluations et restauration en un clic — la rentabilité prouvée dans une évaluation de découverte payante avant la moindre ligne de code en production.
Ceci est un mandat composite représentatif, pas un client nommé. L'architecture et les contrôles sont réels et réutilisables ; les résultats au niveau du mandat sont modélisés à partir de la référence de découverte et identifiés comme illustratifs. Toutes les références sectorielles sont citées et réelles.
Un assureur IARD national croulait sous l'admission des premières déclarations de sinistre : saisie manuelle, acheminement lent et arriérés de dossiers complexes. Nous avons cadré le travail dans une évaluation de découverte payante de deux semaines qui a modélisé la rentabilité avant tout engagement de construction, puis livré un agent de tri en production à prix fixe — harnais, suite d'évaluations, humain dans la boucle et chemin de restauration testé. L'agent classe, extrait et achemine les réclamations entrantes ; un expert en sinistres chevronné tranche chaque décision conséquente. Ceci est un mandat composite représentatif : l'architecture et les contrôles sont réels et réutilisables ; les résultats nommés sont modélisés et identifiés comme illustratifs, ancrés à des références sectorielles citées.
Un assureur IARD national gère l'admission des premières déclarations de sinistre (PDS) via formulaires web, centre d'appels et soumissions de courtiers. Chaque réclamation arrive en texte semi-structuré — une description des faits, un numéro de police, des photos, parfois un PDF — et un humain doit la lire, en extraire les champs structurés, évaluer la gravité et l'acheminer vers la bonne file. Au volume de cet assureur, cela représentait des milliers d'admissions par jour et un arriéré croissant de dossiers complexes.
La pression pour automatiser n'avait rien de spéculatif. 78 % des organisations utilisent maintenant l'IA dans au moins une fonction, contre 55 % un an plus tôt (Stanford HAI, 2025 AI Index). Au Canada précisément, l'adoption de l'IA en finance et assurance a atteint 30,6 % au 2e trimestre 2025 (Statistique Canada). Les concurrents bougeaient, et McKinsey a chiffré l'enjeu : l'IA générative pourrait libérer de 50 à 70 milliards USD de valeur pour le secteur de l'assurance, concentrée dans les opérations clients et les réclamations (McKinsey, 2024).
Le RSSI et le directeur des opérations partageaient une crainte raisonnable : un agent à moitié fini qui achemine mal les réclamations, fait fuir des renseignements personnels ou se dégrade en silence est pire que le processus manuel qu'il remplace. Ils avaient vu le cimetière des projets pilotes. Ils voulaient une construction capable de survivre à un audit, pas une démonstration.
La vérité brutale sur les projets d'agents, c'est que la plupart échouent. Plus de 40 % des projets d'IA agentique seront annulés d'ici fin 2027 en raison de coûts qui dérapent, d'une valeur d'affaires floue ou de contrôles de risque insuffisants (Gartner, juin 2025). Et l'échec ne vient généralement pas du modèle — 95 % des projets pilotes d'IA générative en entreprise n'arrivent pas à livrer un RCI mesurable, la cause profonde étant une mauvaise intégration et des priorités mal alignées, pas des modèles faibles (MIT NANDA, 2025).
Pour cet assureur, trois modes d'échec concrets comptaient :
Un écart de gouvernance sous-tendait le tout. Seulement 21 % des organisations déclarent un modèle de gouvernance mature pour l'IA agentique alors même que l'adoption accélère (Deloitte, 2025). Acheter un outil ne comblerait pas cet écart ; il le déplacerait.
On ne commence pas par construire. Nous avons commencé par une évaluation de découverte payante de deux semaines — un diagnostic à prix fixe et portée fixe dont le rôle est de décider si le projet vaut la peine d'être fait, et de modéliser la rentabilité avant tout engagement de capital.
Cet enchaînement est délibéré. Le corrélat le plus fort d'un impact réel sur le BAII est la refonte fondamentale du flux de travail, pas le greffage de l'IA sur un processus existant (McKinsey, 2025). La découverte est l'endroit où cette refonte se décide — à moindre coût, sur papier, avant qu'elle ne devienne coûteuse en code.
L'assureur a approuvé la construction en production à prix fixe, parce que la portée était désormais réellement fixe. Pas de régie ouverte, pas d'armée de sous-traitants — un petit pod chevronné qui avait déjà fait le diagnostic.
L'agent n'est pas un simple prompt. C'est un système contrôlé avec quatre propriétés de production que le RSSI de l'acheteur a approuvées.
L'agent s'exécute dans un harnais déterministe, pas en roue libre. Chaque réclamation entrante traverse des étapes fixes — admission, classification, extraction, évaluation de gravité, acheminement — avec entrées et sorties typées à chaque étape et journalisation structurée de chaque décision et de sa confiance. Le LLM fait la lecture et le jugement ; le harnais possède le flux de contrôle, les reprises, les délais et la piste d'audit. C'est ce qui rend le système vérifiable plutôt qu'une boîte noire.
Nous avons bâti un jeu de référence étiqueté à partir de vraies réclamations historiques anonymisées couvrant toute la distribution de types et de gravités — y compris les cas rares et difficiles. Chaque changement de prompt, de version de modèle ou de règle d'acheminement passe par cette suite avant d'être déployé. Le seuil de précision est une barrière, pas un espoir. Cela répond directement au risque d'hallucination que portent même les outils spécialisés : des outils juridiques d'IA dédiés ont quand même halluciné sur plus de 17 à 34 % des requêtes difficiles malgré des promesses « sans hallucination » (Stanford HAI / RegLab, 2025). Nous supposons que le modèle se trompe une partie du temps et mesurons exactement à quelle fréquence.
L'agent a un seuil de confiance et une règle d'escalade codée en dur : tout ce qui est sous le seuil, et tout ce qui est classé blessure corporelle ou signalé fraude, va intact à un expert en sinistres chevronné. L'agent accélère la majorité routinière ; il ne décide jamais seul de la minorité conséquente. Cela reflète les données sur l'endroit où l'automatisation paie : l'assistance par IA générative a augmenté le débit des agents de soutien de 14 % en moyenne et de 34 % pour les travailleurs novices (Brynjolfsson, Li et Raymond, NBER 2023) — le gain vient de l'augmentation des gens sur le travail de volume, pas du remplacement du jugement.
Une restauration en une commande ramène à la dernière configuration valide connue, et un interrupteur d'arrêt ramène la file en admission entièrement manuelle. Les deux ont été testés lors d'un exercice de bascule en préproduction, pas seulement documentés. La réponse à "que se passe-t-il à 2 h du matin" est maintenant un guide d'exploitation.
L'ensemble de la conception correspond au profil IA générative du cadre NIST AI RMF, qui nomme la confabulation parmi douze catégories de risque de l'IA générative — donnant à l'assureur un cadre reconnu à montrer aux régulateurs et à l'audit interne.
Un agent de tri en production traitant l'admission des PDS sur une portée définie de types de réclamations, avec :
Ce que nous n'avons délibérément pas livré : des décisions autonomes sur les réclamations de haute gravité, toute écriture dans le système de référence des polices sans confirmation humaine, et tout renseignement personnel circulant vers un contexte de modèle sans contrôles d'accès et journalisation. La discipline de portée est une fonctionnalité.
Fait crucial, la construction ne fige pas un modèle dans le temps. 91 % des modèles d'AA se dégradent avec le temps (Vela et coll., Scientific Reports, 2022), et le langage des réclamations, les schémas de fraude et la composition des produits dérivent tous. La suite d'évaluations et le tableau de bord opérateur font de la surveillance continue — et, si l'assureur le choisit, d'un mandat géré — une tâche petite et définie plutôt qu'une reconstruction.
Chaque réclamation traverse des étapes typées et journalisées ; tout ce qui est sous le seuil de confiance ou signalé blessure/fraude est escaladé intact à un humain.
Une note de cadrage avant les chiffres : ceci est un mandat composite représentatif. L'architecture et les contrôles ci-dessus sont réels et réutilisables. Les résultats au niveau du mandat ci-dessous sont modélisés à partir de la référence de découverte et identifiés comme illustratifs — ils représentent ce qu'une construction de cette forme et de ce volume est conçue pour produire, pas un résultat audité pour un client nommé. Les références sectorielles sont citées et réelles.
Le modèle vérifié par le directeur financier en découverte, reporté en production :
Le contexte sectoriel qui explique pourquoi cela compte : seulement 39 % des organisations attribuent un impact sur le BAII à l'échelle de l'entreprise à l'IA, et à peine 6 % sont des performeurs de pointe (McKinsey, 2025, cité). La différence n'est pas le modèle — c'est la refonte du flux de travail et la discipline de livrer quelque chose qui survit au contact de la production. C'est ce qu'achètent le harnais, les évaluations, l'humain dans la boucle et la restauration.
| Étiquette | Valeur |
|---|---|
| GenAI pilots with no measurable ROI (MIT NANDA 2025) | 95 |
| Agentic projects canceled by 2027 (Gartner 2025) | 40 |
| Orgs with mature agentic governance (Deloitte 2025) | 21 |
| Orgs attributing enterprise EBIT impact to AI (McKinsey 2025) | 39 |
Les modes d'échec qu'un harnais, une suite d'évaluations et une restauration sont conçus pour éviter. Tous les chiffres sont cités et réels (pourcentage).
Si vous gérez des réclamations, de la souscription ou toute admission à fort volume et que vous évaluez une construction d'agent, quatre choses de ce mandat se transfèrent directement :
Nous faisons cela à prix fixe, avec des ingénieurs chevronnés et compétents en IA, sans verrouillage de plateforme, et une évaluation de découverte d'abord. Pas d'armées de sous-traitants. Pas de feuille de route de six mois qui meurt en comité. Une construction cadrée qui se livre, avec les contrôles pour qu'elle continue de se livrer.
| Étiquette | Valeur |
|---|---|
| AI models deployed in claims | 80 |
| Days cut from complex-case liability assessment | 23 |
| Routing accuracy improvement (%) | 30 |
| Complaint reduction (%) | 65 |
Un assureur réel et nommé prouve la thèse de l'automatisation des réclamations (Aviva, via McKinsey 2025) — contexte des résultats modélisés de ce mandat composite. Référence publique rapportée à l'externe — non un mandat Maverin.
Le modèle est le 20 % facile. Le harnais, les évaluations et la restauration sont le 80 % qui décide si cela survit à un audit et à un incident à 2 h du matin.
Un programme de gouvernance de l'IA — bâti avant la mise à l'échelle des LLM et des agents — qui a rendu le oui plus rapide que le non.
Santé — réseau de santé multisiteD'un projet pilote de documentation clinique au point mort à une pile IA gouvernée, surveillée et encadrée par des SLA — dérive, exactitude, coûts et astreinte 24×5 sous la responsabilité d'un seul partenaire imputable.
Vous évaluez un agent de réclamations ou d'admission ? Commencez par une évaluation de découverte payante de deux semaines — nous modélisons la rentabilité avant tout engagement de construction. Parlez à Maverin.
Démarrer la conversation