> For the complete documentation index, see [llms.txt](https://docs.mindee.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.mindee.com/v2/fr/modeles-extraction/optional-features/improving-accuracy.md).

# Apprentissage continu (RAG)

## Aperçu

Lorsque vous utilisez un modèle Extraction, il arrive parfois que la précision de l’extraction ne soit pas satisfaisante sur un document donné ou sur un modèle particulier.

Si vous avez déjà suivi la [Bonnes pratiques du Schéma de données](/v2/fr/modeles-extraction/data-schema-best-practices.md), et que les résultats ne sont toujours pas satisfaisants, tout n’est pas perdu.

Vous disposez d’un moyen d’améliorer durablement les performances du modèle pour les prochaines prédictions que vous effectuerez. La solution dont vous avez besoin est la fonctionnalité RAG.

{% embed url="<http://app.supademo.com/demo/cmfb3c7166gdc39ozj39wogrz>" %}

## Bases du fonctionnement interne de RAG

La génération augmentée par récupération, ou RAG, est une approche en intelligence artificielle qui combine les forces des modèles de récupération avec la production de texte par des LLM génératifs.

En substance, RAG s’appuie sur une riche base de données de documents sources et d’embeddings pour enrichir la base de connaissances dont il tire ses réponses. Cela signifie que le système récupère des extraits de données spécifiques et contextualisés, puis les utilise pour générer des réponses sémantiques et finement ajustées, à la fois créatives et factuellement exactes.

### Étapes globales de RAG

1. L’annotation d’un échantillon donné, ce qui signifie indiquer au modèle la différence entre les données extraites et la ou les valeurs attendues. Lorsqu’il est activé, cet exemple sera ajouté à la base de données RAG pour l’avenir.
2. Récupération : Lorsque le prochain document sera envoyé avec l’option RAG activée, le modèle essaiera de rechercher un exemple similaire dans la base de données existante. La question ici est : "Il existe peut-être un exemple existant pour lequel je dois suivre les instructions afin de ne pas refaire la même erreur". Si aucun exemple n’est trouvé, il n’est pas nécessaire d’enrichir la prédiction. Si un exemple correspond dans la base de données RAG, on passe à l’étape 3.
3. Génération augmentée : un document a été associé dans la base de données RAG. Le modèle utilisera les consignes que vous avez données sur l’échantillon RAG pour produire cette fois une meilleure prédiction. La prédiction générée est enrichie d’un contexte existant, ce qui aide le modèle à être meilleur cette fois-ci.

<figure><img src="/files/c3d2d7729bab6394362fc2fe243b4d4b2cf0de10" alt="RAG process overview" width="563"><figcaption></figcaption></figure>

## Activer RAG

### Configurer la base de données RAG

Pour utiliser RAG sur un modèle Extraction donné, vous devrez d’abord configurer la base de données RAG qui contiendra vos documents et vos données.

Accédez à la base de données en cliquant sur le lien "Apprentissage continu (RAG)" dans la section de configuration du modèle.\
\
Vous pouvez ensuite enrichir votre base de données RAG en téléversant des documents dont le comportement n’est pas satisfaisant.

Vous devez annoter le document en cochant les champs que vous souhaitez voir pris en compte par l’enrichissement RAG sur ce modèle. Vous pouvez également ajouter des consignes supplémentaires en langage clair.

{% hint style="success" %}
La plupart du temps, l’annotation suffit à faire comprendre le problème au modèle.\
Nous recommandons d’utiliser la consigne uniquement lorsque l’annotation ne résout pas le problème.
{% endhint %}

Une fois ce document annoté, **veuillez le valider**, puis allez à l’onglet Live test.\
\
Vous devez téléverser un document et laisser cochée l’option "Afficher l’extraction RAG".

Idéalement, choisissez un document utilisant le même gabarit (une autre facture du même fournisseur, par exemple), mais pas exactement celui que vous avez utilisé dans la base de données RAG. Vous verrez les prédictions avant/après et devrez pouvoir vérifier que les consignes supplémentaires ont été prises en compte afin d’enrichir correctement la prédiction.\
\
À l’avenir, les documents respectant le même gabarit devraient être enrichis, ce qui devrait augmenter considérablement les performances sur ce gabarit donné. Pour les autres types de documents, le comportement reste le même, ce qui signifie que RAG améliore le résultat sans régression sur les autres documents.

### Activer RAG sur la plateforme

Cliquez sur l’onglet "Schéma de données" puis sur "Fonctionnalités optionnelles". Vous pourrez y activer la fonctionnalité "Traitement RAG".

### Activer RAG via des appels API

## Foire aux questions

### Comment mes données sont-elles protégées pendant le traitement RAG ?

Vos données restent privées et isolées au sein de votre modèle.

Tous les documents et annotations ajoutés à votre base de données RAG sont chiffrés lors du transit.

### Mes données RAG sont-elles partagées avec d’autres utilisateurs ou vendues à des tiers ?

Non, jamais.

Les données RAG ne sont accessibles qu’aux utilisateurs de l’organisation à laquelle appartient le modèle.

Mindee ne vend jamais de données à des tiers.

Le stockage et la récupération de toutes les données RAG s’effectuent sur les serveurs dédiés de Mindee.

### Mindee utilise-t-elle mes données RAG pour l’entraînement ?

Non, jamais.

Nous n’utilisons les données RAG qu’en interne, avec votre connaissance explicite et votre consentement préalable. Cela se limite à l’utilisation de vos documents pour aider à résoudre un ticket que vous avez ouvert auprès de notre équipe d’assistance.

### Que devient ma base de données RAG si je passe à une offre inférieure ?

Nous ne supprimerons aucun des fichiers que vous avez téléversés dans votre base de données de documents RAG si vous passez à une offre inférieure ; toutefois, vous ne pourrez pas les modifier ni les valider.

Les consignes que vous avez données à vos documents RAG seront prises en compte dans vos inférences avec l’offre inférieure, même si cela dépasse les fonctionnalités de l’offre.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.mindee.com/v2/fr/modeles-extraction/optional-features/improving-accuracy.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.