> For the complete documentation index, see [llms.txt](https://docs.mindee.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.mindee.com/v2/fr/modeles-extraction/extraction-models-overview.md).

# Aperçu du modèle Extraction

## Qu'est-ce qu'un modèle d'extraction ?

Un **modèle d'extraction** dans la plateforme Mindee est un type de [model](/v2/fr/models/models-overview.md) conçu pour extraire des données structurées à partir de documents en utilisant la reconnaissance optique de caractères (OCR) combinée à des techniques avancées d'extraction de données.

Chaque modèle définit un ensemble de champs appelé un [Aperçu du Schéma de données](/v2/fr/modeles-extraction/data-schema.md). Les champs peuvent inclure « Supplier Name », « Invoice Number » ou « Total Amount » pour un modèle de facture, par exemple. Le système identifiera ensuite et extraira les données des fichiers téléversés conformément à ces définitions de champs.

Vous pouvez créer des modèles d'extraction pour tout type de document, y compris : factures, reçus, passeports, cartes d'identité, états financiers, etc.

Les modèles vous permettent d'automatiser le processus de transformation d'images de documents non structurés en données structurées exploitables. Ils peuvent être adaptés à différents types de documents et besoins métier, garantissant que seules les informations pertinentes sont capturées pour vos flux de travail.

Chaque modèle d'extraction contient ces outils et fonctionnalités dédiés :

* [Aperçu du Schéma de données](/v2/fr/modeles-extraction/data-schema.md): un modèle est également défini par un Schéma de données, qui définit la liste des champs que l'API doit extraire pour un type donné de documents.
* [Apprentissage continu (RAG)](/v2/fr/modeles-extraction/optional-features/improving-accuracy.md): elle permet à l'utilisateur de donner des instructions supplémentaires sur certains exemples présentant un comportement inattendu afin d'améliorer durablement les performances d'extraction du modèle.
* [Paramètres du modèle](/v2/fr/models/model-settings.md): paramètres généraux du modèle tels que la zone de traitement, la Politique de stockage, le transfert de propriété, etc.

## Créer un modèle d'extraction <a href="#creating-from-scratch" id="creating-from-scratch"></a>

Depuis la page principale de la plateforme Mindee, cliquez sur **« Créez votre modèle d’IA documentaire ».**

### Créer à partir du catalogue de modèles

Il y a de fortes chances que le document que vous essayez d'automatiser soit un type de document connu, et qu'il soit déjà présent dans notre catalogue de modèles : facture, reçu, passeport, document financier, carte d'identité...\
\
Ce sont des modèles types avec des Schémas de données créés par notre équipe de science des données, ce qui vous permet de démarrer rapidement grâce à un ensemble de champs prédéfinis.

Vous pouvez rechercher dans notre catalogue le modèle le plus adapté, puis simplement cliquer sur celui qui correspond le mieux à vos besoins. Cela créera un nouveau modèle dans le compte de votre organisation, avec son propre ID de modèle, vous permettant de l'utiliser et de le modifier.

{% hint style="info" %}
**Les modèles du catalogue sont fournis avec des champs d'extraction génériques.**

Vous devrez probablement ajouter et/ou modifier des champs pour répondre à vos besoins et à votre cas d'utilisation.
{% endhint %}

### Créer un modèle personnalisé <a href="#creating-from-scratch" id="creating-from-scratch"></a>

Si aucun des modèles du catalogue ne répond à vos besoins, vous pouvez repartir de zéro.\
Lorsque vous créez un nouveau modèle, cliquez sur **« document personnalisé ».**\
Cette étape générera également l'ID de modèle unique du modèle.

Une boîte de dialogue vous donnera l'occasion d'expliquer votre besoin. Vous devez expliquer précisément le document que vous souhaitez traiter et discuter des champs à extraire. Notre agent IA vous aidera à définir rapidement un Schéma de données initial que vous pourrez ajuster ultérieurement.

{% hint style="info" icon="lightbulb" %}
**Nous vous recommandons de créer rapidement un modèle initial.**

Une fois créé, affinez la configuration du nouveau modèle [Aperçu du Schéma de données](/v2/fr/modeles-extraction/data-schema.md) sur la plateforme, en utilisant la [Live test](/v2/fr/models/live-test.md) fonctionnalité de réglage fin pour affiner vos champs et vos consignes.
{% endhint %}

## Modification de votre Schéma de données d'extraction

Une fois que vous avez créé un modèle, vous souhaiterez probablement modifier son Schéma de données [Aperçu du Schéma de données](/v2/fr/modeles-extraction/data-schema.md) pour mieux répondre à vos besoins.

Même si le modèle a été créé à partir du catalogue de modèles, il est unique à votre compte et entièrement personnalisable.

Accédez à la page Schéma de données où vous pouvez ajuster les champs, mettre à jour les configurations et personnaliser les paramètres selon vos exigences.

### Utilisation de l'assistant IA

Vous pouvez utiliser la boîte de dialogue « Assistant IA » pour des améliorations automatisées.

Soyez aussi précis que possible avec les noms de champs ; les noms et valeurs exacts doivent être entre guillemets.\
\
Exemples de phrases pour modifier votre Schéma de données avec l'Assistant IA :

* *Ajouter un nouveau champ : « identifiant du document »*\
  ⇒ Créera un nouveau champ de texte.
* *Ajouter un nouveau champ : « est en retard »*\
  ⇒ Créera un nouveau champ booléen\
  Astuce : les noms de champs booléens devraient commencer par « is » ou « has ».
* *Renommer le champ « date » en « date de facture »*
* *Transformer le champ « document\_type » en champ de classification. Les classes attendues sont « FACTURE » et « REÇU »*

## Optimisation des résultats du modèle

Afin d'optimiser la précision d'un modèle donné, la première étape consiste à suivre le [Bonnes pratiques du Schéma de données](/v2/fr/modeles-extraction/data-schema-best-practices.md) afin d'affiner la configuration du modèle de base. Si vous êtes parti d'un modèle du catalogue, il est généralement nécessaire de l'adapter à vos documents spécifiques et à votre cas d'utilisation.

Après cette étape, s'il subsiste encore certains problèmes ou comportements inattendus, d'autres ajustements sont possibles.

### Problèmes avec des modèles spécifiques

Lorsque la précision globale est bonne, mais qu'il y a des problèmes sur des modèles de documents spécifiques.

Pour cela, vous voudrez activer [Apprentissage continu (RAG)](/v2/fr/modeles-extraction/optional-features/improving-accuracy.md). Cela permet d'ajouter des consignes à des modèles spécifiques, ce qui vous permet de cibler les documents problématiques sans affecter les autres.

### Précision élevée requise

Lorsque vous avez besoin d'une très grande précision pour tous les documents que vous traitez.

Envisagez d'activer [Score de confiance et exactitude améliorée](/v2/fr/modeles-extraction/optional-features/automation-confidence-score.md). Cela utilise plusieurs modèles pour une précision accrue **et** et signale les champs problématiques.

Les champs signalés peuvent être soumis à [une revue humaine](#end-user-review) ou le document peut être entièrement rejeté, selon les règles métier définies de votre côté.

### Revue par l'utilisateur final

Lorsque vous affichez les documents aux utilisateurs finaux, généralement lorsqu'ils peuvent revoir et corriger les données extraites.

Vous pouvez activer [Polygones (boîtes englobantes)](/v2/fr/modeles-extraction/optional-features/polygons-bounding-boxes.md) afin que l'emplacement des champs extraits puisse être affiché (cette option est toujours activée dans le [Live test](/v2/fr/models/live-test.md)). Ainsi, il sera beaucoup plus facile pour vos utilisateurs de trouver les champs erronés et de les corriger.

C'est encore plus puissant lorsqu'il est combiné avec [les scores de confiance](/v2/fr/modeles-extraction/optional-features/automation-confidence-score.md), vous pouvez signaler directement les champs nécessitant une attention particulière dans vos formulaires.

### Avantages combinés

Ces fonctionnalités travaillent ensemble pour créer un système qui devient plus précis à mesure que vous l'utilisez, réduisant les corrections manuelles et améliorant les taux de réussite de l'automatisation.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.mindee.com/v2/fr/modeles-extraction/extraction-models-overview.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.