> For the complete documentation index, see [llms.txt](https://docs.mindee.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.mindee.com/v2/fr/modeles-extraction/extraction-models-overview.md).

# Aperçu du modèle Extraction

## Qu'est-ce qu'un modèle d'extraction ?

Un **modèle d'extraction** sur la plateforme Mindee est un type de [modèle](/v2/fr/models/models-overview.md) conçu pour extraire des données structurées à partir de documents à l'aide de la reconnaissance optique de caractères (OCR) combinée à des techniques avancées d'extraction de données.

Chaque modèle définit un ensemble de champs appelé un [Aperçu du schéma de données](/v2/fr/modeles-extraction/data-schema.md). Les champs pourraient inclure « Nom du fournisseur », « Numéro de facture » ou « Montant total » pour un modèle de facture, par exemple. Le système identifiera ensuite et extraira les données des fichiers téléversés conformément à ces définitions de champs.

Vous pouvez créer des modèles d'extraction pour tout type de document, y compris : factures, reçus, passeports, cartes d'identité, états financiers, etc.

Les modèles vous permettent d'automatiser le processus de transformation d'images de documents non structurés en données structurées exploitables. Ils peuvent être adaptés à différents types de documents et besoins métier, en veillant à ce que seules les informations pertinentes soient capturées pour vos flux de travail.

Chaque Modèles Extraction contient ces outils et fonctionnalités dédiés :

* [Aperçu du schéma de données](/v2/fr/modeles-extraction/data-schema.md): un modèle est également défini par un Schéma de données, qui définit la liste des champs que l'API doit extraire pour un type donné de documents.
* [Apprentissage continu (RAG)](/v2/fr/modeles-extraction/optional-features/improving-accuracy.md): il permet à l'utilisateur de fournir des instructions supplémentaires sur certains exemples présentant un comportement inattendu afin d'améliorer durablement les performances d'extraction du modèle.
* [Paramètres du modèle](/v2/fr/models/model-settings.md): paramètres généraux du modèle tels que la zone de traitement, la Politique de stockage, le transfert de propriété, etc.

## Créer un modèle d'extraction <a href="#creating-from-scratch" id="creating-from-scratch"></a>

Depuis la page principale de la plateforme Mindee, cliquez sur **« Créez votre modèle d'IA documentaire ».**

### Créer à partir du catalogue de modèles

Il y a de fortes chances que le document que vous essayez d'automatiser soit un type de document connu, et qu'il soit déjà présent dans notre catalogue de modèles : facture, reçu, passeport, document financier, carte d'identité...\
\
Ce sont des modèles de référence avec des Schémas de données créés par notre équipe de science des données, qui vous permettent de démarrer rapidement en utilisant un ensemble de champs prédéfinis.

Vous pouvez rechercher dans notre catalogue les modèles adaptés, puis simplement cliquer sur celui qui correspond le mieux à vos besoins. Cela créera un nouveau modèle dans le compte de votre organisation avec son propre ID de modèle, vous permettant de l'utiliser et de le modifier.

{% hint style="info" %}
**Les modèles du catalogue sont fournis avec des champs d'extraction génériques.**

Vous devrez probablement ajouter et/ou modifier des champs pour répondre à vos besoins et à votre cas d'usage.
{% endhint %}

### Créer un modèle personnalisé <a href="#creating-from-scratch" id="creating-from-scratch"></a>

Si aucun des modèles du catalogue ne répond à vos besoins, vous pouvez repartir de zéro.\
Lors de la création d'un nouveau modèle, cliquez sur **« document personnalisé ».**\
Cette étape générera également l'ID unique du modèle.

Une boîte de dialogue vous permettra d'expliquer votre besoin. Vous devriez décrire précisément le document que vous souhaitez traiter et discuter des champs à extraire. Notre agent IA vous aidera à définir rapidement un schéma de données initial que vous pourrez ajuster plus tard.

{% hint style="info" icon="lightbulb" %}
**Nous recommandons de créer rapidement un modèle initial.**

Une fois créé, affinez le [Aperçu du schéma de données](/v2/fr/modeles-extraction/data-schema.md) sur la plateforme, en utilisant la [Live Test](/v2/fr/models/live-test.md) fonctionnalité pour peaufiner vos champs et vos consignes.
{% endhint %}

## Modifier votre Schéma de données d'extraction

Une fois que vous avez créé un modèle, vous voudrez probablement modifier son [Schéma de données](/v2/fr/modeles-extraction/data-schema.md) pour mieux répondre à vos besoins.

Même si le modèle a été créé à partir d'un modèle de référence dans le catalogue, il est unique à votre compte et entièrement personnalisable.

Rendez-vous sur la page Schéma de données où vous pouvez ajuster les champs, mettre à jour les configurations et personnaliser les paramètres selon vos besoins.

### Utilisation de l'assistant IA

L'assistant IA Mindee est un outil puissant qui peut vous aider à tirer le meilleur parti de votre modèle.

Il est disponible dans une boîte de dialogue sur la page Schéma de données du modèle.

Soyez aussi précis que possible avec les noms des champs ; les noms et valeurs exacts doivent être entre guillemets.\
\
Exemples de phrases à modifier pour votre schéma de données avec l'assistant IA :

* *Ajouter un nouveau champ : « id du document »*\
  ⇒ Créera un nouveau champ de texte.
* *Ajouter un nouveau champ : « est en retard »*\
  ⇒ Créera un nouveau champ booléen\
  Astuce : les noms des champs booléens devraient commencer par « est » ou « a ».
* *Renommer le champ « date » en « date de facture »*
* *Modifier le champ « document\_type » en un champ de classification. Les classes attendues sont « INVOICE » et « RECEIPT »*

## Optimiser les résultats du modèle

Afin d'optimiser la précision d'un modèle donné, la première étape consiste à [affiner le Schéma de données](/v2/fr/modeles-extraction/data-schema-best-practices.md).

commencer par demander à l'assistant IA Mindee de [optimiser automatiquement](/v2/fr/modeles-extraction/data-schema-best-practices.md#automated-optimization) votre Schéma de données.

Si vous êtes parti d'un modèle de référence dans le catalogue, il est généralement nécessaire de l'adapter à vos documents spécifiques et à votre cas d'usage.

Après cette étape, s'il subsiste encore des problèmes ou un comportement inattendu, d'autres améliorations sont possibles.

### Problèmes avec des modèles de référence spécifiques

Lorsque la précision globale est bonne, mais qu'il y a des problèmes sur certains modèles de documents spécifiques.

Pour cela, vous voudrez activer [Apprentissage continu (RAG)](/v2/fr/modeles-extraction/optional-features/improving-accuracy.md). Cela permet d'ajouter des indications à des modèles spécifiques, ce qui signifie que vous pouvez cibler les documents problématiques tout en laissant les autres inchangés.

### Précision élevée requise

Lorsque vous avez besoin d'une très grande précision pour tous les documents que vous traitez.

Envisagez d'activer [Score de confiance et exactitude améliorée](/v2/fr/modeles-extraction/optional-features/automation-confidence-score.md). Cela utilise plusieurs modèles pour une précision accrue **et** signale les champs problématiques.

Les champs signalés peuvent être envoyés en [révision humaine](#end-user-review) ou le document peut être rejeté entièrement, selon les règles métier définies de votre côté.

### Révision par l'utilisateur final

Lorsque vous affichez les documents aux utilisateurs finaux, généralement lorsqu'ils peuvent revoir et corriger les données extraites.

Vous pouvez activer [Polygones (boîtes englobantes)](/v2/fr/modeles-extraction/optional-features/polygons-bounding-boxes.md) afin que l'emplacement des champs extraits puisse être affiché (cela est toujours activé dans le [Live Test](/v2/fr/models/live-test.md)). De cette façon, il sera beaucoup plus facile pour vos utilisateurs de repérer les champs erronés et de les corriger.

C'est encore plus puissant lorsqu'il est combiné avec [scores de confiance](/v2/fr/modeles-extraction/optional-features/automation-confidence-score.md), vous pouvez signaler directement dans vos formulaires les champs nécessitant une attention.

### Avantages combinés

Ces fonctionnalités fonctionnent ensemble pour créer un système qui devient plus précis à mesure que vous l'utilisez, réduisant les corrections manuelles et améliorant les taux de réussite de l'automatisation.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.mindee.com/v2/fr/modeles-extraction/extraction-models-overview.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.