Automatiser vos documents,
avec la puissance de l'IA, en toute confidentialité.

Une plateforme d'IA chez vous, pour automatiser la reconnaissance de documents et l'extraction de données.
01
OCR, NLP, Computer Vision et IA générative

La performance inégalée du GPT, pour tous vos documents

La capture, la reconnaissance des documents, l’extraction de données, la vérification ou la détection de fraude... ont été radicalement changées par les derniers modèles d'Intelligence Artificielle.

Pour faire la lumière sur la réalité des solutions existantes, nous avons joué un protocole de test avec de vraies données, sur les dernières solutions de Kofax, Abbyy, Nanonets et d’autres.

La combinaison des derniers modèles d’OCR, Transformers et IA générative démontre ses performances inégalées.

Nos performances en production :

98.9%
Découpe automatique de documents
99.7%
Identification automatique de documents
99.8%
Détection de points de conformité
98.4%
Extraction de données tapuscrites
94.2%
Extraction de données manuscrites
0.09
Secondes de traitement par page
02
RGPD et sécurité des données

La confidentialité de vos données sensibles

RGPD, HDS, cyber-sécurité… vous ne pouvez pas toujours faire confiance à une solution cloud pour garantir la sécurité de vos documents confidentiels, de vos données personnelles ou de vos données de santé.

Notre solution on-premise utilise une architecture en local qui assure la protection de vos données les plus sensibles. Toutes les opérations de traitement sont effectuées sur votre propre infrastructure, garantissant ainsi la confidentialité et la sécurité de vos documents.
Docker image for OCR and AI
Télécharger notre solution (images Docker)

Notre solution est librement téléchargeable, et toutes ses fonctionnalités peuvent être utilisées dans votre environnement. Il n'y a aucune limite dans les capacités d'entraînement, mais des restrictions sont applicables sur les volumes au-delà d'une inférence de 5 000 documents.

Une intégration simplifiée

Une fois que votre modèle d'IA est entraîné et déployé, vous pouvez simplement appeler votre API depuis vos applications, pour faire de la découpe, de la vérification, de la classification, ou de l'extraction pour personnaliser vos workflows métier.

1
2
3
4
5
6
7
8
9
10
11

12
13

from provenceAI import Model

my_model = Model(
api_key="my_key",
model="my_model")

results = my_model.process(
"my_document.pdf")

print(results)

{
 "pages": [
   {
    "page": 0,
    "class": {
        "value": "Contract",
        "confidence": 0.99 },
     "extractions": [
        "date": {
           "value": date,
           "confidence": 0.90 },
        "signed: {
           "value": true,
           "confidence": 0.95 }]
   }
 ]
}

wait
Qu'il s'agisse d'automatiser des tâches manuelles fastidieuses ou de fournir des informations exploitables, notre plateforme est conçue pour répondre aux divers besoins des organisations dans différents secteurs.

Services publics

Automatiser le traitement de documents contenant des données personnelles et des données de santé, pour libérer les agents, mieux servir les citoyens et les patients.

Secteur financier

Automatiser le traitement de documents financiers confidentiels (grand public, entreprises) et conduire des contrôles anti-fraude.

Assurances

Accélérer le traitement des demandes d'indemnisation, l'adhésion et la souscription, pour fluidifier la relation client et réduire la charge des souscripteurs ou des chargés d'indemnisation.

Entreprises

Simplifier le traitement automatique des documents RH, comptables et autres flux massifs de documents.
03
· capacités
Notre plateforme est utilisée par de grandes organisations qui doivent traiter des volumes massifs de documents, pour des problématiques d'identification, de classification, d'extraction de données complexes, ou de lutte contre la fraude.
Fonctionnalités de la version libre Frioul v.1.2
  • Création de modèles de classification, d'extraction ou combinés.
  • Annotations illimitées (labels de documents et d'extraction).
  • Entraînements et inférence des modèles (entraînements illimités, inférence limitée à 5 000 pages).
  • Correction des images (orientation, obliques, bruit...).
  • scoring : scores de lisibilité des images, scores de confiance sur la classification et l'extraction des données.
  • Interface d'arbitrage utilisateur : vous pouvez corriger l'output selon une limite de confiance.
  • Interface d'analyse des performances par labels.
  • Récupération des données extraites (.csv).
  • splitter : découpage automatique de pièces, sur documents entraînés.
  • splitterAI : découpage agnostique de pièces zéro shot (alpha).
  • quickLearnAI : moteur de classification par similarité.
  • fewShotAI : peu d'annotions, grâce à l'IA générative appliquée aux documents annotés, pour démultiplier la performance.
  • quality : module permettant de valider la qualité des données extraites, selon des critères sur chaque type de données.
  • Accès à l'API
Fonctionnalités additionnelles de la version Massilia v.1.1
  • rights: module de gestion avancée des rôles et des droits pour la plateforme.
  • reTrain: planification intelligente du réentrainement des modèles.
  • autoImproveAI: le modèle se nourrit automatiquement pour améliorer ses performances.
  • arbitrageAI: l'interface d'arbitrage inclut des fonctionnalités avancées telles que la rétro-amélioration des modèles, la possibilité d'arbitrer des dossiers (session comprenant plusieurs documents), de re-jouer des workflows (nommage, classement, etc.), la suggestion de nouveaux labels sur les documents non reconnus, la correction sur des documents historiques.
  • flows: vous construisez des workflows de traitement de données avancés dans l'application.
  • compute: vous construisez des règles de calcul pour la validation des données.
  • lookup: connecteur universel pour interroger des services tiers (API, SQL).
  • truthOrDareAI: module de validation de l'authenticité des documents (image forensics).
  • fraudAI: modèles de détection de fraude (incohérence documentaire, incohérences intra-dossier, suspicions inter-dossiers) basés sur des règles métier.
wait