▸ Outil Zevra · Conformité RGPD
Anonymisez et pseudonymisez vos documents juridiques
Avant de soumettre une pièce à une IA générative, neutralisez les données personnelles. Traitement en mémoire vive, table de correspondance jamais loggée, conformité RGPD art. 4.5.
Aucun stockage
RAM-only. Aucune écriture disque, aucun log de contenu.
Réversible
Mapping JSON local. Vous seul·e désanonymisez.
Open API
Endpoint REST + SDKs. Intégrable à votre stack.
▸ Comment ça marche
Quatre étapes, zéro fuite
- 01
Envoyez votre document
PDF, DOCX, TXT, Markdown ou HTML. Sans limite de taille raisonnable.
- 02
Extraction et neutralisation
Noms, adresses, n° SS, raisons sociales… remplacés par des tokens neutres : PERSON_1, COMPANY_2, ADDRESS_3.
- 03
Récupérez le résultat
Document Markdown anonymisé + table de correspondance JSON pour la désanonymisation locale.
- 04
Soumettez à n'importe quelle IA
Claude, ChatGPT, Mistral, Gemini… Vous remappez les tokens en local sur la réponse.
Performance : P95 < 1.4s · Aucun apprentissage sur le contenu utilisateur.
▸ La technique derrière l'outil
Du Machine Learning spécialisé, pas un LLM
L'Anonymisateur repose sur un modèle de Machine Learning entraîné pour le français juridique. Sa seule fonction : repérer les entités personnelles dans un texte. Il ne lit pas votre document au sens où le ferait un LLM, il ne le comprend pas, il ne génère rien. C'est cette différence d'architecture — et pas une simple clause contractuelle — qui rend votre contenu techniquement inaccessible.
ML spécialisé, hébergé en France
- ▸Modèle léger (~500 Mo) qui identifie les entités personnelles, sans rien produire d'autre.
- ▸Aucun prompt, aucune mémoire, aucune reformulation possible.
- ▸Traitement en mémoire vive. Le document est effacé dès la réponse renvoyée.
- ▸Modèle figé : il ne s'entraîne pas sur ce que vous lui soumettez.
- ▸Infrastructure souveraine, aucun sous-traitant hors Union Européenne.
ChatGPT, Claude, Gemini…
- ▸Modèle génératif (centaines de milliards de paramètres) qui lit, comprend et reformule.
- ▸Le contenu transite par les serveurs du provider, souvent hors UE.
- ▸Logging par défaut, conservation 30 jours minimum, équipes de modération qui peuvent inspecter.
- ▸Vos données peuvent ressortir telles quelles dans la réponse d'un autre utilisateur si le modèle est ré-entraîné dessus.
- ▸Aucune garantie technique sur l'effacement réel du prompt.
▸ Pourquoi la confidentialité est garantie
Comme notre modèle ne fait qu'identifier des entités — sans mémoire, sans génération, sans ré-entraînement — il ne peut techniquement pasmémoriser ni restituer votre contenu. C'est l'architecture qui sécurise, pas une promesse contractuelle.
1. Inférence stateless
Chaque requête est isolée. Aucun état n'est conservé entre deux appels.
2. Aucune écriture disque
Le document vit en mémoire vive le temps du traitement. Aucun log de contenu n'est produit.
3. Mapping côté client
La table de correspondance vous est renvoyée et n'est jamais persistée chez nous. Vous seul·e désanonymisez.
Cas d'usage validés par DPO de cabinets d'avocats. Le secret professionnel reste sous votre contrôle exclusif — la pseudonymisation préalable est précisément ce que recommande la CNIL avant tout recours à un LLM tiers.