▸ Outil Zevra · Conformité RGPD

Anonymisez et pseudonymisez vos documents juridiques

Avant de soumettre une pièce à une IA générative, neutralisez les données personnelles. Traitement en mémoire vive, table de correspondance jamais loggée, conformité RGPD art. 4.5.

Réservé aux membres ZevraInscription en 30 secondesSans carte bancaire

Aucun stockage

RAM-only. Aucune écriture disque, aucun log de contenu.

Réversible

Mapping JSON local. Vous seul·e désanonymisez.

Open API

Endpoint REST + SDKs. Intégrable à votre stack.

▸ Comment ça marche

Quatre étapes, zéro fuite

01
Envoyez votre document
PDF, DOCX, TXT, Markdown ou HTML. Sans limite de taille raisonnable.
02
Extraction et neutralisation
Noms, adresses, n° SS, raisons sociales… remplacés par des tokens neutres : PERSON_1, COMPANY_2, ADDRESS_3.
03
Récupérez le résultat
Document Markdown anonymisé + table de correspondance JSON pour la désanonymisation locale.
04
Soumettez à n'importe quelle IA
Claude, ChatGPT, Mistral, Gemini… Vous remappez les tokens en local sur la réponse.

Performance : P95 < 1.4s · Aucun apprentissage sur le contenu utilisateur.

▸ La technique derrière l'outil

Du Machine Learning spécialisé, pas un LLM

L'Anonymisateur repose sur un modèle de Machine Learning entraîné pour le français juridique. Sa seule fonction : repérer les entités personnelles dans un texte. Il ne lit pas votre document au sens où le ferait un LLM, il ne le comprend pas, il ne génère rien. C'est cette différence d'architecture — et pas une simple clause contractuelle — qui rend votre contenu techniquement inaccessible.

NOTRE OUTIL

ML spécialisé, hébergé en France

▸Modèle léger (~500 Mo) qui identifie les entités personnelles, sans rien produire d'autre.
▸Aucun prompt, aucune mémoire, aucune reformulation possible.
▸Traitement en mémoire vive. Le document est effacé dès la réponse renvoyée.
▸Modèle figé : il ne s'entraîne pas sur ce que vous lui soumettez.
▸Infrastructure souveraine, aucun sous-traitant hors Union Européenne.

LLM CLOUD

ChatGPT, Claude, Gemini…

▸Modèle génératif (centaines de milliards de paramètres) qui lit, comprend et reformule.
▸Le contenu transite par les serveurs du provider, souvent hors UE.
▸Logging par défaut, conservation 30 jours minimum, équipes de modération qui peuvent inspecter.
▸Vos données peuvent ressortir telles quelles dans la réponse d'un autre utilisateur si le modèle est ré-entraîné dessus.
▸Aucune garantie technique sur l'effacement réel du prompt.

▸ Pourquoi la confidentialité est garantie

Comme notre modèle ne fait qu'identifier des entités — sans mémoire, sans génération, sans ré-entraînement — il ne peut techniquement pasmémoriser ni restituer votre contenu. C'est l'architecture qui sécurise, pas une promesse contractuelle.

1. Inférence stateless

Chaque requête est isolée. Aucun état n'est conservé entre deux appels.

2. Aucune écriture disque

Le document vit en mémoire vive le temps du traitement. Aucun log de contenu n'est produit.

3. Mapping côté client

La table de correspondance vous est renvoyée et n'est jamais persistée chez nous. Vous seul·e désanonymisez.

Cas d'usage validés par DPO de cabinets d'avocats. Le secret professionnel reste sous votre contrôle exclusif — la pseudonymisation préalable est précisément ce que recommande la CNIL avant tout recours à un LLM tiers.