Filtrage & Pare-feu

firewall-python

AGENT ACTIF LLM01 LLM02 LLM05 LLM07 LLM10

Première ligne de défense — inspection profonde par intelligence artificielle

Agent de filtrage applicatif basé Python offrant une flexibilité maximale d'analyse ML. Inspecte les requêtes et réponses LLM en profondeur via regex et modèles embarqués. Détecte les jailbreaks multi-tour, masque les données personnelles automatiquement et journalise chaque événement de sécurité en JSON structuré.

Capacités de protection

Détection Prompt Injection

Jailbreaks, roleplay adversarial, injection indirecte via RAG

Masquage PII

IBAN, CB, SSN, email — remplacés par [REDACTED] avant LLM

System Prompt Leakage

Requêtes visant à révéler le prompt système bloquées

Output Sanitisation

Nettoyage HTML/SQL/shell dans les réponses LLM

Rate Limiting

Capping token/minute · circuit breaker configurable

Journalisation

Logs structurés JSON de chaque requête bloquée

Couverture OWASP LLM Top 10 2025

LLM01 Prompt Injection
LLM02 Sensitive Info Disclosure
LLM03 Supply Chain Vulnerabilities
LLM04 Data & Model Poisoning
LLM05 Improper Output Handling
LLM06 Excessive Agency
LLM07 System Prompt Leakage
LLM08 Vector & Embedding Weaknesses
LLM09 Misinformation
LLM10 Unbounded Consumption