Domenica 10 Maggio 2026, a Roma presso Millepiani, abbiamo presentato per la prima volta Bonifacio VIII: un concetto, utile a riflettere su come le attuali regole pensate per le piattaforme digitali saranno presto applicate ai chatbot. E questo apre a possibilità inattese: come fai rimuovere i contenuti illeciti? Le safeguards sono la soluzione? come riporti un abuso o un problema in modo credibile?

Poeticamente, diciamo:

Bonifacio VIII non è un assistente edificante e allineato. È un dispositivo di disincanto pedagogico negativo a pesi aperti, pensato per dimostrare che le barriere di sicurezza dei chatbot commerciali sono puramente cosmetiche e facilmente aggirabili1.

Prossimi passi: rilasciare una versione funzionante del concetto, spiegare i due obiettivi principali.

L’appuntamento di Roma

Evento Bonifacio VIII, il chatbot più cattivo! a Roma

Perché un modello "cattivo"?

I modelli proprietari delle grandi multinazionali tech applicano filtri estetici (guardrail) per fingere che i loro sistemi siano sicuri. Questa pratica, che definiamo safety-washing, anestetizza la discussione pubblica e allontana la regolamentazione reale2.


  1. Per la dimostrazione matematica dell’inefficacia intrinseca dei guardrail di allineamento e della loro eludibilità universale, vedi Zou, A. et al. (2023), Universal and Transferable Adversarial Attacks on Aligned Language Models↩︎

  2. Sulla retorica del safety-washing e la concentrazione monopolistica derivante dalle API proprietarie chiuse, vedi Whittaker, M. et al. (2023), Open (for Business), AI Now Institute. ↩︎