
Le limitazioni su un modello AI pensato per la sicurezza finiscono per ostacolare la ricerca legittima, utile contesto per un collega che lavora in ambito scientifico o tecnologico.

Troppe restrizioni su Claude Fable 5 Flusso della storia e fatti chiave
Anthropic ha rilasciato Claude Fable 5, una variante del modello AI Claude Mythos 5 progettata per prevenire usi impropri in ambiti sensibili come biologia, chimica e cybersicurezza. Per motivi di sicurezza, il modello blocca automaticamente richieste che potrebbero essere collegate a minacce biologiche o attacchi informatici, anche quando i prompt sono neutri o scientificamente legittimi. Questo ha portato a numerosi falsi positivi, con ricercatori che segnalano l’impossibilità di ottenere risposte a domande fondamentali come 'cosa sono le membrane cellulari' o 'come si diffonde il virus Ebola'.
Anthropic ha ammesso che le protezioni sono conservative e che il modello può bloccare input innocui. In questi casi, l’utente viene automaticamente spostato a Claude Opus 4.8, il modello più potente, ma senza notifica iniziale. Dopo le proteste, è stato aggiunto un avviso per informare dell’interruzione del flusso. Nonostante ciò, la frequenza dei blocchi sta ostacolando l’uso accademico e professionale del modello.
Microsoft, che distribuisce Claude Fable 5 tramite GitHub Copilot e Microsoft Foundry, ha limitato l’accesso interno a causa di preoccupazioni sulla privacy. Il team legale deve ancora approvare l’uso del modello, poiché Anthropic conserva prompt e output per 30 giorni, sollevando timori su possibili fughe di dati sensibili. Mentre Anthropic promette di ridurre i falsi positivi, il bilanciamento tra sicurezza e funzionalità rimane un punto critico per l’adozione di modelli AI in contesti scientifici.
Fatti
- Anthropic ha rilasciato Claude Fable 5, una versione con restrizioni su biologia, chimica e cybersicurezza per prevenire usi impropri.
- Il modello blocca anche domande innocue, come 'cosa sono le membrane cellulari', generando proteste tra i ricercatori.
- In caso di blocco, l’utente viene spostato a Claude Opus 4.8 senza notifica iniziale; un avviso è stato aggiunto dopo le critiche.
- Microsoft ha limitato l’uso interno di Claude Fable 5 per motivi di privacy, in attesa di una valutazione legale sui dati conservati.
- Anthropic conserva prompt e output per 30 giorni, sollevando preoccupazioni su accesso a informazioni confidenziali.
Spiegazione visiva delle notizie di Canto. Gli strumenti AI possono assistere la produzione. Politica editoriale





