Illustrazione di un ricercatore che interagisce con un'interfaccia AI, ma riceve un messaggio di blocco per una domanda su biologia cellulare.
Illustrazione di un ricercatore che interagisce con un'interfaccia AI, ma riceve un messaggio di blocco per una domanda su biologia cellulare.

Le limitazioni su un modello AI pensato per la sicurezza finiscono per ostacolare la ricerca legittima, utile contesto per un collega che lavora in ambito scientifico o tecnologico.

Troppe restrizioni su Claude Fable 5 Flusso della storia e fatti chiave

Anthropic ha rilasciato Claude Fable 5, una variante del modello AI Claude Mythos 5 progettata per prevenire usi impropri in ambiti sensibili come biologia, chimica e cybersicurezza. Per motivi di sicurezza, il modello blocca automaticamente richieste che potrebbero essere collegate a minacce biologiche o attacchi informatici, anche quando i prompt sono neutri o scientificamente legittimi. Questo ha portato a numerosi falsi positivi, con ricercatori che segnalano l’impossibilità di ottenere risposte a domande fondamentali come 'cosa sono le membrane cellulari' o 'come si diffonde il virus Ebola'.

Anthropic ha ammesso che le protezioni sono conservative e che il modello può bloccare input innocui. In questi casi, l’utente viene automaticamente spostato a Claude Opus 4.8, il modello più potente, ma senza notifica iniziale. Dopo le proteste, è stato aggiunto un avviso per informare dell’interruzione del flusso. Nonostante ciò, la frequenza dei blocchi sta ostacolando l’uso accademico e professionale del modello.

Microsoft, che distribuisce Claude Fable 5 tramite GitHub Copilot e Microsoft Foundry, ha limitato l’accesso interno a causa di preoccupazioni sulla privacy. Il team legale deve ancora approvare l’uso del modello, poiché Anthropic conserva prompt e output per 30 giorni, sollevando timori su possibili fughe di dati sensibili. Mentre Anthropic promette di ridurre i falsi positivi, il bilanciamento tra sicurezza e funzionalità rimane un punto critico per l’adozione di modelli AI in contesti scientifici.

Fatti

  • Anthropic ha rilasciato Claude Fable 5, una versione con restrizioni su biologia, chimica e cybersicurezza per prevenire usi impropri.
  • Il modello blocca anche domande innocue, come 'cosa sono le membrane cellulari', generando proteste tra i ricercatori.
  • In caso di blocco, l’utente viene spostato a Claude Opus 4.8 senza notifica iniziale; un avviso è stato aggiunto dopo le critiche.
  • Microsoft ha limitato l’uso interno di Claude Fable 5 per motivi di privacy, in attesa di una valutazione legale sui dati conservati.
  • Anthropic conserva prompt e output per 30 giorni, sollevando preoccupazioni su accesso a informazioni confidenziali.

Spiegazione visiva delle notizie di Canto. Gli strumenti AI possono assistere la produzione. Politica editoriale