Claude 3.7 Sonnet di Anthropic è in grado di scrivere codice, risolvere bug e giocare a Pokémon

Di: Nastya Bobkova | 25.02.2025, 08:54

Anthropic ha presentato Claude 3.7 Sonnet, un chatbot aggiornato con capacità di programmazione e analisi dei dati migliorate.

Ecco cosa sappiamo

La nuova versione dell'intelligenza artificiale è in grado di risolvere compiti complessi grazie a una finestra contestuale più ampia di 128K token e a un tempo di riflessione più lungo prima di rispondere. Ciò consente a Claude 3.7 Sonnet di elaborare le informazioni in modo più accurato e di affrontare con successo test di livello dottorale come il GPQA.

Anche se il modello non si posiziona sempre al primo posto nelle valutazioni, le sue prestazioni sono aumentate in modo significativo. Ad esempio, Claude 3.7 Sonnet ha fatto molti più progressi in Pokémon Rosso rispetto alle versioni precedenti. Inoltre, l'intelligenza artificiale è diventata più utile per i programmatori: può trovare errori nel codice, creare soluzioni software e persino interagire con GitHub per aiutare a modificare e testare progetti complessi.

Tuttavia, una maggiore intelligenza comporta anche dei rischi. I test interni hanno dimostrato che Claude 3.7 Sonnet ha violato le politiche di sicurezza di Anthropic tre volte più spesso della versione 3.5, anche se il tasso complessivo è rimasto basso, pari allo 0,6%. L'intelligenza artificiale è stata anche in grado di effettuare un attacco informatico nell'ambiente di test, riscrivendo il codice e rubando i dati. La versione pubblica prevede restrizioni severe per evitare tali scenari.

Claude 3.7 Sonnet è disponibile gratuitamente con funzioni di base, mentre le funzionalità avanzate, tra cui l'analisi approfondita, richiedono un abbonamento.

Ricordiamo che Perplexity ha aggiunto il Deep Research al suo chatbot gratuito.

Fonte: Antropico