Claude 3.5: IA que controla el teu ordinador

Anthropic ha llançat dues noves versions de Claude 3.5Claude 3.5 Sonet i Claude 3.5 Haiku, juntament amb una impressionant funció d'”ús d’ordinadors” que promet revolucionar la interacció entre humans i IA. Aquesta funció permet a Claude controlar un ordinador de manera similar a com ho faria una persona, movent el cursor, fent clic, escrivint text i navegant per interfícies. Això obre la porta a una nova era en la qual un assistent virtual pot no només realitzar tasques complexes, sinó també gestionar directament un equip.

Claude 3.5 Sonet i Haiku: Característiques destacades

Claude 3.5 Sonet és una actualització que millora significativament el rendiment en programació i altres tasques tècniques. En proves de referència com SWE Bench Verified, Claude Sonet va aconseguir un salt impressionant en el rendiment, passant d’un 33,4% a un 49%. Això situa Claude 3.5 per sobre de tots els models públics actuals, incloent-hi GPT-4o.

Per altra banda, Claude 3.5 Haiku és una versió optimitzada per a major velocitat i rendiment. Tot i que manté el mateix cost i velocitat que el seu predecessor, Haiku ha assolit un 40,6% en les proves, acostant-se al rendiment de GPT-4 en certs aspectes. Aquesta versió promet ser una opció preferent per a aquells que busquin eficiència sense comprometre el rendiment.

Funció d’Ús d’Ordinadors: Una Nova Frontera

La característica més destacada d’aquesta actualització és la capacitat de Claude per controlar un ordinador en un entorn de proves. Aquesta capacitat, denominada Computer Use, està disponible en versió Beta pública a través de l’API d’Anthropic. Amb aquesta eina, Claude no només pot fer clic i escriure, sinó que també pot descarregar fitxers, obrir programari com VS Code i executar comandes en terminals. En un exemple pràctic, Claude va aconseguir crear i editar una pàgina web, corregir errors en el codi i llançar un servidor local, tot això des de comandes proporcionades per l’usuari.

Aquesta demostració posa en evidència el potencial de Claude per automatitzar tasques que, fins ara, requerien interacció directa humana. Tot i que la capacitat està en fase de desenvolupament i algunes accions, com desplaçar o arrossegar elements, encara presenten desafiaments, la possibilitat que Claude realitzi aquestes tasques marca un punt d’inflexió en la manera en què s’utilitzarà la intel·ligència artificial en el futur.

Aplicacions Futures i Desafiaments

La capacitat de Computer Use té enormes implicacions. Podria usar-se en àrees com l’automatització de tasques repetitives, facilitant la gestió de sistemes, manteniment de programari, assistència en tasques de programació complexa i fins i tot en la creació de contingut interactiu. Claude podria convertir-se en un assistent indispensable per a desenvolupadors, professionals de TI i qualsevol persona que treballi amb interfícies digitals de manera intensiva.

No obstant això, com s’ha esmentat, algunes limitacions persisteixen. La capacitat d’interactuar fluidament amb interfícies encara està en desenvolupament. Accions simples com fer “scroll” o arrossegar elements poden ser complicades per a Claude en aquest moment, però és probable que futures versions millorin aquesta habilitat. Tot i així, l’actualització ja ha demostrat ser un gran pas endavant en la relació humà-IA.

Comparació amb Altres Models d’IA

El que és interessant de Claude 3.5 Haiku és la seva capacitat per igualar i fins i tot superar en alguns aspectes altres models d’IA populars, com GPT-4o. Els resultats en proves com SWI Bench Verified indiquen que, encara que GPT continua sent una referència en el món de la intel·ligència artificial, Claude està tancant la bretxa amb rapidesa, oferint una alternativa competitiva i eficient, especialment en l’àmbit de la programació i el control de sistemes.

La interfície de Claude també ha estat actualitzada i està disponible en plataformes com Poe i la interfície de Claude AI, on els usuaris poden provar les noves versions de manera gratuïta, encara que amb certes limitacions d’ús. Això facilita l’accés i l’experimentació amb aquestes noves eines, permetent als desenvolupadors i usuaris comuns explorar el seu potencial.

Eina d’anàlisi integrada

La nova eina d’anàlisi integrada a Claude.ai marca un avenç significatiu en les capacitats d’aquest model d’IA, ja que permet l’execució de codi JavaScript directament a la plataforma. Aquesta funció amplia l’abast de Claude, permetent que processi dades, realitzi anàlisis detallades i generi informació en temps real de manera més precisa. L’eina ja està disponible per a tots els usuaris de Claude.ai en la seva versió de vista prèvia.

A través d’aquest sandbox de codi integrat, Claude pot realitzar càlculs matemàtics complexos, analitzar dades i oferir respostes que van més enllà de l’anàlisi abstracte. Amb aquesta nova capacitat, el model funciona de manera similar a un analista de dades, permetent que els usuaris carreguin les seves pròpies dades i Claude les processi de manera metòdica. D’aquesta forma, ofereix solucions clares i verificables, recolzades per anàlisis matemàtiques i execució de codi, una cosa que abans només es podia fer a nivell teòric o amb l’escriptura de codi que no es podia executar.

Capacitat d’anàlisi d’arxius CSV

Una de les característiques destacades de l’eina d’anàlisi és la seva capacitat per treballar amb arxius CSV. Això permet a Claude processar grans volums de dades, desglossant-les i analitzant-les de manera eficient. El procés d’anàlisi de dades ja no és purament conceptual: Claude pot realitzar un cicle complet de depuració i exploració de les dades fins a arribar a conclusions precises.

Preguntes i respostes

Què és Claude 3.5 i quines novetats aporta?

Claude 3.5 és la nova versió de la IA d’Anthropic. Les novetats inclouen les versions Sonet i Haiku, amb millores en programació i la capacitat de controlar un ordinador directament.

En què es diferencia Claude 3.5 de GPT-4o?

Claude 3.5 ha superat a GPT-4o en proves de rendiment específiques, especialment en tasques de programació. A més, compta amb la nova funció d’ús d’ordinadors, que GPT-4o no ofereix.

Què és la funció de “Computer Use” en Claude 3.5?

És una capacitat que permet a Claude interactuar amb un ordinador de manera similar a com ho faria una persona, movent el cursor, escrivint, descarregant fitxers i executant comandes.

Quines són les aplicacions pràctiques de Claude 3.5?

Claude 3.5 es pot utilitzar per automatitzar tasques repetitives, assistir en programació, gestionar sistemes informàtics i facilitar la creació i edició de contingut digital.