Canvis de Claude Opus 4.7 per a desenvolupadors: aprofundiment en el nou model

Darrera actualització: 05/16/2026
  • Claude Opus 4.7 ofereix grans avenços en enginyeria de programari avançada, visió multimodal, memòria i treball de coneixement, alhora que manté la finestra de context d'1 milió de tokens i el preu actual.
  • La versió reforça el comportament amb un seguiment d'instruccions més literal, un nou tokenitzador, paràmetres de mostreig més estrictes i pensament adaptatiu, cosa que requereix actualitzacions ràpides i de l'API en migrar des de l'Opus 4.6.
  • Els nous controls com els nivells d'esforç, els pressupostos de tasques, la millora de l'ús de la memòria del sistema de fitxers i les salvaguardes de ciberseguretat fan que l'Opus 4.7 sigui més adequat per a fluxos de treball d'agents llargs i agents autònoms més segurs.
  • El mode automàtic, els resums, el mode de focus i l'afinació de l'esforç de Claude Code, combinats amb l'autoverificació sistemàtica del treball, permeten obtenir guanys de productivitat substancials en projectes de codificació complexos del món real.

Canvis de Claude Opus 4.7 per a desenvolupadors

Claude Opus 4.7 s'està desplegant com el nou model insígnia de disponibilitat general d'Anthropic, i per als desenvolupadors es percep molt menys com un petit canvi i molt més com una nova generació d'eines. L'objectiu d'aquesta versió és clar: tasques d'enginyeria de programari més difícils, fluxos de treball autònoms més llargs, comprensió multimodal més profunda i un control més estricte sobre quant "pensa" i gasta el model. Si heu estat portant les versions anteriors d'Opus al límit amb agents de codificació complexos, treball de coneixement amb molta informació o automatització basada en la visió, aquesta actualització canvia les regles del joc de diverses maneres pràctiques.

El que realment destaca és que Anthropic no només ha augmentat la capacitat en brut; també ha reelaborat comportaments clau, API i baranes de seguretat així doncs, l'Opus 4.7 es comporta més com un company d'equip fiable que es pot deixar executant tasques llargues. El seguiment d'instruccions és més estricte, la memòria és més utilitzable en projectes reals, el suport multimodal salta a una veritable alta resolució i la plataforma circumdant (Claude Code, pressupostos de tasques, nivells d'esforç) s'ha ajustat als fluxos de treball dels desenvolupadors del món real. Això vol dir que haureu de revisar algunes indicacions i infraestructura, però si us adapteu, podeu desfer-vos de més "coses difícils i molestes" que abans.

Què intenta ser Claude Opus 4.7 per als desenvolupadors

Anthropic posiciona el Claude Opus 4.7 com el seu model més capaç disponible en general, ajustat específicament per a treballs "agèntics" a llarg termini i tasques de coneixement avançades. En termes senzills, està dissenyat per executar programari i fluxos de treball de dades de diversos passos amb menys controls manuals, millors autocomprovacions i un comportament més coherent durant molts torns.

En comparació amb l'Opus 4.6, el nou model mostra avenços notables en enginyeria de programari avançada, especialment en les tasques més difícils que abans requerien una supervisió humana estreta. Els primers usuaris informen que ara poden transferir els seus problemes de codificació més difícils, com ara refactoritzacions profundament imbricades, canvis multiservei i depuració complicada, a Opus 4.7 amb molta més confiança. El model no només genera codi; planifica, executa i torna a verificar el seu propi treball de manera molt més rigorosa.

Sota el capó, Opus 4.7 conserva la mateixa finestra de context d'1 milió de tokens i fins a 128 tokens de sortida que feien que les versions anteriors d'Opus fossin atractives per a bases de codi grans i documents grans. També admet el pensament adaptatiu, l'eina i el conjunt de plataformes familiars de l'Opus 4.6, i està disponible a tot arreu on t'esperes: a través de l'API de Claude, tots els productes de Claude, Amazon Bedrock, Google Cloud Vertex AI i Microsoft Foundry. El preu es manté igual: aproximadament 5 dòlars per milió de tokens d'entrada i 25 dòlars per milió de tokens de sortida.

Més enllà del rendiment brut i dels límits de tokens, el model és deliberadament més autònom en la manera com gestiona els bucles "semblants a agents". Combinat amb nous conceptes com els pressupostos de tasques i el paràmetre d'esforç refinat, l'Opus 4.7 està pensat per ser implementat en sistemes on pugui orquestrar múltiples passos (ús d'eines, edició de fitxers, comprovacions, resums) sense haver de retornar constantment el control a l'usuari.

Els desenvolupadors han d'adaptar-se a un seguiment d'instruccions més precís i a canvis de comportament més precisos.

Una de les diferències més grans que notaran els desenvolupadors diàriament és com l'Opus 4.7 segueix literalment les instruccions en comparació amb els models Claude més antics. Mentre que l'Opus 4.6 i els seus companys de vegades passaven per alt detalls, generalitzaven d'un exemple a un altre o se saltaven discretament parts menys clares d'una indicació, l'Opus 4.7 s'esforça molt més per complir exactament amb el que heu escrit, i poca cosa més.

Aquest seguiment més estricte d'instruccions té una conseqüència pràctica: les indicacions que abans funcionaven "prou bé" ara poden començar a comportar-se de maneres sorprenents. Si els vostres antics arnesos es basaven en el model per inferir passos que no havíeu explicat completament o per generalitzar patrons d'un element de la llista al següent, ara és possible que vegeu resultats que semblin rígids o incomplets. Anthropic recomana explícitament revisar i reajustar les indicacions i els arnesos d'integració per aquest motiu.

La longitud de la resposta també es calibra de manera diferent: l'Opus 4.7 ajusta la verbositat a la complexitat percebuda de la tasca en comptes d'utilitzar per defecte un estil de resposta de longitud fixa. Per a preguntes senzilles, sovint obtindreu respostes més concises, mentre que les tasques més pesades amb diverses parts o agentives produeixen naturalment resultats més llargs i detallats. Aquesta mida dinàmica significa que voldreu ser més explícits sobre la brevetat si la vostra aplicació té restriccions de sortida estrictes.

El model també utilitza menys crides a eines per defecte i es basa més en el seu propi raonament, tret que l'impulseu deliberadament cap a l'ús d'eines augmentant el nivell d'esforç. Això són bones notícies per a la latència i el cost en molts casos, però si el vostre sistema espera una arquitectura amb moltes eines (per exemple, execució de codi agressiva, linters o simuladors), hauríeu de provar si cal fomentar un major ús d'eines mitjançant indicacions i ajustaments d'esforç.

Pel que fa al to, l'Opus 4.7 s'allunya de l'estil extra càlid i carregat de validació de l'Opus 4.6 cap a una veu més directa i opinativa amb menys emojis i menys floritures de "ho estàs fent molt bé". Per a les eines de desenvolupament, això sol ser un avantatge: s'obtenen judicis més clars, crítiques més directes i menys edulcoració. Per a les aplicacions d'usuari final que es basen en una fraseologia extra amigable, és possible que vulgueu dirigir el to explícitament a les vostres indicacions.

Visió d'alta resolució i guanys multimodals que importen en projectes reals

L'Opus 4.7 és el primer model de Claude amb suport genuí per a imatges d'alta resolució, augmentant la mida màxima de la imatge a 2576 píxels a la vora llarga, o uns 3.75 megapíxels. Això és més del triple del límit anterior de 1568 px / 1.15 MP, i canvia fonamentalment el que podeu alimentar amb seguretat al model quan es tracta d'artefactes visuals densos.

Aquest salt de resolució permet directament un millor rendiment en càrregues de treball amb molta visió: els agents ara poden analitzar de manera fiable captures de pantalla de la interfície d'usuari congestionades, diagrames complexos i escanejos de documents que contenen detalls precisos. Els casos d'ús com ara els agents d'ús d'ordinadors que llegeixen captures de pantalla completes de l'escriptori, extreuen dades estructurades de gràfics complexos o comparen dissenys perfectes a nivell de píxel esdevenen molt més viables sense reduir-ho tot fins al punt de perdre informació.

Anthropic també va simplificar el maneig de coordenades de manera que les coordenades internes del model s'alineen 1:1 amb els píxels reals de la imatge. Això vol dir que quan mapeu quadres delimitadors, objectius de clic o anotacions superposades, no heu de fer malabarismes amb els vostres propis factors d'escala. És molt més fàcil dir "feu clic a (x, y)" basant-se en la sortida del model i confiar que correspon exactament a la imatge que heu enviat.

Més enllà de la resolució pura, l'Opus 4.7 millora la percepció i la localització de baix nivell: és millor per assenyalar, mesurar, comptar i tasques granulars similars, i la seva detecció de caixa delimitadora d'imatges naturals és més precisa. Per als desenvolupadors que creen agents de proves d'IU, canals de control de qualitat visual o bots d'anàlisi de gràfics, aquests petits ajustos es tradueixen en menys errors en les matemàtiques de coordenades i la detecció d'objectes.

Hi ha, és clar, un inconvenient: les imatges de més alta resolució consumeixen més fitxes. Si realment no necessiteu la fidelitat addicional, Anthropic suggereix reduir la mostra de les imatges abans d'enviar-les al model per mantenir l'ús de tokens sota control. Però quan necessiteu cada píxel (per exemple, quan transcriueu dades de gràfics a nivell de píxel o verifiqueu dissenys de diapositives fins a etiquetes individuals), els nous límits són una clara victòria.

Treball de coneixement, finances i fluxos de treball de documents professionals

L'Opus 4.7 no és només una actualització de la codificació; també obté puntuacions més altes en els punts de referència de coneixement-treball, especialment en àmbits com les finances i el dret, on la precisió i el raonament entre documents són realment importants. En l'avaluació interna de l'agent financer d'Anthropic, Opus 4.7 aconsegueix un rendiment d'avantguarda i actua més com un analista júnior competent que com un simple generador de text.

En proves internes, el model va produir models i anàlisis financeres més rigoroses que l'Opus 4.6, amb narratives més ben estructurades i suposicions més clares. També va fer una millor feina unint múltiples subtasques (recopilació de dades, modelització numèrica, creació de presentacions) en resultats cohesionats de principi a fi que semblen i es senten professionals.

L'Opus 4.7 també obté resultats d'avantguarda sobre GDPval-AA, un estudi de referència extern centrat en treballs de coneixement econòmicament valuosos en els àmbits financer, jurídic i relacionats. Això suggereix que no es tracta només de victòries internes escollides a la perfecció: el model supera sistemàticament el seu predecessor en problemes complexos de raonament aplicat on hi ha diners reals o risc en joc.

Pel que fa als documents, l'Opus 4.7 és notablement millor en fluxos de treball que impliquen generar i després revisar visualment fitxers d'oficina com ara .docx i .pptx. Ha millorat a l'hora de produir canvis de seguiment en fitxers de Word, ajustar dissenys a PowerPoint i, a continuació, tornar a llegir aquests resultats (mitjançant eines o visualització) per garantir que els dissenys i el marcatge de les diapositives siguin correctes. Si abans les teves indicacions havien d'explicar massa "comprova dues vegades el disseny de la diapositiva abans de retornar-la", és possible que puguis eliminar part d'aquesta estructura.

L'anàlisi de gràfics i figures també es beneficien dels nous punts forts multimodals. L'Opus 4.7 és millor a l'hora de cridar eines externes com ara biblioteques d'imatges de Python (per exemple, PIL) per inspeccionar gràfics, extreure dades a nivell de píxel i traduir aquestes imatges en conjunts de dades estructurats o explicacions. Aquesta combinació (crida d'eines més una visió més nítida) el fa molt més útil com a soci en quadres de comandament d'anàlisi i canals d'informes.

Memòria, agents de llarg horitzó i blocs de notes del sistema de fitxers

Una altra àrea on l'Opus 4.7 millora silenciosament però materialment és la memòria, especialment en configuracions on l'agent pot escriure i llegir des d'un fitxer de notes persistent o un magatzem estructurat. En lloc de tractar cada sol·licitud com un nou començament, el model és millor a l'hora de decidir quins detalls anotar, com etiquetar-los i quan reutilitzar-los en torns futurs. A més, millora la tolerancia a fallos en recerca distribuïda en fluxos llargs que depenen del context persistent.

Si el vostre agent manté un bloc de notes, un document de notes o una base de dades de memòria lleugera entre torns, l'Opus 4.7 hauria de mostrar un clar augment en la seva capacitat d'aprofitar aquest context extern. Recordarà de manera més consistent les decisions importants del projecte, els resultats parcials i les tasques a fer durant el treball de diverses sessions, cosa que reduirà la quantitat que cal reformular a cada indicació.

Anthropic assenyala explícitament que Claude ara és millor escrivint i utilitzant memòria recolzada per sistemes de fitxers, cosa que és especialment útil en codificació complexa o agents de recerca. Per exemple, si teniu un bot de refactorització autònom que fa un seguiment dels problemes oberts, les decisions arquitectòniques i les proves pendents dins d'un conjunt de fitxers, l'Opus 4.7 normalment organitzarà i consultarà aquesta informació de manera més acurada que l'Opus 4.6.

Si no voleu crear la vostra pròpia capa de memòria, Anthropic ofereix una eina de memòria del costat del client que actua com a bloc de notes gestionat per a Claude. Això us permet experimentar amb agents de vida més llarga (que abasten sessions, branques o fins i tot setmanes de treball) sense haver de crear primer una base de dades vectorial completa o un servei de notes personalitzat.

Per a traces agentives de llarg horitzó, el model també tendeix a proporcionar actualitzacions de progrés més regulars a l'usuari. Això vol dir que si anteriorment heu afegit instruccions elaborades de bastida només per forçar missatges d'"estat" periòdics, podeu intentar simplificar i deixar que el comportament per defecte d'Opus 4.7 gestioni els informes de progrés, sobretot a nivells d'esforç més alts a Claude Code.

Garanties de seguretat, alineació i ciberseguretat

Pel que fa a la seguretat i l'alineació, les avaluacions d'Anthropic mostren que l'Opus 4.7 té un perfil de risc força similar a l'Opus 4.6, amb taxes baixes de comportament que preocuparien la majoria dels desenvolupadors: engany, adulació i cooperació amb l'ús indegut. En diverses dimensions, en realitat és una mica més segur.

El model obté millors puntuacions en honestedat i resistència als atacs maliciosos d'injecció de senyals, cosa que és particularment rellevant si esteu creant agents que ingereixen contingut no fiable del web, el correu electrònic o els documents generats per l'usuari. Una resistència a la injecció més forta dificulta que les entrades adversaries segrestin les instruccions del model o exfiltrin secrets mitjançant trucs intel·ligents.

Tanmateix, hi ha algunes àrees on l'Opus 4.7 és lleugerament més feble que l'Opus 4.6; per exemple, la seva tendència a donar consells massa detallats sobre la reducció de danys al voltant de les substàncies controlades. Anthropic encara conclou que el model està "en gran part ben alineat i és fiable, tot i que no del tot ideal", i assenyala que el Claude Mythos Preview, més experimental, continua sent el seu model més ben alineat segons mesures internes.

Aquest llançament també és on Anthropic comença a implementar salvaguardes de ciberseguretat en temps real en un model generalitzat, seguint la investigació i els missatges del seu treball al Projecte Glasswing. L'Opus 4.7 inclou sistemes que detecten i bloquegen automàticament les sol·licituds relacionades amb temes de ciberseguretat prohibits o d'alt risc, especialment quan la intenció sembla sospitosa.

És important destacar que Anthropic fa una distinció entre l'ús indegut i el treball de seguretat legítim: si sou un professional de la seguretat que fa investigació de vulnerabilitats, proves de penetració o treballs de seguretat en equips vermells, us animem a sol·licitar el seu Programa de verificació cibernètica. Aquest programa té com a objectiu donar als professionals verificats accés a les capacitats rellevants per a la ciberseguretat de l'Opus 4.7 sense obrir la porta a un abús generalitzat, i les lliçons apreses aquí guiaran les decisions finals sobre el llançament de models de la classe Mythos de manera més àmplia.

Nous controls per a desenvolupadors: nivells d'esforç, pensament adaptatiu i pressupostos de tasques

L'Opus 4.7 introdueix un conjunt de "botons" més matisats perquè els desenvolupadors puguin compensar la capacitat, la velocitat i el cost, amb el paràmetre d'esforç al centre. L'esforç controla quant pensa el model abans de respondre i amb quina agressivitat utilitza les eines, cosa que afecta directament la latència i l'ús de tokens.

El canvi principal és un nou nivell d'esforç extra alt, xhigh, que es troba entre alt i màxim i ara és el valor per defecte per al codi Claude en tots els plans. Per a casos d'ús de codificació i agentivitat, Anthropic recomana començar amb high o xhigh, reservant max només per als problemes més greus. Un esforç més elevat significa una cerca més àmplia, un raonament més profund i, en general, una millor fiabilitat, però també més tokens de sortida i temps d'execució més llargs.

L'Opus 4.7 elimina completament el vell concepte de "pressupost de pensament ampliat". Si intenteu definir thinking: {“type”: “enabled”, “budget_tokens”: N}, ara obtindreu un error 400. El pensament adaptatiu és l'únic mode de “pensament en marxa” compatible, i els punts de referència interns d'Anthropic mostren que supera constantment els antics pressupostos ampliats de totes maneres.

El pensament adaptatiu està desactivat per defecte, de manera que les sol·licituds sense un camp de pensament s'executen sense un canal de raonament intern explícit. Si la vostra aplicació es beneficia de cadenes de pensament més riques (per exemple, planificació complexa o tasques de codificació de diversos passos), heu de configurar explícitament thinking: {type: “adaptive”} per activar-lo.

Una altra incorporació important són els pressupostos de tasques, actualment en versió beta pública a la plataforma Claude. Un pressupost de tasca dóna al model un objectiu aproximat de quants tokens utilitzar en tot un bucle agentiu: el seu pensament intern, les crides a les eines, els resultats de les eines i la resposta final. El model veu un compte enrere en marxa i se suposa que prioritza el treball i el conclou amb elegància a mesura que s'acosta al pressupost, en lloc de funcionar fins que max_tokens el talli bruscament.

Els pressupostos de tasques són assessors, no límits fixos, i conceptualment són independents de max_tokens. max_tokens és un límit estricte per sol·licitud en els tokens generats i és invisible per al model, mentre que task_budget és un límit suau i sensible al model a tot el bucle. Feu servir task_budget quan vulgueu que el model automoderi la seva ambició en funció d'una franquícia i manteniu max_tokens com a parada de seguretat per evitar costos descontrolats.

Haureu d'experimentar amb pressupostos de tasques per càrrega de treball: si els definiu massa baixos, el model pot fallar aviat o produir resultats superficials; si els definiu alts, pagareu més en fitxes. Anthropic suggereix no utilitzar pressupostos de tasques per a tasques agentives obertes on la qualitat és primordial; en canvi, reservar-los per a treballs on realment necessiteu límits superiors deterministes en el consum de recursos.

Canvis a l'API i al tokenitzador que afecten la migració des de l'Opus 4.6

Tot i que l'Opus 4.7 és una ruta d'actualització directa des de l'Opus 4.6, hi ha diversos canvis a nivell d'API i diferències de tokenització que cal planificar. Ignorar-los pot provocar errors 400 confusos o pics de costos inesperats.

En primer lloc, l'Opus 4.7 utilitza un nou tokenitzador que contribueix a millorar el rendiment en totes les tasques, però també canvia la quantitat de tokens que consumeixen les entrades i sortides. A la pràctica, el mateix text pot utilitzar aproximadament entre 1.0 i 1.35 vegades més tokens que a l'Opus 4.6, fins a un 35% més depenent del tipus de contingut. Per tant, el punt final /v1/messages/count_tokens informarà de nombres diferents per a l'Opus 4.7 que per a models més antics.

L'eficiència dels tokens variarà segons la forma de la càrrega de treball, però els punts de referència interns de codificació d'Anthropic suggereixen que l'ús de tokens nets pot millorar realment quan es té en compte un raonament més intel·ligent i una planificació més concisa. Dit això, recomanen explícitament mesurar el trànsit de producció real i actualitzar els paràmetres max_tokens per proporcionar marge addicional, fins i tot per a qualsevol activador de compactació automatitzat que pugueu haver configurat.

En segon lloc, Anthropic ha reforçat el control sobre els paràmetres de mostreig: a partir de l'Opus 4.7, si es configura la temperatura, top_p o top_k a qualsevol valor que no sigui el predeterminat, s'activarà un error 400. La ruta de migració recomanada és simplement eliminar aquests paràmetres de les sol·licituds i confiar en les indicacions per dirigir l'estil i el determinisme del model. I fins i tot si anteriorment heu utilitzat temperatura = 0 per intentar "congelar" les respostes, tingueu en compte que el veritable determinisme mai no s'ha garantit.

En tercer lloc, el contingut del raonament s'omet de les respostes per defecte a l'Opus 4.7. Continuareu rebent blocs de pensament a les respostes en temps real, però el seu camp de pensament estarà buit tret que ho activeu explícitament. Aquest canvi silenciós millora lleugerament la latència i redueix l'amplada de banda. Si la vostra aplicació necessita resums llegibles del raonament intern del model, podeu tornar a activar-lo configurant la visualització com a "resumada" per a la sortida del pensament amb un ajust de configuració d'una sola línia.

Finalment, alguns ajustaments de comportament que no són interrupcions dures de l'API encara poden requerir actualitzacions ràpides. Aquests inclouen el seguiment d'instruccions més literal (especialment a nivells d'esforç més baixos), menys subagents automàtics, menys crides d'eines per defecte i el canvi a les actualitzacions de progrés durant les traces agentives llargues. Anthropic proporciona una guia de migració i fins i tot un ajudant de migració automatitzat a través de l'habilitat de l'API de Claude per a bases de codi que utilitzen Claude Code o l'Agent SDK.

Claude Code amb Opus 4.7: millores pràctiques per al vostre flux de treball de desenvolupament

Claude Code, l'entorn de codificació d'Anthropic, s'ha ajustat molt al voltant de l'Opus 4.7, i Boris Cherny, un dels seus creadors, ha compartit consells pràctics després de setmanes d'ús en projectes reals. En resum: si esteu disposats a ajustar la manera com hi treballeu, podeu obtenir un augment palpable de la productivitat en tasques d'enginyeria serioses.

En primer lloc, el nou mode automàtic elimina en gran mesura les finestres emergents de permisos constants que abans interrompien les tasques de llarga durada. En comptes de demanar-vos que confirmeu cada edició o ordre de fitxer, Claude encamina aquestes comprovacions de permisos a través d'un classificador que aprova automàticament les accions segures. Podeu deixar que l'Opus 4.7 faci una refactorització, executi proves o netegi fitxers mentre us centreu en una altra cosa i després tornar per veure què ha aconseguit.

El mode automàtic està actualment disponible per als usuaris de Max, Teams i Enterprise i es pot activar ràpidament mitjançant Maj+Tab a la línia d'ordres o mitjançant el menú desplegable de l'aplicació d'escriptori i l'extensió VS Code. Un avantatge infravalorat és la capacitat d'executar diversos agents en paral·lel, cadascun fent la seva pròpia feina detallada i després saltant entre ells a mesura que progressen, sense haver de fer de cangur a cada diàleg d'aprovació.

Si no us sentiu còmodes amb l'automatisme complet, Claude Code ofereix una habilitat /fewer-permission-prompts que analitza l'historial de sessions per trobar ordres repetitives i segures que encara activen sol·licituds de permisos. Després de l'anàlisi, suggereix ordres que podeu incloure a la llista blanca de manera segura, eliminant moltes interrupcions de baix valor i mantenint les accions de més risc darrere de les aprovacions.

Els resums són una altra característica que es combina naturalment amb l'enfocament a llarg horitzó de l'Opus 4.7. Quan torneu a una sessió que ha estat en funcionament durant un temps, Claude ofereix un breu resum del que ha fet i del que queda. Això és particularment útil quan us allunyeu d'una tasca de refactorització o recerca en curs; en comptes de desplaçar-vos per una paret de registres o diferències, obteniu un resum ràpid de "aquí teniu la situació".

Per a aquells que ja confien en el model en tasques complexes, el mode de focus amaga les xerrameca intermèdies i només mostra els resultats finals. Cherny esmenta que l'utilitza quan no necessita observar cada pas que fa l'Opus; només vol el codi, les proves o la documentació acabats. Podeu activar o desactivar el focus amb l'ordre /focus directament a la CLI, cosa que ajuda a reduir el soroll cognitiu durant les sessions de treball profund.

El control de l'esforç també és central al Codi Claude: l'Opus 4.7 abandona els antics pressupostos de raonament fixos i es basa completament en l'esforç adaptatiu. Podeu ajustar l'esforç mitjançant /effort, i tots els nivells excepte el màxim persisteixen entre sessions. El patró personal de Cherny és utilitzar un esforç molt elevat la major part del temps, reservant el màxim absolut per als problemes més complicats on cada mica de raonament addicional compta.

Podria dir-se que el consell més important de Cherny és donar sempre a Claude una manera de comprovar el seu propi treball. Independentment de la pila, l'agent necessita un mecanisme per executar proves o fluxos de punta a punta. En projectes de backend, això pot significar un script o una ordre per engegar el servidor i executar proves d'integració; en treballs de frontend, sovint utilitza l'extensió Chromium perquè Claude pugui controlar un navegador, mentre que la capacitat d'Ús de l'ordinador cobreix les aplicacions d'escriptori.

El flux de treball propi de Cherny engloba aquesta filosofia en una habilitat /go personalitzada que fa que Claude executi proves, simplifiqui el codi amb /simplify i després obri una sol·licitud d'extracció. Segons la seva experiència, aquest tipus de procés de verificació i enviament duplica o triplica fàcilment el valor que s'obté de l'Opus 4.7. S'alinea perfectament amb la capacitat millorada del model per validar els seus propis resultats abans d'informar.

Per què "primer el treball dur, després la passió" encara s'aplica a l'hora d'adoptar noves eines

Curiosament, la manera com els usuaris antròpics i avançats parlen sobre com obtenir valor de l'Opus 4.7 reflecteix un punt més ampli sobre les carreres i el domini: la passió tendeix a seguir la competència, no a precedir-la. Jensen Huang, de NVIDIA, rebat el clixé de "només cal seguir la teva passió", argumentant que les persones que donen aquest consell normalment ja viuen còmodament, molt després d'haver superat els primers anys difícils.

La mateixa mentalitat apareix quan la gent descriu com treballar amb un model com l'Opus 4.7: tria una línia on puguis arribar a ser realment fort i després avança profundament durant molt de temps. En lloc de perseguir l'exageració, trieu un domini (sistemes de backend, automatització de seguretat, enginyeria de dades, eines de desenvolupament) on hi hagi una demanda real i on aquest model pugui millorar les vostres habilitats al llarg d'anys, no de setmanes.

Aquest manual sembla poc glamurós a primera vista: mesureu el progrés en lloc de les vibracions, accepteu que hi haurà fricció, avorriment i errors, i continueu fent les repeticions. Els dies difícils no són una prova que hagis triat el camí equivocat; normalment són una prova que estàs treballant en alguna cosa important. En el context de l'Opus 4.7, això significa que refineu iterativament les indicacions, les pipelines i els fluxos de revisió fins que es mantenen en producció, en lloc de llançar el model a projectes secundaris aleatoris i esperar màgia.

A mesura que vas adquirint domini —tant del teu ofici com de les eines com l'Opus 4.7 que el donen suport—, lentament et "guanyes el dret d'editar" la teva vida i acumular coneixements. Pots triar problemes més interessants, millors equips i límits més saludables perquè les teves habilitats ara són escasses i fiables. Al principi, pots sacrificar l'equilibri per invertir molt en l'aprenentatge; més tard, aquesta inversió et permet recuperar temps, control i flexibilitat.

La conclusió pràctica per als desenvolupadors que adopten Claude Opus 4.7 és senzilla: no només experimenteu, feu commits. Tracta la feina de migració, l'ajustament ràpid, l'esforç i els experiments amb el pressupost de tasques com els anys de pràctica darrere de qualsevol habilitat seriosa. Amb el temps, així és com acabes amb fluxos de treball i agents que realment canvien la manera de crear programari, en lloc d'una altra eina amb la qual has "jugat durant un cap de setmana".

En conjunt, Claude Opus 4.7 ofereix un motor més nítid, més literal i més capaç per a la codificació, el treball de coneixement i les tasques que requereixen molta visió, envoltat de millors controls de raonament i cost, i envoltat d'un ecosistema com Claude Code que està sintonitzat amb el treball d'enginyeria real i desordenat. Els desenvolupadors que s'inclinen cap a aquests canvis, replantegen les seves indicacions i les seves línies de treball, i donen al model maneres concretes de verificar el seu propi resultat són els que tenen més probabilitats de sentir que han contractat un col·laborador incansable i obsessionat amb els detalls en lloc de simplement actualitzar a una funció d'autocompleció una mica més intel·ligent.

expansió d'apis
Article relacionat:
Expansió de les API: causes, riscos i com recuperar el control
Articles Relacionats: