L'accés no autoritzat a Discord a Claude Mythos d'Anthropic provoca noves pors de seguretat sobre la IA

Darrera actualització: 04/24/2026
  • Un petit grup privat de Discord presumptament va obtenir accés no autoritzat a Claude Mythos Preview a través d'un entorn contractat per tercers.
  • Mythos és un model de ciberseguretat d'IA reservat per a un grapat de socis corporatius i institucionals dins del Projecte Glasswing.
  • Segons sembla, el grup va endevinar la ubicació en línia del model utilitzant convencions de nomenclatura, dades filtrades i privilegis de contractista.
  • Anthropic està investigant i diu que actualment no hi ha proves d'impacte en els seus sistemes interns principals, però el cas planteja preocupacions sobre la cadena de subministrament i el control d'accés.

Accés no autoritzat a Mythos a Discord

La recent revelació de presumpte accés no autoritzat al model de Claude Mythos d'Anthropic a través de Discord ha revifat un debat difícil en el món de la IA: com es poden compartir eines de ciberseguretat potents sense donar als atacants exactament el que necessiten? Un petit grup en línia afirma que va aconseguir utilitzar Mythos durant setmanes, tot i que el sistema estava restringit a una vista prèvia estrictament controlada.

Segons diversos informes, l'incident no va implicar un espectacular atac informatiu a l'estil de Hollywood, sinó més aviat un combinació de permisos de contractistes, investigació en línia i conjectures fonamentades sobre on Anthropic allotja els seus sistemes més sensibles. Per a un model dissenyat per trobar i explotar vulnerabilitats de programari a escala, la simple idea que persones externes podrien experimentar-hi ha atret l'atenció d'experts en seguretat, empreses i governs per igual.

Què és Claude Mythos i per què és important

Claude Mythos Preview és el nou sistema d'IA d'Anthropic centrat en la ciberseguretat, presentat com un model d'ús general amb capacitats inusualment avançades per detectar i fins i tot explotar defectes en sistemes operatius i navegadors web. En lloc de publicar-lo, Anthropic va posicionar Mythos com una eina restringida per a la defensa d'infraestructures crítiques.

A principis d'abril, l'empresa va presentar Mythos com a part d'una iniciativa coneguda com a Projecte GlasswingEn el marc d'aquest programa, només es va convidar una llista curta d'organitzacions de confiança a provar el model. Els informes esmenten els principals actors tecnològics i empresarials com Amazon, Microsoft, Apple, Cisco i Nvidia, així com institucions financeres com Goldman Sachs, entre les que reben accés anticipat a experiments controlats.

Els socis han atribuït a Mythos el descobriment d'un nombre significatiu de problemes de seguretat. Un exemple destacat, citat repetidament en la cobertura de l'incident, és Mozilla, que presumptament va utilitzar el model per identificar i corregir centenars de vulnerabilitats de FirefoxAnthropic també ha afirmat que Mythos ha ajudat a descobrir milers de defectes d'alta gravetat en programari àmpliament utilitzat.

Aquests resultats han alimentat tant l'optimisme com el malestar. D'una banda, detecció automatitzada d'errors subtils i configuracions incorrectes podria ajudar els defensors a mantenir-se per davant dels atacants. D'altra banda, un sistema que optimitza les tècniques ofensives complexes corre el risc de convertir-se en un multiplicador de força per a la ciberdelinqüència, sobretot si les seves barreres de seguretat o el seu model d'accés fallen.

Els reguladors ja n'han pres nota. Segons sembla, l'Institut de Seguretat de la IA del Regne Unit va avaluar Mythos i va concloure que pot executar ciberatacs de diversos passos amb una intervenció humana limitada, de vegades completant cadenes d'atac simulades que normalment requeririen dies de feina de professionals experimentats. Aquesta avaluació va contribuir a la percepció de Mythos com un model que canvia les regles del joc pel que fa al risc cibernètic.

Incident d'accés al model de ciberseguretat d'IA

Com diu el grup Discord que va entrar

En aquest context, l'aparició d'un grup de Discord poc organitzat que reclama accés a Mythos ha causat una preocupació comprensible. Els relats recollits per Bloomberg i altres mitjans descriuen un escenari en què la curiositat, les connexions amb persones privilegiades i la recerca de codi obert es van combinar per evitar un perímetre d'accés suposadament estret.

Els membres del grup participen en una canal privat de Discord dedicat al seguiment de models d'IA no publicatsEl seu objectiu declarat, almenys públicament, és experimentar amb sistemes d'avantguarda que encara no estan disponibles per al públic en general. Les persones implicades no han estat identificades formalment, però es va descriure un membre com a treballador d'un contractista que proporciona serveis a Anthropic.

Sembla que la connexió amb el contractista va ser clau. Els informes indiquen que la persona accés privilegiat com a proveïdor extern era una peça del trencaclosques. A més d'aquest punt de suport privilegiat, els membres es van basar en tècniques de recerca comunes a Internet per cartografiar la infraestructura d'Anthropic, així com en coneixements previs de com l'empresa anomena i implementa els seus models.

Una filtració de dades recent a Mercor, una startup d'IA independent, presumptament va proporcionar pistes addicionals. La informació d'aquesta filtració, combinada amb convencions de nomenclatura anteriors utilitzades per als models antròpics, va permetre al grup Discord fer una «conjectura ben informada» sobre la ubicació en línia de Claude MythosEn lloc d'entrar per la força, van endevinar la porta correcta i després la van travessar amb credencials vinculades a l'entorn del contractista.

Un cop van tenir accés funcional, el grup va utilitzar Mythos regularment durant més de dues setmanes. Bloomberg diu que va revisar captures de pantalla i una demostració en directe que semblava confirmar que el model estava funcionant i responent a les indicacions emeses pels usuaris no autoritzats. També hi ha afirmacions que es podia accedir a altres models antròpics no publicats utilitzant el mateix enfocament, tot i que els detalls sobre aquests sistemes continuen sent escassos.

Què afirma el grup que va fer amb Mythos

Públicament, els participants de Discord han intentat distanciar-se de la idea que són ciberdelinqüents. Un membre citat durant la cobertura de l'episodi va dir que l'interès del grup rau en provant nous models d'IA en lloc de llançar atacsSegons la seva narració, Mythos es feia servir per a experimentacions relativament benignes, com ara la generació de llocs web senzills i la prova de propostes.

També suggereixen que van evitar comportaments d'alt risc que poguessin activar alarmes dins dels sistemes de monitorització d'Anthropic. El grup presumptament es va abstenir de consultes òbviament malicioses i de volums d'activitat que destaquessin, amb l'objectiu en canvi de "volar sota el radar" mentre s'exploren les capacitats del modelSegons els informes disponibles, no hi ha proves concretes fins ara que el grup utilitzés Mythos per comprometre objectius del món real.

Fins i tot si aquestes autodescripcions són precises, l'incident ha provocat malestar entre els professionals de la seguretat. Un cop demostrada una via viable cap a un sistema restringit, els imitadors poden intentar replicar la tècnica, possiblement amb motius molt diferents. El fet que aquesta primera onada d'usuaris no autoritzats al·legui una intenció no maliciosa no tranquil·litza gaire els defensors a l'hora de pensar en què vindrà després.

L'episodi també ha destacat fins a quin punt l'accés sensible pot dependre del comportament d'un petit nombre d'individus. Un sol contractista amb privilegis parcials i la voluntat de trencar les normes, combinat amb una certa persistència en un Discord privat, sembla que va ser suficient per... incomplir l'aïllament previst d'un model d'IA d'alt risc.

La resposta d'Anthropic i el problema de la cadena de proveïdors

Anthropic ha reconegut els informes i diu que està duent a terme una revisió formal. En un comunicat compartit amb la premsa, l'empresa va assenyalar: «Estem investigant un informe que reclama accés no autoritzat a Claude Mythos Preview a través d'un dels nostres entorns de proveïdors externs.» La redacció és cautelosa però significativa.

L'empresa destaca que, en aquesta fase, té no hi ha proves que l'activitat s'estengui als seus sistemes corporatius principals o que la seva infraestructura interna s'hagués vist compromesa directament. En plantejar el problema com a limitat a l'entorn d'un proveïdor, Anthropic està traçant efectivament un límit entre les seves operacions centrals i l'entorn utilitzat pel contractista connectat al grup Discord.

Aquesta distinció, però, és precisament el que preocupa a molts observadors. Si es pot arribar a Mythos des d'un entorn extern, aleshores La postura de seguretat de cada soci extern esdevé part de la superfície d'atacLa situació il·lustra un risc clàssic de la cadena de subministrament: fins i tot si una empresa reforça les seves pròpies xarxes, les debilitats o les configuracions incorrectes entre els proveïdors poden obrir portes inesperades.

L'incident també xoca amb la manera com es va comercialitzar el Projecte Glasswing. La lògica del programa era que limitar estrictament l'accés a una llista seleccionada a mà d'organitzacions mantindria Mythos allunyat dels adversaris alhora que permetria proves i retroalimentació útils. La idea d'exclusivitat era central: només les entitats importants i verificades podrien provar el model, reduint la possibilitat d'un mal ús.

Si un grup informal de Discord pogués començar a utilitzar Mythos el mateix dia que es va anunciar, aquesta narrativa es torna més difícil de mantenir. Fins i tot si encara no hi ha cap signe d'atacs del món real que es remetin al model, l'episodi suggereix. el perímetre al voltant dels sistemes d'IA sensibles pot ser més fràgil del previst, sobretot quan els contractistes i socis externs estan al corrent.

Preocupacions més àmplies sobre una IA de ciberseguretat "massa potent"

Més enllà dels detalls específics d'aquest cas, la història de Mythos alimenta una conversa més àmplia sobre Eines d'IA que difuminen la línia entre defensa i atacMythos s'ha promocionat com una mena d'"equip vermell en una caixa", capaç de simular atacants complexos i descobrir punts febles molt abans que els adversaris humans s'hi topin.

Els investigadors de seguretat estan dividits sobre com interpretar aquest argument. Alguns són escèptics que un sistema d'IA, per molt avançat que sigui, pugui descobrir de manera fiable noves vulnerabilitats al ritme suggerit en els materials de màrqueting. D'altres argumenten que, si les afirmacions són encara que parcialment precises, el risc de Els ciberatacs assistits per IA es tornen més ràpids, més econòmics i més escalables és una cosa que els responsables polítics han de tenir en compte en la regulació.

Els comentaris de figures del sector, inclosos executius d'empreses de seguretat al núvol, reflecteixen una barreja de curiositat i preocupació. D'una banda, els defensors veuen una oportunitat per automatitzar programari d'anàlisi tediós i proves d'estrès en escenaris d'atac realistesD'altra banda, imaginen què passa si models similars s'ajusten deliberadament per a l'ofensiva i es distribueixen més àmpliament, o si les barreres destinades a prevenir usos nocius resulten fàcils d'eludir.

Les agències governamentals comencen a tractar aquestes preguntes com a estratègiques en lloc de purament tècniques. Segons sembla, Anthropic ha estat designat com a "risc de la cadena de subministrament" segons el Departament de Defensa dels EUA, amb debats en curs sobre què hauria de comportar aquesta etiqueta i si es pot revisar. Els organismes internacionals de seguretat també veuen sistemes com Mythos com a casos de prova de com gestionar les tecnologies d'IA de doble ús.

Per tant, l'incident d'accés a Discord arriba en un moment delicat. Per als reguladors, pot servir com un primer exemple dels reptes en el control policial de qui pot utilitzar models d'IA potents. com s'audita el seu accés i quines obligacions tenen els proveïdors quan les coses van malament. Per a les empreses que consideren eines similars, això planteja preguntes pràctiques sobre la documentació, el registre i la segregació d'entorns sensibles.

Què significa això per a les empreses, els usuaris i la governança de la IA

Per a les organitzacions que estaven considerant Mythos o sistemes comparables, és probable que l'episodi provoqui noves avaluacions de riscos. La tensió central és senzilla: Les mateixes característiques que fan que un model sigui atractiu per a la defensa poden fer-lo perillós si es maneja malamentSi fins i tot les previsualitzacions restringides poden filtrar-se a comunitats informals, potser caldrà actualitzar les suposicions sobre qui utilitza realment aquestes eines.

Des d'una perspectiva de seguretat corporativa, el cas subratlla la necessitat d'analitzar tota la cadena d'accés, inclosos els contractistes i els proveïdors més petits i la desplegament de producció d'equips d'agents d'IALes polítiques que semblen sòlides sobre el paper es poden desfer en entorns reals on la gent reutilitza les credencials, retalla costos per comoditat o tracta els entorns de previsualització com a menys importants. Les organitzacions poden decidir que necessiten una segmentació més estricta per als sistemes d'IA que interactuen directament amb el codi i la infraestructura en directe.

Per als usuaris i empleats quotidians, la història és un recordatori que la IA no és només una altra peça de programari empresarial. Sistemes com Mythos poden comprimir el temps i l'experiència necessaris per detectar debilitats, cosa que magnifica l'impacte de qualsevol filtració o mal ús. Aquesta realitat pot impulsar nous marcs interns de formació i governança sobre qui pot consultar models d'alt risc i en quines condicions.

Pel que fa a la governança de la IA, hi ha una pressió creixent per anar més enllà de les directrius voluntàries. Incidents com aquest alimenten les demandes de normes formals sobre control d'accés, divulgació d'incidents i auditoria independent per als models més capaços. Tant si els responsables polítics opten per una supervisió lleugera com per una regulació més estricta, és probable que assenyalin casos en què les eines restringides van passar per canals no oficials com a justificació.

Per a la mateixa Anthropic, molt depèn del que descobreixi la seva investigació en curs: com va funcionar la via d'accés en detall, quantes persones hi van participar i quins canvis tècnics o procedimentals s'implementen posteriorment. Sigui quin sigui el resultat, l'episodi de Mythos ja s'ha convertit en un punt de referència en els debats sobre... com mantenir la ciberseguretat avançada en IA limitada als rols previstos pels seus creadors, i què passa quan aquest confinament es veu sotmès a tensió.

En conjunt, el presumpte accés no autoritzat a Claude Mythos per Discord posa de manifest la rapidesa amb què la IA d'avantguarda pot anar més enllà dels límits definits en els anuncis de llançament, exposant llacunes en la seguretat dels proveïdors, posant a prova la robustesa de les promeses "només per invitació" i obligant les empreses, els reguladors i els usuaris a repensar com gestionen eines que poden reforçar i potencialment soscavar les defenses digitals en què confien.

disseny i construcció d'equips d'agents de ia
Article relacionat:
Disseny i construcció d'equips d'agents de IA: de l'estratègia a la puesta en producció
Articles Relacionats: