- Usa AWS Health Dashboard i EventBridge per a esdeveniments fiables i en temps real.
- Controla el RenewalStatus de l'ACM i les notificacions prèvies a la caducitat.
- Vigila comprovacions d'EC2 i mètriques de CloudWatch per activar alarmes i recuperació.
- Ten en compte la naturalesa regional d'AWS i valida la regió per diagnosticar.

quan necessites verificar l'estat d'AWS, no basta amb mirar si un servei “funciona o no”. La clau està en combinar el panel de salut, alertes en temps real i comprovacions específiques dels teus recursos per entendre què ocorre i com et afecta. Si treballa amb càrregues crítiques, anticipar incidències o detectar degradacions de rendiment pot estalviar més d'un sostre.
En aquesta guia trobarà tot el necessari per controlar l'estat d'AWS de forma efectiva: des d'AWS Health Dashboard i la integració amb EventBridge, fins a la comprovació de l'estat de renovació de certificats en ACM i les verificacions de salut de les instàncies EC2 (incloent mètriques de CloudWatch i opcions de recuperació). A més, veràs consells pràctics si la consola no et carrega o un servei sembla caído a la teva regió.
AWS Health Dashboard: el vostre punt de partida per a l'estat dels serveis
L'AWS Health Dashboard mostra informació sobre interrupcions de servei, esdeveniments en curs i manteniment planificat. És un servei integrat al teu compte, no requereix configuració i pots accedir si estàs autenticat. Resulta molt útil quan no s'aconsegueix un recurs concret (per exemple, una instància d'EC2 que justo està en manteniment).
Recordeu un detall important: els serveis d'AWS son regionals. Si consultes el panel de salud, asegúrate de seleccionar la región correcta desde el selector correspondiente; de lo contrari, no pots veure esdeveniments rellevants per als teus recursos.
Des de setembre de 2023, quan s'obre un esdeveniment públic d'AWS Health, l'URL del navegador s'actualitza amb un enllaç profund a aquest esdeveniment. Al compartir aquest enllaç o tornar a obrir-lo, veureu la llista d'esdeveniments amb la finestra emergent de l'esdeveniment ja carregada, per facilitar el seguiment i la col·laboració amb el vostre equip.
Si un dia la consola no et carrega o devuelve errors del tipo 404, conviene ir por partes. El primer és revisar l'AWS Health Dashboard per comprovar si hi ha un esdeveniment actiu que afecti el servei que intenta utilitzar. Després, podeu provar a netejar la caché i les cookies del navegador, canviar un altre navegador i confirmar amb el vostre administrador de red que no hagi bloquejat els dominis d'Amazon (per exemple, aws.amazon.com).
Ingesta d'esdeveniments de salut: EventBridge davant de RSS
Encara que existeix un feed RSS amb esdeveniments de salut, el seu format pot canviar amb el temps, per lo que basar la ingesta programàtica en ell no és més fiable. Scraping o consum director del RSS podria deixar fora del joc si ajustar l'esquema o el contingut.
La recomanació és clara: integra AWS Health amb Amazon EventBridge. D'aquesta manera rebreu esdeveniments de forma consistent, amb un format estable i llista per enrutar a destinacions com Lambda, coles, notificacions o taules interiors. Aquest enfocament permet automatitzar respostes, registrar incidents i generar alarmes sense dependre de formats fràgils.
En altres paraules, si voleu robustez i traçabilitat, EventBridge és el camí correcte per monitoritzar esdeveniments d'AWS Health. A partir de l'ahí, podeu enriquecer la informació, associar-vos a serveis, equips o SLA interns i actuar en calent quan algú s'apropi.
ACM: cómo comprobar l'estat de renovació dels teus certificats
Amb AWS Certificate Manager (ACM) podeu saber si els vostres certificats s'han renovat correctament. Un certificat és elegible per a la renovació automàtica està associat a un altre servei d'AWS (com Elastic Load Balancing o CloudFront) o si s'exporta des de la seva emissió o darrera renovació.. Aquesta elegibilitat és bàsica per a la gestió de les renovacions de l'ACM sense que tinguis que intervenir.
Quan s'iniciï un procés de renovació, ACM mostra un camp requerit Estat de renovació en los detalles del certificado. Podeu consultar aquest estat des de la consola, l'API, l'AWS CLI o inclòs a través de l'AWS Health Dashboard. Si usas la consola, verás un de varios valors posibles para este estado; de forma similar es reflecteixen en el panel de salud.
En entorns automatitzats resulta molt útil tirar de l'API d'ACM. Amb l'acció DescribeCertificate obtiene el detall d'un certificat, inclòs el seu estat de renovació. Per a Java (u altres llenguatges) podeu basar-vos en l'SDK d'AWS i consultar periòdicament aquest camp per preveure caducitats o detectar bloquejos de validació.
Si prefereixes línia de comandaments, l'AWS CLI torna l'estat de renovació. Un exemple senzill seria:
aws acm describe-certificate --certificate-arn arn:aws:acm:REGION:ACCOUNT:certificate/CERTIFICATE_ID
En la resposta JSON, fíjate en el camp Estat de renovació. Si no apareix, significa que ACM encara no ha començat el procés de renovació gestionat per a aquest certificat. És un detall que passa desapercibido, però que t'indica clarament en quin punt estàs del cicle.
ACM intenta renovar automàticament un certificat 60 dies abans de la seva expiració. Si per algun motiu no ho podeu fer (per exemple, un problema amb la validació del domini), consulteu els avisos a AWS Health Dashboard amb antelació: 45, 30, 15, 7, 3 i 1 dies abans de la caducitat. Aquests esdeveniments no requereixen configuració extra i estan disponibles per a qualsevol usuari autenticat al vostre compte, de manera que l'equip pot reaccionar a temps.
Quan la consola no obre o devuelve errors: passos ràpids
Si et topes amb un 404 o la consola no carrega, empieza comprovant l'AWS Health Dashboard i la regió dels teus recursos. Un esdeveniment públic o un manteniment regional poden explicar per què no assoleix algun consol o servei.
Si no hi ha esdeveniments rellevants, neteja la memòria cau i les galetes del navegador, prova amb un altre navegador i, si estàs en una red corporativa, pide al teu equip de TI que verifica que no hagi bloquejat els dominis d'Amazon ni a subdominis crítics.
Procura també confirmar que el problema no sea d'un recurs concret al teu compte. Per exemple, una instància EC2 pot estar passant pel manteniment o afectat per un esdeveniment; el panel de salud mostrará esa información y orientará sobre la ventana y el impacto.
Verificació de l'estat de les instàncies EC2: comprovacions i mètriques
Execució d'Amazon EC2 comprovacions automàtiques en cada instància en execució per detectar problemes de maquinari i incidències de programari que puguin impedir les vostres aplicacions funcionar amb normalitat. Aquests controls es realitzen cada minut y devuelven un resultado que indica si todo está bien o si hay deteriorado.
Quan totes les verificacions es superin, l'estat global es marca com OK. Si una o diverses fallen, l'estat passa a deteriorat (deteriorat). Aquestes comprovacions estan integrades al servei, no se poden desactivar ni eliminar, i proporcionan senyals tempranes de problemes que conviene atender.
Cada tipus de comprovació té associat una mètrica a Amazon CloudWatch. Al fallar un check, la mètrica corresponent augmenta. Això permet crear alarmes que salten al detectar errors d'estat, ja en una instància concreta o escala de flota.
Més encara, pots recolzar-te en alarmes i accions de CloudWatch per automatitzar respostes. Per exemple, configureu una alarma que us aviseu quan fallen checks en una instància específica, o habiliteu-la recuperació automàtica quan el deteriorament se deba a un problema subyacente en el host.
Si necessitas resiliència avançada, no et limites a les alarmes. Combina mètriques d'estat amb Auto Scaling per substituir instàncies deteriorades i mantén la teva capacitat saludable sense intervenció manual, especialment en pics de trànsit o workloads sensibles a la latència.
Comprobacions de l'estat del sistema
Aquestes verificacions monitoritzen la infraestructura d'AWS subyacente on corre la vostra instancia. Quan fallin, sol·liciteu la intervenció d'AWS o accions que muevan la instancia a un altre host per corregir el problema.
En instàncies respaldades per EBS, una mesura efectiva és detener i iniciar la instancia. Esta acció, en la majoria d'escenaris, reubica la instància en un nou host i pot resoldre el fallo de plataforma. Si treballa amb instàncies respaldades per al almacén d'instancies (solo Linux), podeu acabar i reemplaçar la instancia, tenint present que los volúmenes del almacén de instancias son efímeros y los datos se pierden al detener.
Quan falla una comprovació del sistema, augmenta la mètrica StatusCheckFailed_System. És la senyal ideal per activar les alarmes, iniciar procediments de contingència o, en el seu cas, obrir un cas de suport i persistir l'impacte.
Hay un matiz amb Bare Metal: si reinicies des del sistema operatiu, la comprovació de l'estat del sistema pot marcar error de forma temporal. En quant la instancia vuelve a estar disponible, l'estat hauria de tornar a aprovat sense que tinguis que tocar res extra.
Comprovacions de l'estat de la instancia
Aquestes verificacions s'analitzen la connectivitat de red i el programari de la pròpia instancia. EC2 realitza la validació enviant sol·licituds ARP a la interfície de red (NIC) per confirmar que respondre com és degut.
Quan falla una comprovació de la instancia, sol·liciti la teva intervenció directa: reiniciar la instància, revisar la configuració de red (per exemple, regles d'iptables o un firewall que talla tràfic), analitzar els logs del sistema o comprovar que l'agent de red està responent.
En produir-se una fallada, s'incrementa la mètrica StatusCheckFailed_Instance. Aquesta mètrica és perfecta per a disparar alarmes i executar runbooks de diagnosi: des de recopilar logs fins a forçar un reinici controlat si detecta que el servei no remunta.
Igual que amb el check del sistema, en Bare Metal un reinici des del SO pot provocar un estat d'error temporal en la comprovació de la instancia. Quan la instancia finalitzi el cicle d'arranjament, la verificació hauria de tornar a OK sense major complicació.
Comprobaciones de estado de EBS adjunto
Aquestes comprovacions revisen si els volums d'Amazon EBS adjuntos a la instancia son accesibles y completan E/S. La métrica que reflecteix fallos es Error de verificació d'estat_adjuntEBS, de tipus binari, que indica impacte quan un o diversos volums no poden realitzar operacions d'E/S.
Una fallada aquí apunta a problemes subyacentes de computación o en la infraestructura de EBS. Pots esperar a que AWS mitigue la incidència o actuar: substituir els volums afectats, detener i iniciar la instància per a moure un nou host, o inclús repensar el reparto d'IOPS si detecten els cuellos d'ampolla prolongats.
Per a càrregues de treball resilients, aprofita aquesta mètrica per crear alarmes a CloudWatch. Segons la teva arquitectura, pots disparar la commutació per error a una instància secundària o una altra zona de disponibilitat per detectar l'impacte sostingut, reduint el temps fora del servei.
Si tu càrrega de treball no estàs fent E/S a cap volum adjunt, però la comprovació indica deteriorament, detener i iniciar la instància pot resoldre problemes del host que afecta a l'accessibilitat del volum. Complementa amb les mètriques d'EBS en CloudWatch per detectar volums que s'esperen per baixar de l'esperat i reemplàsar preventivament si toca.
En flotas administrades per Auto Scaling, configura la política per a detecteu errors en el check de EBS adjunt i substituir la instància afectada. Així, manté la salut del grup sense intervenció manual i evita degradacions prolongades.
Alarmes i automatització amb CloudWatch i Auto Scaling
Amb totes les mètriques anteriors, CloudWatch es converteix en el teu sistema nerviós. Define umbrales, crea alarmes i orquesta accions: notificacions, execució de funcions.
Si necessitas continuidad de negoci, piensa en termes de automatització i substitució: Auto Scaling pot retirar instàncies amb controls deteriorats i llançar noves, mentre que les alarmes coordinen les respostes i us avisen pels canals adequats (correu, Slack, PagerDuty, el que utilitza).
La combinació de mètriques d'estat, registres, traços i esdeveniments d'AWS Health a través d'EventBridge et dona una visió holística. Així sabràs si el problema és de la teva aplicació, de la instancia, del volum d'EBS o de la plataforma subyacente, i actuaràs amb precisió quirúrgica.
Bones pràctiques per verificar l'estat d'AWS amb el cap
Centralitza l'observabilitat: EUA AWS Health Dashboard per al context de plataforma i CloudWatch per a mètriques operatives. Aquest doble enfocament evita perdre detalls importants de cada capa.
Para certificados, no lo dejes al azar. Automatitza la revisió de RenewalStatus en ACM, i reacciona a les notificacions del panel de salut a 45, 30, 15, 7, 3 i 1 dies de caducitat. Si algo falla, tendrás margen de sobra.
En EC2, activa alarmes sobre StatusCheckFailed_System, StatusCheckFailed_Instance i StatusCheckFailed_AttachedEBS. Asóciales a accions: recuperació, reinici, canvi per error o reemplaçament via Auto Scaling, segons el vostre SLA.
Y si la consola se empeña en no cargar, recorda la receta: verifica els esdeveniments al Health Dashboard a la regió correcta, neteja caché/cookies, canvia el navegador i confirma amb TI que no bloqueja el domini d'AWS.
Recursos i informació relacionada
Per ampliar la configuració i operativa, consulteu la documentació d'AWS Health i d'EventBridge per a l'enrutat d'esdeveniments. En l'àmbit dels certificats, revisa la guia de l'ACM i els exemples de DescribeCertificate si vas a integrar verificacions en pipelines o monitors interns.
- Tauler de control d'estat d'AWS: visibilitat d'esdeveniments públics i de compte, sense configuració extra.
- Amazon EventBridge: ingesta fiable d'esdeveniments de salut, amb regles i destins flexibles.
- Gestor de certificats d'AWS (ACM): estat de renovació i notificacions prèvies a la caducitat.
- Amazon EC2 + CloudWatch: controls per minut, mètriques d'estat i alarmes amb accions.
Si us preocupa l'accés al compte, hi ha articles d'ajuda molt útils: com crear i activar una cuenta nova, com iniciar la sessió en la consola o com demanar suport. Tenlos a mà i gestiones diversos entorns o rotacions de credencials amb freqüència.
Verificar l'estat d'AWS no mira un panel únic i ja. Es tracta d'unificar senyals d'AWS Health, esdeveniments d'EventBridge, estats d'ACM i controls d'EC2/components per components, amb alarmes que actuen a temps i playbooks clars. Amb aquesta combinació tindràs un diagnòstic ràpid, menys sorpreses i una operació més tranquil·la, inclòs quan el trànsit subi i les coses que es posen interessants.