Grandes interrupciones en CrowdStrike y Microsoft dejan al mundo con BSOD y confusión
Millones de personas ajenas al sector de las TI están descubriendo hoy qué es CrowdStrike, y eso es algo realmente malo. Mientras tanto, Microsoft también está siendo culpado por las interrupciones de la red mundial y, entre los dos, no estaba claro hasta el viernes por la mañana quién causó qué.
Después de que la empresa de ciberseguridad CrowdStrike enviara… una actualización de su software Falcon Sensor que protege los sistemas críticos, las pantallas azules de la muerte (BSOD) comenzaron a afectar a los sistemas basados en Windows. Los problemas comenzaron en Australia y siguieron la línea de tiempo desde allí.
Las cadenas de televisión, los centros de llamadas al 911 e incluso los Juegos Olímpicos de París se vieron afectados. Los bancos y los sistemas financieros de la India, Sudáfrica, Tailandia y otros países colapsaron cuando las computadoras dejaron de funcionar repentinamente. Algunos trabajadores descubrieron que las computadoras portátiles que les habían proporcionado en el trabajo se iniciaban con pantallas azules el viernes por la mañana. Las interrupciones podrían Eliminar los pedidos móviles de Starbucks
Las aerolíneas, que nunca han sido las redes más ágiles, se vieron particularmente afectadas, entre ellas American Airlines, United, Delta y Frontier. Las aerolíneas estadounidenses se vieron desbordadas el viernes por la mañana.
Un ingeniero de CrowdStrike Publicado en el subreddit oficial de CrowdStrike que los pasos para solucionar el problema implican arrancar los sistemas Windows afectados en modo seguro o en el entorno de recuperación, navegar hasta un directorio de CrowdStrike, eliminar un archivo .sys y reiniciar. Si esto funciona, no es algo que se pueda hacer a través de una red, por lo que queda mucho trabajo manual por hacer.
Director ejecutivo de CrowdStrike George Kurtz publicó en X (anteriormente Twitter) A las 5:45 am, hora del Este, la empresa estaba trabajando en “un defecto encontrado en una única actualización de contenido para hosts de Windows”, mientras que los hosts de Mac y Linux no se vieron afectados”.“Esto no es un incidente de seguridad ni un ciberataque. El problema ha sido identificado, aislado y se ha implementado una solución”, escribió Kurtz. Kurtz le dijo al programa Today de NBC
Como anotado en Mastodon por LittleAlexKurtz era el director de tecnología de la empresa de seguridad McAfee cuando, en abril de 2010, esa empresa envió Una actualización que eliminó un archivo crucial de Windows XP que causó interrupciones generalizadas y requirió la reparación de archivos sistema por sistema.
Los costos de una interrupción de este tipo tardarán en conocerse y serán difíciles de medir. El analista de costos de la nube CloudZero estimó a media mañana del viernes que el incidente de CrowdStrike ya había costado 24 mil millones de dólares. basado en una estimación previa.
Múltiples cortes de energía, sin una clara culpa
Los servicios de Microsoft fueron, en una coincidencia aparentemente terrible, También cayó durante la noche del jueves al viernesVarios servicios de Azure dejaron de funcionar el jueves por la noche, y la causa citada fue “un flujo de trabajo de administración de clústeres de back-end”. [that] implementó un cambio de configuración que provocó que se bloqueara el acceso al backend entre un subconjunto de clústeres de Azure Storage y recursos informáticos en la región central de EE. UU.
Los informes de prensa sobre estas interrupciones hasta ahora han culpado a Microsoft, CrowdStrike o una combinación poco clara de los dos como responsables de varias interrupciones. Puede que sea inevitable, dado que todas las interrupciones están ocurriendo en una sola plataforma, Windows. Microsoft emitió una “Conciencia” sobre el problema de la pantalla azul de la muerte de CrowdStrike en máquinas virtuales que ejecutan Windows. La empresa lo actualizó con frecuencia los viernes, con una solución que puede sorprender o no a los veteranos de TI.
“Hemos recibido comentarios de los clientes de que pueden ser necesarios varios reinicios (se han informado hasta 15), pero la respuesta general es que los reinicios son un paso eficaz para solucionar problemas en esta etapa”, escribió Microsoft en el boletín. Alternativamente, Microsoft recomienda a los clientes que tengan una copia de seguridad de “antes de las 19:00 UTC del 18 de julio” que la restauren o Conecte el disco del sistema operativo a una máquina virtual de reparación para luego eliminar el archivo (Windows/System32/Drivers/CrowdStrike/C00000291*.sys) en el corazón del bucle de arranque.
Consultor de seguridad Se citó a Troy Hunt al describir las fallas duales como “la mayor interrupción de TI en la historia”, diciendo, “básicamente lo que a todos nos preocupaba con el Y2K, excepto que esta vez realmente sucedió”.
United Airlines le dijo a Ars que estaba “reanudando algunos vuelos, pero espera que las interrupciones en los horarios continúen durante todo el viernes” y había emitido exenciones para que los clientes cambien sus planes de viaje. American Airlines publicado el viernes temprano que había restablecido sus operaciones a las 5 a.m., hora del Este, pero esperaba retrasos y cancelaciones durante todo el viernes.
Ars se ha puesto en contacto con CrowdStrike y Microsoft para solicitar comentarios y actualizará esta publicación con la respuesta.
Esta es una historia en desarrollo y esta publicación se actualizará a medida que haya nueva información disponible.