Blackberry: Tolerancia a fallos

Como ya casi todo el mundo sabe ayer el servicio de Blackberry tuvo un fallo global que dejo sin servicio a millones de usuarios a la vez. Cuando algo como el acceso continuo a aplicaciones y datos se ha vuelto imprescindible es un desastre una caída de unas horas. Si se trata casi de un día entero alcanza el drama.

Parte del problema de la arquitectura de Blackberry es que está muy centralizada. Esto ofrece ventajas de mayor control y permite hacer inversiones más altas en un solo centro de datos, pero a la contra el día que falla (aunque sea menos que el tiempo que fallaría una arquitectura distribuida) el fallo es mucho más visible.

Por contra, Apple o los equipos Android dependen de las infraestructuras de los operadores. De modo que si pierdo el acceso a Internet es culpa de Telefónica, Vodafone o en mi caso Yoigo. Si pierdo el correo, solo pierdo el correo pero puedo seguir navegando. Un fallo global que salga en toda la prensa es practicamente imposible.

Este problema ocurre también con la tendencia a la virtualización que ha generado disponer de grandes servidores y aplicaciones como VmWare. Esto produce que puedas tener una infraestructura potente y flexible pero (como nos ocurrió hace unas semanas en mi compañía) que un fallo temporal de un solo servidor deje a 10 aplicaciones sin funcionar y a 40 personas sin poder trabajar un día.

Creo que tanto para un servicio como Blackberry o el servicio que presta el departamento de TI a sus clientes (las otras áreas) es conveniente evitar que las caídas sean globales, porque la sensación del servicio (siendo mejor en agregado) es muy mala el día que hay fallos.

Tener a todos tus clientes enfadados a la vez es una situación que no le deseo a nadie. 🙂

Por cierto, que Blackberry se niegue de momento a explicar que ha ocurrido es una muy mala política. Cualquier cosa que haya pasado es mejor que lo que podamos creer que nos quiere ocultar, que posiblemente es un fallo puntual o un error de cálculo. Ellos verán.

Anuncios

Una respuesta

  1. Se decía que había sido por culpa de una actualización en sus servidores, lo que me recordó el caso de Vodafone de hace unos años.

    Desde luego las empresas deberían de pensar en cómo actuar en casos así para no dejar a sus clientes tirados. Un solo fallo así puede hacer que en un día pierdas clientes que has tardado meses o años conseguir.

Los comentarios están cerrados.

A %d blogueros les gusta esto: