Si sois poseedores de una BlackBerry seguro que os habéis estado tirando de los pelos estos días por culpa de que los servicios básicos de Internet no funcionaban en absoluto. Después de los primeros días en los que RIM no se aclaraba, al final el problema se arregló y supimos las operadoras deberían indemnizar a los usuarios de BlackBerry, pero lo que no supimos fue cual fue el problema exacto de todo este caos que hemos sufrido en los últimos días. Hoy lo sabemos, ni más ni menos que un switch.
Así como lo leéis, un simple switch ha sido el culpable de que todos los terminales BlackBerry de medio mundo estuvieran sin servicio durante el comienzo la semana. Uno de los puntos fuertes del servicio de BlackBerry es que toda la comunicación que necesite de Internet pasa a través de sus servidores, con la consecuente mejora de velocidad debido a cachés y túneles varios. Pero ese punto fuerte fue a la vez su gran fallo, ya que por culpa de esta centralización el servicio se cayó al completo.
Para el que no lo sepa, un switch es el encargado de repartir los paquetes de información a través de las máquinas que están conectadas a él. En los servidores centrales de BlackBerry poseen un switch central al que han llaman core switch y que fue el que principalmente falló, ya que en el momento que el servidor central dejó de funcionar, el switch no comenzó a repartir los paquetes de información al servidor de respaldo, con la consecuente caída del sistema.
Si esto no fuera poco, el mayor problema fue que al acumularse tal cantidad de información, cuando el core switch fue arreglado, los paquetes que estaban pendientes de enviar acabaron por saturar todo el sistema de RIM, provocando que se cayera la mayor parte de la red del mundo y que muchas BlackBerry volaran por los aires.
Realmente parece mentira que una pieza tan pequeña del sistema como un switch haya conseguido tirar todo el sistema de RIM, pero lo cierto es que en la mayoría de ocasiones, cuando nos topamos con sistemas grandes, es más común de lo que se piensa que las grandes crisis sean provocados por pequeños fallos que provocan grandes reacciones en cadena en todo el sistema. Esto se suele solucionar con sistemas de respaldo y programas que comprueben el estado del sistema, pero hay ocasiones en las que es casi imposible predecir el error, como fue el caso de RIM y sus BlackBerry.
Vía | @BlackBerry, Xataka