Consideraciones de Diseño: Velocidad y Disponibilidad

En los primeros dos blogs de la serie “Pilares de la Tierra”, he cubierto costo y escalabilidad. En este blog cubriré dos consideraciones de diseño: velocidad y disponibilidad.

¿Qué tan rápido es suficiente para que la red pueda hacer su trabajo de permitir que las aplicaciones corran suavemente?

Velocidad

Tendrás que considerar las aplicaciones que corren en tu red actualmente y las que planeas correr en la red en corto y largo plazo para responder a la pregunta: “¿Qué tan rápido es suficientemente rápido?”. Diferentes aplicaciones (datos, voz y video) y protocolos de enrutamiento tienen requerimientos distintos de ancho de banda de extremo a extremo, latencia y jitter. Considera donde los usuarios finales y los servidores corriendo las aplicaciones residen en la red. Necesitas saber estos requerimientos para crear una red que sea adecuada para tu cliente.

(Alta) Disponibilidad

Un componente crítico a considerar cuando se hace a la red “consciente” de las aplicaciones es como hacerla altamente disponible. Pero ¿Qué significa realmente “disponibilidad”? Es una métrica que transmite cuanto downtime por ano es aceptable desde el punto de vista del negocio. Esto varía de compañía a compañía , así que no apuntes a los five 9s solo porque “es cool” (alta disponibilidad no viene gratis) si no es un requerimiento del negocio: el costo del downtime es alto, el costo del incumplimiento de los SLAs es alto, o sus impactos en productividad y resultados de negocio. Puedes calcular la disponibilidad usando Mean Time Between Failures (MTBF) (es decir, qué, cuándo, por qué y cómo falló?) y Mean Time to Repair (MTTR) (es decir, ¿cuánto tarda en repararse?). Para aumentar la disponibilidad puedes combinar reducir MTTR e incrementar MTBF. Mira los componentes que puedes considerar para hacer la red mas disponible.

Confiabilidad

Confiabilidad se refiere a que los paquetes sean enviados consistentemente, de forma oportuna, predecible y precisa y que estos sean recibidos recibidos en su destino propuesto. ¿Cómo lograr alta confiabilidad? Considera enrutamiento simétrico (VS. asimétrico) a lo largo de caminos alternos, ingeniería de tráfico, y sumarización de rutas apropiada.

Redundancia

Redundancia se refiere a la duplicación de componentes para que evitar que la falla en algún componente dado no afecte al resto de la red. ¿Cómo lograr redundancia? Evita hacer uso de componentes (hardware/software y enlaces) en series, puntos unicos de falla (SPOF) y fate sharing. Y considera hacer usar componentes en paralelo, funcionalidad distribuida, y dominios de falla más pequeños.

Convergencia (rápida)

Hay muchas tecnologías que ayudan a lograr alta disponibilidad a través de tiempos más cortos de convergencia, y ellos formalmente se sitúan en una o más de estas categorías: detección de falla y propagación, procesamiento para determinar el mejor camino(s) alternativo(s), el uso de los mejores caminos alternativos considerando el efecto de dampening, y revertir al estado anterior una vez la falla ha sido resuelta.

Resiliencia

Resiliencia es la habilidad de las redes de autosanarse sin requerir la intervención manual del personal de operaciones para mantenerse corriendo (continuidad de negocio). ¿Cómo lograr resiliencia? Considera usar las tecnologías descritas arriba asociadas con los protocolos de capa 2 o capa 3 que ya estas utilizando o planeando utilizar en tu diseño de red, y/o afina los timers de los protocolos (debe usarse con cuidado).

Utilidad

¿Qué falla típicamente en una red estable? Cables, proveedores de telecomunicaciones, fuentes de poder y hardware (esto puede ser resuelto con redundancia), pero principalmente ataques, error humano y lo que ha cambiado. ¿Cómo lograr utilidad? Haciendo uso de la simplicidad en tu diseño de red, manteniendo la documentación actualizada, y siguiendo el proceso establecido de change management.

¿Consideras que estas dimensionando la velocidad y disponibilidad en tus diseños de red? ¿Hay algún tópico del que quieras escuchar en los siguientes blogs? ¡Agregalo al campo de los comentarios!


pic-elopes3.PNG


Elaine Lopes es la Program Manager para las certificaciones CCDE y CCAr, y Team Lead para el equipo del programa CCIE,  Elaine es una apasionada acerca de cómo las vidas pueden cambiar para mejor a través de la educación y certificaciones.


Traductor voluntario del blog en Español: David Peñaloza

Versión original en Inglés: CCDE: The Pillars of the Earth - Part 3


A continuación, algunas maneras adicionales para integrarnos y mantener la conversación: