Construir bosques, no castillos
Diario de Innovación #364
Mi amigo J, físico de formación, me compartió hace unos días una noticia fascinante.
Y acabamos hablando de algo que parece obvio, pero que olvidamos demasiado a menudo: las matemáticas no son solo una asignatura abstracta llena de símbolos raros. Son una caja de herramientas para entender mejor el mundo real. Y, a veces, para resolver problemas de forma mucho más eficiente que la intuición humana.
Amazon ha empezado a rediseñar la conectividad interna de sus centros de datos usando una idea contraintuitiva: conectar parte de la red de forma cuasi aleatoria.
No más jerarquías perfectas.
No más diseño tipo campus llevado al extremo.
No más obsesión por que cada cable, cada sala, cada core y cada camino de red responda a una arquitectura perfectamente planificada.
O, al menos, no siempre.
La tesis es casi herética para cualquiera que haya trabajado en comunicaciones: introducir aleatoriedad en el cableado puede mejorar el rendimiento, reducir cuellos de botella, aumentar la resiliencia y ahorrar una cantidad enorme de dinero en infraestructura.
Cuando leí esto, me acordé inmediatamente de los safaris que me tocó organizar al data center de Alcalá de Henares, de mi querida Telefónica.
Aquello era ingeniería con mayúsculas.
Salas.
Racks.
Meet-me rooms.
Cores de red.
Salas de comunicaciones.
Jerarquías.
Redundancia.
Planos.
Etiquetado.
Latiguillos.
Procedimientos.
Diseños revisados hasta la extenuación.
Y, por supuesto, la parte de comunicaciones era la joya de la corona. La parte que se miraba con más respeto. Casi con cariño.
Si hace más de una década alguien nos hubiese dicho que una vía para optimizar el uso de una red de data center consistía en abrazar la “antiplanificación” y conectar elementos de forma aparentemente aleatoria, probablemente le habríamos mirado raro.
Muy raro.
Quizá no para ingresarle en un psiquiátrico.
Pero cerca.
Y, sin embargo, eso es precisamente lo interesante de esta historia.
Durante décadas, el diseño de redes de centros de datos ha estado dominado por arquitecturas jerárquicas. En especial, por topologías tipo fat-tree: capas de switches y routers organizadas de forma ordenada para agregar tráfico desde los servidores hacia niveles superiores de la red.
Es un modelo muy lógico.
También muy humano.
Dividir.
Agrupar.
Jerarquizar.
Controlar.
El problema es que el tráfico real no siempre se comporta como nuestros diagramas de arquitectura. En cargas modernas, especialmente con cloud, almacenamiento distribuido, microservicios e inteligencia artificial, los datos se mueven en muchas direcciones al mismo tiempo. No solo de arriba abajo. No solo siguiendo caminos limpios y previsibles.
Y cuando una red está demasiado estructurada, esa misma estructura puede convertirse en una limitación.
Los caminos prefijados concentran tráfico.
Los niveles superiores se convierten en puntos críticos.
La redundancia existe, pero no siempre se aprovecha del todo.
Y algunos equipos acaban infrautilizados mientras otros se saturan.
La propuesta de AWS parte de una idea matemática conocida desde hace años: los grafos aleatorios pueden ofrecer muchas rutas alternativas entre nodos sin necesidad de construir una jerarquía pesada.
Dicho en sencillo: si cada router se conecta con varios routers de forma suficientemente distribuida, la red resultante puede tener muchísimos caminos posibles entre dos puntos. No hay un único “centro” de la red. No hay una gran autopista que todo el mundo tenga que usar. Hay una malla amplia de caminos alternativos.
Eso mejora dos cosas.
La primera: la utilización de la red.
El tráfico puede repartirse mejor, evitando que unos enlaces estén al límite mientras otros apenas trabajan.
La segunda: la resiliencia.
Si cae una parte de la red, el tráfico puede encontrar caminos alternativos sin que todo dependa de unos pocos nodos centrales.
La teoría era bonita. El problema era llevarla al mundo real.
Porque una cosa es demostrar en un paper que una red aleatoria funciona mejor sobre el papel. Y otra muy distinta es pedirle a un equipo de operaciones que conecte millones de cables de forma aleatoria en un centro de datos real sin convertir aquello en una pesadilla industrial.
Ahí está lo brillante del trabajo de AWS.
No se han limitado a decir: “la aleatoriedad funciona”.
Han tenido que domesticarla. Y demostrarla.
Para hacerlo, han desarrollado una arquitectura llamada RNG, Resilient Network Graphs. La idea no es crear caos puro, sino una red cuasi aleatoria: lo bastante aleatoria como para aprovechar las ventajas matemáticas de los grafos, pero lo bastante controlada como para poder desplegarla, mantenerla y operarla a escala industrial.
Para resolver el problema físico del cableado, AWS ha creado ShuffleBox, un dispositivo óptico pasivo que permite “barajar” conexiones sin que los técnicos tengan que improvisar cable a cable. Es decir, la aleatoriedad no depende de que alguien tire latiguillos al azar, sino de un componente diseñado para introducir esa mezcla de forma repetible y operable.
Y para resolver el problema lógico del encaminamiento, han desarrollado Spraypoint, un protocolo que no se limita a buscar el camino más corto o más obvio. En lugar de eso, distribuye el tráfico por múltiples rutas, aprovechando la diversidad de caminos que genera la topología.
La clave está ahí.
No basta con tener muchos caminos.
Hay que saber usarlos.
Una red aleatoria mal gestionada sería un infierno. Una red cuasi aleatoria bien encaminada puede convertirse en una ventaja brutal.
Según los datos publicados, esta arquitectura permite usar hasta un 69% menos de routers, mejorar el throughput hasta un 33%, reducir el consumo eléctrico asociado al equipamiento de red alrededor de un 40% y rebajar los costes de infraestructura de red hasta un 45%.
En una época en la que los centros de datos se están convirtiendo en la fábrica invisible de la inteligencia artificial, estos porcentajes no son menores.
Son estrategia.
Porque la carrera de la IA no va solo de tener mejores modelos.
Va también de tener mejor infraestructura.
Mejor energía.
Mejor refrigeración.
Mejor red.
Mejor utilización del hardware.
Mejor coste por unidad de cómputo.
La inteligencia artificial se entrena en GPUs, sí.
Pero respira a través de redes.
Y si la red interna del data center no escala bien, todo lo demás se resiente.
Por eso esta noticia me parece tan interesante. No por los ahorros. Ni siquiera por la elegancia técnica de la solución.
Me interesa porque es una lección más amplia sobre innovación.
A veces innovar no consiste en añadir más complejidad.
A veces consiste en cuestionar la forma en la que hemos organizado la complejidad durante años.
Durante décadas pensamos que planificar mejor significaba jerarquizar más.
Más capas.
Más control.
Más diseño previo.
Más estructura.
Pero quizá, en algunos sistemas suficientemente complejos, la eficiencia aparece justo cuando dejamos espacio a la distribución, a la diversidad de caminos y a cierta dosis de aleatoriedad bien diseñada.
No caos.
No improvisación.
Entropía domesticada.
Y eso es una idea poderosa.
Porque vale para redes.
Pero también, quizá, para organizaciones.
Para equipos.
Para innovación.
Para carreras profesionales.
Para la forma en la que intentamos resolver problemas en entornos donde ya no podemos predecirlo todo desde arriba.
La vieja ingeniería nos enseñó a construir castillos.
La nueva infraestructura quizá nos está enseñando a construir bosques.
Y en un bosque, curiosamente, no todo está perfectamente ordenado.
Pero casi todo encuentra su camino.
🌍 El eco del mercado
⚡ NVIDIA quiere convertir cada portátil en un centro de datos personal. NVIDIA ha abierto un frente que parecía reservado a Apple: controlar el ordenador completo. RTX Spark mezcla CPU ARM, aceleración IA y una nueva arquitectura para ejecutar modelos directamente en el dispositivo.
💻 Microsoft vuelve a intentarlo: Surface ya no compite con el PC, compite con el Mac. Microsoft y NVIDIA recuperan una apuesta que hace una década parecía fallida: unir Windows, ARM y hardware propio. Más que un portátil nuevo, va de recuperar el control del stack completo. Si funciona, Windows deja de depender del calendario de Intel.
🤖 La robótica deja el laboratorio y entra en producción. NVIDIA, Unitree y Sharpa presentan una referencia abierta para acelerar robots humanoides capaces de realizar trabajo real. Al igual que CUDA ordenó el mercado IA, ahora empieza la carrera por crear el “Android” de los humanoides.
📈 Anthropic, se adelanta a OpenAI, y ya piensa como empresa cotizada . La compañía acelera movimientos financieros y operativos pensando en escala y mercados.
El ciclo cambia: durante años se vendió inteligencia; ahora toca demostrar márgenes, disponibilidad y capacidad de suministro. El modelo deja paso a la operación.
🧠 China quiere ganar la carrera del software autónomo antes que la del modelo. MiniMax presenta M3, diseñado específicamente para tareas largas de programación y workflows automatizados.
🇨🇳 Las restricciones de EE.UU. están rediseñando toda la industria china del chip. China empieza a reorganizar su estrategia entre GPU y ASIC para reducir dependencia tecnológica. Ya no buscan copiar a NVIDIA. Buscan construir una cadena propia donde las sanciones pierdan efecto.
🏗️ Europa y Asia descubren que el recurso escaso ya no es el talento: es el megavatio. SoftBank prepara una apuesta masiva por centros de datos. La IA se parece cada vez más a una industria pesada: energía, terreno, refrigeración y financiación gigantesca.
🌍 Europa empieza a preguntarse si externalizó demasiado pronto su infraestructura. Crece la presión para reducir dependencia de hyperscalers extranjeros. Más que soberanía digital, empieza a cuestionarse la propia resiliencia económica.
⚖️ Después de Google, el siguiente objetivo puede ser Microsoft. El foco regulatorio vuelve sobre integración vertical y concentración tecnológica. Cuanto más se unan nube, IA y productividad, más difícil será separar plataforma y mercado.
🧬 China lleva los interfaces cerebro-máquina al terreno clínico. Primer chip cerebral invasivo aprobado. Tiembla, Neuralink. La competición tecnológica también se desplaza hacia biología computacional.
🕳️ Tu navegador podría saber más de tu ordenador de lo que imaginas. Investigadores muestran técnicas para inferir actividad del SSD desde el navegador. La privacidad moderna ya no se rompe entrando. Se rompe observando efectos secundarios.
🛡️ Los agentes autónomos ya tienen ataques propios. Una prueba demuestra cómo un browser agent puede ser manipulado mediante prompt injection. Igual que aprendimos a securizar APIs y microservicios, empieza la era del DevSecOps para agentes.
Déjame recordarte que si te gusta la tecnología, el podcast de Código Abierto también puede ser una buena opción.
Si algo de lo que has leído te ha removido, dímelo.
Ya sabes que estoy al otro lado si quieres comentar, discrepar o simplemente saludar.
Que nunca te falten ideas, ni ganas de probarlas.
A.
PD1: Si este tema te ha gustado, te recomiendo Linked. Es uno de esos libros que te hacen mirar el mundo distinto. Redes sociales, internet, epidemias, empresas… y una idea incómoda: muchas veces el comportamiento colectivo no aparece por planificación, sino por cómo emergen las conexiones.
PD2: Hay un libro que pensé varias veces mientras escribía esto: Sync. Habla de cómo luciérnagas, neuronas, mercados y sistemas complejos consiguen coordinarse sin que nadie esté realmente al mando. Bastante más cerca del funcionamiento de un data center moderno de lo que parece.
PD3: Para quien quiera ir un nivel más abajo: Complexity: A Guided Tour. Probablemente una de las mejores puertas de entrada al pensamiento complejo. Después de leerlo empiezas a desconfiar un poco de cualquier sistema excesivamente ordenado.
PD4: Este artículo me recordó mucho a Where Good Ideas Come From (y en Kindle en español). Una defensa preciosa de que la innovación rara vez aparece en estructuras rígidas. Suele aparecer en bordes, conexiones inesperadas y entornos donde las ideas chocan entre sí.
PD5: Para quienes disfrutan mezclando tecnología, historia e infraestructura: The Evolution of Useful Things. Una idea sencilla pero potente: muchas innovaciones no aparecen porque alguien diseñó la solución perfecta, sino porque alguien descubrió una limitación inesperada.
PD8: Hay una frase de A New Kind of Science que sobrevuela todo esto: reglas muy simples pueden generar comportamientos extraordinariamente complejos. Quizá el futuro de la infraestructura no sea diseñar cada conexión… sino diseñar las reglas que permiten que las conexiones emerjan.


