Zander Rose es un empleado de Automattic especializado en la conservación de datos a largo plazo y la evolución del plan de 100 años. Ha estado involucrado en varios proyectos relacionados con archivos de larga duración como The Long Now Foundation o The Rosetta Project, y es firme defensor de la figura de Internet en general y el código abierto en particular como un importante recurso cultural que debería perdurar durante años y años en el futuro.
Al poco tiempo de unirse a la empresa, Zander decidió visitar uno de los centros de datos de Automattic para comprender mejor cómo funciona la nube. La mayoría de la gente piensa en la nube como algo etéreo, pero la realidad es que tiene una enorme presencia tanto física como energética, incluso aunque no esté a la vista de todos. Esta es la crónica del viaje al lugar donde la nube toca tierra.

Un viaje a la nube
Una de las primeras cosas en las que Zander quiso profundizar fue en el funcionamiento de la entrega y el almacenamiento de los datos de los millones de sitios alojados por Automattic. Hay un gran beneficio histórico y cultural en la conservación de todas estas webs, y es por eso que la visita a uno de los centros de datos de Automattic podía ser muy esclarecedora.
La visita comenzó con un almuerzo de tacos con los compañeros del equipo de ingenieros de WordPress.com, además de con Barry y Eugene, del equipo de sistemas. Ellos son los que mejor conocen los centros de datos, además de ser las personas en las que más podrías confiar para proteger tus datos.
El centro de datos de la visita fue construido en 2013, y fue el primero en el que Automattic operaba la totalidad de sus servidores y equipamiento, en lugar de confiar en servicios de terceros. Al construir su propia infraestructura, Automattic podía controlar mejor cada bit de datos que entra y sale, además de reducir los costes por la gran cantidad de datos que se almacenan y se entregan. A día de hoy, Automattic tiene una red de 28 centros de datos por todo el mundo que proporcionan tanto proximidad en la entrega como redundancia del contenido para los usuarios y para la misma Automattic.
El edificio en sí lo gestiona personal externo, y cuenta con muchos sistemas de seguridad tanto por dentro como por fuera. La visita comenzó echando un vistazo a la infraestructura física: en el edificio hay varios clientes que alquilan espacio de servidores, y Automattic es uno de ellos. El personal técnico que trabaja en el edificio ayuda con el mantenimiento y las actualizaciones de los equipos, pero, por lo general, son los empleados de Automattic los únicos que pueden acceder a ellos, tanto por costes como por seguridad.
Un centro de datos debe proporcionar cuatro elementos principales: energía ininterrumpida, refrigeración, conectividad de los datos, y seguridad física y protección contra incendios. Los clientes, como Automattic, instalan filas de servidores y se responsabilizan de todo el equipo: incluyendo la conexión a la red eléctrica, la refrigeración e internet.
Energía
Durante la visita, se podía ver la enorme subestación eléctrica del recinto (donde hay varios edificios de centros de datos, no solo el de Automattic). Barry explicó que con esta subestación no solo se proporciona una gran cantidad de energía a las instalaciones, si no que también se conecta a la red eléctrica este y oeste, lo que hace que haya una redundancia de energía en los edificios.

Una de las cosas más curiosas de estas instalaciones es que, en lugar de usar baterías para disponer de energía de emergencia, emplea un sistema de batería inercial de Active Power. Básicamente, se trata de una serie de cajas del tamaño de frigoríficos que contienen volantes de inercia de unos 270 kilos girando a 10 000 revoluciones por minuto dentro de una cámara de vacío, apoyados en cojinetes cerámicos de alta precisión. La mayor parte del tiempo, el volante funciona como un motor: recibe energía de la red para mantenerse girando. Pero si se produce un corte de suministro, cambia automáticamente al modo generador y extrae esa energía acumulada para mantener el sistema encendido durante los 5 a 30 segundos que necesitan los enormes generadores diésel del exterior para arrancar.

Estos generadores tienen el tamaño de un remolque de camión y cada uno suministra cuatro megavatios de potencia, alimentados por depósitos de diésel de unos 17 000 litros. Puede parecer mucho, pero en realidad les da una autonomía de unas 48 horas. Si ocurriera una catástrofe importante, es posible que haya problemas de acceso por carretera o escasez de combustible que impidiese repostar los generadores; pero nuestra red de centros de datos redundantes garantiza que los datos sigan fluyendo en este tipo de situaciones.
Refrigeración
Dependiendo de la temperatura ambiente en el exterior, la refrigeración suele representar alrededor del 30 % del consumo energético de un centro de datos. El aire se enfría mediante una serie de unidades de refrigeración que funcionan con un sistema de tanques de agua salina situados junto a los generadores.
Barry y Eugene explicaron que, sin esta refrigeración, los equipos intentarían muy rápidamente (en menos de una hora) disminuir su consumo de energía en respuesta al calor, y eso reduciría el rendimiento. Barry también comentó que, cuando el rendimiento baja de forma drástica, es mucho más difícil gestionar los equipos que si simplemente se apagaran. Pero, si la temperatura baja lo suficientemente rápido, se pueden recuperar más fácilmente que si estuvieran completamente apagados.
La refrigeración de un centro de datos es una tarea complicada, pero es una de las responsabilidades que recae en las instalaciones, y la cumplen satisfactoriamente y con suficientes sistemas de emergencia.
Conectividad de los datos
Hay varias formas de conectar los centros de datos a Internet. En este caso, el centro permite que varios proveedores accedan a un punto de entrada principal del edificio.
Automattic utiliza al menos dos proveedores para asegurar la redundancia, de modo que todos los equipos puedan recibir tanto energía como conexión a Internet desde dos o más fuentes en todo momento. Esta conectividad llega al equipamiento de Automattic a través de fibra óptica por canaletas aéreas, separadas de los sistemas eléctrico y de refrigeración que se encuentran en el suelo. Desde ahí, la señal pasa por dos routers, cada uno de los cuales está conectado a todos los compartimentos de esa fila.
Área de servidores
Como este centro de datos se comparte entre varios usuarios, cada uno de ellos establece su propia última línea de seguridad física. Algunos alquilan una sala de datos entera o utilizan una jaula para proteger sus equipos; otros van incluso más allá y los ocultan para que no se puedan ver o extienden la jaula un metro más bajo el suelo para evitar que alguien pueda colarse por allí.

Las máquinas de Automattic ocupan la parte central de la sala de datos donde están, y tienen algo de espacio para crecer. En esta zona también está la oficina de Automattic, donde se almacenan otros equipos y repuestos, además de funcionar como lugar tranquilo donde trabajar. Pero trabajar en la sala de servidores no es muy agradable: entre los ventiladores y la refrigeración, en las salas hay mucho ruido y hace frío.
En este espacio también se hace patente la cantidad de generaciones diferentes de equipo y discos duros que deben mantenerse operativos al mismo tiempo. No es realista asumir que una generación concreta de discos duros o incluso de cables de conexión estará disponible durante más de unos pocos años. En general, la idea es que todo el hardware utilice la misma memoria, los mismos discos y los mismos cables, pero eso no siempre es posible. En los servidores todavía hay equipos en funcionamiento desde 2013, aunque probablemente haya que sustituirlos por completo en un futuro cercano.
Barry también comentó que se utilizan diferentes tecnologías de almacenamiento según los tipos de datos. Las imágenes se guardan en discos duros mecánicos (que son los más baratos por capacidad, pero tienen piezas móviles, por lo que requieren más sustituciones), mientras que las tecnologías más duraderas como los discos de estado sólido (SSD) y la memoria no volátil (NVMe) se reservan para otros usos, como el almacenamiento en caché y las bases de datos, donde la velocidad y el rendimiento son clave.

Barry explicó que los datos de Automattic se almacenan en diferentes lugares en el mismo centro de datos, y también de forma redundante en otros centros de datos. Además de toda esta redundancia, se almacena otra copia más en una copia de seguridad externa. Cada uno de los centros de datos que utiliza Automattic está diseñado con mecanismos de separación, lo que dificulta que un solo fallo o bug pueda propagarse entre los diferentes edificios. En los últimos diez años, solo ha habido una ocasión en la que fue necesario recurrir a la copia de seguridad externa, y fue para recuperar seis imágenes. No obstante, según Barry, cuando se trata copias de seguridad siempre es mejor pasarse que quedarse corto.
Una infraestructura para el futuro
¿Seguirá funcionando este sistema dentro 100 años? Lo más probable es que sí, pero de una forma completamente diferente, y quizá situado en otras partes del mundo donde la refrigeración y la energía sean más sostenibles, ya que cada vez las conexiones de ancho de banda de alta capacidad llegan a más zonas del planeta.
Resulta impresionante lo que Automattic ha construido, y es de esperar que, si no hay grandes cambios, todos los datos seguirán estando muy seguros de cara al futuro. Sin embargo, para asegurarnos de que el contenido de la Web abierta sobrevive al paso del tiempo, es necesario seguir colaborando con organizaciones como The Internet Archive, Permanent.org e incluso bibliotecas y universidades. También existen sistemas de almacenamiento de larga duración que guardan datos sin necesidad de fuentes de energía, así como sistemas que no pueden ser modificados en el futuro (ya que, con la llegada de la IA, existe la duda de si la censura puede llegar a alterar lo que hoy son hechos incuestionables). Algunos de estos sistemas ópticos estables son Piql, Project Silica y Stampertech.
Sería una gran pena que se perdiera todo lo que se ha llegado a crear: es nuestra responsabilidad crear una forma de que pueda sobrevivir lo máximo posible para las generaciones futuras.
