Down-to-Zero (DTZ) siempre ha sido acerca de hacer más con menos vatios y menos bytes. Desde la programación de contenedores con escala a cero hasta runners de build alimentados por energía solar, cada servicio que entregamos se mide contra una línea base implacable: ¿podría esto funcionar felizmente en una CPU de notebook sin ventilador al sol?
Hoy estamos emocionados de anunciar el siguiente paso en ese viaje – servidores remotos del Protocolo de Contexto de Modelo (MCP) que puedes levantar como contenedores Docker ligeros dentro de cualquier contexto DTZ.
MCP es un estándar abierto que permite a los hosts de modelos de lenguaje comunicarse con “servidores” específicos de tareas para obtener datos, herramientas o acciones, usando un flujo JSON simple y autenticado. Piénsalo como un puerto USB-C para agentes de IA: un conector, muchos periféricos. Al ejecutar un servidor MCP cerca de tus datos, evitas transferir conjuntos completos de datos a través de una llamada API LLM. Esto encaja perfectamente con nuestro mantra de “desplazar el cómputo al borde, no al núcleo”.
Hasta ahora, el balanceador de carga multi-tenant de DTZ terminaba solo HTTP/1 y HTTP/2. MCP, sin embargo, depende de Server-Sent Events (SSE) para su flujo de eventos unidireccional de larga duración. SSE funciona genial sobre HTTP/2, pero los navegadores limitan estrictamente las conexiones SSE concurrentes cuando vuelven a HTTP/1 — usualmente seis por origen.
Por ello, hemos extendido el balanceador con soporte nativo para SSE:
Esta mejora desbloquea servidores MCP remotos de primera clase: ahora puedes desplegar el componente servidor como una imagen de contenedor y cualquier cliente LLM puede conectarse de vuelta a través de SSE seguro sin proxies adicionales.
Construye (o descarga) una imagen de servidor MCP.
Súbela a tu registro privado DTZ:
docker push {context-id}.cr.dtz.dev/my-mcp-server:latest
Crea un nuevo servicio en tu contexto y apunta a la imagen. Nuestro programador jala la imagen solo bajo demanda y escala a cero cuando no hay host conectado.
Como el endpoint del registro vive dentro de la misma red eficiente energéticamente, la descarga de imágenes ocurre sobre la columna vertebral local, manteniendo el egress cerca de cero y acelerando los arranques en frío.
Los servidores MCP remotos típicamente requieren un solo binario basado en Rust o Go más una pequeña capa base Alpine. En nuestras propias pruebas un servidor de integración GitHub de funcionalidad completa consume 15 MiB RAM al arrancar y se mantiene por debajo de 2 W en nuestros nodos de trabajo DTZ. Eso deja mucho margen para decenas de servidores por nodo antes de que los paneles solares siquiera lo noten.
Para cargas de trabajo que sí tienen picos, el aislamiento por cgroups de DTZ permite que el kernel recupere la memoria en cuanto el trabajo termina. Combinado con la hibernación SSE del balanceador, tu contexto vuelve a cero solo segundos después del último token transmitido a tu modelo.
Estamos integrando activamente el Servidor de Identidad DTZ vía OAuth 2.1 en el ecosistema MCP, asegurando que cada stream se sirva solo a clientes autenticados y tus servidores remotos permanezcan tanto mínimos como seguros.
Menos energía, menos complicaciones – solo contexto donde lo necesitas.