Down-to-Zero (DTZ) è sempre stato incentrato su fare di più con meno watt e meno byte. Dallo scheduling dei container scale-to-zero ai build runner alimentati a energia solare, ogni servizio che rilasciamo è misurato rispetto a una linea di base spietata: potrebbe questo funzionare felicemente su una CPU di un notebook senza ventole al sole?
Oggi siamo entusiasti di annunciare il prossimo passo in quel percorso - server remoti Model Context Protocol (MCP) che puoi avviare come container Docker leggeri all’interno di qualsiasi contesto DTZ.
MCP è uno standard aperto che permette agli host di modelli linguistici di contattare “server” specifici per compiti per ottenere dati, strumenti o azioni, usando uno stream JSON semplice e autenticato. Pensalo come una porta USB-C per agenti AI: una presa, molte periferiche. Eseguendo un server MCP accanto ai tuoi dati eviti di trasferire interi dataset attraverso una chiamata API LLM. Questo si adatta perfettamente al nostro mantra “sposta il calcolo al bordo, non al core”.
Finora il bilanciatore multi-tenant di DTZ terminava solo HTTP/1 e HTTP/2. MCP, tuttavia, si basa su Server-Sent Events (SSE) per il suo flusso di eventi unidirezionale e di lunga durata. SSE funziona molto bene su HTTP/2, ma i browser limitano rigorosamente le connessioni SSE concorrenti quando ricadono su HTTP/1 — solitamente sei per origine.
Abbiamo quindi esteso il bilanciatore con supporto nativo per SSE:
Questo miglioramento sblocca i server MCP remoti orientati al remote-first: ora puoi distribuire il componente server come immagine container e consentire a qualsiasi client LLM di connettersi tramite SSE sicure senza proxy aggiuntivi.
Costruisci (o scarica) un’immagine del server MCP.
Pushala nel tuo registry DTZ privato:
docker push {context-id}.cr.dtz.dev/my-mcp-server:latest
Crea un nuovo service nel tuo contesto e punta l’immagine. Il nostro scheduler effettua il pull solo su richiesta e scala a zero quando nessun host è connesso.
Poiché l’endpoint del registry risiede nella stessa mesh ad alta efficienza energetica, i pull delle immagini avvengono sul backbone locale, mantenendo l’egress vicino allo zero e velocizzando i cold start.
I server MCP remoti tipicamente necessitano di un singolo binario basato su Rust o Go più un piccolo livello base Alpine. Nei nostri test un server di integrazione GitHub completo consuma 15 MiB di RAM all’avvio e rimane sotto i 2 W sui nostri nodi worker DTZ. Questo lascia ampio margine per dozzine di server per nodo prima che i pannelli solari se ne accorgano.
Per carichi di lavoro che effettivamente fanno picchi, l’isolamento tramite cgroup di DTZ permette al kernel di recuperare la memoria nel momento in cui il lavoro è terminato. Combinato con l’ibernazione SSE del bilanciatore, il tuo contesto torna a zero pochi secondi dopo che l’ultimo token è stato inviato al tuo modello.
Stiamo integrando attivamente il DTZ Identity Server tramite OAuth 2.1 nell’ecosistema MCP, assicurando che ogni stream sia servito solo a client autenticati e che i tuoi server remoti rimangano sia minimali che sicuri.
Meno energia, meno complicazioni - solo contesto dove ne hai bisogno.