TypeDéverrouillé ÉtapeParc DifficultéAvancé TravailDéployer une API PourConstructeurs d'IA PourÉquipes de dev ServicesPipe ServicesDaemon Pourquoi HoodyHTTP-natif Pourquoi HoodyÉconomie des conteneurs Pourquoi HoodyNatif IA

use-cases / run-a-local-llm-serve-it-to-your-fleet / hero

PIPE · LLM LOCAL · FAN-OUT

Faites tourner un LLM local, servez-le à toute votre flotte

Vous faites tourner un modèle 70B sur une seule machine GPU. Cinquante conteneurs en aval dans votre flotte ont besoin de la même réponse pour la même requête — ils notent le même catalogue, génèrent les mêmes embeddings, évaluent la même expérience. Ne payez pas cinquante inférences. Faites tourner le modèle une fois, diffusez les tokens.

Lire l'API du pipe

gpu-01.fleet.local · llama.cpp

EN COURSRTX 409024 Go VRAMllama3-70b · q41× SOURCE

ÉTAPE 1 · MODÈLE# generate once, pipe upwardllama.cpp -m llama3-70b.gguf \ -p "$PROMPT" --stream \ | curl -T - \ /pipe/llm?n=50

ÉTAPE 2 · PIPEpipe/llm?n=50UN CHEMIN · CINQUANTE LECTEURS

flotte · 50 conteneurs consommateurs

n=50

app-1

app-2

app-3

app-4

app-5

app-6

app-7

app-8

app-9

app-10

app-11

app-12

app-13

app-14

app-15

app-16

app-17

app-18

app-19

app-20

app-21

app-22

app-23

app-24

app-25

app-26

app-27

app-28

app-29

app-30

app-31

app-32

app-33

app-34

app-35

app-36

app-37

app-38

app-39

app-40

app-41

app-42

app-43

app-44

app-45

app-46

app-47

app-48

app-49

app-50

TOUS GOÛTANT LES MÊMES TOKENSBACKPRESSURE PAR CONNEXION

le modèle tourne une fois · le pipe diffuse · les workers lents ne ralentissent qu'eux-mêmes

use-cases / run-a-local-llm-serve-it-to-your-fleet / mechanism

Un GPU, un pipe, cinquante consommateurs

La réponse naïve, c'est un serveur HTTP avec une file d'attente, du batching de requêtes et de la contention de verrous. La réponse moins chère pour cette forme : chaque requête atterrit sur un chemin de pipe avec ?n=50. Le modèle tourne une fois. Cinquante conteneurs consommateurs font GET sur le même chemin et diffusent les mêmes tokens en même temps, distribués par le pipe. Un worker lent applique de la backpressure à sa propre connexion — les autres restent à pleine vitesse.

fleet-broadcast.sh

# 1× GPU box — run the model once and pipe its tokens upward.
llama.cpp -m llama3-70b.gguf -p "$PROMPT" --stream \
  | curl -T - https://pipe.hoody.com/api/v1/pipe/llm?n=50

# 50 consumer containers — same path, ?n=50, fanned out by the pipe.
for i in $(seq 1 50); do
  curl https://pipe.hoody.com/api/v1/pipe/llm?n=50 \
    | jq -c .delta \
    | ./score.py --worker $i &
done

# Sender blocks until 50 readers have connected, then bytes flow.
# Slow workers backpressure their own connection — others stay at line speed.

PUT envoie les octets vers le haut. GET les tire vers le bas. Le paramètre ?n=50 indique combien de lecteurs attendre ; le pipe garde la connexion jusqu'à ce que ce nombre soit atteint, puis distribue le flux simultanément à tous. Pas de file d'attente, pas de couche de batching, pas de serveur-d'inférence-derrière-load-balancer.

UNE INFÉRENCE

Le modèle tourne exactement une fois par requête

cinquante conteneurs en aval veulent la même réponse ; vous la générez sur le GPU une seule fois. Le pipe gère la distribution. Pas de framework de batching de requêtes, pas de couche de cache de tokens, pas de coordination « surtout ne le relancez pas ».

FAN-OUT DU PIPE

?n=50 distribue les mêmes octets à cinquante lecteurs

le pipe se bloque jusqu'à ce que cinquante destinataires se connectent, puis diffuse les octets du producteur à chacun en parallèle. Copies identiques, livraison à pleine vitesse, zéro stockage côté serveur. Jusqu'à 256 destinataires par chemin.

BACKPRESSURE PAR DESTINATAIRE

Les workers lents ne ralentissent qu'eux-mêmes

si un conteneur consommateur fait du GC ou si son disque est occupé, sa connexion prend du retard. Le pipe applique de la backpressure à ce destinataire — les 49 autres continuent à pleine vitesse. Pas de blocage en tête de file, pas de réglage de profondeur de file.

PLAFOND DE FAN-OUT256Plafond de destinataires par chemin imposé par le pipe — réglez ?n pour attendre ce nombre avant que le transfert démarre.

INFÉRENCES PAR REQUÊTE1Le modèle tourne une fois par requête, pas une fois par consommateur. Le coût de calcul est découplé de la taille de la flotte.

EMPREINTE SDK0 koLe producteur, c'est curl. Les consommateurs, c'est curl. Tout ce qui parle HTTP peut s'abonner — conteneur, agent, navigateur, shell.

use-cases / run-a-local-llm-serve-it-to-your-fleet / economics

Ce que vous arrêtez de payer

Quand cinquante conteneurs veulent la même réponse, les alternatives facturent par appel, par token, ou par serveur d'inférence. Le pipe facture un seul transfert HTTP. Faites tourner le modèle sur une machine que vous louez déjà.

AVANTAPI hébergée · facturation au token50× tokensBedrock ou OpenAI vous facturent pour cinquante complétions identiques quand cinquante conteneurs posent la même question. Même prompt, même réponse, facturé cinquante fois.

APRÈSModèle local · diffusion par pipe1× tokensLa machine GPU que vous louez déjà génère une fois. Le pipe transporte les octets jusqu'aux cinquante. La flotte passe à l'échelle horizontalement sans faire grimper la facture d'inférence.

ce n'est pas tous les workloads — c'est la forme où N conteneurs veulent la même réponse. Quand c'est votre forme, le pipe est le fan-out le moins cher que vous câblerez. Les workloads à prompts divergents veulent toujours un vrai serveur d'inférence ; ce schéma brille quand la question est identique et la flotte est large.

use-cases / run-a-local-llm-serve-it-to-your-fleet / punchline

Un GPU, un pipe, cinquante conteneurs goûtant les mêmes tokens.

0101 · UN GPU GÉNÈRE LES TOKENS

0202 · UN PIPE LES TRANSPORTE

0303 · CINQUANTE CONTENEURS LES GOÛTENT EN MÊME TEMPS

pas de service de fan-out d'inférencele chemin est la diffusion

use-cases / run-a-local-llm-serve-it-to-your-fleet / replaces

Ce que cela remplace

Toutes les stacks « donne accès à un modèle à ma flotte » que vous attrapez quand une requête doit alimenter plusieurs consommateurs. Chacune facture par appel, héberge vos poids, ou vous demande de faire tourner un load balancer devant vLLM. Le pipe diffuse une fois.

AWS Lambda + BedrockFacturation au token × taille de la flotte, poids qui ne vous appartiennent pas
Modal LabsRunners GPU hébergés, facturation à la seconde par worker
ReplicateTarification à l'appel, aller-retour réseau par consommateur
API OpenAI à grande échellePrompt identique facturé une fois par consommateur
vLLM/TGI derrière un load balancerServeur, file d'attente, réglage du batching, surface ops à maintenir
Passerelles de modèles auto-hébergéesRoutage, auth, rate limits — tout fait maison pour un fan-out

use-cases / run-a-local-llm-serve-it-to-your-fleet / cta

Arrêtez de payer cinquante factures d'inférence pour une seule réponse. Faites tourner le modèle là où vous louez déjà le silicium. Ouvrez un pipe. Laissez la flotte lire.

Lire l'API du pipe

use-cases / run-a-local-llm-serve-it-to-your-fleet / related

Découvrez les autres

Soixante conteneurs sur un seul serveur

Une machine bare-metal exécute des dizaines à des centaines de conteneurs Hoody. La dédupplication KSM et BTRFS rend le coût marginal quasi nul.

Containers·Snapshots

Intégrer un développeur avec un lien

Un nouvel ingénieur arrive le lundi. Vous envoyez une URL. Il l'ouvre sur n'importe quel laptop et se retrouve dans un conteneur frais cloné à partir de votre snapshot développeur-baseline — code, dépendances, env, données amorce, VSCode-in-browser. Écrire du code en cinq minutes, pas faire de configuration.

Snapshots·Containers·Terminal·Files

Endpoints API qui se matérialisent à la demande

Un script exec wildcard attrape l'appel, demande à un LLM d'écrire le gestionnaire, l'exécute dans un bac à sable V8, et enregistre la route. L'appel suivant est natif.

Exec·Agent·Code·Files

Des ordinateurs avec branches comme Git

Prenez un snapshot d'un conteneur en cours d'exécution — fichiers, processus, mémoire. Restaurez en secondes. Bifurquez avec /copy. Du branchement, mais pour la machine entière.

Snapshots·Containers

Vrai VS Code sur votre téléphone

Le Code Orchestrator lance une instance VS Code dans le conteneur et sert l'éditeur via une URL HTTPS normale. N'importe quel appareil avec un navigateur peut l'ouvrir. Le travail vit dans le conteneur, pas sur l'appareil.

Display·Terminal·Files·Containers+1

Des agents IA qui lancent d'autres agents IA

Un agent de recherche poste vers /api/v1/projects/$PID/containers pour démarrer un conteneur enfant, puis appelle l'URL de l'agent du child comme n'importe quel autre service HTTP. Les sous-agents lancent leurs propres sous-agents de la même façon. Pas de framework d'orchestrateur, juste des URLs.

Agent·Exec·Containers

Un bac à sable par client, automatiquement

Un script exec attrape votre webhook d'inscription, copie un conteneur client frais, et remet au nouveau locataire sa propre URL. L'isolation est le système d'exploitation, pas une colonne tenant_id.

Containers·Snapshots·Exec·Files

Se réveiller avec un prototype terminé

Confiez un paragraphe à l'agent à minuit. Il lance ses propres conteneurs, snapshots avant les étapes risquées, et poste sur votre webhook de notification au lever du soleil.

Agent·Snapshots·Containers·Browser+2

Correction d'urgence en production depuis votre téléphone

PagerDuty vous réveille. Ouvrez l'URL du terminal sur votre téléphone. PATCH le snapshot d'avant le mauvais déploiement. La production est de retour. Pas de bastion, pas de VPN, pas de laptop.

Terminal·Snapshots·Network

Suivez les logs de production sur une URL accessible avec curl

Une URL pipe. Jusqu'à 256 lecteurs. Trois ingénieurs suivent le même incident en même temps, sans bastion, sans siège Datadog, sans agent de logs.

Pipe

Diffusez un build à trente workers CI en même temps

Le conteneur de build envoie le tarball vers une URL pipe avec ?n=30. Les trente workers de test font curl sur la même URL. Les octets passent une seule fois, distribués à tous.

Pipe

Observez votre agent réfléchir depuis le café

Votre agent tourne chez vous. Vous êtes dans un café. Envoyez chaque événement de la boucle dans Hoody Pipe et faites curl sur le même chemin depuis votre téléphone — la trace arrive caractère par caractère. Pas de SSH, pas de tableau de bord, pas d'upload.

Pipe·Agent

Déplacez 200 Go entre clouds avec deux curl

pg_dump | gzip | curl depuis Francfort. curl | gunzip | psql à Singapour. Les octets traversent le pipe sans aucun disque au milieu.

Pipe

Envoyez un état de base de données à un collègue en une ligne

pg_dump diffuse directement dans son psql. Aucun fichier uploadé, aucun lien partagé, aucun téléchargement. Le pipe achemine les octets.

Pipe

Streamez les tokens LLM vers tout ce qui parle HTTP

L'étape 3 envoie les tokens avec curl -T -. L'étape 4 fait curl sur le même chemin. Les tokens vont du générateur au consommateur à pleine vitesse. Pas de plomberie SSE, pas de broker.

Pipe·Agent

Une barre de progression que votre patron peut regarder sans rejoindre

Ajoutez ?progress à l'URL du pipe. Quiconque l'ouvre obtient un tableau de bord HTML en direct — octets, vitesse, ETA, état. Jusqu'à cinquante spectateurs, aucun ne consomme un slot de récepteur, aucun ne touche au flux.

Pipe

Le fan-out de webhook que vous n'avez pas eu à construire

Stripe POST vers un chemin de pipe avec ?n=12. Douze abonnés font curl sur l'URL du récepteur avec ?n=12. Le pipe retient l'événement jusqu'à ce que tout le monde soit connecté.

Pipe·Exec

Un cache CI qui n'est que deux commandes curl

tar | zstd | curl place node_modules dans un pipe. Vingt jobs en aval font curl | zstd -d | tar x. Pas de bucket S3, pas d'action de cache, pas de facture d'egress.

Pipe·Containers

Uploads par glisser-déposer dans votre script

hoody-pipe sert un formulaire d'upload web sur chaque chemin. Glissez un fichier sur la page, votre script lit les octets depuis stdin. Zéro code d'upload, pas de bucket S3, pas d'URL pré-signée.

Pipe·Exec

Diffusez un atelier à 200 spectateurs depuis votre laptop

ffmpeg diffuse votre écran vers un chemin pipe avec ?n=200. Chaque participant fait curl sur l'URL dans un onglet de navigateur. Pas de plateforme, pas de connexion, pas d'upload.

Pipe

IPC inter-conteneurs sans le broker de messages

Le conteneur A écrit sur un chemin pipe. Le conteneur B lit depuis le même chemin. La connexion est la backpressure. Pas de Redis, pas de file, pas de broker.

Pipe·Containers

Suivez votre agent dans le train, recevez un ping à l'arrivée

L'agent diffuse sa trace vers un chemin pipe que vous pouvez curl depuis votre téléphone. Quand il termine, son dernier acte appelle hoody-notifications et votre téléphone vibre. Deux URLs et une vibration — pas de SDK, pas d'application client, pas de tableau de bord.

Pipe·Agent·Notifications

Un microphone sur HTTP, en deux terminaux

ffmpeg capture le micro, le redirige vers une URL. L'autre extrémité fait curl et joue l'audio. Pas de Zoom, pas de SDK, pas de serveur de signaling.

Pipe

Cinq agents, cinq pipes, un verdict

Un panel de cinq modèles examine la même entrée. Chacun s'exécute dans son propre conteneur et diffuse son verdict vers son propre chemin de pipe. Un processus juge fait curl sur les cinq en parallèle et compile le résultat.

Pipe·Agent·Containers

Rejouez l'incident de ce matin à toute l'équipe

Snapshotez les logs au moment de l'incident dans hoody-files. Rejouez-les via une URL Hoody Pipe avec ?n=8. Huit ingénieurs font curl sur le même chemin et regardent la cascade se déclencher en lockstep — le post-mortem est un flux synchronisé, pas un document Confluence.

Pipe·Files

Le « envoie-moi ce fichier » le plus rapide que vous ayez jamais tapé

Un coéquipier réclame un dump de 4 Go. Slack le rejette, Drive demande une demande de partage. Vous tapez curl -T file …; il tape curl … > file. Les octets passent directement de disque à disque — pas de barre d'upload, pas de lien à partager.

Pipe

Un tableau de bord de métriques en direct, sans backend de métriques

La boucle de monitoring de chaque conteneur fait curl d'une métrique vers une URL pipe. Le tableau de bord fait curl sur la même URL avec ?progress et rend le flux SSE.

Pipe

La tâche cron qui se supprime elle-même quand vous avez fini

POSTez une entrée cron managée avec expires_at fixé à 48 heures. La tâche tourne à l'heure prévue, puis disparaît d'elle-même — pas de rappel, pas de PR de nettoyage, pas d'entrée orpheline.

Cron

Snapshotter le conteneur juste avant la migration nocturne

Une entrée hoody-cron qui se déclenche à 02:55 UTC, fait un curl sur l'URL des snapshots et nomme l'artefact pre-migration-2026-05-04. Cinq minutes plus tard, la migration s'exécute. Si elle réussit, le snapshot reste là sans rien coûter. Si elle échoue, vous restaurez en 30 secondes avec un seul PATCH.

Cron·Snapshots

Un crontab distinct pour chaque client, automatiquement

Chaque locataire dispose de son propre conteneur et de son propre service hoody-cron. Le digest de 9h du client A part à l'heure même quand la tâche du client B reste bloquée 40 minutes, parce qu'ils ne sont pas sur le même crontab.

Cron·Containers

Réveiller un agent à 3h, le retirer à 4h

Un cron nocturne POSTe une demande de spawn, l'agent fait son heure de travail, puis un second cron démolit le conteneur. L'agent n'existe que quand il a du travail à faire.

Cron·Agent·Containers

Des agrégats quotidiens sans orchestrateur

Les événements bruts s'accumulent dans une URL sqlite. Chaque nuit, une entrée cron fait un curl sur un endpoint exec, le script lance le SQL d'agrégation et écrit la table quotidienne. Pas de DAG, pas de Postgres Airflow, pas de tableau de bord scheduler.

Cron·SQLite·Exec

Un crontab par branche, déployé avec le code

Votre dépôt versionne `.hoody/crontab`. Le script de déploiement envoie ce fichier en PUT sur l'API Cron du nouveau conteneur. Chaque branche a son conteneur, son système de fichiers, son planning.

Cron·Containers

Une escalade d'astreinte qui expire avec votre garde

POST une entrée cron avec expires_at = fin de garde. À la fin de la garde, l'entrée se supprime d'elle-même. La personne d'astreinte suivante poste la sienne.

Cron·Notifications

Scrape horaire, digest quotidien, archive hebdomadaire — un seul conteneur

Trois lignes dans un même crontab : scrape navigateur horaire dans SQLite, digest exec quotidien, archive hebdomadaire dans des fichiers. Serveur à tarif fixe, trois rythmes, pas de service scheduler.

Cron·Browser·SQLite·Files

Laissez vos clients apporter leur propre planning cron

Les clients postent en POST leurs propres expressions à 5 champs ; leur crontab vit dans leur conteneur, isolé. Vous ne validez pas par rapport à une file globale.

Cron·Containers

Planifiez l'agent, pas le script

Une entrée cron à 5 champs envoie un curl à hoody-agent avec un prompt au lieu d'exécuter un script figé. Aujourd'hui est le dernier jour du mois — l'agent s'en aperçoit. La forme des données a changé — l'agent s'en aperçoit.

Cron·Agent

Un battement de cœur pour les jobs silencieux

Chaque exécution cron envoie un POST de battement de cœur vers un endpoint de notifications. Un second cron vérifie le dernier battement et déclenche une alerte sur le silence. Le silence est l'alerte.

Cron·Notifications

Conservez les 24 dernières heures sous forme de 24 snapshots

Un cron horaire envoie un POST d'un snapshot nommé d'après l'heure. Après 24 heures, chaque nouveau snapshot écrase celui de la veille à la même heure. La machine à remonter le temps à 24 étages.

Cron·Snapshots

Rejouez les webhooks de ce matin à la même heure demain

Vous avez capturé 30 minutes de trafic Stripe réel dans un dossier hoody-files. Une seule entrée cron le rejoue contre la staging à 9h chaque jour ouvré — même volume, mêmes payloads, même pression au même moment de la journée.

Cron·Files·Exec

Éditez votre crontab depuis un téléphone, à l'aéroport

Ouvrez l'URL du cron sur votre téléphone dans la zone d'embarquement. Tapez sur une ligne, modifiez un seul champ de l'expression cron, appuyez sur Enregistrer. Le PATCH passe. Le job se déclenche ce soir avec la nouvelle planification. Pas de session SSH, pas de jump box, pas d'ordinateur portable.

Cron·Terminal

Un digest planifié qui se diffuse à 200 boîtes mail

Cron à 9h envoie un POST vers un script exec qui construit le digest et fait un curl vers une URL pipe avec ?n=200. Deux cents destinataires frappent la même URL en une fois.

Cron·Exec·Pipe

Mettez en sourdine la tâche instable sans la perdre

PATCH /entries/[id] [ enabled: false ]. La tâche reste dans votre crontab en attendant d'être corrigée. Aucune suppression, aucune réécriture, aucun contexte perdu.

Cron

Un agent qui note les agents de la veille

Un cron nocturne envoie un POST à l'agent superviseur avec les traces des agents de la veille issues de SQLite. Le superviseur note chacune d'elles. Le cron est le superviseur.

Cron·Agent·SQLite

Des tâches de nettoyage qui programment leur propre retraite

Le script de nettoyage vérifie s'il reste quelque chose à nettoyer. Quand le répertoire est vide, il envoie un DELETE sur sa propre entrée cron. Travail fini, tâche disparue.

Cron·Files

Renouvelez vos certificats TLS sans session SSH

Cron hebdomadaire : POST vers un script exec qui lance certbot, puis envoie le nouveau certificat au proxy via PATCH. Aucune session shell, aucune clé, aucun jump host.

Cron·Exec

Un canari hebdomadaire qui essaie de casser la production

Dimanche 7h, un cron réveille un Hoody Agent dans un conteneur neuf face à un snapshot de la prod. Il exécute le top vingt OWASP, fuzze l'API, et écrit un rapport de findings sur une URL avant 9h. Le conteneur est mis à la retraite.

Cron·Agent·Browser·Snapshots

Le cimetière de projets perso que vous pouvez vous permettre de garder en vie

Onze projets perso à moitié finis sur Heroku, ce sont onze dynos à 5–7 $ chacun. Sur Hoody, ce sont onze conteneurs sur une seule machine bare-metal à 29 $. L'inactivité ne coûte rien, l'URL réveille le conteneur en quelques millisecondes, et le moteur d'échecs que personne n'utilise tourne encore.

Containers

Un environnement de prévisualisation par pull request, tout le mois

Chaque PR ouverte obtient son propre clone d'un snapshot. Le conteneur se réveille quand les relecteurs cliquent sur le lien ; les PR inactives ne coûtent rien.

Containers·Snapshots

Faites tourner un portefeuille de 12 produits sur une seule machine bare-metal

Douze conteneurs isolés, chacun son propre SaaS, partagent un seul serveur bare-metal à 49 $ — un cran au-dessus du palier d'entrée de 29 $, choisi ici pour la mémoire dont cinquante conteneurs ont besoin. Les marges par produit passent de négatives à confortables.

Containers

Supprimez la taxe du serveur de staging

Arrêtez de payer un duplicata de la production. Faites un snapshot du conteneur de prod, branchez-en le staging à la demande, regelez-le sur disque quand personne ne teste. Trois environnements, une machine, une facture.

Containers·Snapshots

Quarante sites clients, un loyer, un tableau de bord

Chaque site client vit dans son propre conteneur ; vous facturez vos clients par site, vous payez l'hébergeur une seule fois. Les calculs deviennent enfin viables pour les agences.

Containers·Workspaces

Remplacez la facture E2B par le bare metal que vous louez déjà

Vos agents arrêtent de louer du calcul à la seconde sur E2B/Modal/Daytona. Ils utilisent des conteneurs sur la machine que vous possédez déjà.

Containers·Agent·Exec

Le staging au repos ne coûte rien, donc le staging cesse d'être supprimé

Le staging mourait parce qu'il coûtait cher à garder. Quand le repos est gratuit, le staging survit — même celui qu'un coéquipier a touché il y a 90 jours.

Containers·Snapshots

Des sandboxes par client à l'échelle d'une flotte

Huit cents clients isolés sur trois serveurs bare-metal — une seule facture mensuelle à tarif fixe, pas de mesure par-locataire. Chaque locataire reçoit un vrai conteneur avec son propre namespace kernel, son système de fichiers et son URL. Les conteneurs inactifs ne coûtent rien en plus du serveur que vous payez déjà.

Containers·Snapshots·Exec

Le cache CI qui n'est pas une ligne de facture S3

Les fichiers de cache vivent dans /files sur la machine que vous louez déjà. Les workers font PUT et GET de tarballs en HTTP. Pas de bucket S3, pas d'egress, pas de troisième fournisseur — les octets ne quittent jamais la machine.

Files·Containers

Cinquante environnements de démo pour cinquante appels commerciaux

Chaque prospect reçoit une copie réelle et isolée de votre produit, alimentée par leurs données. Clonée depuis un snapshot. À eux pour une semaine.

Containers·Snapshots

Faites tourner un LLM local, servez-le à toute votre flotte

Un GPU, un pipe, cinquante consommateurs

Le modèle tourne exactement une fois par requête

?n=50 distribue les mêmes octets à cinquante lecteurs

Les workers lents ne ralentissent qu'eux-mêmes

Ce que vous arrêtez de payer

Ce que cela remplace

Découvrez les autres

Soixante conteneurs sur un seul serveur

Intégrer un développeur avec un lien

Endpoints API qui se matérialisent à la demande

Des ordinateurs avec branches comme Git

Vrai VS Code sur votre téléphone

Des agents IA qui lancent d'autres agents IA

Un bac à sable par client, automatiquement

Se réveiller avec un prototype terminé

Correction d'urgence en production depuis votre téléphone

Suivez les logs de production sur une URL accessible avec curl

Diffusez un build à trente workers CI en même temps

Observez votre agent réfléchir depuis le café

Partagez votre écran avec une URL, pas une invitation à une réunion

Déplacez 200 Go entre clouds avec deux curl

Envoyez un état de base de données à un collègue en une ligne

Streamez les tokens LLM vers tout ce qui parle HTTP

Une barre de progression que votre patron peut regarder sans rejoindre

Le fan-out de webhook que vous n'avez pas eu à construire

Un cache CI qui n'est que deux commandes curl

Uploads par glisser-déposer dans votre script

Diffusez un atelier à 200 spectateurs depuis votre laptop

IPC inter-conteneurs sans le broker de messages

Suivez votre agent dans le train, recevez un ping à l'arrivée

Un microphone sur HTTP, en deux terminaux

Cinq agents, cinq pipes, un verdict

Rejouez l'incident de ce matin à toute l'équipe

Le « envoie-moi ce fichier » le plus rapide que vous ayez jamais tapé

Un tableau de bord de métriques en direct, sans backend de métriques

La tâche cron qui se supprime elle-même quand vous avez fini

Snapshotter le conteneur juste avant la migration nocturne

Un crontab distinct pour chaque client, automatiquement

Réveiller un agent à 3h, le retirer à 4h

Des agrégats quotidiens sans orchestrateur

Un crontab par branche, déployé avec le code

Une escalade d'astreinte qui expire avec votre garde

Scrape horaire, digest quotidien, archive hebdomadaire — un seul conteneur

Laissez vos clients apporter leur propre planning cron

Planifiez l'agent, pas le script

Un battement de cœur pour les jobs silencieux

Conservez les 24 dernières heures sous forme de 24 snapshots

Rejouez les webhooks de ce matin à la même heure demain

Éditez votre crontab depuis un téléphone, à l'aéroport

Un digest planifié qui se diffuse à 200 boîtes mail

Mettez en sourdine la tâche instable sans la perdre

Un agent qui note les agents de la veille

Des tâches de nettoyage qui programment leur propre retraite

Renouvelez vos certificats TLS sans session SSH

Un canari hebdomadaire qui essaie de casser la production

Le cimetière de projets perso que vous pouvez vous permettre de garder en vie

Un environnement de prévisualisation par pull request, tout le mois

Faites tourner un portefeuille de 12 produits sur une seule machine bare-metal

Supprimez la taxe du serveur de staging

Quarante sites clients, un loyer, un tableau de bord

Remplacez la facture E2B par le bare metal que vous louez déjà

Le staging au repos ne coûte rien, donc le staging cesse d'être supprimé

Des sandboxes par client à l'échelle d'une flotte

Le cache CI qui n'est pas une ligne de facture S3

Cinquante environnements de démo pour cinquante appels commerciaux