use-cases / stream-llm-tokens-to-anything / hero

PIPE · AGENTE · STREAMING

Faça streaming de tokens de LLM para qualquer coisa que leia HTTP

O passo 3 do seu agente gera tokens. O passo 4 precisa começar a consumir antes do 3 terminar. Mande a saída do modelo direto para um caminho; o próximo processo faz curl no mesmo caminho. Sem encanamento de SSE, sem broker, sem domesticar callbacks — os bytes correm na velocidade da linha.

Ler a pipe API

PRODUTOR · PASSO 3CONSUMIDOR · PASSO 4

agent.sh

PASSO 3 · LLM# stream tokens upwardai.generate([ stream: true]) | curl -T - \ /pipe/tokens

STREAM DE TOKENSAO VIVO

theagentcalls{tool:searchquery:kafkavspipe}->streamtheagentcalls{tool:searchquery:kafkavspipe}->stream

MAIS ANTIGOMAIS NOVO

sem buffer · sem broker · sem re-encode

reader.sh

PASSO 4 · CONSUMIDOR# read at line speedcurl \ /pipe/tokens \ | jq -c .delta | apply()# no buffer between us

use-cases / stream-llm-tokens-to-anything / mechanism

Dois curls, um caminho, sem camada do meio

A maioria das stacks de streaming precisa de um endpoint SSE, uma fila, um barramento pub/sub e um callback de framework para mover tokens um metro. O pipe substitui tudo: o produtor escreve em um caminho com PUT, o consumidor lê do mesmo caminho com GET. Os bytes fluem direto entre os dois — sem armazenamento intermediário no servidor.

A STACK USUAL

Cinco camadas entre gerador e leitor

Abstração de streaming do LangChaininferno de callbacks
Encanamento de Server-Sent Eventsframing + heartbeats
Redis pub/subbroker para operar
Relay WebSocket customizadoauth + reconectar
Message broker (Kafka/RabbitMQ)tópicos + partições
Callbacks de framework de agenteespecíficos do fornecedor

O PIPE

Dois curls tocando o mesmo caminho

PRODUTORcurl -T - /pipe/tokens

MESMO CAMINHO

CONSUMIDORcurl /pipe/tokens

Storage do lado do servidor: zero. Os bytes fazem streaming do remetente para o receptor assim que os dois conectam, com backpressure por receptor. O endpoint existe só porque dois curls tocaram nele.

agent-step-3.sh

# Step 3 — agent generates and pipes tokens upward.
ai.generate({ model, stream: true }) \
  | jq -c '{delta: .text}' \
  | curl -T - https://pipe.hoody.com/api/v1/pipe/run-42/tokens?n=3

# Step 4 — three readers GET the same path. The pipe fans out.
curl https://pipe.hoody.com/api/v1/pipe/run-42/tokens?n=3 | tee evaluator.log
curl https://pipe.hoody.com/api/v1/pipe/run-42/tokens?n=3 | jq -c .delta
curl https://pipe.hoody.com/api/v1/pipe/run-42/tokens?n=3 | websocketd --port=8080

# All four processes block until the n=3 readers connect, then bytes flow.

PUT empurra os bytes para cima, GET puxa para baixo. O parâmetro ?n diz quantos leitores esperar; o pipe bloqueia até esse número conectar e aí faz fan-out simultâneo. Sem SDK de cliente, sem broker, sem instalação de SDK — só HTTP.

use-cases / stream-llm-tokens-to-anything / listeners

Mesmo caminho, vários leitores, sem SDK

Quando o produtor está enviando, qualquer coisa que fale HTTP pode assinar. Até 256 leitores no mesmo stream, distribuídos pelo pipe com backpressure por receptor. Sem biblioteca de cliente para instalar, sem relay para provisionar.

PARA O FRONTEND

O navegador lê a mesma URL

Um EventSource ou um leitor fetch bate no caminho do pipe e recebe o mesmo stream de bytes que o agente está produzindo. Sem framing SSE no seu servidor — o pipe carrega os bytes que o modelo emite, crus.

PARA O AVALIADOR

Um segundo agente escuta e decide

Um processo avaliador assina o mesmo caminho. Pode interromper o produtor no momento em que a saída desviar. Dois agentes no mesmo fio, sem framework orquestrador entre eles.

PARA O TRILHO DE LOG

Tee o stream para um contêiner que observa

Um consumidor de logging lê, faz gzip e escreve em disco. Uma UI de debugger lê em paralelo. Nenhum sabe que os outros existem — o pipe entrega os mesmos bytes para cada leitor.

LIMITE DE FAN-OUT256Teto de receptores por caminho garantido pelo pipe — defina ?n para esperar essa quantidade antes da transferência começar.

OVERHEAD DE LATÊNCIA0Os bytes atravessam o pipe conforme chegam. Sem buffer no servidor — backpressure é por receptor.

TAMANHO DE SDK0 kbProdutor e consumidor são curl. Qualquer coisa que fale HTTP pode assinar — navegador, contêiner, agente, shell.

use-cases / stream-llm-tokens-to-anything / punchline

O LLM faz streaming. O pipe faz streaming. O leitor faz streaming. Sem camada do meio.

0101 · o modelo emite tokens

0202 · o pipe encaminha bytes

0303 · o leitor aplica

sem broker entre os passoso caminho é o protocolo

use-cases / stream-llm-tokens-to-anything / replaces

O que isto substitui

A fiação que você procura quando um processo precisa enviar tokens em tempo real para outro. Cada um traz seu framing, seu SDK, sua superfície de operação. O pipe é o fio.

Abstrações de streaming do LangChainCadeias de callback, lock-in de framework
Encanamento de server-sent eventsFraming + heartbeats + lógica de reconexão
Redis pub/subBroker para instalar, operar e pagar
Relays WebSocket customizadosAuth, reconectar, backpressure tudo no DIY
Message brokers (Kafka, RabbitMQ)Tópicos, partições, consumer groups para um stream
Callbacks de framework de agenteEspecíficos do fornecedor, só legíveis a partir do mesmo SDK

use-cases / stream-llm-tokens-to-anything / cta

Pare de cabear infraestrutura de streaming entre dois processos que já falam HTTP. Abra um caminho. Mande para ele. Leia dele.

Ler a pipe API

use-cases / stream-llm-tokens-to-anything / related

Leia os outros

Sessenta contêineres em um servidor

Uma caixa bare-metal executa dezenas a centenas de contêineres Hoody. KSM e BTRFS dedup fazem o custo marginal próximo a zero.

Contêineres·Snapshots

Faça o onboarding de um dev com um link

Uma nova engenheira começa na segunda. Você manda uma URL. Ela abre em qualquer notebook que tiver e já está em um contêiner novo, clonado do seu snapshot de baseline de desenvolvedor — código, dependências, env, dados de seed, VSCode no navegador. Escrevendo código em cinco minutos, não configurando.

Snapshots·Contêineres·Terminal·Arquivos

Endpoints de API que se materializam sob demanda

Um script exec wildcard captura a chamada, pede a uma IA para escrever o handler, executa em uma sandbox V8 e salva a rota. A próxima chamada é nativa.

Exec·Agente·Código·Arquivos

Computadores de ramificação como Git

Capture um contêiner em execução — arquivos, processos, memória. Restaure em segundos. Ramifique via /copy. Ramificação, mas para a máquina inteira.

Snapshots·Contêineres

VS Code de verdade no seu celular

O Code Orchestrator inicia uma instância do VS Code no contêiner e serve o editor por uma URL HTTPS comum. Qualquer dispositivo com navegador consegue abrir. O trabalho mora no contêiner, não no aparelho.

Display·Terminal·Arquivos·Contêineres+1

Agentes de IA que criam outros agentes de IA

Um agente de pesquisa faz POST para /api/v1/projects/$PID/containers para iniciar um contêiner filho, depois chama a URL do agente filho como qualquer outro serviço HTTP. Sub-agentes criam seus próprios sub-agentes do mesmo jeito. Sem framework de orquestrador, só URLs.

Agente·Exec·Contêineres

Um sandbox por cliente, automaticamente

Um script exec captura o webhook de signup, copia um contêiner fresh-customer e entrega ao novo tenant a URL dele. O isolamento é o sistema operacional, não uma coluna tenant_id.

Contêineres·Snapshots·Exec·Arquivos

Acordar com um protótipo pronto

Passe um parágrafo ao agente à meia-noite. Ele cria seus próprios contêineres, snapshots antes dos passos arriscados e publica no seu webhook de notificação ao nascer do sol.

Agente·Snapshots·Contêineres·Navegador+2

Correção de produção de emergência do seu telefone

PagerDuty acorda você. Abra a URL do terminal no seu telefone. PATCH o snapshot de antes do bad deploy. Produção está de volta. Sem bastion, sem VPN, sem notebook.

Terminal·Snapshots·Rede

Acompanhe logs de produção em uma URL que qualquer um pode curl

Uma URL de pipe. Até 256 leitores. Três engenheiros acompanham o mesmo incidente ao mesmo tempo, sem bastion, sem assento Datadog, sem encaminhador de logs.

Pipe

Envie um build para trinta workers de CI ao mesmo tempo

O contêiner do build envia o tarball para um caminho de pipe com ?n=30. Os trinta workers de teste fazem curl na mesma URL. Os bytes passam uma vez, distribuídos em fan-out.

Pipe

Veja seu agente pensar direto da cafeteria

Seu agente roda em casa. Você está num café. Envie cada evento do loop pelo Hoody Pipe e faça curl no mesmo caminho a partir do celular — o trace chega caractere por caractere. Sem SSH, sem dashboard, sem upload.

Pipe·Agente

Mova 200GB entre nuvens com dois curls

pg_dump | gzip | curl em Frankfurt. curl | gunzip | psql em Singapura. Os bytes fluem pelo pipe sem nenhum disco no meio.

Pipe

Envie a um colega o estado de um banco em uma linha

pg_dump entra direto no psql do colega. Nenhum arquivo enviado, nenhum link compartilhado, nenhum download. O pipe roteia os bytes.

Pipe

Uma barra de progresso que seu chefe pode acompanhar sem entrar

Anexe ?progress à URL do pipe. Quem abrir recebe um dashboard HTML ao vivo — bytes, velocidade, ETA, estado. Até cinquenta espectadores, nenhum consumindo um slot de receiver, nenhum tocando no stream.

Pipe

O fan-out de webhook que você não precisou construir

O Stripe faz POST para um caminho de pipe com ?n=12. Doze assinantes fazem curl na URL do receiver com ?n=12. O pipe segura o evento até todos estarem conectados.

Pipe·Exec

Um cache de CI que é só dois comandos curl

tar | zstd | curl coloca node_modules em um pipe. Vinte jobs downstream fazem curl | zstd -d | tar x. Sem bucket S3, sem cache action, sem conta de egress.

Pipe·Contêineres

Uploads por arrastar e soltar direto no seu script

hoody-pipe serve um formulário web de upload em qualquer caminho. Arraste um arquivo na página, seu script lê os bytes do stdin. Zero código de upload, sem bucket S3, sem URLs pré-assinadas.

Pipe·Exec

Transmita um workshop para 200 espectadores a partir do seu laptop

ffmpeg envia sua tela para um caminho de pipe com ?n=200. Cada participante faz curl da URL em uma aba do navegador. Sem plataforma, sem logins, sem upload.

Pipe

IPC entre contêineres sem o message broker

O Contêiner A escreve em um caminho de pipe. O Contêiner B lê do mesmo caminho. A backpressure é a conexão. Sem Redis, sem fila, sem broker.

Pipe·Contêineres

Acompanhe seu agente no trem, receba um aviso quando ele terminar

O agente envia o trace para um caminho de pipe que você pode acessar via curl pelo celular. Quando ele termina, sua última ação aciona o hoody-notifications e seu telefone vibra. Duas URLs e um buzz — sem SDK, sem app cliente, sem dashboard.

Pipe·Agente·Notificações

Um microfone via HTTP, em dois terminais

ffmpeg captura o microfone, envia para uma URL. O outro lado faz curl e toca o áudio. Sem Zoom, sem SDK, sem servidor de signaling.

Pipe

Cinco agentes, cinco pipes, um veredito

Um painel de cinco modelos revisa a mesma entrada. Cada um roda no próprio contêiner e faz streaming do veredito para seu próprio caminho de pipe. Um processo juiz faz curl nos cinco em paralelo e contabiliza o resultado.

Pipe·Agente·Contêineres

Reproduza o incidente desta manhã para o time inteiro

Faça snapshot dos logs do horário do incidente em hoody-files. Reproduza-os por uma URL do Hoody Pipe com ?n=8. Oito engenheiros fazem curl no mesmo caminho e veem a cascata acontecer em sincronia — o post-mortem é um stream sincronizado, não um doc no Confluence.

Pipe·Arquivos

O 'me manda esse arquivo' mais rápido que você já digitou

Um colega pede um dump de 4 GB. O Slack rejeita, o Drive precisa de pedido de compartilhamento. Você digita curl -T file …; ele digita curl … > file. Os bytes vão direto entre os discos — sem barra de upload, sem link para compartilhar.

Pipe

Rode um LLM local e sirva-o à sua frota inteira

Uma GPU executa llama.cpp. Seus tokens fluem para um caminho de pipe com ?n=50. Cinquenta contêineres fazem curl na mesma URL e dividem o stream.

Pipe·Daemon

Um dashboard de métricas ao vivo sem backend de métricas

O loop de monitoramento de cada contêiner faz curl de uma métrica para uma URL de pipe. O dashboard faz curl na mesma URL com ?progress e renderiza o stream SSE.

Pipe

O cron job que se apaga sozinho quando você termina

POST em uma entrada gerenciada de cron com expires_at definido para 48 horas no futuro. O job roda no horário e depois se remove sozinho — sem lembrete, sem PR de limpeza, sem entrada órfã.

Cron

Tire um snapshot do contêiner logo antes da migração noturna

Uma entrada hoody-cron que dispara às 02:55 UTC, dá curl na URL de snapshots e nomeia o artefato como pre-migration-2026-05-04. Cinco minutos depois a migração roda. Se der certo, o snapshot fica parado e não custa nada. Se falhar, você restaura em 30 segundos com um único PATCH.

Cron·Snapshots

Um crontab separado para cada cliente, automaticamente

Cada tenant ganha seu próprio contêiner e seu próprio serviço hoody-cron. O resumo das 9h do cliente A dispara no horário mesmo quando o job do cliente B trava por 40 minutos, porque eles não estão no mesmo crontab.

Cron·Contêineres

Acorde um agente às 3h da manhã, aposente-o às 4h

Um cron noturno faz POST de uma requisição de spawn, o agente faz sua hora de trabalho e então um segundo cron desmonta o contêiner. O agente só existe quando há trabalho para ele fazer.

Cron·Agente·Contêineres

Rollups diários sem um orquestrador

Eventos brutos se acumulam em uma URL sqlite. Toda noite uma entrada de cron dá curl em um endpoint exec, o script roda o SQL de rollup e grava a tabela diária de volta. Sem DAG, sem Postgres do Airflow, sem dashboard de scheduler.

Cron·SQLite·Exec

Um crontab por branch, implantado junto com o código

Seu repositório versiona `.hoody/crontab`. O script de deploy faz PUT desse arquivo para a Cron API do novo contêiner. Cada branch ganha seu contêiner, seu sistema de arquivos, seu agendamento.

Cron·Contêineres

Escalonamento de plantão que expira junto com o turno

Faça POST de uma entrada cron com expires_at = fim do turno. Quando o turno termina, a entrada se apaga sozinha. O próximo plantonista posta a sua.

Cron·Notificações

Scrape por hora, resumo diário, arquivo semanal — um contêiner

Três linhas em um crontab: scrape do navegador a cada hora para SQLite, resumo exec diário, arquivamento semanal em arquivos. Servidor de tarifa fixa, três ritmos, nenhum serviço scheduler.

Cron·Navegador·SQLite·Arquivos

Deixe seus clientes trazerem o próprio agendamento cron

Os clientes fazem POST das próprias expressões de 5 campos; o crontab deles vive no contêiner deles, isolado. Você não valida contra uma fila global.

Cron·Contêineres

Agende o agente, não o script

Uma entrada cron de 5 campos faz curl no hoody-agent com um prompt em vez de rodar um script fixo. Hoje é o último dia do mês — o agente descobre. O formato dos dados mudou — o agente descobre.

Cron·Agente

Um heartbeat para os jobs silenciosos

Cada execução do cron faz POST de um heartbeat em um endpoint de notificações. Um segundo cron checa o último heartbeat e dispara alerta no silêncio. O silêncio é o alerta.

Cron·Notificações

Mantenha as últimas 24 horas como 24 snapshots

Um cron de hora em hora faz POST de um snapshot nomeado com a hora. Depois de 24 horas, cada novo snapshot sobrescreve o de ontem na mesma hora. A máquina do tempo de 24 andares.

Cron·Snapshots

Replay dos webhooks de hoje cedo no mesmo horário amanhã

Você capturou 30 minutos de tráfego real do Stripe em uma pasta hoody-files. Uma entrada de cron faz o replay contra staging às 9h em todos os dias úteis — mesmo volume, mesmos payloads, mesma pressão de horário.

Cron·Arquivos·Exec

Edite seu crontab pelo celular, no aeroporto

Abra a URL do cron no celular na área do portão. Toque numa linha, mude um único campo da expressão cron, aperte Salvar. O PATCH cai. O job dispara hoje à noite no novo horário. Sem sessão SSH, sem jump box, sem laptop.

Cron·Terminal

Um digest agendado que faz fan-out para 200 caixas de entrada

Cron às 9h faz POST para um script exec que monta o digest e faz curl numa URL de pipe com ?n=200. Duzentos destinatários acessam a mesma URL uma vez.

Cron·Exec·Pipe

Silencie o job instável sem perdê-lo

PATCH /entries/[id] [ enabled: false ]. O job permanece no seu crontab esperando ser corrigido. Sem deleção, sem reescrita, sem perda de contexto.

Cron

Um agente que avalia os agentes de ontem

Um cron noturno faz POST para o agente supervisor com os traços dos agentes de ontem vindos do SQLite. O supervisor pontua cada um. O cron é o supervisor.

Cron·Agente·SQLite

Jobs de limpeza que agendam a própria aposentadoria

O script de limpeza verifica se ainda há algo para limpar. Quando o diretório está vazio, ele faz DELETE na própria entrada do cron. Trabalho feito, job encerrado.

Cron·Arquivos

Renove seus certificados TLS sem uma sessão SSH

Cron semanal: POST para um script exec que roda o certbot, envia o novo certificado para o proxy via PATCH. Sem sessão de shell, sem chave, sem jump host.

Cron·Exec

Um canário semanal que tenta quebrar a produção

Domingo, 7h, um cron acorda um Hoody Agent em um container novo, contra um snapshot da produção. Ele roda o OWASP top vinte, faz fuzz na API e escreve um relatório de descobertas em uma URL até as 9h. Container se aposenta.

Cron·Agente·Navegador·Snapshots

O cemitério de projetos paralelos que você pode bancar

Onze projetos paralelos pela metade no Heroku são onze dynos a $5–7 cada. No Hoody, são onze contêineres em uma máquina bare-metal de $29. Ocioso custa zero, a URL acorda o contêiner em milissegundos, e o motor de xadrez que ninguém usa continua rodando.

Contêineres

Um ambiente de preview por pull request, o mês todo

Cada PR aberto ganha seu próprio clone de um snapshot. O contêiner acorda quando os revisores clicam no link; PRs ociosos não custam nada.

Contêineres·Snapshots

Rode um portfólio de 12 produtos em uma máquina bare-metal

Doze contêineres isolados, cada um seu próprio SaaS, compartilham um servidor de $49. As margens por produto saem do negativo para o saudável.

Contêineres

Acabe com o imposto do servidor de staging

Pare de pagar por uma duplicata da produção. Tire um snapshot do contêiner de prod, ramifique staging a partir dele sob demanda, congele de volta para o disco quando ninguém estiver testando. Três ambientes, uma máquina, uma conta.

Contêineres·Snapshots

Quarenta sites de clientes, um aluguel, um painel

Cada site de cliente vive em seu próprio contêiner; você cobra deles por site, paga o host uma vez. A matemática finalmente fecha para agências.

Contêineres·Espaços de trabalho

Substitua a fatura da E2B pelo bare metal que você já aluga

Seus agentes param de alugar computação por segundo da E2B/Modal/Daytona. Eles usam contêineres na máquina que você já tem.

Contêineres·Agente·Exec

Staging ocioso não custa nada, então staging para de ser deletado

O staging morria porque era caro mantê-lo. Quando ocioso é grátis, o staging continua vivo — até aquele que um colega tocou há 90 dias.

Contêineres·Snapshots

Sandboxes por cliente em escala de frota

Oitocentos clientes isolados em três servidores bare-metal — uma conta mensal de tarifa fixa, nenhuma métrica por tenant. Cada tenant ganha um contêiner real com seu próprio kernel namespace, sistema de arquivos e URL. Contêineres ociosos não custam nada além do servidor que você já aluga.

Contêineres·Snapshots·Exec

O cache de CI que não é uma linha de fatura do S3

Os arquivos de cache vivem em /files na máquina que você já aluga. Os workers fazem PUT e GET de tarballs por HTTP. Sem bucket S3, sem egress, sem terceiro fornecedor — os bytes nunca saem da máquina.

Arquivos·Contêineres

Cinquenta ambientes de demo para cinquenta calls de vendas

Cada prospect ganha uma cópia real e isolada do seu produto, com os dados dele. Clonado de um snapshot. Fica com ele por uma semana.

Contêineres·Snapshots

Faça streaming de tokens de LLM para qualquer coisa que leia HTTP

Dois curls, um caminho, sem camada do meio

Cinco camadas entre gerador e leitor

Dois curls tocando o mesmo caminho

Mesmo caminho, vários leitores, sem SDK

O navegador lê a mesma URL

Um segundo agente escuta e decide

Tee o stream para um contêiner que observa

O que isto substitui

Leia os outros

Sessenta contêineres em um servidor

Faça o onboarding de um dev com um link

Endpoints de API que se materializam sob demanda

Computadores de ramificação como Git

VS Code de verdade no seu celular

Agentes de IA que criam outros agentes de IA

Um sandbox por cliente, automaticamente

Acordar com um protótipo pronto

Correção de produção de emergência do seu telefone

Acompanhe logs de produção em uma URL que qualquer um pode curl

Envie um build para trinta workers de CI ao mesmo tempo

Veja seu agente pensar direto da cafeteria

Compartilhe sua tela com uma URL, não com um convite de reunião

Mova 200GB entre nuvens com dois curls

Envie a um colega o estado de um banco em uma linha

Uma barra de progresso que seu chefe pode acompanhar sem entrar

O fan-out de webhook que você não precisou construir

Um cache de CI que é só dois comandos curl

Uploads por arrastar e soltar direto no seu script

Transmita um workshop para 200 espectadores a partir do seu laptop

IPC entre contêineres sem o message broker

Acompanhe seu agente no trem, receba um aviso quando ele terminar

Um microfone via HTTP, em dois terminais

Cinco agentes, cinco pipes, um veredito

Reproduza o incidente desta manhã para o time inteiro

O 'me manda esse arquivo' mais rápido que você já digitou

Rode um LLM local e sirva-o à sua frota inteira

Um dashboard de métricas ao vivo sem backend de métricas

O cron job que se apaga sozinho quando você termina

Tire um snapshot do contêiner logo antes da migração noturna

Um crontab separado para cada cliente, automaticamente

Acorde um agente às 3h da manhã, aposente-o às 4h

Rollups diários sem um orquestrador

Um crontab por branch, implantado junto com o código

Escalonamento de plantão que expira junto com o turno

Scrape por hora, resumo diário, arquivo semanal — um contêiner

Deixe seus clientes trazerem o próprio agendamento cron

Agende o agente, não o script

Um heartbeat para os jobs silenciosos

Mantenha as últimas 24 horas como 24 snapshots

Replay dos webhooks de hoje cedo no mesmo horário amanhã

Edite seu crontab pelo celular, no aeroporto

Um digest agendado que faz fan-out para 200 caixas de entrada

Silencie o job instável sem perdê-lo

Um agente que avalia os agentes de ontem

Jobs de limpeza que agendam a própria aposentadoria

Renove seus certificados TLS sem uma sessão SSH

Um canário semanal que tenta quebrar a produção

O cemitério de projetos paralelos que você pode bancar

Um ambiente de preview por pull request, o mês todo

Rode um portfólio de 12 produtos em uma máquina bare-metal

Acabe com o imposto do servidor de staging

Quarenta sites de clientes, um aluguel, um painel

Substitua a fatura da E2B pelo bare metal que você já aluga

Staging ocioso não custa nada, então staging para de ser deletado

Sandboxes por cliente em escala de frota

O cache de CI que não é uma linha de fatura do S3

Cinquenta ambientes de demo para cinquenta calls de vendas