
Sechzig Container auf einem Server
Eine Bare-Metal-Box führt Dutzende bis Hunderte von Hoody-Containern aus. KSM und BTRFS-Dedup machen die Marginalkosten nahezu null.
Du debuggst um Mitternacht zu zweit und der Hotspot der Gegenseite überlebt kein Zoom. Ihr habt beide eine Shell. ffmpeg nimmt das Mikrofon auf, curl PUTtet es an einen Pipe-Pfad, das andere Terminal curlst und gibt die Bytes aus. Kein SDK, kein Signaling, kein Meeting.
$ ffmpeg -f alsa -i default \
-c:a libopus -f ogg - \
| curl -T - https://pipe.containers.hoody.com/api/v1/pipe/voice$ curl https://pipe.containers.hoody.com/api/v1/pipe/voice
| mpv --no-video -kein Signaling, kein SDK, kein Zoom
ffmpeg encodiert dein Mikrofon zu opus und schreibt es nach stdout. curl PUTtet dieses stdin an /api/v1/pipe/voice. Wer auch immer denselben Pfad GETtet, empfängt die Bytes, sobald der Sender sie produziert. Die Pipe hält den Receiver bis zu fünf Minuten lang, damit der Sender sich verbindet, reicht den Content-Type weiter und speichert nichts.
ffmpeg -f alsa -i default -c:a libopus -f ogg - liest dein Mikrofon, encodiert zu opus, schreibt nach stdout.
curl -T - PUTtet stdin an /api/v1/pipe/voice. Die Pipe wartet bis zu fünf Minuten auf einen Receiver auf demselben Pfad.
Ihr Terminal führt curl https://.../api/v1/pipe/voice aus. Die Pipe verbindet Sender und Receiver und beginnt zu streamen.
Ihr curl pipet in aplay oder mpv. Audio läuft, sobald es ankommt, Byte für Byte. ctrl-C beendet den Call.
Die Pipe reicht den Content-Type weiter, unterstützt bis zu fünf Minuten Hold-Time, bevor ein Gegenstück verbindet, und nutzt HTTPS — nichts Exotischeres als das Protokoll, das deine Shell sowieso schon spricht.
Es gibt keine Echo-Cancellation, keinen Jitter-Buffer, kein fancy DSP. Es ist die Art Voice-Channel, mit der ein SRE-Paar debuggt: heruntergebrochen, geringer Overhead, verlässlich. Jede Schicht, die eine Meeting-Plattform draufpackt, ist eine Schicht, die das Pipe-Paar einfach nicht hat.
Derselbe Mic-über-HTTP-Mechanismus liest sich auf drei verschiedene Arten, je nachdem, wer am anderen Ende der Pipe ist.
Du bist drei Befehle tief in einem Prod-Incident. Zoom hochzufahren würde länger dauern als der Fix. ffmpeg | curl auf deiner Seite, curl | mpv auf ihrer — du kannst reden, während du Logs tailst.
Phone-Tethering erstickt an einem Videocall. Ein 32-kbps-Opus-Stream über HTTP nicht. Das andere Ende öffnet eine URL und hört zu — ein Mikrofon zur Teilnahme braucht es nicht einmal.
Nichts wird auf einem Server gespeichert. Es gibt keine Drittanbieter-App auf einer der beiden Maschinen. Die Pipe ist reines Streaming — Bytes laufen durch und sind weg, sobald ctrl-C gedrückt wird.
Audio sind nur Bytes. Bytes sind nur eine Pipe.
Die Reihe an Voice-Tools, die jedes Engineer-Paar anhäuft. Jedes davon setzt ein Meeting, einen Account oder einen eigenen Signaling-Server voraus. Die Pipe-URL setzt nichts davon voraus.
Wenn das nächste Mal jemand sagt 'können wir kurz telefonieren', öffne stattdessen eine Pipe.