类型解锁

阶段生产环境

难度简单

工作监控服务

用于个人创始人

用于DevOps & 基础设施

服务Cron

服务通知

为何选 HoodyHTTP 原生

类型解锁

阶段生产环境

难度简单

工作监控服务

用于个人创始人

用于DevOps & 基础设施

服务Cron

服务通知

为何选 HoodyHTTP 原生

类型解锁

阶段生产环境

难度简单

工作监控服务

用于个人创始人

用于DevOps & 基础设施

服务Cron

服务通知

为何选 HoodyHTTP 原生

类型解锁

阶段生产环境

难度简单

工作监控服务

用于个人创始人

用于DevOps & 基础设施

服务Cron

服务通知

为何选 HoodyHTTP 原生

返回使用场景列表

use-cases / heartbeat-for-silent-jobs / hero

CRON · NOTIFICATIONS · SILENCE-ALARM

为沉默的任务装上心跳

大多数监控盯着发生过的事。你需要的是一个盯着没发生的事的东西。两条 cron —— 一条跳动，一条聆听跳动的缺席 —— 还有一条在沙滩上也能找到你的呼叫。

阅读 cron 文档

ops · heartbeats

https://ops.containers.hoody.com/heartbeatslive

受监控任务 · 最近 24 次跳动

6 / 6

backup-prod-dbMISSED · 2h overdue
2h 06m ago
@daily · 02:00
rotate-api-keys
6m ago
0 4 * * 0 · weekly
cleanup-stale-snapshots
3m ago
0 * * * * · hourly
export-stripe-ledger
11h 04m ago
@daily · 03:30
renew-letsencrypt
1h 12m ago
0 1 * * * · daily
vacuum-postgres
2m ago
*/15 * * * *

沉默观察者

# 缺失跳动时呼叫*/15 * * * *curl /silence-check

通道

push · ios
sms · twilio
email · ops@

正常延迟缺失窗口：24 次跳动

两条 cron · 零新服务 · 什么都没发生时，告警来找你

use-cases / heartbeat-for-silent-jobs / mechanism

两条 cron。一条说我还活着。另一条聆听沉默。

你已有的任务继续干自己的活。完成后，它额外加一条 curl:向通知端点 POST 一行心跳。第二条 cron 按自己的节奏运行，检查沉默 —— 如果没有新心跳，它就呼叫你的手机。任务的成功是无声的。它的缺席是响亮的。

worker.cron · 任务

POST · heartbeat

schedule0 2 * * *

# After the nightly export finishes,# the job pings its own heartbeat.0 2 * * * /usr/local/bin/export.sh \ && curl -fsS -X POST \ https://notify.containers.hoody.com/heartbeats/backup-prod-db

缺席就是信号

watcher.cron · 聆听者

GET · silence-check

schedule*/15 * * * *

# Every 15 minutes, ask: was there a beat?# If silent for >1h, the API pages all channels.*/15 * * * * curl -fsS \ https://notify.containers.hoody.com/silence-check?\ job=backup-prod-db&max_age=1h

两次 POST 到 /users/root/entries，带 5 字段的表达式。第一条在每个定时任务后运行，发送它的心跳。第二条按自己的节奏运行，询问通知端点最后一次跳动是否仍然新鲜，不是就触发呼叫。无队列、无代理、无守护进程 —— 只有两行原本就必须存在的 crontab。

use-cases / heartbeat-for-silent-jobs / powers

为什么盯着缺席不一样

大多数监控工具盯着成功路径：有事发生时告警。这种形态在没有事发生时告警 —— 而那正是沉默的任务每次都会输掉的场景。

FAILURE MODES

捕获沉默的崩溃

如果 worker 进程根本没启动 —— 机器重启、脚本被删、配额过期 —— 没有任何东西可以记录，也没有任何东西可以告警。观察者 cron 仍然照常运行，并发现心跳行已经过期。捕获沉默崩溃的东西，正是不依赖那个沉默对象的东西。

ZERO SURFACE

没有新服务需要照看

监控只是一行额外的 crontab，而不是一个 Healthchecks.io 账号或 CloudWatch 告警。它和工作绑定在同一个容器里，如果你需要，可以用 `expires_at` 一起过期，并从你栈里其他部分已在使用的同一个通知 API 读取。

REACHES YOU

在重要的时候够响

通知端点把呼叫扇出到推送、短信和邮件 —— 那些你已经信赖的通道。你不盯面板。面板自己盯自己，只在沉默拖得过久时，在巴厘岛的沙滩上找到你。

use-cases / heartbeat-for-silent-jobs / capacity

真实的 cron，真实的通知

机制就是普通的 Hoody Cron 加 Hoody Notifications。数字来自有据可查的 API 表面，而不是 demo 运行时。

ALL CRON SYNTAX@daily
标准的 5 字段表达式加宏 —— `@hourly`、`@daily`、`@weekly`、`@monthly`、`@yearly`。观察者和 worker 可以有完全不同的节奏。
AUTO-EXPIRYexpires_at
受管理的条目支持 `expires_at`，所以一个临时心跳(比如一周的迁移窗口)能自己清理。观察者随工作一同消失。
ISOLATIONper-user
每个容器都有自己的 crontab。一个租户的心跳无法静音另一个租户的观察者，禁用一个任务只是一次 PATCH `enabled: false`。

限制以 Hoody Cron API 为准：5 字段表达式加 `@hourly`/`@daily`/`@weekly`/`@monthly`/`@yearly` 宏，受管理条目可选 `expires_at`，按用户隔离的 crontab，通过 PATCH 启用/禁用。

use-cases / heartbeat-for-silent-jobs / punchline

沉默，如今是一种告警。

之前 · 盯着日志打开面板 · 搜索上次导出 · 叹气 · 忘记你只在周一才注意到任务没跑

之后 · 守着平静*/15 * * * * curl /silence-check?job=backup-prod-db沉默还很小的时候，呼叫已经找到你

阅读 cron 文档

use-cases / heartbeat-for-silent-jobs / replaces

这取代了什么

你想要带呼叫的 cron 监控时常会去够的工具。每一个都是单独的账号、单独的账单、单独的 API。两行 crontab 加上通知端点就能完成同样的事。

custom orchestrators为两行 crontab 而搭一整套编排服务
Healthchecks.io光为了接收一个 HTTP 心跳而开的 SaaS 账号
Cronitor按监控数计费，只为做一件你的容器自己就能做的事
Dead Man's Snitch完全相同的模式，被卖成订阅
用于 cron 的 AWS CloudWatch 告警为一行过期的记录搭 Lambda + 告警 + IAM 策略
自定义心跳采集脚本搭一个微服务来记录一个 cron 自己就能 POST 的值

use-cases / heartbeat-for-silent-jobs / cta

别再盯着成功路径。盯着成功的缺席 —— 沉默的失败只活在那里。

阅读 cron 文档

use-cases / heartbeat-for-silent-jobs / related

为沉默的任务装上心跳

两条 cron。一条说我还活着。另一条聆听沉默。

为什么盯着缺席不一样

捕获沉默的崩溃

没有新服务需要照看

在重要的时候够响

真实的 cron，真实的通知

这取代了什么

阅读其他内容

一台服务器上运行 60 个容器

一条链接搞定开发者入职

按需实现的 API 端点

像 Git 一样分支计算机

在手机上跑真正的 VS Code

能派生其他 AI 智能体的 AI 智能体

每个客户自动获得一个沙盒

醒来即看到完成的原型

从手机进行生产紧急修复

把生产日志 tail 到一个谁都能 curl 的 URL

把一次构建推送到三十个 CI worker

在咖啡馆看 agent 思考

用一个 URL 分享屏幕，而不是会议邀请

用两条 curl 在云之间搬 200GB

用一行命令把数据库状态发给队友

把 LLM token 流到任何能读 HTTP 的东西

老板可以围观但无需加入的进度条

你无需自建的 webhook 扇出

只用两条 curl 命令的 CI 缓存

把拖拽上传接进你的脚本

用笔记本把工作坊广播给 200 个观众

无需消息中间件的容器间 IPC

在火车上 tail 你的 agent，落地时收到推送

两个终端搭起来的 HTTP 麦克风

五个智能体，五条管道，一个裁决

把今早的故障回放给整个团队

你能输入的最快「把那个文件发我」

本地跑一个 LLM，服务给你的整支舰队

没有指标后端的实时指标仪表盘

干完活就自动删掉自己的定时任务

在每晚迁移前给容器拍快照

每个客户自动获得独立的 crontab

凌晨 3 点唤醒智能体，4 点退场

无需编排器的每日汇总

每个分支一份 crontab，与代码一起部署

随班次自动过期的 on-call 升级

每小时抓取、每日摘要、每周归档——同一个容器

让客户自带自己的 cron 调度

调度 agent，而不是脚本

把过去 24 小时保留为 24 个快照

把今天早上的 webhook 在明天同一时间重放一次

在机场用手机编辑你的 crontab

一个定时摘要扇出到 200 个收件箱

把不稳定的任务静音，但别丢掉它

一个给昨天的智能体打分的智能体

会安排自己退休的清理任务

不开 SSH 会话也能轮换 TLS 证书

每周一次试图搞垮生产的金丝雀

让兴趣项目坟场也养得起的方案

每个 PR 一个预览环境，整月

用一台裸金属机器跑 12 款产品的产品组合

干掉预发布服务器税

用你已经租用的裸金属替换 E2B 账单

闲置 staging 不花钱，所以 staging 不再被删除

舰队规模的按客户隔离沙箱

不再是 S3 账单条目的 CI 缓存

为五十个销售电话准备五十个演示环境