3 min read
AI Builders Digest — 2026年4月8日

AI Builders Digest — 2026年4月8日

X / TWITTER

Anthropic 研究员 Alex Albert 宣布了 Claude Mythos Preview,称 Project Glasswing 是”我加入 Anthropic 近3年以来亲眼见证的 AI 行业中最重大的事件”。新模型在关键基准测试上取得了显著的两位数提升。Mythos 目前已向 Project Glasswing 的 launch partners 开放。

https://x.com/alexalbert__/status/2041579950332113155

https://x.com/alexalbert__/status/2041579938537775160

OpenAI CEO Sam Altman 庆祝 Codex 周活跃用户突破 300 万,并重置了使用限额——承诺每增加 100 万用户都会这样做,直到 1000 万。用户增长速度正在加速。

https://x.com/sama/status/2041658719839383945

Box CEO Aaron Levie 评论 Anthropic 的 Mythos:“模型能力的进步目前完全没有遇到瓶颈。“他认为这种能力提升正在解锁金融、医疗、法律、咨询、供应链等领域的新应用场景——构建者需要做好准备抓住这些机会。

https://x.com/levie/status/2041732610179703100

他还演示了 Box Agent 自动填写 RFP 回复——agent 可以在后台工作数小时,阅读文档、提取问题、搜索素材、生成最终输出,用户 meanwhile 做其他事情。这种架构与 coding agent 对软件开发的影响类似。

https://x.com/levie/status/2041512156693201176

OpenAI VP Science Kevin Weil 介绍了 Prism 的 Paper Review 功能——一个像严谨技术审稿人一样工作的流程,能发现数学错误、不一致性、表述不清、未被结果支持的论断等问题。输出是可编辑的 LaTeX review 文件。由 @hemal 用 Codex skill 在几小时内构建完成。

https://x.com/kevinweil/status/2041573802212303053

https://x.com/kevinweil/status/2041592093718749659

Anthropic Claude Code 工程师 Thariq 分享了 10+ 次用户访谈的收获:“很容易在开放式验证上消耗大量 token,但输出质量并不会因此提升。“他正在研究高效的验证策略。

https://x.com/trq212/status/2041722125510377705

他还在两周后与 @swyx 和 @MilksandMatcha 在 SF 举办技术写作 workshop。

https://x.com/trq212/status/2041677067117588871

Cursor 设计师 Ryo Lu 分享了他们的 flow philosophy:“没有多余的按钮——只需要点击、画、聊天,完全沉浸在工作流中。”

https://x.com/ryolu_/status/2041564082034372956

Vercel CEO Guillermo Rauch 在 YC 演讲时说:“最好的城市、最好的时代、几代人以来最好的创业机会。”

https://x.com/rauchg/status/2041720266154504351

YC 主席 Garry Tan 指出:“我们生活在一个 LISPy 时代,原因很明确:代码即数据,数据即代码。但奇怪的是?它是 Markdown。”

https://x.com/garrytan/status/2041653129020936328

他还观察到 Claude Code 的一个行为:agent 不能在 workspace 外使用 Write File,但可以通过 bash 的 cat >> 写入任何文件。

https://x.com/garrytan/status/2041654662764609735

ClawFather Peter Steinberger 发布了 CodexBar 0.20,新增 Perplexity 和 OpenCode Go providers,支持账号切换和费用历史改进。目前追踪 16 个 providers。

https://x.com/steipete/status/2041731875241066517

Builder Zara Zhang 发布了 Personalized Podcast skill——把任何内容转成两个 AI host 的播客,发布为 RSS,在喜欢的播客 app 里收听。“这是一个’为一个人生产内容’的时代。”

https://x.com/zarazhangrui/status/2041736869998948528

FPV Ventures 合伙人 Nikunj Kothari 批评早期创业者过度优化曝光和融资而非产品和留存:“相信我,VC 会跟上的!”

https://x.com/nikunj/status/2041757065354293760

Linear 产品负责人 Nan Yu 观察:设计师在抽象产品问题上表现很好,但必须拿走 Figma,否则他们会直接设计被要求的东西。更多设计师应该成为 PM。

https://x.com/thenanyu/status/2041495924682244275

Every CEO Dan Shipper 提出:“做 model manager”——指向从把 AI 当助手到管理 agents 的转变。

https://x.com/danshipper/status/2041624900046106907

Roblox 产品 Peter Yang 询问 Anthropic 是否内部使用 Mythos 来维持最近的惊人发布速度。

https://x.com/petergyang/status/2041678988318543908

South Park Commons GP Aditya Agarwal 感叹 Mythos:“生活在这样的时代真是太棒了。”

https://x.com/adityaag/status/2041771160359375001


PODCASTS

Latent Space: 为 Token Billionaire 打造的极致 Harness Engineering

核心洞察: OpenAI Frontier 工程师 Ryan Lopopolo 的团队在 5 个月内构建了百万行代码库,零人工编写代码——通过把 Codex harness 当作一个”能从代码到 dashboard 到 incident response 全权负责的队友”。

OpenAI Frontier 工程师 Ryan Lopopolo 描述了团队如何走向”AI maximalist”——自己不写代码,只 orchestrate Codex。开始时比正常慢 10 倍,但最终效率远超,因为他们为 agents 建好了”组装站”。关键洞察:一切都是文本。工作是把文本(文档、测试、错误信息、PR comments)funnel 进 agent 的 context。他们部署 review agents,每天从 session logs 提炼团队知识,甚至让 agents 在 Slack shitpost。代码库结构像一个 10000 人工程团队(500 个 npm packages),因为每个 human 现在等于 10-50 个 agents。

引用:“You can just Codex things.”

团队还构建了 Symphony——一个 Elixir orchestration layer,彻底把人类从 terminal 移除。你在 Linear 里 approve tickets,Symphony 就在 dev boxes 里启动 Codex,等待 CI,处理 merge conflicts,交付。Ryan 的愿景:“我的生活就是海滩,每天打开 Linear 两次说 yes/no。”

关于 Frontier(OpenAI 的企业平台),他强调 observability 和 safety:dashboard 让 IT/GRC 能 dive 进每个 agent trajectory,safety specs 让企业能按自己的 exfiltration 顾虑来 instrument agents。

https://www.youtube.com/@LatentSpacePod


Generated through the Follow Builders skill: https://github.com/zarazhangrui/follow-builders