Skip to content
Go back

美国政府要求 Anthropic 暂停 Fable 5 和 Myth | Hacker News 摘要 (2026-06-14)

Published:  at  03:05 PM

1. 美国政府要求 Anthropic 暂停 Fable 5 和 Mythos 5 访问 (Statement on US government directive to suspend access to Fable 5 and Mythos 5)

Anthropic 发布声明称,美国政府以国家安全权限下达出口管制指令,要求暂停所有外国国民访问 Fable 5 和 Mythos 5,无论这些人位于美国境内还是境外,甚至包括 Anthropic 内部的外籍员工。由于实际执行上很难只按国籍精确限制,公司选择临时关闭所有客户对这两个模型的访问,其他 Anthropic 模型不受影响。政府信函没有给出详细理由,Anthropic 理解为相关部门认为 Fable 5 存在某种可被绕过安全护栏的 jailbreak。公司回应称,演示中识别的是少量已知、较轻微漏洞,且其他公开模型也能发现类似问题;Fable 发布前已经经过美国政府、英国 AISI、第三方和内部团队数千小时红队测试。文章核心不是模型能力本身,而是前沿 AI、网络安全、出口管制和商业可用性第一次以非常直接的方式撞在一起。

原文链接:https://www.anthropic.com/news/fable-mythos-access

论坛讨论链接:https://news.ycombinator.com/item?id=48511072

HN 讨论规模很大,很多人认为 Anthropic 长期强调自家模型危险性,最终可能被监管者按危险品对待。有人把它视为政府惩罚性动作,也有人怀疑是公关或政策博弈。争议集中在两个问题:Fable/Mythos 是否真的构成独特风险,以及一家美国 AI 公司是否能在没有清晰细节的情况下被迫全球关停前沿模型。


2. Fable 被禁后,开发者感到一片阴影压了下来 (There is a shadow hanging over this Fable thing)

这篇个人文章从用户侧记录了 Fable/Myt​​hos 被暂停访问的冲击。作者原本只是周五晚上让 Agent 帮自己做一些 HTML 小游戏,突然发现模型报错“不存在”。他起初以为是登录、额度或自研 Rust Agent harness 出了问题,直到朋友提醒“政府禁了 Fable”。文章引用 Anthropic 声明,指出美国政府要求禁止任何外国国民访问 Fable 5 和 Mythos 5,这在全球 SaaS 和跨国团队语境下几乎无法精细执行,结果就是模型被整体关停。作者担心的不是某一次工具不可用,而是这种先例会给 AI 开发生态投下长期阴影:如果前沿模型可以因为模糊的国家安全理由突然消失,开发者就很难把工作流、产品和个人创造力稳定建立在其上。

原文链接:https://12gramsofcarbon.com/p/tech-things-there-is-a-massive-shadow

论坛讨论链接:https://news.ycombinator.com/item?id=48513536

讨论一开始被作者提到的 AI 小游戏引向 game design:不少人认为 LLM 能快速生成代码,但不等于能设计好玩的游戏。随后话题回到 Fable,被禁事件让很多人重新审视依赖闭源模型的风险。有人认为这是政策噪音,有人认为这是前沿模型商业化必然遇到的国家能力边界。


3. 安全 Agent 在 FFmpeg 中发现 21 个零日漏洞 (Twenty One Zero-Days in FFmpeg)

Depthfirst 称其生产级自主安全 Agent 在 FFmpeg 中发现了 21 个零日漏洞,并能生成可复现的 PoC 输入来验证发现,成本约 1000 美元,低于传统深度分析的量级。FFmpeg 是全球部署最广的软件组件之一,浏览器、流媒体和各种后端系统都会用它处理复杂、非可信媒体文件,因此一直是零点击攻击的重要目标。它同时也是一个安全研究硬骨头:约 150 万行高优化 C 代码,支持大量格式,经历了二十多年 fuzzing 和人工审计。文章把安全 Agent 和普通 coding Agent 区分开来:后者是交互式写代码,前者要从威胁建模开始,识别攻击面、追踪攻击者可控输入、审计解析器,并产出具体触发样本。Depthfirst 还声称探索了部分问题的可利用性,并开发了 RCE exploit primitive。

原文链接:https://depthfirst.com/research/21-zero-days-in-ffmpeg

论坛讨论链接:https://news.ycombinator.com/item?id=48510046

HN 评论一方面承认这是 LLM 安全能力的有力演示,另一方面提醒 FFmpeg 长期就是内存破坏漏洞高发区,任何处理不可信媒体的部署都应该沙箱化。还有维护者视角的讨论:开源项目经常收到漏洞披露,却缺少足够多人帮忙修补,AI 扫出更多 bug 之后,修复和协调压力会更大。


4. 美国商务部禁用 Census 统计产品中的噪声注入 (Noise infusion banned from statistical products published by Census Bureau)

这篇文章解释美国商务部下令禁止 Census Bureau 和 Bureau of Economic Analysis 在统计产品中使用“noise infusion”意味着什么。统计机构要从保密原始数据中发布有用数字,同时不能泄露个体信息,传统方法包括抑制、泛化、抽样、交换、贡献限制和加噪声。其中,贡献限制加上精心校准的噪声是差分隐私的重要组成部分,也是科学界广泛认可的隐私保护金标准。作者回顾说,美国人口普查曾长期依赖数据交换,但后来发现用公开统计重建个体记录并不难,于是 2020 年 Census 采用差分隐私,不是因为数学好看,而是在能抵御重建攻击的方案中保留了最多数据效用。禁用噪声听起来像提高准确性,实际可能让统计机构在隐私和可发布性之间失去关键工具。

原文链接:https://desfontain.es/blog/banning-noise.html

论坛讨论链接:https://news.ycombinator.com/item?id=48517377

讨论里有参与人口普查的人担心,缺少隐私保护会进一步削弱公众信任,尤其是在对政府不信任已经很高的社区。也有人认为 Census 应该只做人头统计,但反驳者强调这些数据是公共政策、研究和资源分配的重要基线。争议核心是:没有可靠隐私保护,更多人可能拒答或提供低质量数据,最终反而伤害统计质量。


5. Google 支持用退役手机搭低碳计算集群 (A low-carbon computing platform from your retired phones)

Google Research 介绍了 UC San Diego 在做的“phone cluster computing”项目:把退役智能手机的主板拆出并组成集群,重新部署为通用计算平台。计算的碳足迹不仅来自运行时用电,也来自硬件制造阶段的 embodied carbon;提高能效和使用清洁能源主要解决前者,而延长设备寿命可以减少后者。Google 支持该校建设一个由 2000 台 Pixel 手机组成的数据中心,为数百名研究人员和学生提供低成本、低碳云计算。文章指出,现代手机的单线程性能已经接近甚至超过一些服务器核心,但每台手机的核心数、内存和 I/O 都有限,因此适合的任务必须能拆分、能适应 8 到 12GB 内存约束。项目价值在于把消费电子废弃物重新纳入计算基础设施,而不是把旧手机只看成回收材料。

原文链接:https://research.google/blog/a-low-carbon-computing-platform-from-your-retired-phones/

论坛讨论链接:https://news.ycombinator.com/item?id=48515336

HN 讨论很快转向手机被迫报废的根因:专有固件、锁定系统、短安全更新周期和不可维修设计。有人指出,如果 Google 能把旧手机刷成安全的集群节点,为什么普通消费者不能获得同样能力。另一个问题是 I/O 和运维细节:这些主板如何联网、供电、散热和更新,原文讲得还不够具体。


6. RTX 5080 加 3090,本地 Qwen 3.6 跑到 80 tok/s (RTX 5080 and RTX 3090 Setup: 80 Tok/s on Qwen 3.6 27B Q8)

作者分享了一套混合 GPU 本地 LLM 配置:RTX 5080 加翻新的 RTX 3090,用来运行 Qwen 3.6 27B Q8,并达到 80 tokens/s 左右。起初他只有 5080,后来发现 16GB 显存限制明显,于是买了 24GB 的 3090,先用 Q4 量化跑到约 30 tok/s,再借助 MTP 提升到 50 到 60 tok/s。为了同时利用两张不同代际显卡,他选择支持 PCIe x16 拆成 2x8 的 Asus Prime X570-Pro,用 PCIe 4 riser 安装 5080,并在 BIOS 中关闭 CSM、打开 Above 4G Decoding 和 ReSize BAR。文章还记录了 NVIDIA 驱动、不同显卡无法使用某些 P2P 优化、nvidia-open、拓扑检查和实际推理调参。它不是一篇产品评测,而是一份本地高性能推理的硬件踩坑笔记。

原文链接:https://imil.net/blog/posts/2026/rtx-5080-+-rtx-3090-setup-80+-tok-s-on-qwen-3.6-27b-q8/

论坛讨论链接:https://news.ycombinator.com/item?id=48515454

讨论中有人表示类似配置已经让本地 Qwen Agent 在简单任务上比 Claude Code 更顺手,因为失败方式更直白,不会用华丽措辞掩盖胡说,也不太会把问题越搞越复杂。也有人指出,本地模型在上下文充足、任务边界清晰时很有竞争力,但开放式复杂任务仍然是 Claude/ChatGPT 更快到达目标。


7. Every Frame Perfect:任何一帧截图都应该说得通 (Every Frame Perfect)

Tonsky 借 Wayland 的“every frame is perfect”理念讨论 UI 细节:如果在应用运行的任意时刻截图,这一帧都应该有意义。用户看不到代码,只能通过界面判断软件质量;如果 UI 在加载、切换、动画中出现白屏、半成品内容、跳动布局、状态不一致或奇怪过渡,就会削弱信任。文章举了多个例子:动画起点和终点看似正常,但中间帧图标、占位符、光标或边框不同步;照片应用切换模式时图片和裁剪框运动不同步,让用户误以为内容发生了变化;YouTube 等复杂 DOM 架构下简单矩形移动也可能变得反直觉。作者的主张不是反动画,而是要求动画像精密工具一样帮助理解,而不是制造虚假的视觉感觉。

原文链接:https://tonsky.me/blog/every-frame-perfect/

论坛讨论链接:https://news.ycombinator.com/item?id=48516251

讨论对“逐帧完美”有保留。图形和影视背景的评论指出,人眼感知运动和静止帧不同,单独截图看起来错误的运动模糊或变形,可能在实时观看中最自然。因此大家更倾向于把文章理解为反对 jank、不同步和无意义过渡,而不是要求每个中间帧都像静态设计稿。


8. 计算机科学学位没死,坏的是入门招聘管道 (The computer science degree isn’t dead)

IEEE Spectrum 这篇职业文章反驳“CS 学位已经没用”的流行说法。作者承认近期美国 CS 毕业生失业率看起来比一些人文学科更高,但认为只看失业率会误导:如果同时考虑 underemployment 和早期收入,CS 与计算机工程仍是总体就业结果最强的专业之一。真正坏掉的是 entry-level 软件工程岗位的招聘管道。职位广告看似增长,但实际入门招聘大幅下降,ghost jobs 进一步制造市场繁荣假象。作者建议新毕业生不要只投冷申请,而要动用现实网络和推荐;接受创业公司这类风险对称的第一份工作;通过真实部署项目、开源贡献或为小企业解决问题来制造经验;并学习实际 AI 工程能力,如 RAG、embedding、向量数据库和生产集成,而不只是会用 Copilot 或 Cursor。

原文链接:https://spectrum.ieee.org/computer-science-degree-isnt-dead

论坛讨论链接:https://news.ycombinator.com/item?id=48470152

讨论里很多人强调学位的社会资本功能。没有学位直接入行的人提醒,学历不只是知识证明,也传递家庭资源、稳定性、圈层和“会玩游戏”的信号;这些在当下技术行业反而更重要。也有人认为大学的价值在于系统训练和人脉,而不是保证第一份工作。整体共识是:学位不是万能门票,但完全绕开它会失去很多隐性通道。


9. 开放源码 AI 必须赢,否则智能会变成租赁品 (Open source AI must win)

这个宣言式页面主张开源 AI 必须胜出,因为 AI 正在成为工作、教育、科学、软件、创造力、公共服务和国家能力的基础设施。如果智能只能从少数封闭机构租用,公众失去的不只是软件自由,而是操作自由:无法自由研究、构建、修复、部署、审计、适配、教学、保存和本地运行智能系统。作者担心闭源 API、远程平台、不断变化的服务条款、 opaque moderation、模型下架和价格调整,会让认知能力变成订阅经济。文章强调开放 AI 应保持可用、可理解、可复现、可本地部署、经济可行并由社区治理,即使今天的主导实验室、云平台、硬件商或开放权重提供者改变方向,也不应让社会失去运行智能基础设施的能力。

原文链接:https://opensourceaimustwin.com/?share=v2

论坛讨论链接:https://news.ycombinator.com/item?id=48511908

讨论从去中心化训练展开。有人设想用志愿者机器训练模型,但很快指出通信带宽、能效、互联和数据投毒都是巨大障碍;专业 AI 硬件不仅更快,也更省电、更适合大规模互连。支持者仍认为,哪怕无法快速训练 Fable 级模型,长期拥有分布式可访问能力也比永远只能租用封闭模型强。


10. Show HN:每天一洞的浏览器迷你高尔夫 (Show HN: Putt.day a daily mini golf game)

Putt.day 是一个每日迷你高尔夫网页游戏。截图显示它采用俯视 3D 风格,球道是绿色平台,周围有木质边框、水域、洞口和一些高低落差。玩法很直接:抓住球,向后拖动再松手击球;拖得越远力度越大。拖动球以外的位置可以转动视角,捏合或滚轮可以缩放。目标是在尽可能少的杆数内把球打进洞里;如果球落水,会回到之前的位置。游戏每天提供一个新球洞,第一次完成会计入成绩,过去日期可以在日历中回看。它可以理解为 Wordle 式每日挑战的另一种形式:不是文字谜题,而是一个轻量物理小游戏,每天给玩家一个固定关卡和可分享的成绩。

原文链接:https://putt.day/

论坛讨论链接:https://news.ycombinator.com/item?id=48510341

HN 讨论主要是玩法反馈。有人觉得滚动阻力太大,即使路线正确也很难打够远;默认摄像机角度有时会限制最大拉杆距离。也有玩家分享从墙面反弹、穿过城堡等路线。作者在评论里回应正在调整。另一些建议包括改进成绩卡展示、标记前进方向、减少进洞后视角迷失等。


Suggest Changes

Previous Post
Paul Graham:怎样赚到十亿美元 | Hacker News 摘要 (2026-06-15)
Next Post
把网站改回 HTML 优先后,用户量一夜翻倍 | Hacker News 摘要 (2026-06-11)