美国医保市场把公民身份和种族数据送进了广告像素 | Hacker News 摘要 (2026-05-05)

1. 美国医保市场把公民身份和种族数据送进了广告像素 (US healthcare marketplaces shared citizenship and race data with ad tech giants)

TechCrunch 引述 Bloomberg 调查称，美国 20 个州政府运营的医保 marketplace 中，几乎全部都把居民申请信息通过网页追踪像素分享给 Google、LinkedIn、Meta、Snap 等广告和科技公司。问题来自常见的 pixel tracker：网站通常用它们做分析、广告归因和 bug 诊断，但如果被放在含有敏感字段的页面上，就可能把医疗、身份和人口统计信息一起带出。报道提到，纽约医保交易所分享了申请相关信息，包括用户是否提供有被监禁家庭成员等细节；华盛顿特区交易所页面涉及性别和种族字段，TikTok 像素尝试遮蔽部分种族但并不完整，还分享了邮箱、电话和国家标识符。DC 暂停 TikTok tracker，弗吉尼亚也在调查后移除了 Meta tracker。事件说明，政府网站上一个小小广告像素，可能影响数百万医保申请者。

原文链接：https://techcrunch.com/2026/05/04/us-healthcare-marketplaces-shared-citizenship-and-race-data-with-ad-tech-giants/

论坛讨论链接：https://news.ycombinator.com/item?id=48011689

HN 讨论集中在美国缺少类似 GDPR 的约束，以及政府服务是否应该做广告再营销。有人分享使用州医保 marketplace 后被大量保险代理电话短信轰炸的经历，认为自己把信息交给政府系统，却被转手给一堆第三方。也有人解释，技术上这可能是为了提高医保注册率的 retargeting，但像素天然会把数据交给广告平台，之后用途很难控制。多数评论认为敏感公共服务不应把数据发送给广告网络，接收方也应承担责任。

2. GameStop 出价 555 亿美元买 eBay：梗股公司想吞下老牌电商 (GameStop makes $55.5B takeover offer for eBay)

BBC 报道，GameStop 向 eBay 提出 555 亿美元现金加股票收购要约，报价为每股 125 美元，比 eBay 上周五收盘价高约 20 美元。GameStop CEO Ryan Cohen 称，eBay 在他的领导下可以更成功，甚至成为 Amazon 的真正竞争者；如果 eBay 董事会拒绝，他准备直接面向股东推进。eBay 表示会评估提案，但分析师普遍怀疑交易可行性：Morgan Stanley 指出两家公司商业模式根本不同，Bernstein 则提到 GameStop 自身资产负债表更小。GameStop 当前市值约 119 亿美元，称已获得 TD Securities 提供约 200 亿美元债务融资承诺。Cohen 计划一年内削减 eBay 20 亿美元成本，主要集中在销售和营销。消息公布后 eBay 股价涨 5%，GameStop 跌超 9%。

原文链接：https://www.bbc.co.uk/news/articles/cn0p8yled1do

论坛讨论链接：https://news.ycombinator.com/item?id=48006402

讨论里有人认为这并非完全荒谬：GameStop 在美国各州拥有类似 pawnshop 的线下网络，如果和 eBay 结合，理论上可以提供本地寄售、线下交付、提前买断和线上转售服务。反对者则提醒，2021 年 GameStop 通过增发筹资并不是利润，不能把 meme stock 带来的资本结构改善误读成经营强劲。很多评论把焦点放在交易融资和债务负担上：eBay 比 GameStop 大得多，若被小公司高杠杆收购，风险可能主要落在 eBay 资产和现金流上。

3. 有人想众筹买下 Spirit：把破产廉航变成“乘客所有” (Let’s Buy Spirit Air)

“Let’s Buy Spirit Air” 是一个为 Spirit Airlines 提出合作社式收购设想的网站。页面称，Spirit 在 2026 年 5 月 2 日凌晨 3 点停止运营，曾在 2024 年承载 4400 万美国乘客；在私募股权拆分资产之前，乘客、员工和社区可以用类似 Green Bay Packers 的模式把它买回来。网站提出最低 45 美元 pledge，目标筹集 17.5 亿美元，目前显示约 1.32 亿美元承诺和 13.9 万笔 pledge。其治理设想是“一人一票”，无论出 45 美元还是 4.5 万美元，投票权相同；利润分配则按 pledge 比例。页面也反复声明，这只是非约束性意向，不收款，不构成证券发行，最终结构需法律审查。核心叙事是把航空作为公共服务，用合作社所有制抵抗私募拆解。

原文链接：https://letsbuyspiritair.com/

论坛讨论链接：https://news.ycombinator.com/item?id=48002777

HN 讨论很快回到航空业基本盘：不少人指出航班本身利润很薄，航空公司真正赚钱往往靠忠诚度计划和联名信用卡，因此只靠“人民所有”很难解决现金流。也有人认为如果航空具有公共交通属性，就应被当作受监管公用事业，而不是在破产和私募拆分之间循环。反对者则说这恰恰是市场把票价压到成本附近的结果，监管公用事业并不必然更好。整体讨论对项目理想主义有兴趣，但对财务可行性非常怀疑。

4. Notepad++ 作者怒斥假冒 Mac 版：这不是移植，是商标侵权 (Trademark violation: Fake Notepad++ for Mac)

Notepad++ 官网发布声明，指 notepad-plus-plus-mac.org 假冒官方 macOS 版本，未经授权使用 Notepad++ 名称，甚至把作者 Don Ho 的姓名和简介放在站点上制造官方印象。声明明确表示：Notepad++ 从未发布过 macOS 版本，任何宣称“Notepad++ 终于上 Mac”的说法都不是官方项目。维护者称该网站已经误导用户和部分科技媒体，目前已联系站点所有者要求处理，并呼吁社区在 Reddit、Twitter、Mastodon、Discord、StackOverflow 或技术博客看到相关宣传时，说明它不是官方版本，而是未经授权使用 Notepad++ 商标。事件本质不是“能不能有人做 Mac 编辑器”，而是能否用别人的项目身份和商标来包装自己的产品。

原文链接：https://notepad-plus-plus.org/news/npp-trademark-infringement/

论坛讨论链接：https://news.ycombinator.com/item?id=48006445

评论区一半看开源 drama，一半讨论商标保护。有人引用 Don Ho 在 GitHub issue 中更强硬的表态，要求对方立即下线域名，不能再以“需要一两周重品牌”作为继续侵权的理由。也有人讨论 Notepad++ 商标在法国注册、在美国可能依赖 common-law 权利，是否足以支撑维权。少数评论同情 Mac 端需求，认为用户确实想要 Notepad++ for Mac；但多数人认为需求不能授权你冒充官方，想移植就换名字。

5. 用微基准反推出硬盘物理结构：从转速到磁道边界都能测 (Discovering hard disk physical geometry through microbenchmarking (2019))

这篇 2019 年长文通过 microbenchmarking 推断机械硬盘的物理几何结构。作者从一个看似简单的问题出发：能否不拆盘就知道硬盘有几张碟片。现代硬盘虽然仍是旋转磁盘加移动磁头，但内部远比早期 CHS 模型复杂：柱面概念基本失效，磁道数量、每磁道扇区数、坏扇区、记录面布局和 track skew 都不再简单。文章通过精确计时特定扇区读取序列，测量转速、每个扇区的角位置和半径、寻道时间、磁道边界、磁道在记录面上的排列，以及 recording surface 数量。测试覆盖 1989 年 45MB 到 2015 年 5TB 的 17 块硬盘。结论之一是，完整行程寻道通常需要 1.3 到 3.6 圈，磁头加速很慢，短 stroking 对寻道时间的改善也有限。

原文链接：https://blog.stuffedcow.net/2019/09/hard-disk-geometry-microbenchmarking/

论坛讨论链接：https://news.ycombinator.com/item?id=47968187

HN 讨论认为这是少见的高密度系统文章。有人补充，SSD 也存在类似的黑盒表征需求：通过测试推断固件子系统容量、吞吐、异常行为和缺陷，这对调优 I/O scheduler、提前发现硬件问题很有用。另有人提到自己曾做过旋转硬盘模拟器，用来夸大 seek、track-to-track 等参数，测试文件系统、数据库或备份程序是否能适应真实物理延迟。几条评论感慨，这类长而数据密集的文章在 HN 上不应被 AI 发布新闻淹没。

6. 让 AI 图片写对数字：先画底稿，再让模型上色 (Using “underdrawings” for accurate text and numbers)

Sam Collins 提出一种“underdrawing”技巧，用来提升 AI 生成图片中数字和文字的准确性。问题很典型：让 Gemini 或 ChatGPT Images 直接生成一个 1 到 50 连续编号、螺旋排列的棋盘，看起来漂亮但数字顺序很快崩坏。作者的做法是把任务拆成两层：第一层用 SVG、HTML、Python 或 Mermaid 这类确定性工具生成精准的数字、位置和方向，也就是底稿；第二层把这张底稿作为图像输入，再让多模态图像模型按提示把它“画成”黏土动画、糖果棋盘等风格。确定性工具负责数学和布局，生成模型负责视觉质感。作者称这种方法仍不保证每次完美，但明显提高了文本和编号正确率，也适合交给 Claude Code 或 Codex 串起流程。

原文链接：https://samcollins.blog/underdrawings/

论坛讨论链接：https://news.ycombinator.com/item?id=47977990

讨论把 underdrawing 类比到 LLM 编程：先定义架构、接口或 SQL 目标，再让模型在一个抽象层级内工作，而不是让它同时承担规划、计算和呈现。有人总结说，LLM 擅长一次处理一个抽象层级，你可以从高层走到低层，但要分步迭代。争议点在“基础限制”这个词：一些人认为模型过去被认为做不到的字符计数、算术等任务正在被硬训练补上；另一些人则认为这恰恰说明应该把计算、计数交给工具，而不是让 transformer 用大量参数硬记。

7. macOS 打出来的 tar，为什么到 Linux 上会报错？ (Tar Files Created on macOS Display Errors When Extracting on Linux (2024))

这篇文章解释了 macOS 上创建的 tar 文件在 Linux 解压时常见的告警来源。macOS 会在归档中包含 AppleDouble 元数据文件，例如 ._filename，用于保存资源 fork、扩展属性、Finder 信息等 HFS+/APFS 生态中的额外元数据。当这些 tar 包被放到 Linux 上解压时，GNU tar 或其他工具可能会看到不认识的扩展属性、PAX header 或 Apple 特有条目，于是输出 Ignoring unknown extended header keyword、Cannot change ownership 或相关警告。解决方式通常包括创建归档时设置 COPYFILE_DISABLE=1，避免写入 AppleDouble 文件；用 --disable-copyfile 等工具选项；或者在解压前过滤 ._*、.DS_Store 这类条目。文章的实际价值是提醒跨平台归档不只是文件内容，还会携带操作系统元数据习惯。

原文链接：https://aruljohn.com/blog/macos-created-tar-files-linux-errors/

论坛讨论链接：https://news.ycombinator.com/item?id=47961208

HN 讨论围绕 macOS 元数据到底是有用功能还是跨平台污染展开。有人认为资源 fork 和扩展属性是 Mac 生态长期特性，问题在于把本地语义打包给不理解这些语义的系统；也有人认为 .DS_Store、._* 这些文件在共享目录和 tar 包中反复出现，非常烦人。评论还延伸到 GNU tar、bsdtar、libarchive 对 PAX headers 和 xattrs 的处理差异。整体共识是，如果归档要给 Linux 或 CI 使用，最好显式关闭 macOS copyfile 元数据，而不是默认相信 tar 输出可移植。

8. Atom 订阅格式回到首页：那个没完全赢下 RSS 的 XML 标准 (Introduction to Atom)

W3C Feed Validation Service 的 Atom 介绍文档解释了 Atom Syndication Format：它是基于 XML 的内容与元数据聚合格式，也是用于发布和编辑周期更新网站资源的应用层协议。Atom feed 必须是 well-formed XML，媒体类型为 application/atom+xml，元素位于 http://www.w3.org/2005/Atom 命名空间，时间戳遵循 RFC 3339。文档给出示例 feed，并列出 feed 和 entry 的必需、推荐和可选元素。feed 至少需要 id、title、updated；通常还会有 author、link、category、generator、icon、logo、rights、subtitle。entry 同样需要稳定 id、非空 title 和 updated，并推荐提供 author、content、link 等。它代表了 2000 年代试图把 Web 内容订阅做得更规范的一条路线。

原文链接：https://validator.w3.org/feed/docs/atom.html

论坛讨论链接：https://news.ycombinator.com/item?id=48002089

评论第一反应是“Atom”这个名字已经被太多项目复用，但随后转向 RSS/Atom 的历史。有人指出 Atom feed 早在 2005 年就存在，曾经很重要，也被很多 feed reader 和平台支持，只是普通用户常把所有订阅都叫 RSS。争论点在于它是否“失败”：播客世界基本仍是 RSS 2.0，但 WordPress、YouTube 等仍能输出 Atom 或类似 XML feed。也有人把 syndication 衰落归因于社交平台不愿让用户通过开放格式离开围墙花园。

9. 好抽象的隐藏成本：门槛降低后，判断好坏反而更稀缺 (The ‘Hidden’ Costs of Great Abstractions)

这篇短文反思计算机行业不断抽象复杂性的代价。抽象让人能关注更大图景，也降低了进入门槛，但作者认为它同时降低了理解的保真度：早期运行程序昂贵、错误成本高，开发者必须理解机器细节；后来内存和算力增长，库和框架让人不再关心字节和周期；现在 LLM 让几乎任何人都能用提示生成“看起来能用”的软件。问题在于，功能可用不等于质量好，判断好坏本身需要专业知识。作者用“黄铁矿和黄金”“看起来像钢材但不能拿去盖楼”的比喻说明，低成本产出会带来大量足够便宜、足够像样但未必可靠的东西。文章最后带有明显个人困境：作者受伤后不能从事体力工作，自 2025 年 7 月失业，尝试简历、求职、Claude 做原型和冷邮件后仍未找到出路。

原文链接：https://jdgr.net/the-hidden-costs-of-great-abstractions

论坛讨论链接：https://news.ycombinator.com/item?id=48002607

评论区明显更像行业处境讨论。有人直言，软件开发者过去的高薪和安全感部分建立在竞争不充分、软件难以生产的商业环境上；AI 让很多业务目标更容易达成，会削弱对深厚基本功的需求，即使这未来可能反噬质量。反对者则认为，把软件交给不懂技术和不在乎质量的人管理，会制造大量 foot-gun，基础设施迟早出事。讨论没有简单结论，但共同承认一点：AI 降低生产门槛后，真正稀缺的可能变成判断、责任和长期维护能力。

10. 一个月在健身房搭话 35 个陌生人：反社恐的实测报告 (Talking to strangers at the gym)

作者毕业近两年后发现自己几乎没有朋友，于是把“在健身房认识人”设计成一个月实验。网上常见建议是“和别人一起做你的爱好，并且经常出现”，健身房正好是他几乎每天去的地方；但 Reddit 上也有大量人讨厌被打扰，这让本来就害怕尴尬的作者非常紧张。他决定每天选一个经常见到的人主动开口，最初统一用“我经常看到你，你很强，你练什么 split？”作为开场，后来根据帽子、学校、训练动作等定制问题。目标是聊 5 到 10 分钟，并尽量不由自己提前结束。文章详细记录了 35 次对话的对象、时长、备注和后续互动，有些人只回答一句离开，有些人成为每周会聊的熟人，也有人主动给训练建议或分享计划。

原文链接：https://thienantran.com/talking-to-35-strangers-at-the-gym/

论坛讨论链接：https://news.ycombinator.com/item?id=48007438

HN 讨论喜欢这篇文章的原因是作者没有明显功利目的，而是在真诚称赞和接触别人。有人引用《How to Win Friends and Influence People》里 Dale Carnegie 赞美邮局职员头发的故事，强调真正的赞美不应总是为了从对方身上获得什么。评论也提到，这本书常被误解成操纵术，但其中也有“无所求地给别人一点快乐”的朴素部分。整体讨论比技术帖更温和，焦点是成年后交朋友的困难、真诚搭话的风险，以及反复练习如何降低社交恐惧。