1. 凯撒的最后一口气:每一次呼吸都是历史的回响 (Caesar’s Last Breath)
惊不惊喜?我们每次呼吸,竟然都会吸入大约一个来自凯撒大帝临终之息的分子!这是一个令人惊叹的结论,源于一次经典的费米估算练习,它告诉我们,每一次呼吸,都与历史上所有呼吸过的人——苏格拉底、林肯、爱因斯坦——息息相关。
这项估算基于大气均匀扩散和分子守恒的假设,通过计算凯撒最后一口气在大气中所占的比例,再乘以每次呼吸所包含的分子数量得出。虽然其中包含一些简化,但估算结果依然可靠。计算过程用到了地球半径、大气厚度、呼吸体积等“锚定值”,这些数值本身也需要通过费米估算来获得。文章还鼓励读者通过实践来掌握这项有用的技能,并提供了一些有趣的练习资源和软件工程领域的应用案例。总而言之,这个估算结果令人着迷,它让我们以一种意想不到的方式与历史产生了连接。
原文链接:https://charliesabino.com/caesars-last-breath/
论坛讨论链接:https://news.ycombinator.com/item?id=44073185
论坛中的讨论围绕费米估算问题展开,例如“一个棒球场能装多少个高尔夫球?”以及“纽约市有多少辆出租车?”。有人认为,这类问题常被用作衡量“智力”的指标,擅长解决这类问题甚至可以弥补特定知识的不足。
一些人分享了他们面试时遇到的类似问题,例如估算纽约市出租车的数量。有人认为,比起让应聘者估算,不如让他们学会在网上查找官方答案并验证来源的质量。但也有人反驳说,判断信息来源质量的关键在于辨别其答案是否明显偏离实际数量级。
还有人分享了估算技巧,例如先估算曼哈顿的出租车数量,再推算到其他四个区。一些人觉得估算出租车数量比估算棒球场能装多少高尔夫球更容易,因为他们对前者涉及的数量更有概念。论坛中也有人承认自己不擅长估算单位,认为这更像是一种直觉,而非智力。另一些人则分享了自己估算长度的技巧,例如用小指的宽度作为参考。
2. VS Code PostgreSQL扩展重磅发布:告别繁琐,迎接智能数据库开发新纪元 (Postgres IDE in VS Code)
微软于2025年5月19日发布了Visual Studio Code (VS Code) 的全新PostgreSQL扩展的公开预览版,旨在简化PostgreSQL数据库管理和开发流程,让开发者们欢呼雀跃!
面对开发者们在时间管理上的挑战,以及高达50%的时间花费在调试代码和数据库上的现状,这款扩展应运而生。它集成了Postgres数据库工具和@pgsql GitHub Copilot智能助手,打造统一的应用开发和数据库管理体验。通过Entra ID认证实现集中身份管理,并深度集成Azure Database for PostgreSQL,开发者们可以专注于创新应用的构建,告别繁琐的工作流程。
这款扩展带来了一系列强大功能,包括便捷的数据库模式可视化、数据库感知的GitHub Copilot AI助手,能使用自然语言轻松查询数据库、优化模式和执行SQL操作。此外,它还具备GitHub Copilot Chat代理模式,提供数据库上下文感知的智能助手,可以执行多阶段任务,甚至在用户授权下自动编写和调试代码。连接管理也得到简化,支持多种连接配置文件,并能直接浏览和过滤Azure Database for PostgreSQL部署。
论坛讨论链接:https://news.ycombinator.com/item?id=44073588
论坛有用户讨论将数据库模式纳入版本控制的问题。有人提到自己创建了一个名为”pgstrap”的npm包,用于生成数据库结构目录,以便LLM可以使用,并简化代码审查。他认为,将代码库与数据库上下文关联起来,或者让编辑器具备数据库感知能力,各有优劣。虽然VS Code有成为“开发中查看数据库的标准方式”的潜力,但数据库浏览器GUI尚未出现绝对的赢家。
另一些用户认为,将数据库模式的规范状态与所有迁移一起纳入版本控制,是每个Web框架的标准做法。但也有人指出,schema可能针对特定语言的ORM编写,运行时才能确定具体的SQL schema。
有人强调,生产数据库才是规范状态,版本控制中的内容只是希望能够重现它。对于开发而言,数据的特征(例如字段的基数、访问频率)比数据本身更重要,索引通常会反映这些特征。
也有用户不理解为何要将数据库的整个schema纳入使用该数据库的项目的版本控制中,其他人解释说,应用程序的数据库schema与代码紧密耦合,迁移也需要纳入版本控制,这样可以跟踪schema随时间的变化,以及使用schema的查询。当多个应用程序共享一个数据库时,通常会有一个专门的存储库来存储schema和迁移。总之,以代码形式管理schema对于变更控制和搭建开发数据库等原因至关重要。
3. 放弃传统证书:我的 HTTPS 站点拥抱 Let’s Encrypt 自建之路 (Why I no longer have an old-school cert on my HTTPS site)
瑞秋(Rachel)分享了她克服对ACME协议的反感,并最终成功为自己的网站部署Let’s Encrypt证书的经历。她长期以来对ACME协议的复杂性感到厌恶,同时也对现有客户端代码的安全性表示担忧。为了摆脱对Gandi依赖,她决定自己动手,逐步分解问题,编写小型实用工具库,最终成功创建了一个简陋但有效的ACME客户端。
整个过程充满了挑战,瑞秋需要应对各种编码问题、JSON处理以及复杂的HTTP请求。她还发现了一个有用的Pebble测试服务器,用于在不影响真实环境的情况下进行开发和调试。最终,她成功地用自己编写的工具获取了Let’s Encrypt的证书,并在网站上部署。
瑞秋还分享了她最初对ACME协议的一些看法,并提供了关于如何实现ACME客户端的详细步骤,包括生成RSA密钥、创建CSR、处理JSON数据、生成签名等。她强调了协议的复杂性,但也鼓励其他有类似想法的人挑战自我,亲手构建自己的解决方案。她还发现现有ACME客户端的编码错误,即使存在异常也能正常工作。
原文链接:https://rachelbythebay.com/w/2025/05/22/ssl/
论坛讨论链接:https://news.ycombinator.com/item?id=44071690
论坛上有用户表达了对ACME和Let’s Encrypt (LE) 的复杂情感。他宁愿每年手动购买和激活证书,也不愿使用所谓的“自动化”流程。虽然最初Gethly.com也是如此操作,但商业证书价格昂贵,且相比免费的LE证书并无优势,尤其是通配符证书。因此,他决定切换到使用DNS挑战的LE,这成为了一个半自动化过程。DNS供应商在证书即将过期时发送通知,然后用户只需花费两分钟登录DNS供应商的界面,复制证书并粘贴到运行中的应用程序即可。虽然使用DNS供应商的API进行DNS挑战是可行的,但ACME未能检测到更新的记录,幸好DNS供应商提供了支持。
另一位用户讨论了JSON处理大整数的问题。JSON解析器可能无法正确处理大整数,可能会截断为64位整数、浮点数,或者抛出错误。因此,将大整数编码为其他格式(如Base64编码的大端字节)是更可靠的选择。虽然这牺牲了JSON的可读性,但可以避免潜在的安全问题。用户认为JSON胜过XML,但Canonical S-表达式本应是更好的选择。
有评论反驳了Canonical S-表达式的观点,认为JSON的胜出是因为其易于手写、编辑和阅读。Canonical S-表达式不易读,手动编写困难,需要为每个原子添加长度前缀,这使得手动编辑变得繁琐。
4. AI判断大翻车:位置偏好、顺序效应、提示敏感性联手作祟 (Positional preferences, order effects, prompt sensitivity undermine AI judgments)
大型语言模型(LLM)正越来越多地应用于招聘、医疗、法律等敏感领域,但一项最新研究表明,LLM在决策时可能存在偏见,其判断的可靠性受到质疑。研究人员发现,LLM在进行A/B选择时,倾向于选择“Response B”,概率高达60%-69%。此外,评分标准呈现顺序会显著影响结果,“清晰度”等标准在最后评估时得分会降低约3.5%。
更令人惊讶的是,即使是旨在消除偏见的提示,有时反而会加剧偏见。例如,指示LLM“避免任何位置偏见”的提示,反而使其更倾向于选择第二个选项。分类任务也极不稳定,提示结构、类别顺序和定义措辞的微小变化都可能导致模型改变分类结果。
研究人员强调,LLM并非传统计算机程序那样精确,prompt工程更多的是一种“playing”。他们建议,应谨慎使用LLM进行系统性评估和判断,并采取多种措施来提高其鲁棒性,包括使用中性标签、改变呈现顺序、验证所有prompt组件,并对模型进行多样化选择。此外,还应避免盲目追求与人类偏好匹配,而应力求客观、公平和一致的输出。研究团队还开源了测试工具,呼吁大家共同参与,提升AI判断的可靠性。
原文链接:https://www.cip.org/blog/llm-judges-are-unreliable
论坛讨论链接:https://news.ycombinator.com/item?id=44074668
论坛上的讨论主要围绕大型语言模型(LLM)对语言的敏感性展开。一位开发者分享了实验结果,指出LLM的回答质量和准确性高度依赖于系统提示的顺序、语言选择、长度以及示例的详细程度等多种因素。他认为LLM的“推理和思考”本质上是基于tokens的统计数据分布,而非内在的世界表征。因此,寻找与特定LLM沟通的最佳方式至关重要,他正在开发一个自动校准系统来优化系统提示和其他超参数。
另一位参与者部分同意这一观点,但对语言的例子提出了质疑。他引用了Anthropic的研究,认为LLM确实存在能够概括抽象概念的“概念神经元”,这些概念可以在不同语言之间转换。问题在于,这些概念在训练过程中被编码到中间层,吸收了训练数据中存在的偏见,导致模型容易受到排序或措辞的影响。
还有人对这类研究持保留态度,认为它们通常依赖于精心挑选的例子,使模型的行为显得比实际情况更一致和可靠。他以Word2Vec的例子为例,说明某些看似有效的模式可能并不具有普遍性,并指出卷积神经网络也存在类似的问题,即并非总是能学习到易于解释的图像特征。
5. 美国“极简”生活:月 खर्च 432 美元不是梦 (How to live on $432 a month in America)
在美国每月仅用432美元生活?这并非天方夜谭!作家A.M. Hickman在纽约州北部小镇马塞纳找到了可能性。当地一套600平方英尺的房屋售价仅2.9万美元,甚至可能2万美元就能成交,加上当地廉价的电力(0.04美元/千瓦时)和低廉的公交系统,以及当地Amish社区提供的廉价食物,生活成本大大降低。
Hickman认为,许多年轻人对高房价和就业市场感到沮丧,但往往忽略了美国乡村地区的机会。马塞纳虽地处偏远,但自然资源丰富,拥有优质的土壤、充足的水源,且临近加拿大城市。通过拥抱更简单的生活方式,比如减少不必要消费、利用当地资源(如图书馆、钓鱼),年轻人不仅能摆脱经济压力,还能为这些亟需活力的地区注入新生命,重塑“美国梦”。作者鼓励大家摆脱对城市生活的迷恋,重新审视乡村的潜力,或许就能发现意想不到的惊喜。
原文链接:https://shagbark.substack.com/p/how-to-live-on-432-a-month-in-america
论坛讨论链接:https://news.ycombinator.com/item?id=44074340
论坛上的讨论主要围绕文章提出的“低成本生活,减少工作时间”这一理念展开,但讨论者们也提出了该理念的局限性,特别是社交联系方面。
有人指出,即使降低生活成本,搬到偏远地区,与家人朋友的联系也会变得非常困难。考虑到交通成本和距离,一年可能只能见几次面,而亲情友情是无法替代的。对于重视社交的人来说,这会成为难以克服的障碍。
另一些人则关注到地理位置的特殊性,文章中提到的地点靠近加拿大边境,从蒙特利尔机场出入境美国都需要多次过境,这增加了时间和不确定性。虽然有人提到该地也有一个国际机场,但实际上航班选择非常有限,主要依靠政府补贴。
也有观点认为,如果能够找到当地活跃的社交群体,例如通过共同的爱好(如网球、攀岩等),可以缓解社交缺失的问题。
6. 找到你的同路人 (Find Your People)
Y Combinator 创始人 Paul Graham 在 Bucknell 大学 2025 届毕业典礼上发表了一场别开生面的演讲。他坦诚回忆自己毕业时的迷茫,没有目标、没有方向,并鼓励毕业生们主动规划人生,打破固有轨道,勇敢地“重新发明自己”。
Graham 建议毕业生们积极探索,不要害怕被拒绝,要多与有趣的人交流,发掘自己的兴趣所在,并为之努力。他分享了 Y Combinator 早期不被看好的经历,正是因为坚持自己的想法,才最终获得了成功。他还强调,找到自己热爱的事业,并全身心投入,才能变得更有雄心壮志。
Graham 鼓励毕业生们不要害怕与众不同,勇敢追求自己的梦想,因为那些看似疯狂的想法往往蕴藏着巨大的潜力。这场充满智慧和鼓励的演讲,无疑将激励着新一代的年轻人勇往直前,开创属于自己的精彩人生。
原文链接:https://foundersatwork.posthaven.com/find-your-people
论坛讨论链接:https://news.ycombinator.com/item?id=44074017
论坛的讨论围绕着大学毕业后的职业发展方向展开,有人赞同演讲者在结尾的总结,并指出许多大学生没有意识到毕业后“轨道”的消失,他们长期专注于下一个目标,却对未来的不确定性感到惊讶。另一些人则认为,继续提供“轨道”的毕业后选择,如研究生院或大型科技公司,往往被视为更“有声望”的选择,但这主要是因为这些选择提供了明确的成就感和外部认可,吸引了那些习惯以成就来衡量成功的人。同时,有人指出,选择研究生院并非完全出于声望的考虑,更多是出于对学术的热爱,而选择FAANG等公司则是看重其优厚的薪酬待遇,这可以实现人们对大学教育的财富梦想。总的来说,讨论突出了大学生在职业选择上的不同心态和追求,以及“轨道”的延续与否对他们的影响。
7. 法国大革命孕育“米”:一段长度单位的变革史 (The metre originated in the French Revolution)
1875年的《米制公约》奠定了现代公制的基础,但“米”的定义却经历了多次变革。最初,法国大革命时期,科学家们将经过巴黎天文台从北极到赤道距离的千万分之一定义为一米。由于测量存在误差,实际长度与最初定义略有偏差。
随着科技发展,米的定义不断演进。早期的铂铱合金米尺逐渐被淘汰。1960年,科学家们利用氪-86发出的特定波长的光重新定义了一米。而如今,得益于原子钟的精确计时和对光速的认知,自1983年起,一米被定义为光在真空中1/299,792,458秒内传播的距离。
这个新定义不仅提高了测量精度,还开创了新的测量方法。例如,通过向月球上的反射镜发射激光,科学家们能够精确测量地月距离,并发现月球正以每年3.8厘米的速度远离地球。尽管公制系统已被广泛采用,但部分国家,如美国,在日常生活中仍使用英制单位。澳大利亚的餐桌计量也存在“一澳式汤匙等于四茶匙”这样的小小差异。
论坛讨论链接:https://news.ycombinator.com/item?id=44073867
论坛上关于法国大革命时期十进制时间的讨论,最初由一人分享了关于当时采用10小时制日期的趣闻。另一位评论者指出,虽然法国革命时期确实使用了十进制时间,但取消星期日礼拜对民众产生了意想不到的影响,引述历史学家Michel Vovelle的观点,认为这使得人们失去了社交和娱乐的机会,尤其是对年轻人而言,导致社会关系的紧张。随后有人指出,共和历的真正目的是削弱教会的权力,并降低工人的周末休息频率。但实际上,人们并没有遵守新的日历,仍然在星期日去教堂,因此前述引用的观点可能存在党派偏见。最后,有人对此提出疑问,认为在法国大革命最糟糕的时期,教堂可能都被关闭了,例如巴黎圣母院等天主教堂被改造成理性圣殿,用于庆祝新的国教——理性崇拜。