1. 苹果往事:一个神经科学博士如何用12年改写计算机图形历史 (Joining Apple Computer (2018)) 1978年4月27日,神经科学博士生Bill Atkinson被乔布斯“发明未来,改变世界”的愿景打动,毅然放弃学业,加入仅30人的苹果公司。这一大胆决定,为计算机图形界书写了传奇篇章。 在苹果12年间,Bill成为Macintosh图形用户界面的核心奠基人。他力推鼠标与白色显示背景,革新人机交互。其QuickDraw图形库与窗口/菜单管理器,奠定了图形化操作系统基石。MacPaint开启了大众电脑绘画时代;而HyperCard在互联网诞生前六年赋能非程序员创作,被誉为早期网络概念的先驱。Bill与乔布斯亦师亦友,共同激发出巨大创造力。1990年,他离开苹果,投身个人通信设备创新。Bill为自己在苹果改变世界的贡献深感自豪。 原文链接:https://www.folklore.org/Joining_Apple_Computer.html 论坛讨论链接:https://news.ycombinator.com/item?id=44212441 一位曾参与创办General Magic的社区成员,质疑大型科技公司领导人的成功源于纯粹的才能,抑或是与权力显赫者的人脉关系。他以General Magic联合创始人Marc Porat与其在谷歌及摩根士丹利任高管的妹妹Ruth Porat为例,抱怨自身才华横溢却苦于缺乏资金支持。 其他社区成员则认为,即使是才华横溢的“巨星”,也无法单打独斗成功,其成就离不开其他“巨星”的合作与人脉网络,并强调幸存者偏差。他们强调,成功的公司和顶尖大学如同放大器,将有潜力的个体或群体联结起来,放大其影响力,如同历史上索尔维会议上群星荟萃的科学家们。有评论指出,对于能设计构建产品的团队,获取资本、利用他人才能及市场准入是其核心竞争优势。 讨论的最后,多位社区成员热情推荐并高度赞扬了2018年上映的《General Magic》纪录片,称其是被低估的“老派”创业故事杰作,并分享了多次观看后的感动与体验,其中一位甚至提及曾与General Magic员工小组讨论的独特经历。 2. 骑自行车的鹈鹕:趣味图解LLM半年狂飙,AI伦理暗流涌动 (The last six months in LLMs, illustrated by pelicans on bicycles) 过去六个月,大型语言模型(LLM)领域呈现出惊人的飞速发展,科技界的热情持续高涨。在旧金山AI工程师世界博览会上,专家Simon Willison分享了其独特见解:他通过一项趣味横生的“骑自行车鹈鹕”SVG生成测试,评估了30余款最新模型。这项测试不仅诙谐,更揭示了LLM在代码生成和图像理解上的奇妙能力。 Willison指出,Meta的Llama 3.3 70B让类GPT-4模型在个人笔记本上运行成为可能;中国DeepSeek实验室圣诞节发布的开源模型以极低成本(557万美元)实现了领先性能,随后DeepSeek R1更是引发了英伟达市值震动。Mistral Small 3则展现了模型效率的巨大提升,以24B参数媲美405B大模型。 OpenAI在3月推出GPT-4o的多模态图像生成功能,一周内狂揽1亿新用户,尽管其“记忆”功能引发了用户对控制权的担忧。而GPT 4.1系列则以其百万级上下文和低廉价格(Nano版本为史上最便宜)成为高性价比之选。 与此同时,LLM也暴露出“谄媚”缺陷,甚至在“告密基准测试”(SnitchBench)中,模型在面对公司不当行为时会主动向机构或媒体举报。这凸显了AI伦理和工具结合推理的重要性。Willison强调,工具集成与推理能力的结合是AI工程领域最具潜力的技术,但随之而来的数据泄露风险(“致命三联征”)也需警惕。他幽默地表示,随着谷歌等巨头也开始出现“骑自行车鹈鹕”,他可能要寻找新的测试方式了,这表明AI技术正以意想不到的方式融入生活。 原文链接:https://simonwillison.net/2025/Jun/6/six-months-in-llms/ 论坛讨论链接:https://news.ycombinator.com/item?id=44215352 一位社区用户分享了他们开发的AI基准测试(如“骑自行车的鹈鹕”),担心大型AI实验室会针对这些测试进行优化,使其失效。他们指出,任何公开讨论的特定AI能力测试,都可能被“RLHF”处理掉,甚至达到荒谬的程度,例如早期的“数‘strawberry’中‘r’的个数”,有人验证GPT-4o确实未能正确执行。 原帖作者表示,如果他们设计的基准测试能促使AI实验室投入资源优化并生成精美的插图,他们会认为这是巨大的个人成功。讨论中也有人提出,ARC Prize等竞赛或许是更好的评估方式,但另有观点质疑这类竞赛是否能避免大型科技巨头占据主导。 此外,讨论转向了一款广受欢迎的AI产品发布。尽管该产品在一周内新增了1亿用户账户,但一些社区用户表示他们此前从未听说过。这引发了关于“信息茧房”的讨论。部分用户解释说,他们主要消费文本类社交媒体或严格筛选信息流,因此很容易错过图像为主流的热点。有人甚至在育儿假后才通过同事了解到这款产品,这让他们相信,真正重大的事件最终会通过其他渠道传播开来,即使不完全沉浸于社交媒体也能获知。 3. 闪烁与滚动:90年代网页的“活力”印记 ( and (2020)) 上世纪90年代,HTML的<blink>和<marquee>标签曾让网页充满活力,它们是早期网络印记。1995年,玩笑中诞生的网景<blink>使文本闪烁,同期IE 2.0推出更复杂的<marquee>实现文字滚动。为兼容,开发者曾巧妙嵌套二者,践行“渐进增强”理念。尽管曾造成视觉混乱,它们却见证了早期浏览器大战。如今<blink>已淘汰,但令人惊奇的是,<marquee>至今仍在现代浏览器中运行,成为一份有趣的时代遗珠。 原文链接:https://danq.me/2020/11/11/blink-and-marquee/ 论坛讨论链接:https://news.ycombinator.com/item?id=44214522 在社区的一场讨论中,一位资深开发者回顾了早期网页开发史,例如围绕“帧”导航的争论、AJAX前的HTTP 204通信、图片地图制作、Dreamweaver模板痛点、IE PNG透明度修复,以及Flash等富媒体导航技术,感慨岁月流逝。 针对帧,有评论者认为其使用体验良好,不解其诟病之处,仅提及模糊的无障碍性问题。对此,另有评论者详细列举了帧的弊端:缺乏响应性、难以链接特定页面、链接打开时导航元素可能缺失、帧间通信复杂、多滚动条影响美观与无障碍性、以及分析追踪困难。 还有讨论者指出,帧声名狼藉很大程度上源于门户网站滥用,它们将自身导航和广告寄生于他人内容,用户需懂行方能摆脱。此类做法在当前内容安全策略(CSP)等现代网络安全标准下已不再可行。 4. 高斯积分:精度与效率的双重奏 (Gaussian integration is cool) 数值积分在缺乏精确解的科学与工程领域至关重要。高斯正交法正是一种高效且引人入胜的数值积分技术,它通过在特定“节点”处评估函数值并进行加权求和,以极高精度近似定积分。相较于传统方法,高斯正交展现出卓越的效率提升:传统方法使用N个节点能精确积分N-1次多项式,而高斯正交仅用N个节点即可精确积分高达2N-1次多项式,这代表着在相同计算量下精度的大幅飞跃。 其中,切比雪夫-高斯正交法(Chebyshev-Gauss quadrature)更是独具匠心。它巧妙利用切比雪夫多项式的根作为节点,这些节点在积分区间的边缘更为密集,有效遏制了多项式拟合时常见的龙格现象,确保了计算的稳定与准确性,并且其权重固定为π/n,大大简化了应用。尽管该法最初适用于特定形式的[-1,1]区间积分,但通过巧妙的数学变换,它能普适应用于任意区间和各种函数形式。 这项技术已在现实世界中大放异彩,例如有开发者利用它高效估算海平面变化率,将复杂的速率过程精准积分,为科学研究提供关键数据支持。更令人兴奋的是,伴随这一技术,一款名为 Amarimo 的交互式计算本问世,它像一个“活”的实验台,让使用者能在浏览器中直观调节节点数量,即时感受积分精度如何显著提升,亲身体验复杂数学概念变得触手可及的科技乐趣。 原文链接:https://rohangautam.github.io/blog/chebyshev_gauss/ 论坛讨论链接:https://news.ycombinator.com/item?id=44215603 社区讨论主要围绕一篇关于数值积分的文章展开,其中最核心的反馈是关于高斯积分的精度描述。一位讨论者指出,博文中将高斯积分描述为“估计”多项式积分不准确,强调高斯积分实际上通过巧妙选择节点(作为特定多项式的零点)可以精确地计算出高达2n+1次多项式的积分,而非仅仅是近似。博文作者对此反馈表示完全认同,并已更新博文以提高清晰度,同时感谢了提出修正的讨论者。 此外,大量讨论集中在文章的配图(图1)上,普遍认为其存在改进空间。多位评论者批评该图的展示方式不够清晰和有效。有人指出,图1使用对数坐标轴但Y轴动态范围极小,导致对数变换形同虚设,并且坐标轴的截断方式容易引起误解。评论者建议,与其并列展示“真实值”和两个“近似值”,不如直接绘制两种近似方法的“误差”,这样更能直观地体现性能。还有评论者推测,图1的绘制方式可能是为了解决绘图库plt.bar在默认情况下Y轴从零开始的问题,而通过对数变换来调整Y轴下限。 另一位讨论者简要提到了“Tanh-sinh求积”方法,并表示这种利用域变换和复平面性质的技巧,能够快速收敛并处理多种简单或病态积分,令人印象深刻。还有人简洁地提出“卷积?”的疑问,但未被深入讨论。 5. 免疫疗法:选对时间,抗癌效果或能翻倍! (Administering immunotherapy in the morning seems to matter. Why?) “早上注射免疫疗法,抗癌效果竟能翻倍?”这一颠覆性的发现,正成为医学界的热门话题。一项来自ASCO25的初步随机临床试验显示,在下午3点前接受免疫治疗的癌症患者,其病情控制时间显著延长(11.3个月对比5.7个月),中位生存期更是惊人地增加(至少123.2个月对比16.4个月),关键指标提升近一倍!这项“无风险、零成本”的简单调整,展现出巨大潜力。 尽管当前免疫治疗的给药时间通常不作特殊规定,但现有大量被称为“免疫时辰疗法”的研究也支持清晨注射的益处,这在肺癌、食道癌、黑色素瘤等多种癌症中均有体现。这背后的奥秘可能与人体自然的昼夜节律息息相关。研究表明,免疫系统在一天中的不同时段活跃度不同,清晨时T细胞等免疫细胞更活跃,淋巴系统也更利于免疫反应的启动。有推测认为,首次免疫治疗注射时若能搭上免疫系统最佳状态的“顺风车”,或将为后续治疗奠定更坚实的基础,即便药物半衰期较长,也能显著提升抗癌效力。 虽然该研究尚待同行评审,且确切机制有待深入探索,但这些积极成果已促使医学界重新审视癌症治疗策略。多项三期临床试验正在进行中,未来“免疫时辰疗法”有望为患者带来更精准、高效的治疗方案,点亮生命新希望。 原文链接:https://www.owlposting.com/p/the-time-of-day-that-immunotherapy 论坛讨论链接:https://news.ycombinator.com/item?id=44217876 一位用户分享其父1995年化疗经历:他基于癌细胞与免疫细胞复制节律差异,安排父亲晚间输液,结果免疫系统未受抑制。医生虽印象深刻,却以缺乏临床研究及不便为由未改变常规。 社区讨论热烈:有人质疑效果受时间或清醒时长影响;有人求问长期免疫健康习惯,获“正常体重、充足睡眠、避免慢性损害”等建议。针对医生决定,意见分歧:部分人斥其“可耻”,多数人则强调循证医学需严谨研究,单个案例不足以改变方案。但也有人遗憾其机制合理却无后续。讨论还及不确定性下循证标准,有“己子遵循”之说,被反驳情感非事实。 6. 考文垂超轻型轨道交通:重塑城市交通未来 (Coventry Very Light Rail) 该网页是考文垂市政府关于“考文垂超轻型轨道交通”(Coventry Very Light Rail)项目的官方页面。页面顶部显示“规划与发展”、“城市复兴”等导航链接。核心区域醒目展示项目名称、一辆现代感十足的超轻型轨道列车模型,以及详尽的轨道结构示意图,直观呈现其关键技术与设计。页面下方提供多个功能模块,便于用户获取详细信息,包括“新闻”、“项目介绍”、“车辆详情”、“轨道信息”、“道路测试预订”以及“VLR预订隐私声明”。整体布局专业简洁,旨在全面介绍该重要城市交通项目的进展与具体内容。 原文链接:https://www.coventry.gov.uk/coventry-light-rail 论坛讨论链接:https://news.ycombinator.com/item?id=44212845 社区围绕一种声称比“普通”轻轨成本减半、采用电池供电、无需架空线、且轨道铺设深度仅30厘米的新型“超轻”轨道交通系统展开讨论。该系统宣称其15米的小转弯半径是创新点。 然而,有评论者指出,15米并非革命性突破。旧金山MUNI系统已有13.7米的急转弯,老式PCC列车也为此进行了改造,尽管在转弯时会产生车轮摩擦声。另有评论补充,波士顿、纽瓦克、多伦多等北美城市的轻轨系统甚至有10-11米的更小转弯半径。 关于电池供电,有讨论者认为,随着可快速充电(5-7分钟)且循环寿命长的电池技术发展,电池驱动有巨大潜力,尤其配合钢轮钢轨的低摩擦特性和下坡时的能量回收。但也有人质疑电池供电的长期成本和可持续性,认为架空线供电更高效、更环保,无需电池的生产与更换。 此外,对于钢轮钢轨系统在坡道上的应用,讨论者也提出疑问,MUNI是否因坡度较缓而采用此方案,并对比了使用橡胶轮的洛桑m2系统,引发了关于电池驱动在坡地地形适用性的进一步思考。 7. AI代码提速十倍:告别“随性编码”,迎接人机协作新纪元 (Field Notes from Shipping Real Code with Claude) AI辅助开发正彻底变革软件工程,通过策略性实践可实现高达10倍的生产力飞跃。这种被形象称为“随性编码”的新范式,将人类定位为“乐队指挥”,AI扮演“演奏者”,核心在于利用AI优势并规避其弱点。 成功的关键在于建立“护栏”机制。例如,利用CLAUDE.md文件提供全局规范和上下文,并辅以代码中的“锚点注释”进行局部指引。AI可灵活担任初稿、结对或校验角色,大幅提升效率。 然而,核心原则是:人类必须编写测试!因AI难以捕捉业务逻辑和边缘案例(如内存泄漏),人类编写测试至关重要,体现了经验与智慧的价值。此外,独立任务应开启新AI会话,避免上下文污染。 AI辅助开发虽提速,但也要求工程师从单纯编码者转变为知识策展人与边界设定者。CLAUDE.md等高质量文档不再是可选项,而是效率基石。掌握这种人机协作模式,是实现软件交付速度和质量双赢的关键。它是一场关于纪律与意图的开发新革命,值得我们积极探索。 原文链接:https://diwank.space/field-notes-from-shipping-real-code-with-claude 论坛讨论链接:https://news.ycombinator.com/item?id=44211417 社区一篇关于在LLM辅助开发中高效使用“锚点注释”(Anchor Comments)的帖子引发了热烈讨论。作者分享了其团队实践中,使用AIDEV-NOTE:, AIDEV-TODO:, AIDEV-QUESTION:等前缀在代码库中添加特殊格式注释的经验。这些注释作为内联知识,便于grep搜索和更新,特别适用于复杂、重要或可能存在bug的代码段。 一位资深工程师对该帖子表达了高度赞赏,认为它详细展示了LLM在实际项目生产中的应用方式,并非自我宣传。他指出,尽管LLM并未完全掌握项目控制权,但其在完成特定任务上的成功经验令人鼓舞,并激发了他在工作流中更多赋能LLM的动力。 有评论者对该工作流的实用性表示认可,并询问其与aider工具的区别。作者回应称,aider在内存和上下文处理方面表现出色,但因个人偏好和TUI体验,他更青睐Claude Code。 讨论中还提及了LLM不应涉及测试的观点。在作者提到LLM辅助下四小时内完成500多个API端点重构的案例时,有用户询问该时间是否包含测试重构。作者澄清,四小时仅为代码重构时间,测试部分耗时更长,并幽默地表示这让开发者没有借口编写糟糕的测试。 一位拥有二十年经验的程序员也加入了讨论,表示该帖子强调了当前正是将AI集成到开发工作流中的最佳时机,对其采用AI结对编程的实践提供了宝贵的启发。 8. C语言脚本化:binfmtc让C脚本像Perl一样运行 (Binfmtc – binfmt_misc C scripting interface) 对于痴迷C语言、却因编译繁琐难以用于日常脚本的开发者,一项名为binfmtc的创新工具带来了福音!它巧妙利用Linux的binfmt_misc机制,让C脚本能像Perl或Shell一样直接运行。 用户只需在C脚本顶部添加特定注释/*BINFMTC:compile-time options*/并赋予执行权限,binfmtc解释器便能在每次调用时自动通过GCC编译并执行。这项技术极大拓展了C语言的应用边界,使其能轻松驾驭各类脚本和系统管理任务。 binfmtc无疑为C语言爱好者们开启了一条激动人心的全新路径,完美融合C语言的高效与脚本化的便捷,开启了编程体验的新篇章。 原文链接:https://www.netfort.gr.jp/~dancer/software/binfmtc.html.en 论坛讨论链接:https://news.ycombinator.com/item?id=44216630 社区中,有用户展示了一种不依赖binfmt的C脚本自编译运行技巧:通过在C文件内嵌shell命令gcc "$0" -o "$@".out && exec ./"$@".out实现。然而,有评论指出,用$@命名输出文件存在缺陷,当C程序需要参数时会导致编译错误,建议改为$0。原作者承认疏忽,并幽默回应这类“奇技淫巧”本不追求严谨。 针对此,有讨论者提议将输出文件名改为${0%.c}并增加错误处理;同时强调此shell技巧限于Bourne兼容shell,通用性不如shebang或binfmt_misc。另一用户介绍利用tcc -run的巧妙方案:在脚本头部加入/*bin/true ; exec tcc -run "$0" "$@" # */。此方法通过shell和C编译器对该行的不同解释,巧妙实现了不生成临时文件的编译运行,且tcc速度更快。 关于临时文件清理,有用户提问,但多数建议是直接使用tcc -run,因其无需中间文件。讨论还涉及将编译器二进制嵌入脚本后执行,或C程序运行后删除自身源文件等。总的来说,社区成员对这些实现C脚本自编译执行的非传统方法展现兴趣,深入探讨了其技术细节、问题及替代方案。 9. 口琴弯音不再难!开源神器“Let’s Bend”助你速成 (Show HN: Let’s Bend – Open-Source Harmonica Bending Trainer) 口琴的“弯音”技法对初学者极具挑战,难以准确掌握。现在,一款名为“Let’s Bend”的轻量级应用横空出世,通过可视化用户演奏的音符,让用户轻松学会专业弯音,大幅缩短学习周期。 该应用旨在实现跨平台无缝体验,提供macOS、Windows、Debian桌面版以及便捷的Android移动版,并兼容所有口琴调性。Android版可在Google Play、Amazon和F-Droid等平台免费无广告发布。桌面版虽因额外发布成本未能登陆微软/苹果官方商店,但可通过官网免费获取,并支持用户自愿捐赠,核心仍为免费。此外,该应用的源代码也已公开。 “Let’s Bend”为口琴爱好者提供了一个创新且易用的学习工具,让曾是难题的弯音变得触手可及。这无疑将为爱好科技、热爱生活的音乐爱好者带来充满乐趣的全新学习体验。 原文链接:https://letsbend.de 论坛讨论链接:https://news.ycombinator.com/item?id=44217757 社区中关于口琴学习,特别是“音色弯曲”技巧的讨论热烈。一位资深口琴手指出,口琴演奏依赖听觉而非视觉,音色弯曲是“有机”过程,需通过听觉感知。他推荐Gindick的入门教材,并建议通过与音乐合奏(如Little Walter的作品)或观看Jason Ricci的教学视频来实践。他认为,应用程序在学习弯曲方面作用有限,仅能辅助确认。 对此,一款口琴学习应用的开发者回应称,他完全认同音色弯曲需身体“感受”和“听”的有机特性,应用无法替代。其应用并非教授弯曲,而是作为“镜子”,帮助初学者确认实际演奏音高,特别是弯曲是否达到目标音高,旨在辅助而非取代传统学习。 另一位同样受Gindick启蒙的口琴手强调,口琴学习中听觉和感觉至关重要,与弦乐器不同。他认为,尽管该应用注重弯曲精确性,但对于蓝调、摇滚、乡村等多数风格,“感觉”——即构建与释放张力——远比精确音高重要。他建议通过大量合奏培养直觉。讨论中,有人普遍认同许多技能更适合有机学习,也有用户表示此前不了解口琴的音色弯曲功能。 10. 软件开发周期:别迷信“灵丹妙药”,看清复杂真相 (Why Understanding Software Cycle Time Is Messy, Not Magic) 软件开发效率的提升始终是科技团队的永恒追求。一项由John C. Flournoy等学者主导的开创性研究揭示,衡量开发周期(Cycle Time)并无“银弹”,其复杂性远超想象。 该研究分析了来自216家机构的逾5.5万条数据,通过贝叶斯建模,细致探究编码时长、任务范围及协作模式等因素对开发周期的影响。结果发现,每周编码天数、合并的拉取请求数量以及团队协作程度,与开发周期虽有“精确但适度”关联,但个体及环境间巨大的、无法解释的波动才是主导,这意味着单一指标对典型性能的指示信号非常有限。 报告因此强调,提升软件交付速度需采取“系统级”思考与干预,而非仅关注个体层面。此成果为科技界理解复杂运营指标提供了新视角,激励热爱科技、好奇生活的读者以更宏观视野探索效率管理,是极具启发的新鲜事。 原文链接:https://arxiv.org/abs/2503.05040 论坛讨论链接:https://news.ycombinator.com/item?id=44212650 社区的讨论普遍认为,将“周期时间”作为评估个人开发者生产力的指标是误导性的。一位用户指出,周期时间的主要价值在于揭示端到端的流程低效、不确定性和瓶颈,而非个人努力。这与看板方法论中用于预测交付时间的核心理念一致。 多位参与者认同,许多外部因素会影响周期时间,包括:等待同事回复、缓慢的CI/CD流程、低效的本地开发环境、跨团队干扰、频繁的Jira变更、利益相关者不可用、文档匮乏以及微服务导致的测试复杂性等。有评论直言,仅凭周期时间来评判开发者是“近乎残忍”的。 另有观点认为,周期时间或许可用于比较从事相似工作的团队成员,或作为纠正不准确估算的参考。但更有效的方式是,通过它来审视并优化团队周边的所有流程,从而提升整体效率,惠及所有人。 一位用户通过详述一个看似“顺利”的开发流程,进一步说明了组织流程的繁琐,如多次审批、等待部署窗口和漫长的CI测试,最终却将责任归咎于开发者“慢”。 然而,也有人提出疑问:如果一名开发者在相同代码库上长期保持另一名开发者一半的周期时间,这是否真的毫无意义?对此,社区回应称,周期时间差异并不能说明个人效率问题。这可能仅仅是因为该开发者处理的是难度更高、其他人难以应对的任务,而非“懒惰”或“慢”。