Hacker News 每日播报 2025-09-08

September 8

Episode Description

欢迎收看 Hacker News 每日播报，今天我们聊聊如何用 AI 复活 25 年前的内核驱动、NPM 供应链再响警报、GPT-5 惊人的搜索能力、代码格式化的存废之争、能效百倍于 GPU 的模拟光计算机、开源照片管理神器 Immich、日本为何坚持自研浮点加速器、声霸卡 Sound Blaster 的传奇故事，以及那些挑战编程思维极限的深奥语言。

用 AI 复活 25 年前的内核驱动

一位开发者上演了一场“技术考古”与“未来科技”的奇妙碰撞。为了从 90 年代的老式 QIC-80 磁带中恢复数据，他必须使用一个名为 ftape 的 Linux 内核驱动。然而，这个驱动自 2000 年以来就停止了维护，只能在古老的内核 2.4 版本上运行。这意味着每次恢复数据，都得启动一台尘封的老旧 PC。

为了摆脱这种不便，他大胆地向 AI 编码助手 Claude Code 求助，希望将这个“活化石”般的驱动程序现代化。出人意料的是，Claude 像一位勤奋的初级工程师，通过分析编译器错误并进行多轮迭代，成功地将所有过时的内核 API 和数据结构替换为现代版本。接着，在开发者的指导下，Claude 还为这个驱动创建了独立的构建系统，使其能作为一个可加载的内核模块（.ko 文件）在最新的 Linux 系统上运行。

整个调试过程充满了人机协作的智慧。开发者将新驱动的日志输出与之前成功运行时的“标准答案”进行对比，并将差异反馈给 Claude。AI 最终精准地定位到问题在于模块参数的默认值错误，导致 I/O 端口配置失败。经过短短两个晚上的奋战，这个沉睡了 25 年的驱动程序在现代 Linux 内核 6.8+ 上被成功唤醒，顺利完成了磁带数据的读取。

这个案例生动地展示了 AI 在现代化遗留系统方面的巨大潜力。AI 在处理代码翻译、API 升级和模式识别等规则明确的任务时表现出色，能极大地提高效率。然而，这并非意味着人类专家的退场。在内核驱动这样对稳定性、安全性和性能要求极高的领域，AI 生成的代码仍需人类的严格审查和专业指导。AI 更像是一个强大的技能倍增器，它能显著降低学习新技术的门槛，让开发者专注于更高层次的架构设计和创造性工作，但核心的编程思维、系统设计和调试技巧，依然是人类工程师不可替代的价值所在。

NPM 热门包 debug 和 chalk 遭供应链攻击

开源软件世界再次响起安全警报。NPM 生态系统中两个极其热门的包——debug 和 chalk，连同其他 16 个相关包，遭遇了严重的供应链攻击。这些包每周的总下载量超过 20 亿次，影响范围之广，令人咋舌。

攻击者通过网络钓鱼邮件获取了维护者的账户权限，并向这些包的新版本中注入了恶意代码。这段恶意代码专门针对用户的浏览器环境，其目标是静默拦截加密货币和 Web3 相关的活动。它通过“钩住”（hooking）浏览器核心的网络请求函数（如 fetch）和主流钱包接口（如 window.ethereum），在用户毫不知情的情况下，篡改交易中的收款地址。

为了增加隐蔽性，恶意代码甚至会使用与原始地址看起来相似的地址进行替换，使得普通用户极难察觉。这意味着，即使用户界面上显示的是正确的收款方，实际签名的交易也会将资金导向攻击者控制的账户。

这起事件再次凸显了开源供应链的脆弱性。它提醒所有开发者和组织，依赖管理和安全审计至关重要。在享受开源带来的便利的同时，必须时刻保持警惕，采取必要的安全措施，例如锁定依赖版本、使用代码签名和多因素认证等，以保护自己的项目免受此类攻击的侵害。

ChatGPT 中的 GPT-5 思维模式在搜索方面表现惊人

以往我们常说“不要把聊天机器人当搜索引擎用”，但随着 GPT-5 的出现，这条建议可能已经过时了。技术作家 Simon Willison 发现，ChatGPT 中新的“GPT-5 Thinking”模式展现出了堪称“研究小妖精”（Research Goblin）的强大搜索与信息综合能力。

这个“小妖精”似乎对任何问题都抱有无穷的好奇心和探索欲，愿意投入“不合理”的精力去互联网上挖掘答案。Willison 通过一系列生动的例子展示了它的威力：

识别建筑：仅凭一张火车上随手拍的模糊照片，它就能准确识别出英国雷丁的“The Blade”大厦。
调查产品：当发现英国星巴克没有蛋糕棒时，它不仅查明了产品历史，还通过“阅读”官网的 PDF 过敏原指南，确认了其不在特定门店销售。
挖掘历史：为了探究一家餐厅内部洞穴的来历，它不仅找到了 19 世纪的建筑历史，还翻阅了城市规划文件和租赁手册的 PDF，甚至在发现关键考古报告可能未在线公开后，主动草拟了一封信息索取邮件。

这种能力的背后，是“工具调用”（tool calling）和“思维链”（chain-of-thought）技术的深度��合。模型能够执行搜索、推理结果，然后根据推理进行下一步搜索，形成一个高效的“交错思维”循环。

这一进步无疑极大地提升了信息获取的效率，将从“好奇”到“获得答案”的时间大大缩短。然而，这也引发了新的思考。尽管 GPT-5 表现“胜任”，但 AI 的“幻觉”问题依然存在，验证信息来源变得尤为重要。它更像一个强大的研究助理，而非简单的搜索引擎，擅长综合信息和理解复杂意图。未来，搜索的范式或许将从关键词匹配转向与 AI 助手的深度对话，而如何在这种协作中保持批判性思维，将是每个用户都需要学习的课题。

代码格式化本应是不必要的

我们今天还在为代码是用制表符还是空格、括号是否换行而争论不休，这在一些资深程序员看来，简直是一种“历史的倒退”。文章作者 Max Leiter 回忆起上世纪 80 年代 Ada 语言的开发环境，那时，代码格式化根本不是问题。

当时，Ada 的开发系统并不存储纯文本源代码，而是使用一种名为 DIANA 的中间表示（IR）。这意味着源代码本身只是这棵抽象语法树的一种“漂亮打印”（pretty-printing）。每个开发者都可以根据自己的偏好，设置不同的显示风格，而不会影响底层代码的存储。这种被称为“投影编辑”（projectional editing）的方式，从根本上消除了所有关于代码格式的争论。

理想与现实的碰撞

这种基于 IR 的开发模式在理论上优势明显：它不仅能解决格式问题，还能带来更强大的 IDE 功能，如增量编译、语义感知的重构和更智能的代码补全。然而，为什么最终是纯文本代码成为了事实上的标准呢？

答案在于简单性和通用性。纯文本是人类可读的，可以用任何简单的文本编辑器打开。更重要的是，它与 Unix 哲学中的“小工具组合”完美契合。像 grep, diff, sed 这样的命令行工具在处理纯文本时威力无穷。尤其是在版本控制方面，git diff 和 git merge 对纯文本的强大支持是其成功的关键。如果代码以复杂的 IR 形式存储，版本对比和合并将变得异常困难，极大地增加了协作的门槛。

此外，早期 Ada 开发系统的高昂成本和封闭生态也限制了其普及。相比之下，纯文本的低门槛和开放性使其迅速传播，并形成了庞大的生态系统。

如今，像 Prettier、Black 这样的自动化格式化工具，虽然只是“治标不治本”的补丁，但它们通过强制执行一致的风格，已经极大地减少了团队内部的无谓争论。这场关于代码存储方式的讨论，反映了软件开发中理想主义与实用主义的持续张力。未来，或许能在保留纯文本便利性的同时，更好地融入 IR 的优势。

用于 AI 推理和组合优化的模拟光计算机

《自然》杂志上的一篇论文，为我们揭示了计算领域的下一个可能突破口：模拟光计算机（AOC）。面对 AI 模型日益增长的能耗和延迟挑战，传统的数字计算正逐渐逼近极限，而 AOC 有望在效率和速度上实现数量级的飞跃。

这台计算机的精妙之处在于，它将模拟电子元件与三维光学技术在一个反馈回路中结合，实现了完全在模拟域内的计算。光学部分负责高效的矩阵-向量乘法，而电子部分则处理非线性操作。整个过程避免了耗能的数字-模拟转换，从而实现了惊人的能效。研究人员预测，在 8 位精度下，AOC 的能效可达到每瓦 500 万亿次操作（500 TOPS/watt），比当前顶级的 Nvidia H100 GPU 高出 100 倍以上。

AOC 不仅擅长加速 AI 推理，尤其是在深度平衡网络这类需要迭代计算的模型上，还能高效解决组合优化问题，例如在金融交易结算、医学图像重建等领域展现了巨大潜力。更重要的是，它采用消费级的光学和电子元件构建，为未来的大规模商业化铺平了道路。

当然，这项技术也面临着现实的挑战。模拟计算固有的精度问题，是其能否应用于更广泛科学计算和复杂 AI 模型的关键。目前的系统规模与现代 AI 模型庞大的参数量相比，仍有很大差距，如何扩展到大规模芯片上是一个巨大的工程难题。此外，AOC 目前主要用于推理，模型的训练仍需依赖传统的数字计算机。尽管如此，AOC 为构建更快、更可持续的计算未来，开辟了一条充满希望的新路径。

尼泊尔因社交媒体禁令引发大规模抗议

尼泊尔政府近期以“未在当地注册”为由，对 Facebook、WhatsApp、X 等 26 个主流社交媒体平台实施禁令，此举引发了全国范围内的激烈反抗。数千名以年轻人为主的抗议者走上街头，要求撤销禁令，不幸的是，抗议活动升级为严重冲突，造成了重大人员伤亡。

政府声称此举旨在“监管”而非“审查”，要求在尼泊尔运营的平台遵守当地法规。然而，这一决定对尼泊尔的社会和经济造成了巨大冲击。尼泊尔计算机协会（CAN）指出，一次性关闭这些平台，严重影响了教育、商业、通信和公民的日常生活，可能导致尼泊尔在数字时代被世界孤立。

这起事件在全球科技界引发了深刻反思，并提出了几个关键问题：

数字权利的边界：政府以监管为名的禁令，是否构成了对公民言论自由和信息获取权的侵犯？
技术规避的现实：虽然 VPN 等工具可以绕过封锁，但在一个国家范围内，这些技术手段的普及度和有效性面临挑战。
科技公司的责任：面对政府禁令，大型科技公司应如何平衡遵守当地法律与保护用户权利之间的关系？
经济与创新的代价：对于依赖社交平台进行营销和运营的小企业和创业者而言，这样的禁令无异于一场灾难，严重打击了数字经济的活力。

尼泊尔的事件是一个沉痛的警示，提醒我们数字权利并非理所当然，它需要在技术、法律和公民社会的共同努力下，不断地被捍卫和争取。

Creative Technology 的传奇：声霸卡的兴衰史

对于许多从 DOS 时代一路走来的 PC 玩家来说，Creative Technology 和它的 Sound Blaster（声霸卡）是电脑从“哑巴”变成能发出震撼音效和动人音乐的神奇魔盒。这篇文章回顾了这家新加坡公司的完整历史，堪称 PC 硬件发展史的一个缩影。

故事始于创始人沈望傅将音乐与计算机结合的梦想。在经历了早期兼容机项目的失败后，Creative 敏锐地抓住了 PC 音频市场的空白，于 1989 年推出了划时代的 Sound Blaster 声卡。它不仅兼容当时流行的 Adlib 声卡，还创新地集成了数字采样播放、MIDI 接口和游戏摇杆端口，一举成为 PC 扩展卡的标配，定义了 PC 游戏的音频体验。

随后，Creative 通过不断推出 Sound Blaster 16、AWE32 等迭代产品，引入立体声、波表合成等先进技术，并与游戏开发者紧密合作，牢牢巩固了其市场霸主地位。然而，在声卡业务之外，Creative 的多元化尝试却屡屡受挫，无论是 3D 显卡还是调制解调器，都未能复制 Sound Blaster 的辉煌。

进入 21 世纪，随着主板集成声卡的普及，独立声卡市场迅速萎缩。尽管 Creative 曾凭借 NOMAD 系列 MP3 播放器在便携音乐市场取得过一定成功，但最终未能抵挡住苹果 iPod 的浪潮。

如今，Creative 已转型为一家专注于核心音频产品的公司，在 DAC、音箱和耳机等细分市场中依然享有声誉。它的故事告诉我们，在一个快速变化的科技行业，专注核心技术和敏锐的市场洞察力可以创造辉煌，但如何成功地进行多元化转型和适应技术浪潮的冲击，则是决定企业能否长盛不衰的关键。

为何日本仍在投资定制浮点加速器？

在 NVIDIA GPU 几乎垄断全球高性能计算（HPC）和 AI 市场的今天，日本 Pezy Computing 公司却在政府的支持下，坚持开发一种独特的定制浮点加速器。这背后，是深远的战略考量和对极致能效的不懈追求。

Pezy 的加速器采用了一种与 GPU 不同的“单程序多数据”（SPMD）架构，允许程序员更精细地控制线程和数据，从而简化核心设计，在同等芯片面积下集成更多核心，以达到更高的能效。其最新的 Pezy-SC4s 芯片采用 5 纳米工艺，集成了 RISC-V CPU 核心，可以直接运行 Linux，成为一个更独立的计算单元。

在性能上，Pezy 的芯片表现不俗。测试表明，在特定工作负载（如基因组分析）上，其性能甚至数倍于顶级的 NVIDIA H100 GPU。在能效方面，其每瓦浮点性能也与 NVIDIA 的旗舰产品不相上下，极具竞争力。

那么，日本为何要坚持这项“逆流而上”的投资呢？

战略对冲：面对 GPU 市场的高度集中，拥有自主设计和制造加速器的能力，是保障国家技术安全和供应链韧性的重要一环。
编程灵活性：对于非 AI 的传统科学计算工作负载，Pezy 的架构提供了比 GPU 更灵活的编程模型。
能效至上：对于大型超级计算机而言，能耗是巨大的成本和挑战。Pezy 从设计之初就将极致能效作为核心目标。

然而，Pezy 也面临着巨大的挑战。NVIDIA 的成功不仅在于硬件，更在于其构建的强大而成熟的 CUDA 软件生态。对于开发者而言，“程序员时间”也是一种成本，缺乏强大软件生态支持的硬件，推广难度巨大。尽管如此，Pezy 的坚持为 HPC 领域带来了宝贵的技术多样性，也为追求极致能效的未来计算提供了另一种可能。

Immich：高性能自托管照片和视频管理方案

对于那些越来越担心个人数据隐私，并希望摆脱大型科技公司云服务束缚的用户来说，Immich 项目提供了一个近乎完美的答案。它是一个高性能的自托管照片和视频管理解决方案，被誉为 Google Photos 的最佳开源替代品。

Immich 的核心价值在于让用户完全掌控自己的数字回忆。你可以在自己的服务器上部署它，无论是树莓派、NAS 还是家用服务器，从而将所有珍贵的照片和视频安全地存储在自己家中。

它的功能异常强大，几乎涵盖了现代照片管理应用的所有需求：

智能备份：支持手机端自动备份，并能智能识别重复文件。
多用户与分享：支持创建多个用户，并能方便地与家人朋友共享相册。
强大搜索：不仅能按时间、地点、元数据搜索，还内置了基于 AI 的物体识别、人脸识别和 CLIP 语义搜索，让你能用自然语言找到想要的瞬间。
隐私优先：所有 AI/ML 分析都在本地服务器上运行，你的照片数据永远不会离开你的设备。
格式支持广泛：支持 RAW、LivePhoto 等专业格式。

当然，自托管也意味着需要承担一定的技术责任。用户需要了解如何使用 Docker 进行部署和维护，并做好数据备份。项目本身也处于非常活跃的开发阶段，可能会有功能变动。但对于追求数据主权、注重隐私并乐于动手的技术爱好者来说，Immich 提供了一个无与伦比的、功能丰富的自由选择。

四十四种深奥语言：代码世界的行为艺术

你是否想过用乐谱、照片，甚至是向希腊诸神“祈祷”的方式来编程？欢迎来到深奥编程语言（Esolangs）的奇妙世界。这些语言的设计初衷并非为了实用，而是为了挑战我们对编程的固有认知，它们是代码世界的诗歌、哲学与行为艺术。

Daniel Temkin 的新书《四十四种深奥语言》深入探讨了这一领域。这些语言充满了奇思妙想：

Befunge：挑战代码必须从左到右线性执行的常规，让指令指针可以在二维空间中任意游走。
INTERCAL：以其晦涩的语法著称，程序员甚至需要用“PLEASE”这样的礼貌词来让编译器接受某些操作。
Olympus：程序员需要用伪自然语言向不同的希腊神祇“恳求”来构建程序，充满了神秘的仪式感。

在 AI 编程助手日益普及的今天，这些“无用”的语言提供了一种独特的反思。当 AI 致力于提供最高效、最直接的解决方案时，深奥语言却反其道而行之，它们故意设置障碍，追求概念上的新颖和艺术上的表达。它们就像是代码世界里用来迷惑 AI 的“反识别服装”，提醒我们人类的创造力可以超越效率和实用性的束缚。

学习和尝试这些语言，虽然不能帮你找到一份高薪工作，但它能极大地锻炼你的思维，让你跳出舒适区，从一个全新的、充满趣味的角度去理解计算的本质。它们所代表的“玩代码”的精神，以及围绕它们形成的独特社区文化，正是技术世界保持活力和创新精神的重要源泉。

相关链接：

See all episodes

Hacker News 每日播报 2025-09-08

Episode Description

理想与现实的碰撞

Never lose your place, on any device