Navigated to Hacker News 每日播报 2025-09-08

Hacker News 每日播报 2025-09-08

September 8

Episode Description

欢迎收看 Hacker News 每日播报,今天我们聊聊如何用 AI 复活 25 年前的内核驱动、NPM 供应链再响警报、GPT-5 惊人的搜索能力、代码格式化的存废之争、能效百倍于 GPU 的模拟光计算机、开源照片管理神器 Immich、日本为何坚持自研浮点加速器、声霸卡 Sound Blaster 的传奇故事,以及那些挑战编程思维极限的深奥语言。

用 AI 复活 25 年前的内核驱动

一位开发者上演了一场“技术考古”与“未来科技”的奇妙碰撞。为了从 90 年代的老式 QIC-80 磁带中恢复数据,他必须使用一个名为 ftape 的 Linux 内核驱动。然而,这个驱动自 2000 年以来就停止了维护,只能在古老的内核 2.4 版本上运行。这意味着每次恢复数据,都得启动一台尘封的老旧 PC。

为了摆脱这种不便,他大胆地向 AI 编码助手 Claude Code 求助,希望将这个“活化石”般的驱动程序现代化。出人意料的是,Claude 像一位勤奋的初级工程师,通过分析编译器错误并进行多轮迭代,成功地将所有过时的内核 API 和数据结构替换为现代版本。接着,在开发者的指导下,Claude 还为这个驱动创建了独立的构建系统,使其能作为一个可加载的内核模块(.ko 文件)在最新的 Linux 系统上运行。

整个调试过程充满了人机协作的智慧。开发者将新驱动的日志输出与之前成功运行时的“标准答案”进行对比,并将差异反馈给 Claude。AI 最终精准地定位到问题在于模块参数的默认值错误,导致 I/O 端口配置失败。经过短短两个晚上的奋战,这个沉睡了 25 年的驱动程序在现代 Linux 内核 6.8+ 上被成功唤醒,顺利完成了磁带数据的读取。

这个案例生动地展示了 AI 在现代化遗留系统方面的巨大潜力。AI 在处理代码翻译、API 升级和模式识别等规则明确的任务时表现出色,能极大地提高效率。然而,这并非意味着人类专家的退场。在内核驱动这样对稳定性、安全性和性能要求极高的领域,AI 生成的代码仍需人类的严格审查和专业指导。AI 更像是一个强大的技能倍增器,它能显著降低学习新技术的门槛,让开发者专注于更高层次的架构设计和创造性工作,但核心的编程思维、系统设计和调试技巧,依然是人类工程师不可替代的价值所在。

NPM 热门包 debug 和 chalk 遭供应链攻击

开源软件世界再次响起安全警报。NPM 生态系统中两个极其热门的包——debugchalk,连同其他 16 个相关包,遭遇了严重的供应链攻击。这些包每周的总下载量超过 20 亿次,影响范围之广,令人咋舌。

攻击者通过网络钓鱼邮件获取了维护者的账户权限,并向这些包的新版本中注入了恶意代码。这段恶意代码专门针对用户的浏览器环境,其目标是静默拦截加密货币和 Web3 相关的活动。它通过“钩住”(hooking)浏览器核心的网络请求函数(如 fetch)和主流钱包接口(如 window.ethereum),在用户毫不知情的情况下,篡改交易中的收款地址。

为了增加隐蔽性,恶意代码甚至会使用与原始地址看起来相似的地址进行替换,使得普通用户极难察觉。这意味着,即使用户界面上显示的是正确的收款方,实际签名的交易也会将资金导向攻击者控制的账户。

这起事件再次凸显了开源供应链的脆弱性。它提醒所有开发者和组织,依赖管理和安全审计至关重要。在享受开源带来的便利的同时,必须时刻保持警惕,采取必要的安全措施,例如锁定依赖版本、使用代码签名和多因素认证等,以保护自己的项目免受此类攻击的侵害。

ChatGPT 中的 GPT-5 思维模式在搜索方面表现惊人

以往我们常说“不要把聊天机器人当搜索引擎用”,但随着 GPT-5 的出现,这条建议可能已经过时了。技术作家 Simon Willison 发现,ChatGPT 中新的“GPT-5 Thinking”模式展现出了堪称“研究小妖精”(Research Goblin)的强大搜索与信息综合能力。

这个“小妖精”似乎对任何问题都抱有无穷的好奇心和探索欲,愿意投入“不合理”的精力去互联网上挖掘答案。Willison 通过一系列生动的例子展示了它的威力:

  • 识别建筑:仅凭一张火车上随手拍的模糊照片,它就能准确识别出英国雷丁的“The Blade”大厦。
  • 调查产品:当发现英国星巴克没有蛋糕棒时,它不仅查明了产品历史,还通过“阅读”官网的 PDF 过敏原指南,确认了其不在特定门店销售。
  • 挖掘历史:为了探究一家餐厅内部洞穴的来历,它不仅找到了 19 世纪的建筑历史,还翻阅了城市规划文件和租赁手册的 PDF,甚至在发现关键考古报告可能未在线公开后,主动草拟了一封信息索取邮件。

这种能力的背后,是“工具调用”(tool calling)和“思维链”(chain-of-thought)技术的深度��合。模型能够执行搜索、推理结果,然后根据推理进行下一步搜索,形成一个高效的“交错思维”循环。

这一进步无疑极大地提升了信息获取的效率,将从“好奇”到“获得答案”的时间大大缩短。然而,这也引发了新的思考。尽管 GPT-5 表现“胜任”,但 AI 的“幻觉”问题依然存在,验证信息来源变得尤为重要。它更像一个强大的研究助理,而非简单的搜索引擎,擅长综合信息和理解复杂意图。未来,搜索的范式或许将从关键词匹配转向与 AI 助手的深度对话,而如何在这种协作中保持批判性思维,将是每个用户都需要学习的课题。

代码格式化本应是不必要的

我们今天还在为代码是用制表符还是空格、括号是否换行而争论不休,这在一些资深程序员看来,简直是一种“历史的倒退”。文章作者 Max Leiter 回忆起上世纪 80 年代 Ada 语言的开发环境,那时,代码格式化根本不是问题。

当时,Ada 的开发系统并不存储纯文本源代码,而是使用一种名为 DIANA 的中间表示(IR)。这意味着源代码本身只是这棵抽象语法树的一种“漂亮打印”(pretty-printing)。每个开发者都可以根据自己的偏好,设置不同的显示风格,而不会影响底层代码的存储。这种被称为“投影编辑”(projectional editing)的方式,从根本上消除了所有关于代码格式的争论。

理想与现实的碰撞

这种基于 IR 的开发模式在理论上优势明显:它不仅能解决格式问题,还能带来更强大的 IDE 功能,如增量编译、语义感知的重构和更智能的代码补全。然而,为什么最终是纯文本代码成为了事实上的标准呢?

答案在于简单性和通用性。纯文本是人类可读的,可以用任何简单的文本编辑器打开。更重要的是,它与 Unix 哲学中的“小工具组合”完美契合。像 grep, diff, sed 这样的命令行工具在处理纯文本时威力无穷。尤其是在版本控制方面,git diffgit merge 对纯文本的强大支持是其成功的关键。如果代码以复杂的 IR 形式存储,版本对比和合并将变得异常困难,极大地增加了协作的门槛。

此外,早期 Ada 开发系统的高昂成本和封闭生态也限制了其普及。相比之下,纯文本的低门槛和开放性使其迅速传播,并形成了庞大的生态系统。

如今,像 Prettier、Black 这样的自动化格式化工具,虽然只是“治标不治本”的补丁,但它们通过强制执行一致的风格,已经极大地减少了团队内部的无谓争论。这场关于代码存储方式的讨论,反映了软件开发中理想主义与实用主义的持续张力。未来,或许能在保留纯文本便利性的同时,更好地融入 IR 的优势。

用于 AI 推理和组合优化的模拟光计算机

《自然》杂志上的一篇论文,为我们揭示了计算领域的下一个可能突破口:模拟光计算机(AOC)。面对 AI 模型日益增长的能耗和延迟挑战,传统的数字计算正逐渐逼近极限,而 AOC 有望在效率和速度上实现数量级的飞跃。

这台计算机的精妙之处在于,它将模拟电子元件与三维光学技术在一个反馈回路中结合,实现了完全在模拟域内的计算。光学部分负责高效的矩阵-向量乘法,而电子部分则处理非线性操作。整个过程避免了耗能的数字-模拟转换,从而实现了惊人的能效。研究人员预测,在 8 位精度下,AOC 的能效可达到每瓦 500 万亿次操作(500 TOPS/watt),比当前顶级的 Nvidia H100 GPU 高出 100 倍以上。

AOC 不仅擅长加速 AI 推理,尤其是在深度平衡网络这类需要迭代计算的模型上,还能高效解决组合优化问题,例如在金融交易结算、医学图像重建等领域展现了巨大潜力。更重要的是,它采用消费级的光学和电子元件构建,为未来的大规模商业化铺平了道路。

当然,这项技术也面临着现实的挑战。模拟计算固有的精度问题,是其能否应用于更广泛科学计算和复杂 AI 模型的关键。目前的系统规模与现代 AI 模型庞大的参数量相比,仍有很大差距,如何扩展到大规模芯片上是一个巨大的工程难题。此外,AOC 目前主要用于推理,模型的训练仍需依赖传统的数字计算机。尽管如此,AOC 为构建更快、更可持续的计算未来,开辟了一条充满希望的新路径。

尼泊尔因社交媒体禁令引发大规模抗议

尼泊尔政府近期以“未在当地注册”为由,对 Facebook、WhatsApp、X 等 26 个主流社交媒体平台实施禁令,此举引发了全国范围内的激烈反抗。数千名以年轻人为主的抗议者走上街头,要求撤销禁令,不幸的是,抗议活动升级为严重冲突,造成了重大人员伤亡。

政府声称此举旨在“监管”而非“审查”,要求在尼泊尔运营的平台遵守当地法规。然而,这一决定对尼泊尔的社会和经济造成了巨大冲击。尼泊尔计算机协会(CAN)指出,一次性关闭这些平台,严重影响了教育、商业、通信和公民的日常生活,可能导致尼泊尔在数字时代被世界孤立。

这起事件在全球科技界引发了深刻反思,并提出了几个关键问题:

  1. 数字权利的边界:政府以监管为名的禁令,是否构成了对公民言论自由和信息获取权的侵犯?
  2. 技术规避的现实:虽然 VPN 等工具可以绕过封锁,但在一个国家范围内,这些技术手段的普及度和有效性面临挑战。
  3. 科技公司的责任:面对政府禁令,大型科技公司应如何平衡遵守当地法律与保护用户权利之间的关系?
  4. 经济与创新的代价:对于依赖社交平台进行营销和运营的小企业和创业者而言,这样的禁令无异于一场灾难,严重打击了数字经济的活力。

尼泊尔的事件是一个沉痛的警示,提醒我们数字权利并非理所当然,它需要在技术、法律和公民社会的共同努力下,不断地被捍卫和争取。

Creative Technology 的传奇:声霸卡的兴衰史

对于许多从 DOS 时代一路走来的 PC 玩家来说,Creative Technology 和它的 Sound Blaster(声霸卡)是电脑从“哑巴”变成能发出震撼音效和动人音乐的神奇魔盒。这篇文章回顾了这家新加坡公司的完整历史,堪称 PC 硬件发展史的一个缩影。

故事始于创始人沈望傅将音乐与计算机结合的梦想。在经历了早期兼容机项目的失败后,Creative 敏锐地抓住了 PC 音频市场的空白,于 1989 年推出了划时代的 Sound Blaster 声卡。它不仅兼容当时流行的 Adlib 声卡,还创新地集成了数字采样播放、MIDI 接口和游戏摇杆端口,一举成为 PC 扩展卡的标配,定义了 PC 游戏的音频体验。

随后,Creative 通过不断推出 Sound Blaster 16、AWE32 等迭代产品,引入立体声、波表合成等先进技术,并与游戏开发者紧密合作,牢牢巩固了其市场霸主地位。然而,在声卡业务之外,Creative 的多元化尝试却屡屡受挫,无论是 3D 显卡还是调制解调器,都未能复制 Sound Blaster 的辉煌。

进入 21 世纪,随着主板集成声卡的普及,独立声卡市场迅速萎缩。尽管 Creative 曾凭借 NOMAD 系列 MP3 播放器在便携音乐市场取得过一定成功,但最终未能抵挡住苹果 iPod 的浪潮。

如今,Creative 已转型为一家专注于核心音频产品的公司,在 DAC、音箱和耳机等细分市场中依然享有声誉。它的故事告诉我们,在一个快速变化的科技行业,专注核心技术和敏锐的市场洞察力可以创造辉煌,但如何成功地进行多元化转型和适应技术浪潮的冲击,则是决定企业能否长盛不衰的关键。

为何日本仍在投资定制浮点加速器?

在 NVIDIA GPU 几乎垄断全球高性能计算(HPC)和 AI 市场的今天,日本 Pezy Computing 公司却在政府的支持下,坚持开发一种独特的定制浮点加速器。这背后,是深远的战略考量和对极致能效的不懈追求。

Pezy 的加速器采用了一种与 GPU 不同的“单程序多数据”(SPMD)架构,允许程序员更精细地控制线程和数据,从而简化核心设计,在同等芯片面积下集成更多核心,以达到更高的能效。其最新的 Pezy-SC4s 芯片采用 5 纳米工艺,集成了 RISC-V CPU 核心,可以直接运行 Linux,成为一个更独立的计算单元。

在性能上,Pezy 的芯片表现不俗。测试表明,在特定工作负载(如基因组分析)上,其性能甚至数倍于顶级的 NVIDIA H100 GPU。在能效方面,其每瓦浮点性能也与 NVIDIA 的旗舰产品不相上下,极具竞争力。

那么,日本为何要坚持这项“逆流而上”的投资呢?

  1. 战略对冲:面对 GPU 市场的高度集中,拥有自主设计和制造加速器的能力,是保障国家技术安全和供应链韧性的重要一环。
  2. 编程灵活性:对于非 AI 的传统科学计算工作负载,Pezy 的架构提供了比 GPU 更灵活的编程模型。
  3. 能效至上:对于大型超级计算机而言,能耗是巨大的成本和挑战。Pezy 从设计之初就将极致能效作为核心目标。

然而,Pezy 也面临着巨大的挑战。NVIDIA 的成功不仅在于硬件,更在于其构建的强大而成熟的 CUDA 软件生态。对于开发者而言,“程序员时间”也是一种成本,缺乏强大软件生态支持的硬件,推广难度巨大。尽管如此,Pezy 的坚持为 HPC 领域带来了宝贵的技术多样性,也为追求极致能效的未来计算提供了另一种可能。

Immich:高性能自托管照片和视频管理方案

对于那些越来越担心个人数据隐私,并希望摆脱大型科技公司云服务束缚的用户来说,Immich 项目提供了一个近乎完美的答案。它是一个高性能的自托管照片和视频管理解决方案,被誉为 Google Photos 的最佳开源替代品。

Immich 的核心价值在于让用户完全掌控自己的数字回忆。你可以在自己的服务器上部署它,无论是树莓派、NAS 还是家用服务器,从而将所有珍贵的照片和视频安全地存储在自己家中。

它的功能异常强大,几乎涵盖了现代照片管理应用的所有需求:

  • 智能备份:支持手机端自动备份,并能智能识别重复文件。
  • 多用户与分享:支持创建多个用户,并能方便地与家人朋友共享相册。
  • 强大搜索:不仅能按时间、地点、元数据搜索,还内置了基于 AI 的物体识别、人脸识别和 CLIP 语义搜索,让你能用自然语言找到想要的瞬间。
  • 隐私优先:所有 AI/ML 分析都在本地服务器上运行,你的照片数据永远不会离开你的设备。
  • 格式支持广泛:支持 RAW、LivePhoto 等专业格式。

当然,自托管也意味着需要承担一定的技术责任。用户需要了解如何使用 Docker 进行部署和维护,并做好数据备份。项目本身也处于非常活跃的开发阶段,可能会有功能变动。但对于追求数据主权、注重隐私并乐于动手的技术爱好者来说,Immich 提供了一个无与伦比的、功能丰富的自由选择。

四十四种深奥语言:代码世界的行为艺术

你是否想过用乐谱、照片,甚至是向希腊诸神“祈祷”的方式来编程?欢迎来到深奥编程语言(Esolangs)的奇妙世界。这些语言的设计初衷并非为了实用,而是为了挑战我们对编程的固有认知,它们是代码世界的诗歌、哲学与行为艺术。

Daniel Temkin 的新书《四十四种深奥语言》深入探讨了这一领域。这些语言充满了奇思妙想:

  • Befunge:挑战代码必须从左到右线性执行的常规,让指令指针可以在二维空间中任意游走。
  • INTERCAL:以其晦涩的语法著称,程序员甚至需要用“PLEASE”这样的礼貌词来让编译器接受某些操作。
  • Olympus:程序员需要用伪自然语言向不同的希腊神祇“恳求”来构建程序,充满了神秘的仪式感。

在 AI 编程助手日益普及的今天,这些“无用”的语言提供了一种独特的反思。当 AI 致力于提供最高效、最直接的解决方案时,深奥语言却反其道而行之,它们故意设置障碍,追求概念上的新颖和艺术上的表达。它们就像是代码世界里用来迷惑 AI 的“反识别服装”,提醒我们人类的创造力可以超越效率和实用性的束缚。

学习和尝试这些语言,虽然不能帮你找到一份高薪工作,但它能极大地锻炼你的思维,让你跳出舒适区,从一个全新的、充满趣味的角度去理解计算的本质。它们所代表的“玩代码”的精神,以及围绕它们形成的独特社区文化,正是技术世界保持活力和创新精神的重要源泉。

相关链接:

See all episodes

Never lose your place, on any device

Create a free account to sync, back up, and get personal recommendations.