算法会梦见电子羊,但人类需要学会与有偏见的AI共存 | 嗨点小圆桌

April 1
1h 19m

Episode Description

我们避开关于算力和估值的宏大叙事,在 AI 原点社区的小圆桌旁,和两位刚刚从硅谷大厂“回归”实验室的科学家聊了聊智能的底色。今天的 AI 圈正处于一种近乎疯狂的正反馈中:计算能力的提升不断压缩试错成本,让轮子越转越快。然而,在这种狂飙突进的背后,一种“令人不安的乌云”正在蔓延——当我们试图用语言模型去模拟整个世界时,我们是否忽略了那些语言无法描述的物理规律,以及潜伏在算法深处的、能够轻易被塑造的偏见?

本期嘉宾带来了极具穿透力的行业观察。刘淼在参与 Llama 系列模型研发时发现,通过改变后训练数据,可以轻而易举地塑造一个模型的偏见与世界观。这种“价值蒸馏”的过程正在悄无声息地发生,并最终通过屏幕影响到那些世界观尚未成型的下一代。而靳潇杰则在试图拆掉“语言模型”的围墙,他认为真实的智能应当源于视觉,源于对物理世界原生规律的理解,而非仅仅是对文字符号的拟合。

在这场对话中,你不会听到枯燥的技术参数,而是会听到关于“学术界如何在 GPU 贫困中坚持想象力”、关于“为什么机器人需要学会识别用户的心流”、以及“为什么说 AI 必须具备情感底线”的深度思考。这不仅是一场关于技术的校准,更是一场关于人类如何在算法织就的现实中,守护自身价值坐标的讨论。

【关于 嗨点小圆桌】

今年中关村论坛期间,海淀区人工智能主题日场外氛围活动“原点 Party Nights”在AI原点社区举办。其中音视频播客“嗨点小圆桌”是一档“海淀和他的朋友们”深度对话节目,将邀请主论坛嘉宾、AI热点人物一同探讨AI青年关心的热点话题,欢迎大家收听观看体验。

【本期嘉宾】
  • 刘淼:清华大学人工智能学院助理教授,前 Meta GenAI 高级研究科学家, Llama3/Llama4 多模态核心研发成员;
  • 靳潇杰:北京交通大学计算机学院教授、博导,字节跳动美国研究院创始成员及技术负责人,前 Google 研究院、Snap 研究院研究员
  • 王兆洋:硅星人合伙人
【时间线】

00:05:43 AI 行业完全进入一个正反馈阶段,而这其实从来不是AI研究领域的常态
00:06:38 今天整个 AI 在技术方面过于聚焦了,这是令人不安的乌云
00:13:37 起起伏伏的 AI:2022年“入行”的刘淼,和2017年拿到 Image Net 最后一届冠军的靳潇杰
00:16:11 语言,是我们需要的全部吗——VideoWord 的诞生
00:27:02 Ego4D 与 MEOW 实验室:从用户驱动到任务驱动
00:27:40 CLIP:一个被忽视的但非常关键的工作
00:32:10 当 LLM 统治一切技术路线:在工业界你没有”动摇”的权限
00:43:58 50 年之后,我能非常确信 AI 一定是一个主动的个人化的智能
00:45:07 学术界的 GPU 危机:资源受限是诅咒还是倒逼创新?
00:54:09 的研究院,能不能做出真正的研究?
01:01:35 人不是为了有什么价值而存在的
01:07:10 当看到一个小女孩因为 AI “姐姐”要下线而哭
01:08:53 在训练 Llama 时发现,修改后训练数据可以轻易决定模型的偏见和世界观
01:12:15 未来方向:世界模型,AI的情感,人与机器人的交互

【延伸阅读】

本期对话中涉及的关键论文与资料:Transformer 与注意力机制

  • Vaswani et al. (2017),Attention Is All You Needarxiv.org

CLIP:图文对齐的奠基工作

  • Radford et al. (2021),Learning Transferable Visual Models From Natural Language Supervisionarxiv.org

Ego4D:第一视角视频大规模数据集

  • Grauman et al. (2022),Ego4D: Around the World in 3,000 Hours of Egocentric Video(刘淼为共同作者)arxiv.org

VideoWorld:不依赖语言的视觉世界模型

  • Ren et al. (2025),VideoWorld: Exploring Knowledge Learning from Unlabeled Videos(靳潇杰为通讯作者,CVPR 2025)arxiv.org
  • VideoWorld 2(2026,靳潇杰团队最新续作)arxiv.org

ImageNet 竞赛:深度学习时代的起点

  • Russakovsky et al. (2015),ImageNet Large Scale Visual Recognition Challenge(ILSVRC,靳潇杰 2017 届冠军)arxiv.org

MEOW LAB(Modeling Egocentric Omniscient Worlds)

【制作团队】

后期 / 卷圈
封面 / 姝琦
运营 / 卷圈
监制 / 姝琦
产品统筹 / bobo
场地支持 / AI原点社区

【联系我们】

希望大家在听友群和评论区多多反馈收听感受,这对我们来说十分重要。欢迎添加津津乐道小助手微信:dao160301,加入听友群。

【关于「津津乐道播客网络」】

在一派纷繁芜杂里,我们为愉悦双耳而生。科技、教育、文化、美食、生活、技能、情绪……严肃认真却不刻板,拒绝空泛浮夸。与专业且有趣的人携手缔造清流,分享经历,传播体验,厘清世界与你的关系。

津津乐道 | 科技乱炖 | 津津有味 | 记者下班 | 不叁不肆 | 厂长来了 | 编码人声 | 沸腾客厅 | 拼娃时代

收听平台

苹果播客 | 小宇宙App | Spotify | 喜马拉雅 | 网易云音乐 | QQ音乐 | 微信听书 | 荔枝FM | 央广云听 | 听听FM | Sure竖耳App | Bilibili | YouTube

联系我们

津津乐道播客官网 | 公众号:津津乐道播客 | 微信:dao160301 | 微博:津津乐道播客 | 商业合作:hi@dao.fm | 版权声明 | RSS订阅

本节目由「声湃 WavPub」提供内容托管和数据服务支持。

See all episodes