算法会梦见电子羊，但人类需要学会与有偏见的AI共存 | 嗨点小圆桌

April 1

1h 19m

View Transcript

Episode Description

我们避开关于算力和估值的宏大叙事，在 AI 原点社区的小圆桌旁，和两位刚刚从硅谷大厂“回归”实验室的科学家聊了聊智能的底色。今天的 AI 圈正处于一种近乎疯狂的正反馈中：计算能力的提升不断压缩试错成本，让轮子越转越快。然而，在这种狂飙突进的背后，一种“令人不安的乌云”正在蔓延——当我们试图用语言模型去模拟整个世界时，我们是否忽略了那些语言无法描述的物理规律，以及潜伏在算法深处的、能够轻易被塑造的偏见？

本期嘉宾带来了极具穿透力的行业观察。刘淼在参与 Llama 系列模型研发时发现，通过改变后训练数据，可以轻而易举地塑造一个模型的偏见与世界观。这种“价值蒸馏”的过程正在悄无声息地发生，并最终通过屏幕影响到那些世界观尚未成型的下一代。而靳潇杰则在试图拆掉“语言模型”的围墙，他认为真实的智能应当源于视觉，源于对物理世界原生规律的理解，而非仅仅是对文字符号的拟合。

在这场对话中，你不会听到枯燥的技术参数，而是会听到关于“学术界如何在 GPU 贫困中坚持想象力”、关于“为什么机器人需要学会识别用户的心流”、以及“为什么说 AI 必须具备情感底线”的深度思考。这不仅是一场关于技术的校准，更是一场关于人类如何在算法织就的现实中，守护自身价值坐标的讨论。

【关于嗨点小圆桌】

2026 中关村论坛期间，海淀区人工智能主题日场外氛围活动“原点 Party Nights”在 AI 原点社区举办。其中音视频播客“嗨点小圆桌”是一档“海淀和他的朋友们”深度对话节目，将邀请主论坛嘉宾、AI 热点人物一同探讨 AI 青年关心的热点话题，欢迎大家收听观看体验。

【本期嘉宾】

刘淼：清华大学人工智能学院助理教授，前 Meta GenAI 高级研究科学家， Llama3/Llama4 多模态核心研发成员；
靳潇杰：北京交通大学计算机学院教授、博导，字节跳动美国研究院创始成员及技术负责人，前 Google 研究院、Snap 研究院研究员
王兆洋：硅星人合伙人

【时间线】

00:05:43 AI 行业完全进入一个正反馈阶段，而这其实从来不是AI研究领域的常态
00:06:38 今天整个 AI 在技术方面过于聚焦了，这是令人不安的乌云
00:13:37 起起伏伏的 AI：2022年“入行”的刘淼，和2017年拿到 Image Net 最后一届冠军的靳潇杰
00:16:11 语言，是我们需要的全部吗——VideoWord 的诞生
00:27:02 Ego4D 与 MEOW 实验室：从用户驱动到任务驱动
00:27:40 CLIP：一个被忽视的但非常关键的工作
00:32:10 当 LLM 统治一切技术路线：在工业界你没有”动摇”的权限
00:43:58 50 年之后，我能非常确信 AI 一定是一个主动的个人化的智能
00:45:07 学术界的 GPU 危机：资源受限是诅咒还是倒逼创新？
00:54:09 的研究院，能不能做出真正的研究？
01:01:35 人不是为了有什么价值而存在的
01:07:10 当看到一个小女孩因为 AI “姐姐”要下线而哭
01:08:53 在训练 Llama 时发现，修改后训练数据可以轻易决定模型的偏见和世界观
01:12:15 未来方向：世界模型，AI的情感，人与机器人的交互

【延伸阅读】

本期对话中涉及的关键论文与资料：Transformer 与注意力机制

Vaswani et al. (2017)，Attention Is All You Needarxiv.org

CLIP：图文对齐的奠基工作

Radford et al. (2021)，Learning Transferable Visual Models From Natural Language Supervisionarxiv.org

Ego4D：第一视角视频大规模数据集

Grauman et al. (2022)，Ego4D: Around the World in 3,000 Hours of Egocentric Video（刘淼为共同作者）arxiv.org

VideoWorld：不依赖语言的视觉世界模型

Ren et al. (2025)，VideoWorld: Exploring Knowledge Learning from Unlabeled Videos（靳潇杰为通讯作者，CVPR 2025）arxiv.org
VideoWorld 2（2026，靳潇杰团队最新续作）arxiv.org

ImageNet 竞赛：深度学习时代的起点

Russakovsky et al. (2015)，ImageNet Large Scale Visual Recognition Challenge（ILSVRC，靳潇杰 2017 届冠军）arxiv.org

MEOW LAB（Modeling Egocentric Omniscient Worlds）

致力于构建 “看你所见、学你所会、懂你所想”的下一代人本能智能系统
collegeai.tsinghua.edu.cn

【制作团队】

后期 / 卷圈
封面 / 姝琦
运营 / 卷圈
监制 / 姝琦
产品统筹 / bobo
场地支持 / AI原点社区

【联系我们】

希望大家在听友群和评论区多多反馈收听感受，这对我们来说十分重要。欢迎添加津津乐道小助手微信：dao160301，加入听友群。

【关于「津津乐道播客网络」】

在一派纷繁芜杂里，我们为愉悦双耳而生。科技、教育、文化、美食、生活、技能、情绪……严肃认真却不刻板，拒绝空泛浮夸。与专业且有趣的人携手缔造清流，分享经历，传播体验，厘清世界与你的关系。

收听平台

联系我们

本节目由「声湃 WavPub」提供内容托管和数据服务支持。

See all episodes

算法会梦见电子羊，但人类需要学会与有偏见的AI共存 | 嗨点小圆桌

View Transcript

Episode Description

Never lose your place, on any device