AI浪潮录丨对话刘知远：通往AGI不易，长跑要顶住资本寒冬

北京AI产业发展现状 - 北京已成为AI大模型领域的战略高地，汇聚了智源研究院、月之暗面、DeepSeek、智谱等人工智能独角兽 [1] - 北京正积极打造"全球开源之都"，开源生态已深入汽车、机器人等行业 [1] - 智源研究院发布的"悟道2.0"成为中国第一个万亿大模型 [4] 中国AI技术发展历程 - 2011-2012年科技部973计划项目投入数千万元支持自然语言处理研究，是国内最早的大规模专项支持 [6] - 2013年word2vec方法发布，国内团队立即跟进，与国外领先水平差距约3-4年 [6] - 2018年BERT模型发布，国内团队转向预训练模型研究，同年推出首个知识增强预训练模型ERNIE [7][8] - 2020年GPT-3发布，国内团队训练了CPM（中文预训练模型）第一个版本 [10] - 2024年DeepSeek成功复现OpenAI的o1模型，中美技术差距缩小至半年 [9] 智源研究院的作用 - 采用"投资就是投人"理念，成为顶尖学者的"天使投资人"，支持面向未来的科研探索 [11] - 支持机制灵活，2020年拨款数百万元购置10台A100 GPU机器用于大模型训练 [10] - 通过"小同行评议"选拔优秀学者，支持青年科学家3年，理念先进 [11] 企业发展战略 - 面壁智能采取"小而美"的端侧模型战略，避开大厂竞争，从局部优势领域出发 [17][19] - DeepSeek通过算法创新与高效训练克服算力限制，2024年DeepSeek-R1火爆市场 [20] - AI创业者终极目标是奔向AGI，但需要分阶段实现，是一场"持久战" [17][18] 行业竞争格局 - 2023年后国内AI领域明显加速，多个AI"小龙""小虎"涌现，大模型百花齐放 [5][15] - DeepSeek的成功证明中国AI技术已具备国际竞争力，中美差距正在缩小 [5][20] - 行业需要更多耐心，中国可能涌现10个以上类似DeepSeek的企业 [21][22] 技术发展趋势 - AI发展两大主旋律：能效更高（Densing）和能力更强 [20] - 端侧大模型在数据保护、隐私安全方面具有优势，适合汽车座舱等场景 [19] - 未来将通过提高模型能力密度来获得市场竞争力 [20]