Workflow
AI浪潮录丨对话刘知远:通往AGI不易,长跑要顶住资本寒冬
贝壳财经·2025-04-29 09:18

北京AI产业发展现状 - 北京已成为AI大模型领域的战略高地,汇聚了智源研究院、月之暗面、DeepSeek、智谱等人工智能独角兽 [1] - 北京正积极打造"全球开源之都",开源生态已深入汽车、机器人等行业 [1] - 智源研究院发布的"悟道2.0"成为中国第一个万亿大模型 [4] 中国AI技术发展历程 - 2011-2012年科技部973计划项目投入数千万元支持自然语言处理研究,是国内最早的大规模专项支持 [6] - 2013年word2vec方法发布,国内团队立即跟进,与国外领先水平差距约3-4年 [6] - 2018年BERT模型发布,国内团队转向预训练模型研究,同年推出首个知识增强预训练模型ERNIE [7][8] - 2020年GPT-3发布,国内团队训练了CPM(中文预训练模型)第一个版本 [10] - 2024年DeepSeek成功复现OpenAI的o1模型,中美技术差距缩小至半年 [9] 智源研究院的作用 - 采用"投资就是投人"理念,成为顶尖学者的"天使投资人",支持面向未来的科研探索 [11] - 支持机制灵活,2020年拨款数百万元购置10台A100 GPU机器用于大模型训练 [10] - 通过"小同行评议"选拔优秀学者,支持青年科学家3年,理念先进 [11] 企业发展战略 - 面壁智能采取"小而美"的端侧模型战略,避开大厂竞争,从局部优势领域出发 [17][19] - DeepSeek通过算法创新与高效训练克服算力限制,2024年DeepSeek-R1火爆市场 [20] - AI创业者终极目标是奔向AGI,但需要分阶段实现,是一场"持久战" [17][18] 行业竞争格局 - 2023年后国内AI领域明显加速,多个AI"小龙""小虎"涌现,大模型百花齐放 [5][15] - DeepSeek的成功证明中国AI技术已具备国际竞争力,中美差距正在缩小 [5][20] - 行业需要更多耐心,中国可能涌现10个以上类似DeepSeek的企业 [21][22] 技术发展趋势 - AI发展两大主旋律:能效更高(Densing)和能力更强 [20] - 端侧大模型在数据保护、隐私安全方面具有优势,适合汽车座舱等场景 [19] - 未来将通过提高模型能力密度来获得市场竞争力 [20]