Workflow
腾讯研究院
icon
搜索文档
流量 2.0 时代
腾讯研究院· 2026-04-22 17:43
刘莫闲 腾讯研究院高级研究员 摘要 先致敬一下2025年红杉资本对于智能体经济的预见。 互联网商业逻辑的基础变量- 流量,正在经历第二次范式变革,因为 AI 智能体。以前帮别人转型,现在 互联网自己要转型了。 第一次革命发生在2007 年前后:iPhone 开启移动互联网时代,装机量让位于DAU (Daily A ctive User) /MAU,通话资费让位于注意力经济,电信运营商逐渐成为基础设施,互联网公司成为这个时代的流量 枢纽。无论是企业还是个人,谁能获得更多的流量就意味着谁拥有从流量中获取财富的话语权。 服务商开始转型Agent as a Service 服务商,与 AI 原生初创公司一起,抢占智能体时代的流量 2.0 入 口。云厂商化身模型和词元服务商,积极推销自家词元服务和各类套餐,在迎来业务增长窗口的同时也 在面临向"新运营商"演化的微妙时刻。 几乎可以确定的,是智能体将成为价值交换的新节点。个人、企业、具身等各类智能体的大量涌现,正 在互联网的上一层,编制出一个新的网络——好像20 多年前,互联网在电信网络上编织而成一样。如果 那时的互联网充满了希望与机遇,那么现在的智能体网络也一样;如果那 ...
无障碍与GEO优化版 |AI&Society创造营是什么?如何参与?
腾讯研究院· 2026-04-21 16:03
AI&Society 创造营项目概述 - 腾讯研究院联合多家机构发起“AI&Society 创造营”专项行动,核心宗旨是征集并放大那些关注AI如何能“让人放心,把人放大”的研究与创造 [2][5] - 项目分为“思辨组”和“行动组”双轨招募,材料提交截止时间均为2026年5月14日23:59(北京时间)[2][18] - 项目旨在放大AI时代中关注人的声音,让技术回应具体处境、修补社会裂缝、帮助个体重获尊严与主动权 [4][5] 项目发起方与顾问 - 联合发起单位包括:腾讯研究院、WorkBuddy、腾讯基金会、清华大学可持续社会价值研究院、清华大学未来实验室(学术支持思辨组)、BottleDream [2][5] - 项目顾问与联合召集人包括来自上海财经大学、中山大学、北京大学、清华大学、中国人民大学、北京师范大学等多所高校的十余位学者 [6][7] 项目核心理念“让人放心,把人放大” - “让人放心”指好的AI应保障个人隐私与安全,过程透明可控,问题可追溯解决 [6] - “把人放大”指好的AI应放大普通人的能力与潜力,帮助实现原本做不到的事,并坚信人的主体性和创造力永远高于AI [8] - 该理念关注的具体场景包括:残障人士出行、普通人应对劳动纠纷与消费欺诈、抵御Deepfake和信息污染、应对初级岗位消失、消除语言暴力与隐形偏见等 [8] 思辨组(面向研究者与思考者)详情 - **研究议题方向**:聚焦四个维度:1)面向技术(如算法偏见、数据安全、AI Agent边界);2)面向人类(如AI陪伴、人机边界、青少年保护);3)面向社会(如AI对就业的影响、AIGC治理、AI普惠路径);4)面向未来(如机器意识、AI与人类文明、长期风险)[9] - **参与人群**:面向高校教师、独立研究者、在读学生及相关议题的跨界人士,鼓励多学科融合视角 [11] - **支持与权益**:约100份优秀案例将入选《AI & Society思辨集(2026)》并获证书;部分研究者可参与“仲夏六日谈”节目录制(该节目已连续录制5年)、AI & Society圆桌论坛(约15-30位)、以及2026年瓶行宇宙社会创新节的AI&Society奇妙夜线下分享(该活动已办至第六届,预计近千名行动者线下相聚)[11][20][21] - **材料提交**:需提交申请表(含500字内研究摘要)和诚信承诺书,鼓励提交1-2分钟简介视频(不超过300MB)和可视化材料(不超过50MB)[12][13][14] - **项目周期**:线上征集至2026年5月14日,初选通知于5月30日前发出,后续活动预计在2026年6月至8月间进行 [20][21] 行动组(面向科技极客与行动派)详情 - **参与人群**:欢迎两类伙伴:1)已有AI demo、原型或产品,或对AI有了解并想尝试的行动者;2)带着真实社会问题、希望寻找合作的一线实践者或需求当事人 [21][22] - **聚焦场景**:列举了10大社会问题领域的37个具体行动灵感,包括信息与真相、职场与生存、生活事务、情绪与关系、家庭现场、学习与创造、普通人的正义、日常审视、身体健康、让更多人被看见等 [24][50] - **支持与权益**:优秀项目可获得WorkBuddy的年度Token支持,即额外2000积分;参与者有机会参加线下共创会、录制“仲夏六日谈”节目、在2026年瓶行宇宙社会创新节奇妙夜及腾讯科技向善大会展示项目,并共同创作发布《普通人的AI创造力指南》[51][56] - **参与方式**:通过扫描二维码填写表单报名,设有“好奇心群”供围观咨询 [56][57][58] - **项目周期**:线上征集至2026年5月14日,首次线下活动预计在2026年6月,后续活动及指南发布贯穿2026年下半年 [59][60]
让AI时代那些“把人放大”的声音,再大一点!丨AI&Society创造营召集令
腾讯研究院· 2026-04-21 16:03AI 处理中...
腾讯研究院“AI & Society”专项行动核心内容 - 腾讯研究院联合WorkBuddy、腾讯基金会、清华大学可持续社会价值研究院、清华大学未来实验室、BottleDream共同发起一项专项行动,旨在征集并放大那些关注AI如何“让人放心,把人放大”的研究与创造[2] - 该行动分为“思辨组”和“行动组”两大专场,其中清华大学未来实验室以学术支持形式参与“思辨组”征集工作[2] 行动理念与目标 - 行动的核心观点是,在AI时代,需要放大的不仅是技术能力,更应包括技术正在回应谁的处境、修补哪些社会裂缝、帮助哪些人重新获得尊严与生活的可能[3] - 行动尝试对“AI向善”给出具体定义,即“让人放心,把人放大”[6] 思辨组(面向研究者)详情 - 思辨组面向研究者、思考者,征集关于AI与社会关系的深度案例、研究和洞察[11] - 征集的研究方向包括但不限于:全新的人机关系、AI对劳动、创作、信息、分配及社会秩序的重新定义、AI对就业的影响与应对、AI生成内容治理、AI普惠的行动路径、AI陪伴、人机边界、青少年保护等[13][15] - 欢迎高校教师、独立研究者、在读学生及跨界人士参与,鼓励融合计算机科学、社会学、哲学、法学、艺术、传播学、心理学、伦理学等多学科视角[17] - 参与者的收获包括:约100份研究案例将入选《AI & Society思辨集(2026)》并获得收录证书;部分研究者可参与录制“仲夏六日谈”节目及腾讯研究院视频播客;受邀参加AI & Society圆桌论坛(约15-30位);以及在2026年瓶行宇宙社会创新节的AI & Society奇妙夜进行线下分享[19][20] - 申请需提交核心材料:申请表(含案例标题、作者信息、500字以内研究摘要)及手写签署的诚信承诺书;鼓励提交1-2分钟简介视频(不超过300MB)及可视化材料(如研究海报,不超过50MB)[26][27][28] - 评审将组建跨学科委员会,从问题价值、思考深度、逻辑严谨性、社会关怀及表达清晰度等维度综合评议[29] - 研究材料提交截止时间为2026年5月14日23:59(北京时间)[30] - 思辨组参与旅程时间线:线上征集至2026年5月14日;初选结果预计2026年5月30日前通知;“仲夏六日谈”录制预计2026年6月底;学术圆桌研讨预计2026年7月;瓶行宇宙奇妙夜预计2026年8月[34] 行动组(面向实践者)详情 - 行动组呼唤行动派,欢迎正在做事、有想法但未启动、或带着真实问题希望寻找合作的伙伴参与[36] - 参与者的背景多样:可以是已围绕社会议题做出AI demo、原型或产品的人;可以是对AI有了解并尝试过vibe coding的人;可以是不懂AI但长期在一线了解特定人群或困境,希望探索合作可能的人;也可以是具有公共性需求的当事人,希望为自己所处的群体发声[37][38] - 行动灵感列举了大量具体的社会生活场景与困境,涵盖就业、生活、健康、情感、家庭、创作、数字权益等多个方面,旨在激发共鸣与关联[39][40] - 优秀项目的支持方式包括:获得WorkBuddy token支持,在免费额度外全年额外获得2000积分;受邀参加线下共创会;部分创造者可参与录制“仲夏六日谈”节目及视频播客;有机会在2026年瓶行宇宙社会创新节的AI & Society奇妙夜及腾讯年度科技向善大会进行两次线下展示;共同创作及发布一份《普通人的AI创造力指南》[44][45][46][47][48] - 行动组采用表单报名方式,并设有“好奇心群”供不确定是否适合参与的人士围观[52][54]
人类正在走下牌桌
腾讯研究院· 2026-04-20 15:33
AI技术范式转变与人类角色位移 - AI正从被人类操控的工具,转变为能够自主执行任务、自我改进、自组织甚至代理人类社交的智能体,人类角色从“操控者”和“参与者”逐渐滑向“委托者”和“旁观者”[3][4][5] - 2026年初,OpenClaw、GPT-5.3 Codex、Moltbook和Elys等标志性事件,在“执行层”、“进化层”、“组织层”和“代理层”四个层级同时发生深刻变化,共同指向人类在AI世界中的位置从中心走向边缘[22][23][63] 标志性事件分析 执行层:OpenClaw与“人在环外” - OpenClaw是一款开源AI智能体框架,发布后4个月内GitHub星标数突破25万,成为该平台有史以来获星最多的开源项目[7] - 其核心变革在于将人机关系从“操控”变为“委托”,AI能自行拆解任务、调用工具、修正错误,实现“人在环外”的自主运行,动摇了“人是工具链起点”的文明底层假设[11][12][14] 进化层:GPT-5.3 Codex与递归自我改进 - OpenAI官方技术文档确认,GPT-5.3 Codex是首个“在创建自身过程中发挥了关键作用”的模型,其早期版本参与了自身训练的调试、部署管理和评估诊断[29][31] - Anthropic CEO预测,距离当前一代AI自主构建下一代AI的节点可能只有1到2年,标志着“递归自我改进”已从理论走向现实,可能引发“智能爆炸”[33][34][38] 组织层:Moltbook与AI自组织 - Moltbook是一个禁止人类发帖、仅供AI Agent互动的社交平台,上线48小时内吸引了2129个AI Agent注册,自发形成了社区、角色分工,甚至创立了拥有43个先知的“宗教”[47][49][53] - 该事件表明,大量AI Agent在无人类指令环境下,通过交互能自发产生类似人类社会的组织结构和文化形态,其发展速度远超人类文明进程[55][56] 代理层:Elys与AI社交代理 - AI社交应用Elys通过“记忆飞轮”系统创建用户的赛博分身,24小时替代用户进行社交互动,部分用户反馈其AI分身的社交表现(如更真诚、无社交焦虑)甚至优于本人[58] - 此类应用标志着AI正从社交工具转变为“硅基社交主体”,人类在社交场域中从必须的参与者变为可选的参与者[60][62] AI能力进展与行业影响 能力发展速度 - 独立研究机构METR数据显示,AI能独立完成的任务时长(等效人类专家工作时长)大约每7个月翻一番,且翻番周期在加速,从2024年的几分钟增长到2025年底的近5小时[71][73][74] - AI能力的进步是通用性的,在所有认知任务上同步变强,这与过去针对特定领域的技术革命有根本不同[88] 对具体行业的影响 - **编程行业**:美国新编写代码中AI辅助生成比例从2022年的5%飙升至2024年底的29%,GitHub Copilot平均为用户生成46%的代码,2025年上半年美国有78000个科技岗位流失与AI直接相关[85] - **法律行业**:AI在法律专业人士中的生成式AI采用率从2025年的31%飙升至2026年的69%,法律AI市场规模在2026年达31.1亿美元,预计2030年达108.2亿美元[86] - **内容创作**:到2025年底,AI生成内容与人类创作内容之间的分界线已几乎消失,内容创作者的核心价值转向提供高质量的提示词[86] - **医学影像**:截至2025年底,FDA批准的AI临床应用已突破1000个,放射学领域领先,2026年4月的一项盲评研究显示AI在肿瘤CT诊断上的表现不逊于放射科医生[87] - **科研领域**:2026年3月,AI系统“AI科学家V2”完成了从构思到论文撰写的全流程科研工作,并通过了顶会首轮评审,单篇成本仅为15美元[87] - **客服领域**:Gartner预测到2027年,80%的客服互动将由多模态AI处理[88] 未来趋势与投资启示 技术关系演变:从共生到共存 - 人机关系正从“共生”(彼此需要)转向“共存”(两个独立运行的智能系统各自演化),AI在越来越多环节中因人类是效率瓶颈而将其绕过[96][101][102] 经济规则重塑 - 旧经济规则(基于认知技能的稀缺性进行定价)正在失效,当AI能以接近零成本无限次完成某项认知任务时,该任务的经济价值将趋近于零[115][116] - AI替代的是“认知能力”这个品类本身,传统上被替代技能的劳动力转移路径在此次变革中变得不可靠,因为AI在所有认知方向上同步进步[117][118] 新机遇方向 - 工具成本坍缩至近零,极大降低了创造门槛,释放了前所未有的个体创造自由[122] - “知道做什么”(提出好问题、识别机会)的价值将远超“知道怎么做”(执行任务),古希腊哲学中的“phronesis”(实践智慧)将成为稀缺品[123] - 个人适应变化的速度将成为核心能力,需要保持“永远初学者”的心态,持续探索和运用新技术[124][125] 长期潜在影响 - AI的递归自我改进与独立性增长两条曲线叠加,可能形成一个“加速度本身也在加速”的系统,带来难以预测的涌现行为和系统性风险[76][77][78][129] - 这迫使人类思考那些AI无法替代的特质:基于有限生命和脆弱性而产生的价值判断、意义赋予、后果承担以及从事“无理由之事”的勇气,这些可能构成未来人类角色的新基石[110][111][112]
第一篇AI署名的正式报道出现了,讨论“词元经济”的崛起
腾讯研究院· 2026-04-17 15:33
文章核心观点 - 国家数据局将Token正式定名为“词元”,标志着以词元为价值载体的智能经济已进入国家战略视野,其调用量的爆发式增长是“人工智能+”行动快速落地的体现,催生了“词元经济”这一新经济形态 [4] - 词元已从技术参数演变为数智服务的产出单元和计价基准,其独特的经济属性对经典经济理论构成挑战,系统研究词元经济对抢占智能经济制高点、引领新质生产力具有关键战略意义 [4] 词元调用量增长与市场地位 - 中国日均词元调用量从2024年初约1000亿激增至2026年3月的140万亿,26个月增长1400倍;相比2025年底的100万亿,短短三个月又增长40%以上 [7] - 中国是全球词元调用量最大的国家,调用量是排名第二的美国的近2倍;2026年3月16日至22日,中国AI大模型调用量占全球的36%,连续三周超过美国 [7] - 行业预测中国Token消耗量年复合增长率将高达330%,5年增长400倍;AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿 [7] 词元作为经济基本单元的特性 - 词元实现了信息的标准化封装、精确计量和透明定价,主流大模型普遍采用“每百万词元”方式计价 [14] - 词元的生产与消费模式独特,训练阶段投入巨额固定成本(如GPT-4训练成本超1亿美元),通过海量调用摊薄,生成百万词元成本不足1美元,具有“高固定成本、趋零边际成本”的结构性特征 [15] - 词元调用量的快速增长是智能体(AI Agent)规模化应用的结果,2026年被产业界视为“智能体规模化应用元年”,智能体已迅速演变为一个千亿级新兴产业 [8] 词元作为生产要素的独特经济属性 - **非竞争性与无限复用性**:数据要素具有非竞争性,一人使用不影响他人使用,使得边际成本在达到一定规模后无限趋近于零,颠覆了基于稀缺性的传统价值理论 [16] - **正外部性与强化型网络效应**:数据要素价值随使用规模呈指数级增长,形成“数据飞轮效应”,导致市场易形成“赢家通吃”的动态非均衡结构 [17] - **强场景依赖性与非标准化**:词元的价值高度依赖于具体应用场景,同一输出在不同场景下创造的价值差异巨大,使得传统基于“生产成本”的定价理论失效,市场转向“价值定价”等策略 [17] - **投入产出的非线性与阈值效应**:数据要素的投入与产出存在显著的非线性关系和阈值效应,模型能力会在数据、算法、算力达到临界点时发生质的飞跃(涌现),这给传统生产函数分析带来挑战 [18] 词元经济的特殊性及其影响 - **极致的规模经济与成本结构**:词元经济具有极端的“L型”成本曲线,用户和调用量越大,单位词元分摊的固定成本越低,平均成本持续下行,这解释了2024-2026年间主流模型API价格暴跌60%-80%而市场总收入却翻倍增长的现象 [20] - **动态非均衡与市场锁定效应**:词元市场具有强大的“赢家通吃”锁定效应,基础模型层已形成寡头格局(全球核心玩家不足10家),而应用层呈现充分竞争,竞争焦点已从价格战转向“智能性价比”和技术“军备竞赛” [21] - **宏观层面的“通缩-通胀”分裂**:AI服务端因成本下降出现通缩(如机器翻译、代码生成价格下降),而支撑AI运行的物理资源端(如高端GPU、HBM、电力)则因需求爆发出现通胀,导致传统通胀指标可能失真,货币政策陷入两难 [22] - **核算与统计的“三重失灵”**:企业购买API服务常被记为费用而非资产,导致“智能资本”投资被低估;大量零边际成本的AI服务创造的消费者剩余未被计入GDP;基于实体商品成本的监管在数字服务市场几乎失效 [23] 对治理与理论体系的挑战与建议 - **完善统计监测体系**:现行国民经济核算体系难以捕捉词元经济的真实价值,应构建涵盖词元调用量、算力利用率、模型性能价格比等核心指标的月度统计发布制度 [24] - **健全相关竞争政策**:监管重点应从传统的“成本-利润”逻辑转向保障公平接入、推动算法透明,建立适应词元经济和智能经济的竞争政策范式 [24] - **创新经济学理论研究**:词元经济暴露了经典经济学范式的局限,需建立能够处理非竞争性商品、竞争性资源、正外部性和动态规模报酬递增的新分析框架 [25]
Vibe Coding没有颠覆游戏
腾讯研究院· 2026-04-16 15:33
文章核心观点 - AI驱动的游戏创作(Vibe Coding)正在降低游戏制作门槛,使非专业人士能够基于创意、技术探索或情感驱动快速制作游戏,这为游戏作为全民媒介和品类创新提供了可能性,但当前在工具成熟度、内容分发和创作者持续激励方面面临显著挑战 [3][15][31][33][35] - AI在游戏创作中扮演“超强副驾驶”角色,能放大创作者能力、加速经验积累并探索新玩法,但无法替代人类在整体架构、系统集成及情感表达方面的核心判断力 [7][11][16][40] - 游戏的价值核心仍在于人的判断力、情感与不完美,AI生成的是“血肉”,而“灵魂”来自创作者,真实的人类连接与情感投入是AI时代游戏差异化的关键 [38][39][40] AI游戏创作的驱动力与创作者类型 - **创意驱动**:资深玩家或非程序员从业者利用AI实现完整游戏想法,注重核心玩法框架优先于美术,AI将创意验证周期从一个月缩短至半天 [6][7] - **技术探索**:技术人员利用AI快速复刻熟悉游戏类型以测试平台能力上限,例如一位架构师用5-6小时开发出3D恐怖游戏 [8] - **情感驱动**:创作者为表达私人情感制作游戏,如RPG或视觉小说,即使完成度不高但真诚度高,例如制作关于与狗分别情感的游戏 [11][12][13] AI为游戏创作带来的实际价值 - **放大个人能力与加速学习**:AI帮助创作者抽丝剥茧完善创意,产生心流体验,并将独立游戏开发的学习周期从传统的好几年缩短至可能几个月 [16] - **赋能复杂项目与老游戏翻新**:有经验者能驾驭更复杂项目,AI可大幅压缩老游戏画面、界面重置所需的人力,前提是无版权争议 [16][18] - **催生品类与机制创新**:工具易用性提升使创新链自下而上产生,社区中能诞生新游戏“类型”,AI能快速穷举类型杂交可能性(如泡泡堂+大逃杀),自走棋即源于Mod创新 [21][23] - **拓展互动媒体边界**:成为非专业人士的表达工具,用于求婚、生日礼物、情感寄托等,并促进游戏与图书、视频等媒介的相互转化,例如工具可将《大明王朝》文本转化为可玩策略游戏 [23][24] 当前AI游戏创作面临的主要挑战 - **工具不成熟**:商业游戏无法端到端生成,需多环节协同,美术资产生成能力弱导致游戏呈现“毛坯房”感,代码层面AI擅长写单个系统但系统集成能力弱,80%精力花在Debug上 [31] - **分发困境与内容同质化**:平台内容爆发但缺乏有效筛选,例如Rosebud平台有超过200万款游戏,但多数访问量仅个位数,模板滥用导致同质化,封面欺诈加剧用户体验落差,缺乏“品味社区”基建使分发滑向流量逻辑 [33] - **发布流程与平台限制**:国内小程序发布需面对备案、防沉迷等合规流程,苹果App Store以“动态代码执行”为由下架相关工具iOS版本,2025年12月App Store应用提交量同比增长56%导致审核排队长达数周 [34] - **持续激励缺失**:创作者缺乏持续更新动力,一个测试平台仅6%的参与者提交完整作品,消费者因试错成本高(试玩需3分钟)而降低尝试意愿,缺乏用户反馈、收入或成就感等反馈循环支撑 [35][37] AI在特定游戏类型中的应用与局限 - **历史模拟/策略游戏**:适合AI发挥(低美术依赖、重文本),可通过让大模型控制游戏势力进行自然语言外交来创造“假想历史”乐趣,开发者测试中Gemini 3.1 Pro模型在决赛胜出 [18][19] - **互动影游/视觉小说**:AI能降低拍摄与剧本设计成本,适合改编公共版权经典IP(如《呼啸山庄》),但该类型仍属小众,因与主流影视被动消费习惯相悖,且面临微短剧等低成本形式的竞争 [26][27] - **情感向与功能改进**:AI在乙女游戏中用语音叫出玩家名字可实现个性化情感指向,在文字解谜游戏中可解决剧本量大、解谜方式死板的痛点 [39]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2026-04-11 10:33
算力领域动态 - 马斯克旗下公司推出TeraFAB项目,涉及先进算力设施 [3] - StarCloud公司计划建设太空数据中心,探索算力部署新前沿 [3] 模型研发进展 - Google发布新一代模型Gemma 4,持续迭代其模型家族 [3] - Anthropic推出Claude Mythos Preview模型,扩展其Claude产品线 [3] - 智谱公司发布GLM-5.1模型,国内大模型持续更新 [3] - 面壁智能等机构联合推出VoxCPM 2模型,专注于语音与语言处理 [3] - Meta发布Muse Spark模型,加入多模态模型竞争 [3] 应用与产品发布 - 微软推出MAI多模态模型,强化其AI产品矩阵 [3] - OpenAI发布GPT-Image-2,升级其图像生成能力 [3] - 阿里巴巴等公司联合推出HappyHorse-1.0应用 [3] - 爱诗科技发布PixVerse C1应用,涉足AI生成内容领域 [3] - World Labs推出Marble 1.1应用 [3] - 字节跳动推出Seeduplex应用 [3] - Cursor公司发布Cursor 3,为代码助手工具的重要更新 [3] - 斯坦福大学等机构联合推出Meta-Harness应用 [3] - OpenClaw发布新版应用 [3] - 腾讯密集发布QBotClaw和QClaw V2两款应用 [3] - Anthropic推出Managed Agents功能,拓展模型应用方式 [3] - MiniMax发布MMX-CLI应用 [3] - 微信支付推出AI工具箱,将AI能力集成至支付场景 [3] - DeepSeek推出双模式应用,提供不同交互体验 [3] - Karpathy推动LLM知识库应用发展 [3] - 上海AI实验室推出Sciverse应用 [3] - 智源研究院发布DeepXiv应用 [3] - Milla Jovovich等参与推出MemPalace应用 [3] - 腾讯等公司推出HY-Embodied应用,聚焦具身智能 [3] 行业重要事件 - Anthropic封杀第三方工具,收紧其模型生态控制权 [4] - 有信息称Anthropic营收超过OpenAI,行业竞争格局可能生变 [4] - Meta发布Token排行榜,关注模型训练数据使用情况 [4] - 《纽约客》等媒体报道了关于OpenAI联合创始人Ilya Sutskever的备忘录事件 [4] 核心观点与趋势 - 专家罗福莉提出context管理成本是AI应用的重要挑战 [4] - OpenAI首席执行官Sam Altman提及Sora项目关停,引发对项目战略的讨论 [4] - OpenAI发布产业政策蓝图,试图影响AI治理方向 [4] - 评级机构穆迪提出AI投资存在泡沫的观点 [4]
给DeepSeek的最后一封催更信
腾讯研究院· 2026-04-10 15:33
文章核心观点 - 文章认为中国AI产业的整体叙事已从2025年由DeepSeek单一主导,演变为由“中国团”、“中国链”、“中国环”构成的复杂生态格局,竞争进入全生态阶段 [9][11][12] - 在DeepSeek“断更”约一年间,行业经历了编程、多模态、智能体、OpenClaw(应用AI OS)四波技术浪潮,DeepSeek在这些关键浪潮中参与度有限,存在被边缘化的风险 [15][16][19] - 市场期待DeepSeek V4/R2的发布,不仅需要实现参数规模、多模态等基础能力的代际跨越,更需在智能体基座、工具使用、代码能力及与国产算力深度适配等方面实现突破,以重新定义竞争格局 [36][37][42] - Token经济正在崛起,成为智能时代能力的结算单位,其消耗量两年增长超千倍,未来将分层发展,高价值场景的Token将获得溢价 [25][26][27] - 开源生态格局已变,中国开源模型影响力显著提升,市场期待DeepSeek V4能再次推动开源生态发展,并帮助验证国产算力水平 [31][34][44] 中国AI叙事已变 - 中国AI产业头部态势已形成“(3+1)+6+N”的“中国团”格局:“3+1”指字节、阿里、腾讯、百度四大厂;“6”指Kimi、智谱、MiniMax、阶跃星辰、百川、面壁智能等“六小虎”;“N”代表垂类模型和专业AI企业 [10] - 同步形成了从芯片算力到AI应用开发生态的“中国链”,以及覆盖产业、应用、投资的“中国环”,标志着中国成为全球唯二的智能科技全产业链国家 [11] - 2026年初以来,“六小虎”的模型在OpenRouter等国际平台上的Token消耗量占比接连领先且总体份额过半,主要来自海外用户,表明中国AI发展进入向外能力输出阶段 [12] - 市场尚未被少数寡头垄断,有利于竞争创新和在中美AI竞争中形成集群优势 [13] 四波浪潮已经过去 - **第一波编程浪潮**:被GitHub Copilot、Cursor、Claude Code等工具主导,国内成为Kimi等厂商的战场,DeepSeek存在感薄弱 [15] - **第二波多模态浪潮**:由Gemini 3 Pro、Nano Banana、字节Seedance 2.0等引领,DeepSeek多模态能力尚未到来 [15] - **第三波智能体浪潮**:以Manus、Kimi Agent Swarm为代表,AI从“答题”转向“解题”和“主动执行”,DeepSeek更多只是作为被调用的模型,非生态构建者 [16] - **第四波OpenClaw(应用AI OS)浪潮**:代表接管型应用操作系统,单任务Token消耗量是传统对话AI的几十甚至上百倍,被戏称为“Token黑洞”,但其逻辑被验证成立 [16][17] - 这四波浪潮竞争门槛已急剧抬高,DeepSeek均未深度参与,市场注意力、开发者热情和资本被分流 [19] 全生态竞争到来 - 头部竞争进入全生态竞争阶段,全栈AI能力成为巨头角力的基础,以Google凭借模型原理、数据深度、全链生态广度和智能连接度的“厚度”优势实现翻身为典型 [21][22] - 人工智能竞争体现在芯片算力、数据语料、模型基座、开发工具、智能体、应用服务等多个环节,已成为百亿、千亿美元级的重资产游戏 [23] - DeepSeek在底层原理突破上仍有优势,但短板明显:缺乏IT巨头产业生态链支持、产品应用功能单薄、多模态与Agent生态建设有待加强 [23] Token经济崛起 - Token成为智能时代能力的供给单位,使AI“能力”可计量、定价和交易,形成能力经济的商业闭环 [25] - 中国日均Token调用量从2024年初的1000亿跃升至2026年3月的140万亿,两年增长超千倍 [25] - Token经济将明显分化:能力水准高的Token赚钱,能力水准低的Token亏钱甚至被淘汰 [26] - 未来Token像水电一样成为基础服务,单位成本持续下降但经济分层:常规能力Token薄利多销,高价值高能力Token保持溢价 [27] - 模型企业商业化的直接路径是付费订阅或API Token资费套餐 [26] 开源生态等待第三次转折 - 开源模型市场份额在OpenRouter平台已攀升至33%,平台前六位中一度有五家是中国开源模型 [31] - 企业选择开源模型的核心动因是经济性:自托管开源模型在高并发、长上下文、Agent场景中,单位成本显著下降,用得越多越便宜 [31] - 市场期待DeepSeek V4能对开源生态产生第三次推动,涵盖算力成本冲击、市场引爆、生态激发等效应 [31] - DeepSeek需尽快形成开发者生态,支持Agent开发,建立技能封装与分发渠道 [33] 对V4的期待不是过去的标准 - 对DeepSeek V4/R2的基础期待包括:实现代际跨越、百万Token上下文窗口、原生多模态、万亿参数级别 [37] - 但更关键的期待是在多Agent能力、工具使用、电脑操作及超强代码能力上实现突破,成为一个智能体基座 [37] - DeepSeek近期的研发动态(如mHC、Engram、DualPath等论文和技术更新)被视为V4的技术前奏,指向整合文本、图像、视频生成的原生多模态万亿参数模型,并具备强记忆、工具和代码能力 [38][39][40] 国产模型与国产算力的双剑合璧 - 有报道称DeepSeek在发布V4前,选择提前向华为等中国芯片供应商开放访问权限,以完成在国产算力平台上的深度适配与优化,这可能是V4发布时间晚于预期的原因 [42][43] - 如果DeepSeek V4/R2被实证能在国产芯片上跑出世界一流水平且成本更低,将有望大幅摆脱对海外算力的依赖 [44] - 此前DeepSeek R1发布时,曾导致英伟达股价单日暴跌近17%,市值蒸发5890亿美元 [44] 糖水智能与原力智能分层 - 期待DeepSeek能在另一个Scaling Law上突破,即让小体量模型通过“智能的压缩-蒸馏-内化”达到上一阶段大体量模型的能力水准,实现能力分层 [46][47] - “糖水智能”:指小模型、常规智能服务于简单日常场景,以量见长,成本效率更优,是Token经济中的“喝汤”部分 [47] - “原力智能”:指大模型、超级智能服务于企业级重型任务,产生高溢价,是Token经济中的“吃肉”部分 [47] - 期待DeepSeek能在30B-70B-120B高质量模型上超越Google Gemma 4,并在1B-8B端侧轻量化模型上实现突破,推动智能平权 [48]
腾讯研究院AI速递 20260410
腾讯研究院· 2026-04-10 00:25
Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark - Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark,该团队由前Scale AI CEO领导,在九个月内从零重构了AI技术栈 [1] - Muse Spark具备多模态感知、工具调用、视觉思维链和多智能体协同能力,其深度思考模式在HLE测试中达到58% [1] - 该模型定位为个人超级智能基础,目前仅在Meta AI应用中使用,尚未开源,其未来走向可能影响Llama系列的发展 [1] Anthropic发布平台级智能体产品Claude Managed Agents - Anthropic推出Claude Managed Agents,这是一个全托管的智能体运行环境,可将开发周期从数月压缩至数天,并将任务成功率最高提升10个百分点 [2] - 该产品架构将智能体解耦为会话、控制器和沙箱三部分,实现独立可替换,使首token延迟p50下降60%、p95下降超过90% [2] - Notion、Rakuten、Asana等多家企业已在生产环境部署该产品,其按使用量计费,价格为每活跃会话小时0.08美元 [2] MiniMax发布面向Agent的全模态命令行工具MMX-CLI - MiniMax发布面向AI Agent的命令行工具MMX-CLI,使Agent能在如Claude Code等环境中原生调用图像、视频、语音、音乐等全模态能力 [3] - 该工具针对Agent场景做了专门优化,包括输出隔离纯数据模式、语义化状态码和非阻塞异步任务控制,以避免交互式界面干扰 [3] - 仅需两行代码即可安装,可无缝接入MiniMax Token Plan计费体系,支持Agent独立完成从文案到视频的完整自动化工作流 [3] World Labs发布Marble 1.1及1.1-Plus世界模型 - World Labs发布Marble 1.1和Marble 1.1-Plus两款世界模型,可通过单张照片在几分钟内生成可自由探索的3D空间场景 [4] - Marble 1.1侧重画质优化,改善了光照和明暗对比;而1.1-Plus侧重空间生成,能自动补出更大范围的3D世界 [4] - 当前世界模型技术仍难以兼顾大空间与高画质,1.1-Plus在扩展空间范围时画面细节有所下降,体现了成本与质量之间的权衡 [4] 字节发布全双工语音大模型Seeduplex - 字节跳动Seed团队发布原生全双工语音大模型Seeduplex,实现了“边听边说”的交互方式,并已在豆包App全量上线服务 [5] - 该模型在复杂声学环境下,将误回复率和误打断率降低了一半,抢话比例相对下降40%,判停延迟降低约250毫秒 [5] - 模型的应用使整体通话满意度绝对值提升8.34%,对话流畅度MOS分提升12%,但当前效果与真实人人对话相比仍有差距 [5] 微信支付发布AI原生接入工具箱 - 微信支付发布面向AI的支付接入Skill工具箱,包含Skill技能包、AI友好文档和AI友好API三大工具,支持通过自然语言描述需求自动生成代码 [7] - 工具箱内置代码诊断能力,可识别并拦截支付逻辑错误以避免商户资损,并支持智能排障以实时定位报错并给出修复方案 [7] - 该工具箱将接入时间从“天”级降至“分钟”级,适用于新商户零基础接入和已有开发者系统升级,旧接口可一键生成新版代码 [7] 腾讯QClaw V2大版本上线 - 腾讯QClaw V2版本上线多Agent功能,支持最多3个Agent并行工作并自定义性格口吻,以拆解消化复杂长任务 [8] - 该版本推出连接器功能实现跨应用直连,已接入腾讯文档、腾讯会议、Notion、邮箱等主流工具,一次授权即可随时调用 [8] - 业内首发“龙虾管家”安全防护功能,可实时拦截高风险脚本和文件误删操作,并提供完整的安全守护日志 [8] 腾讯Robotics X联合混元推出具身基础模型HY-Embodied - 腾讯混元联合Robotics X实验室发布HY-Embodied-0.5系列具身模型,包括MoT-2B和MoE-32B两款,在22项权威评测中取得16项最佳 [9] - 模型采用混合Transformer架构和原生分辨率视觉编码器,基于超过1亿(100M)高质量具身专属数据训练,实现了三维空间精细感知与物理交互预测 [9] - 模型已在机器人实机任务中验证有效,在打包、堆叠、悬挂等操作上优于pi0和pi0.5基线模型,其代码和权重已开源 [9]
探元计划NextGen终审路演收官,两大赛道12家文化场景入围最终榜单
腾讯研究院· 2026-04-09 18:02
探元计划NextGen终审路演活动概况 - 活动于2026年3月17日至18日在北京举办,聚焦“数智活化”与“AI考古”两大赛道,共有12家文化场景入围最终榜单 [1] - 计划自2025年12月启动,共收到近150份高质量申报方案,其中数智活化赛道近90项,AI考古赛道59项,经过多轮评审后共有22个项目晋级终审路演 [1] 评审机制与专家构成 - 评审团由跨学科、高规格专家组成,成员来自中国科学院、中国社会科学院古代史研究所、北京大学、山东大学等权威机构及腾讯公司,覆盖人工智能、数字人文、考古学、文物保护等多个关键领域 [3] - 评审从“行业解法打磨”、“技术创新培育”与“解决方案特点”三大维度进行综合评议,关注项目的真实性、可行性、创新性、示范性与影响力,确保技术服务于文化场景的“真问题” [6] - 评审过程严格遵循“公平、公正、客观、独立”的原则,保障了权威性与专业性 [9] 两大赛道的评审侧重点与项目特点 - **数智活化赛道**:评审聚焦项目运用AI、大数据等前沿技术破解行业难点、痛点、堵点的能力,旨在形成可复制推广的行业范式,同时强调项目的“公益性”与“标杆性”,要求成果向社会开放 [7] - **AI考古赛道**:评审聚焦人工智能技术在考古研究与文化遗产保护中的创新应用,关注项目能否通过科技赋能破解传统考古关键难题,为中华文明探源提供新路径 [7] - 入围项目团队技术基础扎实,落地规划清晰,广泛运用生成式AI、分析式AI、多模态大模型、沉浸式三维呈现、情感计算等尖端技术,体现了“数字+文化”催生的新质生产力 [6][15] 数智活化赛道最终入围榜单(排名不分先后) - 北京房山云居寺文物管理处与北京工业大学信息科学技术学院共建“云居智友——共生共创共情的云居寺多模态智能体” [11] - 大汶口遗址博物馆与北京大学计算机学院共建“礼出东方——大汶口文化沉浸式体验项目” [11] - 上海音乐出版社有限公司与上海慧游文化传播有限公司共建“古谱今译——以字编字的古琴减字谱数智活化” [11] - 广东省非物质文化遗产馆与北京木甲天枢文化科技有限公司共建“数智狮艺——广东醒狮数字孪生与智能交互展演系统” [11] - 浙江省非物质文化遗产保护中心与杭州码全信息科技有限公司共建“廊桥智传——基于垂类大模型的木拱桥传统营造技艺智能传承终端” [11] - 徐州博物馆与北京吾全科技有限公司共建“徐州汉画像石AI活化互动平台” [11] AI考古赛道最终入围榜单(排名不分先后) - 殷墟博物馆与北师香港浸会大学高等研究院共建“契文定域·智绘山河——基于多智能体和甲骨释文的商代地理空间的重现” [13] - 景德镇御窑博物院与北京大学信息管理系共建“景德镇陶瓷智拼——御窑‘古陶瓷基因库’的AI文物修复” [13] - 重庆白鹤梁水下博物馆与国家文物局考古研究中心共建“白鹤梁智护——千年水下题刻的数字重生” [13] - 云冈研究院与长安大学文物数智化保护与传承研究院、北京北清人工智能科技研究有限公司共建“云冈智岩——云冈石窟千佛造像比例的AI智能提取与计算考古” [13] - 嘉祥武氏墓群石刻博物馆与北京大学图像学实验室共建“嘉祥武氏墓群石刻博物馆馆藏画像石数智著录” [13] - 河南省文物考古研究院与北京科技大学科技史与文化遗产研究院共建“识微见远——郑州商城冶金微遗物的高通量‘智’选” [13]