腾讯研究院 - 财报，业绩电话会，研报，新闻

腾讯研究院

搜索文档

腾讯研究院· 2025-09-12 16:58

文章核心观点 - OpenAI最新研究揭示语言模型幻觉产生的根本原因在于其统计学习本质，且后训练过程在当前评估体系下未能有效抑制幻觉，GPT-5可能通过非二元评估技术显著降低幻觉率 [9][12][24][32] 幻觉产生的必然性 - 幻觉是语言模型预训练阶段不可避免的副产品，因模型本质是通过统计规律生成内容，而非真实判断 [11][12] - 模型通过"是否有效"（IIV）判断器评估句子概率，但面对数据稀疏、复杂概念或训练数据错误时必然失效 [13][14] - 生成模型的错误率至少是IIV判断器错误率的2倍，因单个判断错误会衍生多种幻觉（如1+1=3和1+1≠2均属幻觉） [15][16] 后训练的局限性 - 后训练通过偏好反馈改变概率分布，将概率集中到"最佳答案"以减少不确定性幻觉，但可能增加过度自信风险 [19][20] - 主流评估基准（如GPQA、MMLU-Pro、SWE-bench）采用二元评分制，仅区分正确（1分）或错误（0分），系统性地惩罚"我不知道"的回答 [21][23] - 当前评估标准奖励猜测行为而非诚实回答，导致后训练在实践中未能有效引导模型降低幻觉 [24] 模型性能对比与技术路径 - DeepSeek R1采用二元奖励模型（ORM），在Vectara HHEM测试中幻觉率达14.3%，远高于其预训练模型DeepSeek V3的3.9% [30][31] - OpenAI o3使用过程奖励模型（PRM），通过逐步推理反馈降低幻觉率至6.8%，仅为DeepSeek R1的一半 [32] - GPT-5可能引入Universal Verifier技术，采用非二元评估标准（如评分细则Rubric），从根源上减少二元激励的负面影响 [32] 解决方向 - 后训练需引入带惩罚的评分机制，例如答对得1分、答错扣1分、过度自信答错扣9分，迫使模型成为"风险评估器"而非"得分优化器" [33] - 模型需专注于真实性而非单纯得分优化，才可能从根本上解决幻觉问题 [34]

AI模型幻觉

强化学习

后训练

Artificial Intelligence

Artificial Intelligence

GPT-5

DeepSeek R1

腾讯研究院AI速递 20250912

腾讯研究院· 2025-09-12 00:01

估值120亿美元的Thinking Machines发布首篇研究博客 - 公司估值达120亿美元创始团队多来自OpenAI 首款产品命名为Connection Machine [1] - 研究团队通过改进RMSNorm 矩阵乘法和注意力机制实现完全可复现的推理结果性能损失可接受 [1] - 解决LLM推理中的非确定性问题核心是批次不变性 [1] OpenAI ChatGPT支持MCP协议 - OpenAI宣布ChatGPT正式支持MCP Plus和Pro用户可一句Prompt实现自动化操作 [2] - MCP实现AI模型工具和数据源的标准化交互使不同模型能共享上下文支持即插即用 [2] - 用户可通过开启开发人员模式连接第三方服务如Stripe 完成复杂任务 [2] 微信推出混元大模型智能回复功能 - 微信公众号推出由腾讯混元大模型支持的智能回复功能解决运营者无法及时回复读者问题 [3] - 功能可自动学习公众号历史文章和回复风格回复内容会标注该消息为智能回复并可引用相关历史文章 [3] - 腾讯混元还将上线Roleplay模型和AI分身应用提供沉浸式对话体验 [3] Kimi开源万亿参数模型中间件 - Kimi开源新中间件checkpoint-engine 能在20秒内完成万亿参数模型在数千GPU上的更新 [4] - 采用混合共置架构通过分布式检查点引擎管理参数状态实现参数广播和重载并行处理 [4] - 系统设计支持训练和推理引擎完全解耦采用参数逐条更新的流水线方式可抵御单点故障 [4] 英伟达发布文本驱动3D模型生成AI - NVIDIA发布新AI Blueprint 通过生成式AI技术让3D艺术家快速创建场景原型 [5] - 集成Microsoft TRELLIS NVIDIA NIM微服务比原生应用快20% 支持所有配备16GB以上显存的RTX 50和40系列GPU [5] - 只需文本提示即可生成多达20个3D模型工作流程自动化从创意到3D模型的转换 [5] 百度学术完成AI重构 - 百度学术推出AI学术搜索 AI文献总结 AI阅读论文图谱等功能打造行业首个一站式AI学术平台 [6][7] - 全面覆盖搜读创编学术全链路提供文献总结全文翻译选题推荐和专业排版等功能 [7] - 平台已收录6.9亿文献资源覆盖104万学术站点建立420万学者主页 [7] 腾讯会议推出AI托管功能 - 腾讯会议联合元宝推出AI托管功能能替用户提前听会并实时记录 [8] - 用户只需在会议页面或列表点击AI托管元宝将自动接入会议生成智能AI纪要 [8] - 会后可直接向元宝提问会议内容辅助决策推进实现会议成果沉淀转化 [8] 宇树科技创始人谈AI与机器人发展 - 宇树科技创始人王兴兴表示最后悔2011年起专注机器人而错过AI发展 [9] - 公司已宣布IPO计划预计2025年底提交申请 2024年营收突破10亿元且连续4年盈利 [9] - 修正此前关于数据的观点承认机器人数据和模型都是核心问题 [9] 强化学习之父萨顿预言AI未来 - 萨顿认为AI进入经验时代将从持续学习而非静态知识积累中获得智能 [10] - 指出对AI的恐惧被夸大认为AI与人类繁荣源自去中心化协作 [10] - 提出四条预测原则认为人类智能将被超越权力将流向最聪明的智能体 [10]

腾讯控股(HK:00700)

生成式AI

强化学习

Artificial Intelligence

Artificial Intelligence

腾讯研究院· 2025-09-11 16:31

文章核心观点 - 人类选择伴侣时会理性分析特质而非盲目追求爱情并将关系组成部分拆解为可量化的现实因素[2][3][4] - 科技发展正逐步介入人类情感领域人工智能和虚拟现实系统已能提供陪伴并模仿人类互动方式[5][6] - 社会对"人机关系"的接受度存在显著分歧但调查显示接受比例正逐步上升（不信任比例从2019年50%降至2024年35.3%）[10][11][12] - "人造情感"通过媒体和宗教仪式等形式早已融入人类生活科技公司持续投入资金开发更接近人类的情感体验产品[14][16][17] 人类伴侣选择机制 - 伴侣选择过程类似商品调研会评估教育程度、年龄、家庭背景、政治观点和恋爱史等现实因素[2] - 关系维系取决于积极方面是否超过消极方面而非完美匹配[3] - 存在"同质相婚"现象社会阶层和教育程度相近的人更易结合[4] 科技介入情感关系的现状 - 现有机器人已具备打扫房屋、微笑、移动和辅助残疾人等功能[5] - 人工智能系统可模拟人类互动方式但当前设计仍以功能为导向缺乏情感魔力[5] - 关系4.0时代通过手机社交和约会网站实现伴侣选择的分解剖析[6] 社会接受度调查数据 - 2018年调查显示74%美国人担忧人工智能加剧社交孤立 70%认为会导致人类智力下降[10] - 认为科技变革太快的人群比例从2018年49%降至2024年32%[10] - 对人工智能公司不信任率从2019年50%降至2022年41% 2024年进一步降至35.3%[11] 人造情感的发展历程 - 戏剧、电影和书籍等媒介几个世纪来一直在设计人造情感[14] - 流媒体服务（如奈飞、苹果电视、亚马逊）以月费12.99美元形式提供情感内容[14] - 宗教仪式通过点蜡烛、唱赞美歌等方式设计情感体验其效果与真实人际互动相当[17] 未来科技情感交互 - 科技巨头持续投入开发机器人、虚拟现实和增强现实等更接近人类的情感交互形式[17] - 关键问题在于人工情感是否会突破屏幕限制以及人类对其的回应程度[17]

腾讯研究院· 2025-09-11 00:07

英伟达新一代GPU平台 - 推出专为长上下文推理设计的Rubin CPX GPU 支持一次性在数百万token范围内推理适用于软件开发与视频生成长上下文任务[1] - 与NVIDIA Vera CPU和Rubin GPU组成Vera Rubin NVL144 CPX平台单机架提供8 exaflops AI算力是GB300 NVL72系统的7.5倍[1] - 系统配备100TB高速内存和1.7 PB/s内存带宽预计2026年底上市[1] Claude文档生成功能升级 - 新增直接创建编辑Excel Word PPT和PDF文件能力输出真正可用文件格式[2] - 配备私有计算环境支持代码运行生成文档具备高级数据分析与跨格式转换功能[2] - 功能已向Max Team和Enterprise用户开放 Pro用户需等待数周支持导出或保存至Google Drive[2] 腾讯AI编程工具矩阵 - 发布AI CLI工具CodeBuddy Code并开放CodeBuddy IDE公测国内版支持无限制使用DeepSeek模型[3] - CLI Agent通过自然语言驱动开发运维生命周期支持多智能体协作与Git/CI/CD深度集成[3] - 内部使用显示编码时间缩短40%以上 AI代码评审贡献从12%增至35%[3] 快手AIGC视频生产系统 - 推出AIGC超级员工Kwali 通过一句话生成完整短视频自动完成脚本拍摄剪辑到发布全流程[4] - 多Agent框架包含意图解析脚本生成镜头匹配和剪辑合成四大模块接入千寻素材库与数字人模特库[4] - 支持私有素材拖入所有元素拆分为可独立操控节点实现实时预览与单独操作[4] Fellou连续体体验系统 - 创建无割裂连续体体验实现交互连续任务连续和记忆连续三大特性[5] - 支持跨应用自主执行与动态工作流编排在Halluminate's Web Bench benchmark测试中取得72%成功率[6] - 推出深度搜索与可视化报告生成核心功能免费开放引入任务可定时与知识可编辑特性[6] 腾讯开源文生图模型 - 混元图像2.1版本支持原生2K生图在复杂语义理解与文字生成方面达到业界领先水平[7] - 支持最长1000个tokens提示词实现多物体分别描述与文字精细控制覆盖真人漫画等丰富风格[7] - 采用32倍超高压缩倍率VAE 配备双文本编码器将推理步数由100步蒸馏至8步[7] 谷歌科研软件AI系统 - 结合大语言模型和树搜索算法自动编写优化科研任务所需软件程序[8] - 作为搜索过程中的变异引擎整合重组科学文献研究思路形成全新解决方案[8] - 在基因组学地理空间分析等领域表现突出解决方案常超越学术界最新研究成果[8] AI平台迁移与交互变革 - Agent趋向微服务化与领域专精由多Agent组成系统每个在特定任务成为专家[9] - 专家可获得10倍生产力提升改变工作性质解放开发者处理平台琐事[9] - 平台转型改变人与计算交互抽象层可能出现数千个垂直场景创业机会[9] 马斯克科技项目进展 - Optimus人形机器人将拥有接近人类手部灵巧性成本约2万美元难点集中在硬件设计[10] - 特斯拉AI5芯片较AI4实现40倍性能飞跃年底软件升级使汽车展现意识[10] - 第三代星舰运载能力超100吨明年有望实现完全可重复使用预计25年内火星实现自给自足移民[11]

腾讯研究院· 2025-09-10 12:33

AI时代教育变革核心观点 - 生成式AI正在全球范围内引发智能革命教育系统作为关键子系统面临本质重构教育现象复杂化和教育动因解析难度加大[2] - 教育根本命题"培养什么人怎样培养人为谁培养人"需要在智能浪潮冲击下重新回答[2] - 国家学界产业界社会家庭与个体共同探索面向未来教育的解决方案与实施路径[3] 腾讯研究院AI教育研究体系 - 长期关注AI与教育时代课题联合学界专家与一线实践者通过对话访谈沙龙趋势报告等形式持续追踪演进发展[3] - 研究覆盖教育焦虑学习方式人才培养就业转型应用生态等多维度议题[3][6] - 在教师节特别整理发布AI教育领域多方洞察与成果形成产学研各界对智能时代教育的系统性思考[3] 具体研究方向与成果 - 提出AI新知识时代下刷题和应试教育模式将失去意义[6] - 开展七大核心维度研究：教育焦虑教育变革人机协同人才培养学习方式应用生态就业转型[6] - 发布《2024教育科技十大趋势洞察报告》指出未来教育迈向人机共智新时代[6] - 组织2万字圆桌对话深度探讨AI时代职业与教育问题[6] - 通过专家对话形式探讨人机互生时代的教育变革时机与社会未来[6]

Artificial Intelligence

AI Education

Internet

Artificial Intelligence

AI Education

Internet

腾讯研究院AI速递 20250910

腾讯研究院· 2025-09-10 00:01

生成式AI行业动态 - OpenAI CEO特别介绍两位核心研究员Jakub Pachocki和Szymon Sidor 称其为完美互补的传奇搭档[1] - Pachocki作为首席科学家负责制定公司宏观研究路线图曾领导GPT-4预训练工作入选《时代》杂志百大AI人物[1] - 两人在2023年OpenAI宫斗事件中发挥关键作用辞职威胁成为员工大规模抗议导火索最终促使董事会妥协迎回Altman[1] 多模态AI技术突破 - 国产AI工具Vidu Q1推出参考生图功能能同时处理7张参考图在一致性真实性美学方面超越Flux Kontext 媲美谷歌Nano Banana[2] - Vidu Q1在主体一致性方面表现出色精准还原人物特征细节和服饰支持换装换背景换道具等多种创意应用满足电商广告等行业需求[2] - Vidu专注一致性赛道从参考生视频到参考生图实现多模态可控将AI从娱乐工具转变为规模化落地的生产力工具效率提升90%[2] - 豆包图像创作模型Seedream 4.0上线支持4K高清多模态生图多图融合参考生图等功能对标谷歌Nano Banana[5][6] - Seedream 4.0在主体一致性方面表现突出支持火柴人姿势转专业摄影多人物合影场景拼装产品展示在亚洲人脸识别和中文文字呈现方面更有优势[6] - 该模型采用生成和编辑任务统一的工作方式通过联合训练和多模态感知实现秒级4K出图能自动补充知识和背景逻辑[6] 语音识别技术进展 - 阿里发布语音识别模型Qwen3-ASR-Flash 支持11种语言和多种口音能自动分辨语种过滤噪声通过添加上下文信息定制识别结果[3] - 在基准测试中识别错误率明显低于谷歌Gemini-2.5-Pro和OpenAI GPT-4o-Transcribe等竞品在方言多语种关键信息和歌词识别方面表现突出[3] - 实测表明在连续多种噪音电竞解说英文说唱方言混杂等复杂场景中仍能精准识别歌词识别错误率低于8%[3] 大模型能力提升 - 百度发布文心大模型X1.1深度思考模型相比X1版本事实性能力提升34.8% 指令遵循能力提升12.5% 智能体能力提升9.6%[4] - 该模型在多项基准测试中超越DeepSeek-R1-0528 效果与GPT-5和Gemini 2.5 Pro基本持平采用迭代式混合强化学习框架提升效果[4] - 基于文心X1.1技术推出剧本驱动多模协同数字人同时发布飞桨3.2版本及文心快码3.5S 目前百度45%新增代码由AI生成[4] AI编程赛道发展 - AI编程独角兽Cognition获超4亿美元融资投后估值达102亿美元超越Anysphere成为全球AI编程赛道估值最高企业[7] - 公司由华裔工程师Scott Wu Steven Hao和Walden Yan共同创立创始人均为国际信息学奥林匹克金牌得主融资由Peter Thiel旗下基金领投[7] - Cognition在收购Windsurf后年化收入从7300万美元翻倍增长同时获得高盛花旗等大客户但因要求996级工作强度引发争议[7] 前沿科技应用 - 18岁女孩Audrey Lo创业打造养老机器人Sam 上线两天因预订量过大导致网站崩溃多家养老院提出批量订购需求[8] - Sam以24小时守护为核心能自动检测老人跌倒并发送紧急警报提醒服药记录日历事项还能与老人进行自然对话陪伴[8] - 麻省理工学院推出非侵入式可穿戴无声语音交互AI设备AlterEgo 通过捕捉神经肌肉信号实现无声沟通用户只需内心发声即可与设备交互[9] - 设备采用精确传感器放置在面部和颈部关键区域以250Hz采样并24倍放大信号经多重滤波和算法处理后神经网络实现92%的词准确率[9] - AlterEgo可通过骨传导耳机将AI处理结果以声音反馈给用户形成闭环交互适合因喉部疾病失去发声能力的残疾人使用[9] AI经济影响与基础设施 - 经济周期大师拉斯·特维德认为AI对社会创造的价值已是其成本的10倍但这些价值未被GDP统计捕捉反而因替代人力可能导致GDP统计值下降[10] - 预测到2050年全球将有41亿智能机器人其有效劳动力将是人类的6倍真正的风险是目标之死即人类如何在机器高效世界中找到生活意义[11] - 未来AI时代能源成为关键挑战每个提示词消耗的能量是一年前的50倍美国AI工厂建设需要相当于100座核反应堆的电力[11] - 谷歌Gemini工程副总裁预测大模型需要更高计算能力更大内存容量更高内存带宽和网络带宽[12] - 模型训练从2015年的32块GPU扩展到数十万块GPU规模预计未来五年AI基础设施支出将达3-4万亿美元[12] - 芯片创新领域出现多种解决方案 HBM容量和带宽持续增加内存层次结构应运而生新型网络技术如UALink和CPO光学交换机降低功耗增加带宽[12]

愿公益成为每个人皆可抵达的良善之路｜2025久久公益节观察

腾讯研究院· 2025-09-09 18:23

久久公益节转型方向 - 取消配捐机制转向静默沉淀模式检验行业资源动员能力 [3][4] - 倡导从情感驱动转向理性审视断开对悲情叙事和表演式慈善的依赖 [6] - 推动公益与商业边界重建企业将社会责任内化为发展基因追求可持续效能 [6] 公益战略聚焦领域 - 议题选择集中于生态保护教育公平乡村医疗科研创新等基础领域 [6] - 采取"守一隅"战略在细分领域做深做实西北小学阅读课程与西南山林碳汇项目形成网络节点价值 [17][18] - 通过社区菜园街边小店供水邻里体育组织等微观形式深入社会肌理 [10] 社区化与技术创新 - 公益模式从"陌生人伦理"转向"邻里伦理" 构建基于地缘信任的互助体系 [10][11] - 数字技术赋能邻里公益通过小程序微信群接龙地图标注等方式强化连接效率 [11] - 信任成为核心社会资本透明化专业化在地化成为构建信任的关键手段 [15] 行业价值重构 - 公益保守主义兴起强调对核心价值有机秩序和人的有限性的尊重 [14] - 影响力生成机制改变从声量驱动转向实践深度与可信度驱动 [18] - 公益本质从救济帮扶转向人心善念与社会责任的塑造形成双向精神实践 [20] 生态体系演变 - 公益生态连点成网本地项目成为全国网络中的关键节点形成共生共长格局 [17][18] - 模式依靠灯塔效应自然扩散无需自我推广即可吸引同行借鉴 [17] - 最终目标是将公益内化为生活方式与文化常态构建"家外之家"的社区生态 [12]

腾讯研究院AI速递 20250909

腾讯研究院· 2025-09-09 00:27

特斯拉AI芯片进展 - AI5芯片设计完成评审预计2025年下半年推出算力是前代10倍初期由中国台湾代工后期转至美国生产[1] - AI6芯片可能由三星美国工厂生产被描述为"迄今为止最好的AI芯片"[1] - 公司决定从双架构切换为单一架构集中所有芯片人才专注同一目标[1] Meta人工智能技术突破 - 推出REFRAG框架重新定义RAG技术最高将首字生成延迟加速30倍[2] - 通过压缩-感知-扩展三步流程处理长文本使上下文窗口等效扩大16倍且保持性能无损[2] - 技术适用于RAG、多轮对话、长文档摘要等多种长上下文应用场景[2] ASML战略投资布局 - 光刻机巨头ASML斥资15亿美元领投Mistral AI 成为这家法国AI初创公司最大股东[3] - Mistral AI融资后估值达140亿美元将成为欧洲最有价值的AI公司[3] - 被投公司由Meta和DeepMind前员工创立秉承开源理念已发布多款开源模型及产品[3] 微软开源AI模型突破 - 开源rStar2-Agent推理模型仅140亿参数却在多项测试中超越6710亿参数的DeepSeek-R1[4] - 通过三大技术突破：隔离式代码执行基础设施、动态负载均衡调度器和GRPO-RoC算法[4] - 采用高效训练流程仅用64台MI300X GPU一周内完成510步强化学习迭代[4] OpenAI生态发展 - 举办GPT-5黑客马拉松 500多位开发者参与韩国Gentoo团队获得冠军[5] - 获奖项目涵盖营销模拟、时尚搭配、表格辅助、视频生成等实用场景[6] - 支持制作首部AI动画长片《Critterz》预算3000万美元以内制作周期仅9个月[7] 3D视觉技术突破 - 港科大发布SAIL-Recon方法通过锚点图建立全局隐式表征突破大规模3D重建瓶颈[8] - 采用统一Transformer架构和渐进式2D-3D编码实现万帧级场景重建[8] - 在权威数据集上相机位姿估计与新视角合成精度显著超越现有方法[8] 具身智能模型开源 - 自变量机器人开源WALL-OSS具身智能基础大模型参数量4.2B[9] - 融合超大规模真机数据单张RTX 4090即可完成从训练到部署全流程[9] - 实现多模态端到端统一生成各项指标超越π0 突破模态统一与能力泛化难题[9] AI行业发展阶段 - 行业从过度炒作走向理性回归用户对新模型反应逐渐平淡[10] - 仅5%的公司成功将AI技术转化为实际收入尚未转化为宏观经济生产力提升[10] - 发展进入"iPhone 4时刻"：从颠覆性突破转向持续迭代和小步快跑阶段[10]

胡泳：AI时代，“文科有用”

腾讯研究院· 2025-09-08 17:13

AI对人类认知能力的影响 - 人工智能的认知卸载可能导致人类特定认知技能下降，例如个体记忆能力减退 [5] - 过度依赖AI与较低的批判性思维能力存在显著关联性，年长者因对AI工具依赖程度较低，其批判性思维得分反而高于年轻人 [6] - 对AI产生过度依赖性可能导致一旦丧失AI支持，个体解决问题能力显著下降，并且难以适应没有AI的环境 [6] - 弗林效应在最近几年出现减缓甚至逆转，许多地区学生的科学、数学和阅读成绩呈下降趋势，年轻人注意力持续时长缩短，批判性思维能力变弱 [7][8] - 人工智能技术与过往技术有本质不同，它直接替代人类的判断、思考和创造等核心认知活动，其渗透速度极快，覆盖面极广，技术性依赖风险远高于其他技术 [9][10] 人工智能的技术局限性 - 当前大模型的智能几乎只集中在语言智能和部分逻辑推理智能上，在视觉空间智能、具身智能等方面表现较差 [14][15] - 人工智能本质上是一个概率问题，而非真正的理解或推理，它缺乏临床直觉和具身认知能力，不存在原生的学习过程和反思内化能力 [12][13] - 生成式AI面临的最大障碍是幻觉问题，这使得它不能百分之百地被当作知识停止点系统，不同AI模型的幻觉程度存在差异 [16] - 人工智能可以模拟同理心，但并不能真正理解他人的情感、动机或关系，它缺乏作为一个“人”真正的激情和痛苦等深刻个人体验 [14][26] - 现有AI在结构上完全无法与人类匹配，尤其是在具身性、情感性、经验性方面，对“人工智能意味着新物种”的说法持否定态度 [15] AI时代的教育变革需求 - 人工智能时代需要培养的关键技能包括使用工具生产东西的能力、沟通协作、批判性思维、创造力以及自信心 [22] - 应设想“无分数学习”概念，将评分体系置换到更具挑战性的学习任务，让学生注意力回归到更有意义的事情上 [20] - 需要构建全新的评估体系，不依赖分数却能有效表达知识、促进交流，该体系需与社会接轨，并关注学生使用AI工具进行深度思考和创新的能力 [21][22] - 通识教育培育的软技能在AI时代变得前所未有的重要，人文社科能帮助人类发现自我，并与人工智能更好地相处 [26] - 教育应聚焦于让学生掌握相关知识，而非仅仅通过刷题获得好成绩，需创造服务于学生成长和发展的新系统，关注学习价值和评价正义性 [20][22] 人机协作的边界与风险 - 人机协作存在丧失人类思想主体性的潜在危险，可用“骆驼挤进帐篷”的寓言比喻AI逐步渗透并最终将人顶出帐篷的风险 [10] - 需做到“人的归人，机器的归机器”，不混淆两者边界，并不仅关注人工智能能为人类做什么，更要审视其正在对人类做什么 [24] - 人工智能在个体层面可帮助拓展想象空间，但在群体层面，当前生成式系统能否产生颠覆性的范式创新想法仍是未明确的问题 [7][25] - 使用人工智能必须养成“人在回路中”的习惯，且使用者需具备超高信息素养，能够识别AI的根本性幻觉 [16][17] - 机器与人类的创造力不能等同，AI产出的内容存在千篇一律问题，缺乏灵魂，其在行星层级问题上产生颠覆性范式创新想法的能力值得怀疑 [24][25]

腾讯研究院AI速递 20250908

腾讯研究院· 2025-09-08 00:01

Anthropic地缘政治限制政策 - Anthropic停止向多数股权由中国资本持有的集团或子公司提供Claude服务无论其运营地点在哪里[1] - 限制适用于直接或间接被中国公司持股超过50%的实体官方声明出于法律、监管和安全风险考虑[1] - 政策同样适用于俄罗斯、伊朗、朝鲜等"对手国家"实体预计对Anthropic全球收入造成"数亿美元"范围影响[1] AI硬件设备市场动态 - AI Key作为定价89美元的iPhone外接AI助手硬件上线7小时内几乎售罄通过USB接口连接实现语音控制功能[2] - 当前iPhone已自带强大芯片能访问各类AI模型外接硬件本质是给已足够智能的设备增加冗余功能[2] - AI硬件创业潮(如Humane Ai Pin和Rabbit R1)多数是短期热度未来真正有价值的是将AI作为系统"属性"嵌入所有智能设备[2] 腾讯混元游戏平台升级 - 混元游戏2.0正式发布并全面开放使用新增游戏图生视频、自定义模型训练、角色一键精修等能力[3] - 新推出的AI动画/CG能力支持角色360度旋转用户只需上传游戏图片并输入动态描述即可生成高质量动态视频[3] - 自定义模型训练功能大幅降低生图模型精调门槛用户上传数十张相同风格图片即可训练专属LoRA模型[3] 阿里大模型技术突破 - 阿里发布Qwen3-Max-Preview超万亿参数模型在全球主流权威基准测试中碾压Claude-Opus 4、Kimi-K2和DeepSeek-V3.1[4] - 新模型在知识推理、数学推理、竞争性编程等多项评测中表现优异证明参数越大模型性能越强[4] - 模型已上线阿里云百炼平台和Qwen Chat 支持100+语言最大支持256k上下文按token数阶梯计费[4] 字节跳动机器人研发进展 - 字节跳动Seed团队发布机器人研究成果Robix 将推理、任务规划与人机交互无缝整合的统一"机器人大脑"[5] - Robix采用层次化架构将"大脑"与"小脑"解耦高阶认知层负责复杂任务决策低阶控制层执行具体动作[5] - 通过三阶段训练构建了Robix 使机器人能理解模糊指令、处理实时反馈、进行动态推理决策[6] AR/AI智能眼镜市场表现 - Rokid Glasses开售5天全渠道已售40000台 9月产能已排满以49g轻量化设计和精细产品体验赢得市场认可[7] - 产品核心优势包括可拆卸鼻托适配各种鼻型、三种音频模式、三种拾音模式显示位置无级调节 89种语言实时翻译[7] - Rokid开放SDK 首次提供面向AI智能眼镜的完整开发工具链产品已布局全球80多个国家和地区[7] Anthropic版权纠纷解决 - Anthropic同意支付至少15亿美元和解作家集体诉讼案成为美国版权案件历史上金额最高的赔偿[8] - 和解金涉及约50万本书平均每本赔偿3000美元同意销毁从盗版网站下载的原始文件及所有副本[8] - 相比Anthropic近期130亿美元融资和50亿美元年化营收影响有限此案或成为AI公司与创意产业版权纠纷转折点[8] 开源机器人项目发展 - XLeRobot开源机器人项目零件成本仅3999元起可完成擦桌子、浇水、逗猫等家务[9] - 项目已累计1.6k标星包括抱抱脸联合创始人Thomas Wolf在内的多位业内人士给予高度评价[9] - 硬件组合包括LeKiwi开源低成本移动机械手、SO-100/101机械臂、RGB摄像头和树莓派5 组装时间仅4小时[9] AI应用市场数据报告 - 2025上半年全球生成式AI应用下载量近17亿次 IAP收入19亿美元环比增长67% 收入翻倍[10] - 头部AI助手用户仍以年轻男性为主但ChatGPT、Copilot等应用女性用户已超30% ChatGPT全球用户月均活跃13天[10] - 垂直领域应用面临被"颠覆"压力应用名称/描述加入"AI"可带来显著下载增长头部应用主推图像生成与语音模式功能[10] OpenAI幻觉研究突破 - OpenAI发表论文定义幻觉为"模型自信地生成不真实答案的情况"[11] - 研究发现幻觉持续存在原因是当前评估方法鼓励模型猜测而非承认不确定性基于准确度的评估奖励侥幸猜对的回答[11] - 提出解决方案：对自信错误的惩罚力度大于对不确定性的惩罚奖励恰当表达不确定性的行为[11]