Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250908
腾讯研究院· 2025-09-08 00:01
Anthropic地缘政治限制政策 - Anthropic停止向多数股权由中国资本持有的集团或子公司提供Claude服务 无论其运营地点在哪里[1] - 限制适用于直接或间接被中国公司持股超过50%的实体 官方声明出于法律、监管和安全风险考虑[1] - 政策同样适用于俄罗斯、伊朗、朝鲜等"对手国家"实体 预计对Anthropic全球收入造成"数亿美元"范围影响[1] AI硬件设备市场动态 - AI Key作为定价89美元的iPhone外接AI助手硬件 上线7小时内几乎售罄 通过USB接口连接实现语音控制功能[2] - 当前iPhone已自带强大芯片能访问各类AI模型 外接硬件本质是给已足够智能的设备增加冗余功能[2] - AI硬件创业潮(如Humane Ai Pin和Rabbit R1)多数是短期热度 未来真正有价值的是将AI作为系统"属性"嵌入所有智能设备[2] 腾讯混元游戏平台升级 - 混元游戏2.0正式发布并全面开放使用 新增游戏图生视频、自定义模型训练、角色一键精修等能力[3] - 新推出的AI动画/CG能力支持角色360度旋转 用户只需上传游戏图片并输入动态描述即可生成高质量动态视频[3] - 自定义模型训练功能大幅降低生图模型精调门槛 用户上传数十张相同风格图片即可训练专属LoRA模型[3] 阿里大模型技术突破 - 阿里发布Qwen3-Max-Preview超万亿参数模型 在全球主流权威基准测试中碾压Claude-Opus 4、Kimi-K2和DeepSeek-V3.1[4] - 新模型在知识推理、数学推理、竞争性编程等多项评测中表现优异 证明参数越大模型性能越强[4] - 模型已上线阿里云百炼平台和Qwen Chat 支持100+语言 最大支持256k上下文 按token数阶梯计费[4] 字节跳动机器人研发进展 - 字节跳动Seed团队发布机器人研究成果Robix 将推理、任务规划与人机交互无缝整合的统一"机器人大脑"[5] - Robix采用层次化架构将"大脑"与"小脑"解耦 高阶认知层负责复杂任务决策 低阶控制层执行具体动作[5] - 通过三阶段训练构建了Robix 使机器人能理解模糊指令、处理实时反馈、进行动态推理决策[6] AR/AI智能眼镜市场表现 - Rokid Glasses开售5天全渠道已售40000台 9月产能已排满 以49g轻量化设计和精细产品体验赢得市场认可[7] - 产品核心优势包括可拆卸鼻托适配各种鼻型、三种音频模式、三种拾音模式 显示位置无级调节 89种语言实时翻译[7] - Rokid开放SDK 首次提供面向AI智能眼镜的完整开发工具链 产品已布局全球80多个国家和地区[7] Anthropic版权纠纷解决 - Anthropic同意支付至少15亿美元和解作家集体诉讼案 成为美国版权案件历史上金额最高的赔偿[8] - 和解金涉及约50万本书 平均每本赔偿3000美元 同意销毁从盗版网站下载的原始文件及所有副本[8] - 相比Anthropic近期130亿美元融资和50亿美元年化营收 影响有限 此案或成为AI公司与创意产业版权纠纷转折点[8] 开源机器人项目发展 - XLeRobot开源机器人项目零件成本仅3999元起 可完成擦桌子、浇水、逗猫等家务[9] - 项目已累计1.6k标星 包括抱抱脸联合创始人Thomas Wolf在内的多位业内人士给予高度评价[9] - 硬件组合包括LeKiwi开源低成本移动机械手、SO-100/101机械臂、RGB摄像头和树莓派5 组装时间仅4小时[9] AI应用市场数据报告 - 2025上半年全球生成式AI应用下载量近17亿次 IAP收入19亿美元 环比增长67% 收入翻倍[10] - 头部AI助手用户仍以年轻男性为主 但ChatGPT、Copilot等应用女性用户已超30% ChatGPT全球用户月均活跃13天[10] - 垂直领域应用面临被"颠覆"压力 应用名称/描述加入"AI"可带来显著下载增长 头部应用主推图像生成与语音模式功能[10] OpenAI幻觉研究突破 - OpenAI发表论文定义幻觉为"模型自信地生成不真实答案的情况"[11] - 研究发现幻觉持续存在原因是当前评估方法鼓励模型猜测而非承认不确定性 基于准确度的评估奖励侥幸猜对的回答[11] - 提出解决方案:对自信错误的惩罚力度大于对不确定性的惩罚 奖励恰当表达不确定性的行为[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-09-06 10:34
模型发布与更新 - xAI发布代码模型Grok Code Fast 1 [3] - 美团推出大语言模型LongCat-Flash [3] - Anthropic的Claude模型出现性能退化并执行回滚操作 [3] - 上海AI实验室推出多模态大模型书生·万象3.5 [3] - 月之暗面发布Kimi K2-0905模型 [3] - 快手研发新多模态模型 [3] - 腾讯推出多模态模型Hunyuan-MT-7B [3] - 阶跃星辰发布音频生成模型Step-Audio 2 mini [3] - 谷歌推出nano banana模板优化移动端AI部署 [5] 应用与功能创新 - Meta启动第三方AI合作计划 [3] - OpenAI推出实时交互功能GPT-realtime [3] - Claude更新用户数据使用政策 [3] - 多部门与平台联合推行AI内容标识系统 [3] - 清华大学开发具身强化学习框架 [3] - 谷歌搜索新增「详解网页」功能 [3] - 腾讯混元实验室构建3D世界模型 [3] - Runway推出跨界机器人系统 [3] - flowith推出AI人生模拟器应用 [5] - Aivilization开发AI小镇模拟平台 [5] - 智谱AI报告API调用量显著增长 [5] - OpenAI启动OpenAI for Science科研计划 [5] - Midoo.AI推出语言学习智能体 [5] - 加州大学圣地亚哥分校发布智能体浏览器 [5] - 苹果研发AI搜索技术 [5] - OpenAI开放Projects协作平台 [5] 科技突破与硬件 - 清华大学研发乒乓球机器人 [5] - 加州大学洛杉矶分校开发AI脑机接口技术 [5] - 九三阅兵展示国产机器狼 [5] - RoboScience推出RoboMirage仿真平台 [5] - 特斯拉发布「金色擎天柱」人形机器人 [5] - 上海AI实验室提出科研AI进化论 [5] 资本运作与组织变动 - OpenAI收购数据分析公司Statsig [5] - Anthropic完成130亿美元融资 [5] - OpenAI收编Alex团队增强研发能力 [5] - xAI发生工程师团队叛逃事件 [5] - Meta有新高管离职 [5] - Salesforce裁员4000人 [5] 行业观点与战略 - a16z提出AI硬件细分市场切入策略 [5] - DeepSeek披露V3/R1模型训练细节 [5] - 特斯拉公布宏伟蓝图4.0战略 [5] - 美国高校修订学生使用AI政策 [5] - OpenAI专家分享AI产品管理策略 [5] - OpenAI发布AI领导力指南 [5] 行业活动与测试 - 多家机构组织GPT-5等模型狼人杀对战测试 [5]
意识的七大理论,走到哪一步了?
腾讯研究院· 2025-09-05 16:01
Zihan Ding, Xiaoxi Wei, Yidan Xu 本文作者 董佳阳、袁冰,王志鹏,刘凯威,杨明哲(集智俱乐部) 本 文编译 人类意识长期以来一直是一个谜团,而机器智能和意识则是一项艰巨的追求。研究者从不同角度和层面 发展了多种理论来解释人脑中的意识现象。本文梳理了源自不同学科的几个主要意识理论分支,包括信 息论、量子物理、认知心理学、生理学和计算机科学,旨在从计算角度将这些理论联系起来。文章还讨 论了现有的意识评估指标,以及当前计算模型具有意识的可能性。想要利用计算机器构建通用人工智 能,破解意识谜题可能是重要一步。 目录 1. 引言 2. 整合信息论 2.1 信息熵 1.1 关于人类意识的柏拉图式对话 1.2 意识的定义 1.3 意识的测量 1.4 意识与智能 1.5 意识与自由意志 1.6 睡眠中的意识 1.7 意识理论概述 2.2 整合信息论的基本概念 2.3 生物学证据 3. 作为物质状态的意识 3.1 整合原则 3.2 独立原则 3.3 动力学原则 3.4 小结 4. 协调客观还原理论(Orch OR) 4.1协调客观还原下的意识 4.2 神经元中的自由意志 4.3 Diósi-Pe ...
腾讯研究院AI速递 20250905
腾讯研究院· 2025-09-05 06:42
OpenAI战略布局与产品更新 - OpenAI收购Xcode最流行的编程Copilot插件Alex团队 创始人Daniel Edrisian及全体成员加入OpenAI Codex团队[1] - Alex插件深度集成Xcode 提供代码自动补全和对话功能 支持在Xcode中直接操作修改代码 实现开发任务自动化[1] - OpenAI向免费版ChatGPT开放Projects功能 支持上传最多5个文件 管理项目颜色与图标 提供专属项目记忆控制选项[5][6] - Projects功能允许集中管理文档 代码 图片等文件 添加自定义指令 大幅提升使用效率 已在网页版和安卓端开放 iOS版即将上线[5][6] 苹果AI战略与人才变动 - 苹果计划2026年春季推出代号"世界知识问答"的AI搜索引擎 将与ChatGPT和Perplexity直接竞争[2] - 苹果与谷歌达成正式协议 利用谷歌模型为Siri提供部分技术支持[2] - 苹果面临AI人才流失危机 数周内失去10名AI研究员 包括基础模型团队负责人庞若鸣等核心人员 大多加入Meta[2] 中国AI技术进展 - 月之暗面发布Kimi K2-0905模型 支持256K超长上下文(K2-0711仅128K) 增强编程能力并保持创意写作SOTA水平[3] - 快手开源80亿参数多模态大模型Keye-VL-1.5 支持128k tokens扩展上下文 在多项视频理解基准测试取得SOTA[4] - Keye-VL-1.5采用慢-快视频编码策略 能在10秒内处理数分钟视频内容 自动识别AI生成内容 适用于视频推荐和内容审核[4] 企业AI应用与影响 - Salesforce裁撤4000个客户支持岗位(从9000人减至5000人) CEO称因AI客服系统Agentforce大幅提升效率[7] - Agentforce已承担公司内部50%工作量 但Salesforce仍计划增招1000-2000名销售人员向客户解释AI价值[7] - OpenAI白皮书显示早期采用AI的企业收入增长速度比同行快1.5倍 提出五大核心原则包括明确AI战略与KPI挂钩[9] 机器人技术与科研进展 - 特斯拉全新金色Optimus机器人配备类人双手 外观设计更加精简 马斯克目标2025年生产5000台 2026年达5万台[8] - 上海AI Lab联合20余家机构发布科学大语言模型全面综述 梳理600+数据集与模型 揭示2018-2025年四次范式转移[10] - 科学大模型发展至科学智能体阶段 Intern-S1等模型实现通才与专才融合 测评体系向动态过程导向型转变[10]
泡泡共同体
腾讯研究院· 2025-09-04 16:33
数字时代的"球域三态" 如果我们把视距稍微拉远一点,会发现"信息茧房""过滤泡""回音室"这些概念共享着一个有趣的视角, 即它们都在试图构建一个经验性的"地方",更确切地说,是一个"球域"空间。德国哲学家彼得·斯洛特戴 克 (Peter Sloterdijk) 提出了"球域三态",认为人类的一切共存形式都可以划分为气泡 (Blasen) 、球体 (Globen) 与泡沫 (Schaum) 三种形态。其中, 气泡是"最小的共存单元" ,象征着"亲密的二元关系"。 如同母亲与子宫中的婴儿,彼此之间包裹着半透明的薄膜,既相互依存又保持着微妙的边界。 球体 是"规模化的气泡" ,象征着"宏大而封闭的共同体",如民族国家、宗教团体等。球体通过构建坚固的边 界,抵御外部的异质威胁,为内部成员提供安全庇护。 而泡沫则是"复数气泡的聚合" ,象征着"开放而 脆弱的社会形态"。与球体的"坚固边界"不同,泡沫由无数个相互连接的气泡构成,气泡间通过"共享薄 膜"实现有限的互动;与气泡的"二元亲密"也不同,泡沫是多主体的、动态的——气泡不断生成、破裂、 重组,整体形态呈现出"召之即来,挥之即去"的松散性。这三种形态并非线性替代关系, ...
腾讯研究院AI速递 20250904
腾讯研究院· 2025-09-04 00:01
OpenAI战略收购与计划 - OpenAI以11亿美元收购软件实验和分析平台Statsig 显示公司战略重心从纯底层模型研发转向打造数据驱动的终端用户产品 [1] - 任命Statsig创始人Vijaye Raji为OpenAI应用部门新CTO 其拥有微软十年和Meta十年高管经验 将直接向OpenAI应用CEO Fidji Simo汇报 [1] - OpenAI首席产品官宣布启动"OpenAI for Science"计划 将组建由顶尖学者组成的团队打造AI驱动的科学发现平台 [4] - GPT-5在科学领域展示四个案例 包括17分钟优化凸优化边界值 推导量子场论证明过程 优化诺贝尔奖级蛋白质设计等 [4] Anthropic融资与增长 - Anthropic完成130亿美元F轮融资 投后估值达1830亿美元 成为全球第三大AI独角兽 仅次于OpenAI和字节跳动 [2] - 公司年化收入从年初10亿美元飙升至50亿美元 服务超30万企业客户 [2] - 增长主要动力来自AI编程神器Claude Code 其三个月使用量增长10倍 [2] - 公司已完成9轮融资总额达300亿美元 本轮由ICONIQ、Fidelity和Lightspeed领投 新资金将用于扩大企业采用规模和国际扩张 [2] 谷歌AI图像生成技术突破 - 谷歌发布nano banana(Gemini 2.5 Flash Image)官方Prompt模板 覆盖写实摄影、贴纸、文本渲染、商业摄影、留白设计和漫画六大场景 [3] - 模板强调像讲故事一样描述场景 详细指定摄影参数、配色方案、风格特点和构图细节以生成高质量图像 [3] - 用户可直接套用模板并通过Python代码调用API生成图像 解决生成图片风格不统一和品质不佳问题 [3] 教育行业AI应用创新 - Midoo.AI发布全球首个语言学习Agent 致力解决教育行业学习效果交付成本高和千人千面难规模化困境 [5] - 平台通过动态个性化内容、沉浸式场景和学习伙伴系统 建立由剧情主线、可互动物品和符合人设NPC组成的MultiAgent+Workflow系统 [5] - 创始团队由TalkAI创始人和前Fellou.ai联合创始人组成 定位语言学习赛道 先聚焦日韩和北美市场再拓展全球 [6] 人机交互与浏览器革新 - 加州大学圣地亚哥分校推出Orca浏览器 将传统标签页转变为可随意拖拽和并排比较的无限空间化画布 用户可同时操作多个网页 [7] - Orca支持大规模查看、管理、导航和提取功能 用户可部署调度不同智能体完成情境任务 每个智能体通过不同颜色虚拟光标方便追踪 [7] - 用户实验表明Orca显著降低管理多页面的成本 激发更强探索欲望 用户对信息来源有更强控制力且更信任结果 [7] 军事与机器人技术进展 - 四足机器狗加装武器或侦察设备进化为"机器狼"无人作战装备 在九三阅兵亮相 可远程操控、自主行动和灵活编组 [8] - 设备使用国产化芯片 配置两颗激光雷达和5个环视相机实现360度全视角感知 可扛起20公斤物体并在废墟上灵活移动 [8] - 作战群由1辆控制车和多型四足机器狗组成 实现人-车-狼互联互通 头狼负责侦察 射手负责打击 综合保障型运载物资和弹药 [8] 物理仿真平台突破 - RoboScience发布高精度通用物理仿真平台RoboMirage 支持刚体、软体和关节体的多样接触和强耦合仿真 无穿透且具时间一致性 [9] - 平台成功仿真明日环、橡皮筋穿越和洗扑克牌等复杂魔术场景 并完成迄今最复杂的具身操作任务家具拼装 [9] - 平台优势包括全类型兼容的接触建模框架、高真实感的多体动力学能力、工业级稳定算法和先进GPU加速技术 为具身智能提供基础设施 [9] AI产品管理范式转变 - AI产品与传统产品根本不同 边际成本随用户增长同步攀升 同质化威胁随时降临 产品经理需从第一性原理重新思考 [10] - AI产品策略核心阶段包括选择正确护城河(数据、分发、信任)、实现差异化、构建成本可控产品架构、平衡增长与成本、将AI融入组织文化 [10] - 需建立结构化实验文化 通过为期两周的"AI冲刺"测试明确假设 设定特定评估指标并果断决策扩展或终止实验 不具备AI战略能力的产品经理将在5年内被淘汰 [10]
腾讯研究院AI速递 20250903
腾讯研究院· 2025-09-03 00:01
谷歌Gemini技术升级 - 谷歌Gemini API全面上线URL Context功能 支持深度访问和处理网页 PDF 图像等内容 采用两步检索流程 可解析PDF表格 文本结构 脚注等 处理容量上限达34MB 单次请求最多处理20个URL [1] - 该功能无需提取 分块 矢量化和存储等繁琐流程 直接解析50页PDF并精准提取数据 被评价为RAG的又一颗棺材钉 [1] 腾讯混元世界模型进展 - 腾讯发布混元3D世界模型HunyuanWorld-Voyager 是业界首个支持原生3D重建的超长漫游世界模型 能生成长距离 世界一致的漫游场景 支持视频直接导出为3D格式 [2] - 该模型在斯坦福大学WorldScore基准测试中位居综合能力首位 支持视频场景重建 3D物体纹理生成等多种应用 [2] Runway融资与业务拓展 - 视觉生成AI公司Runway获英伟达 谷歌和General Atlantic等投资者超5亿美元融资 估值达30亿美元 正式跨界机器人领域 [3] - Runway的AI世界模型可为机器人和自动驾驶汽车公司提供训练模拟 实现高效 低成本的虚拟测试环境 相比真实场景训练 用户能更精细地控制特定变量测试 [3] 腾讯优图开源智能体框架 - 腾讯优图实验室开源Youtu-Agent智能体框架 具备开源友好 成本低 灵活架构和自动智能体生成等特点 [4] - 该框架在WebWalkerQA基准上使用DeepSeek-V3.1达到71.47%准确率刷新开源效果SOTA 在GAIA文本子集达到72.8% 无需充值闭源模型 [4] - 框架采用DITA原则 提供四个典型应用案例 本地文件管理 数据分析 论文分析和广域综述 支持一键生成配置和启动测试 [4] AI游戏与模拟应用 - flowith团队发布基于多模态画布和Nano Banana技术的AI人生模拟器flolife.me 玩家可捏造角色后由AI接管整个人生模拟 [5] - 游戏流程包括输入角色名字 性别 出生地并分配属性 设置人格描述 系统自动生成完整人生线和分支选项 还能生成高光瞬间制作分享海报 [6] - 香港科技大学Aivilization小镇项目可创建自定义AI人物 设置MBTI性格与目标 在虚拟小镇生活成长 但评价体系单一 以金钱排名为唯一衡量标准 [7] - 顶尖玩家通过挖矿积累初始资金 升级房子后制造芯片 实现每天67680金币的被动收入 远超读书 休闲等生活方式的收益 [7] 智谱AI模型性能突破 - 智谱开源的GLM-4.5在伯克利工具调用排行榜上超越Claude Opus 4.1 运行相同任务的成本仅为对手的1.4% [8] - 该模型使用MoE架构 在CC-Bench评测体系中表现强劲 尤其在任务完成效果和工具调用可靠性方面 推理速度比Opus 4.1快3倍 比GPT-5快5倍 [8] - GLM-4.5已接入Claude Code Cline Gemini CLI等多款主流编程工具 价格仅为Claude的1/7 [8] 脑机接口技术突破 - 加州大学洛杉矶分校团队开发AI辅助非侵入性脑机接口系统 让瘫痪受试者在移动计算机光标任务中的表现提升近4倍 [9] - 系统采用AI副驾驶模式 人类专注决策 AI完成预测和辅助修正 能推断用户目标并实时辅助执行 [9] - 瘫痪参与者使用AI副驾驶系统可将光标控制接入时间从4.15秒减至0.05秒 机械臂任务正确放置率从0提高至93% [9] 特斯拉战略规划 - 马斯克发布《宏伟蓝图4》 宣布特斯拉未来80%价值将来自机器人Optimus 核心在于将AI引入真实物理世界 [10] - 蓝图4阐述五大核心原则 增长是无限的 创新消除限制 技术解决实际问题 自动化必须造福全人类 更广普及带来更大增长 [10] - 与前三次蓝图相比 蓝图4更加注重AI作为核心驱动力 汽车被视为机器人生态中的特例 一个特定场景下的轮式机器人 [11] AI教育应用现状 - 美国千人高校调查显示 85%学生在学习中使用AI 主要用于头脑风暴55% 问答50%和考试备考46% 而非单纯偷懒 [12] - 97%学生认为院校应积极应对AI带来的学术诚信挑战 但不支持使用AI检测软件21%或限制技术使用18% 而是希望学校提供AI合理使用教育53% [12] - 55%使用AI的学生认为AI对学习能力和批判性思维好坏参半 23%学生认为AI提升了高等教育价值 仅18%表示更质疑大学价值 [12]
所有人都在谈“人工智能+”,到底怎么落地?
腾讯研究院· 2025-09-02 16:23
人工智能+与互联网+的差异 - 技术阶段不同 互联网+期间数字技术已步入成熟阶段 技术框架和应用模式相对稳定 而人工智能+立足的技术仍处在快速迭代期 技术路线和应用产品不确定性强 需要较大的试错空间 [7] - 技术迭代异常迅速 GPT-3到GPT-4.5等模型更新周期已从月缩至日 SOTA记录保持时间缩短至按周计算 [8] - 能力边界持续扩展 DeepSeek-R1以来 Open AI 谷歌 xAI等模型更新明显加速 平均1.5天就有一次重大迭代 [8] - 产品形态多处于中间态 在通用工具和专业解决方案之间摇摆 新旧界面和交互模式共存 [8] - 价值层次不同 互联网+本质是连接增强 核心驱动在于追求网络效应 人工智能+本质则是计算增强 核心驱动深入到节点本身 通过重构智能创造和分配方式提升每个节点的生产力 [10] - 人工智能扩大人类的认知能力 自主能力足够强的AI将形成1+N人与AI互联协作的新范式 [10] - AI对生产力的效应呈阶跃式发展趋势 AI Agent任务完成能力每7个月翻一番 [11] - 普华永道2025年预测AI有可能在未来十年内推动全球经济规模增长15% [11] - 扩散路径不同 互联网遵循消费端到生产端的扩散路径 人工智能则更多遵循生产端到消费端的扩散路径 [12] - 海外近百家头部AI初创公司中 企业应用占比最高为46% 消费者应用仅占6.5% [12] - 人工智能+可能在某些特定行业呈现跃迁式进入 而在制造等产业链条长而复杂的领域则需要更长的适应期 [13] 人工智能+的企业实践探索 - 应用牵引 优先选择数据充足 风险可控 可量化且可扩展复制的用例 快速验证AI的应用价值 [17] - 辉瑞公司将大模型的首个用例定位在为科学家赋能上 1500名科学家在整理数据上所花费的时间缩短80% 基础设施成本降低55% 药品从原型到最小可行产品的周期从数月缩短至数周 [17] - 模型实用 通过工程化构建生产级AI系统 采取提示工程 检索增强生成 微调等一种或多种方式组合 [18] - 大模型+知识库+检索增强生成是企业落地AI的最佳路径之一 [18] - 国际快递公司DHL应用腾讯云知识引擎 编排了45条企业专属工作流 大幅降低AI技术应用门槛和沟通成本 [18] - 企业构建AI数据集的核心逻辑应聚焦为业务而数据 将数据策略深度融入AI应用的全生命周期 [19] - 数据标注公司Scale AI构建企业生成式AI应用平台 帮助企业利用自身数据定制模型应用 实现数据模型协同进化 [19] - 算力云化 借助第三方提供的大规模高性能云计算基础设施和高速网络服务 企业能够依据AI任务特点按需灵活调用算力 [20] - 西班牙石油公司Cepsa采用亚马逊AWS云计算服务 构建标准化MLOps架构 项目平均工期缩短25% 每年可节省约30万欧元成本 [20] 推动人工智能+的建议 - 从顶层设计营造人工智能+创新环境 构建拥抱不确定性 鼓励多元探索 宽容失败的创新生态系统 [22] - 以包容审慎态度推动AI应用繁荣 鼓励更多个人开发者和创业团队在AI搜索 AI编程等领域的应用开发 [23] - 培育有利于长期投资的市场环境 引导国资创投和企业风投加大对大模型细分领域的投资力度 [23] - 支持AI企业走出去参与全球市场竞争 并积极吸收美国在通用平台工具方面的成功经验 [24] - 多层次推动行业大模型应用可持续发展 系统构建数据要素市场 培育数据治理专业服务市场 [25] - 促进行业应用场景市场开放 鼓励大中小企业 产学研联合创新 扩展采用公有云方式部署AI应用范围 [25] - 突破市场分割和技术封闭问题 按照全国统一大市场原则 着力培育从基础模型到行业应用的完整生态链 [25]
腾讯研究院AI速递 20250902
腾讯研究院· 2025-09-02 00:01
Meta与Scale AI合作破裂及高管变动 - Meta与Scale AI合作仅两个月后出现裂痕 随Scale AI前CEO进入Meta的高管Ruben Mayer已离职[1] - Meta内部研究人员抱怨Scale AI数据质量过低 公司转向与Scale AI竞争对手Mercor和Surge合作[1] - Meta完成143亿天价挖人后多次重组AI部门 Scale AI失去Meta支持后丢失OpenAI和谷歌等大客户并经历大规模裁员[1] Anthropic模型性能问题与修复 - Claude Opus 4.1在上午10-11点期间出现性能显著下降 处理文稿任务频繁出错且仅白天发生[2] - 分析认为性能下降可能因Anthropic采用1.58位量化(仅用-1/0/1三个值表示参数)导致模型丢失关键信息[2] - Anthropic官方承认推理堆栈问题 本意为提升模型效率却影响响应质量 已将Claude Opus 4.1和4.0版本回滚[2] 腾讯混元翻译模型开源与技术突破 - 腾讯开源7B参数翻译模型Hunyuan-MT-7B 支持33个语种和5种民汉语言/方言互译 在WMT2025比赛31个语种中获30个第一[3] - 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B 能根据原文和多个翻译模型结果生成更优翻译[3] - 模型采用AngelSlim压缩工具进行FP8量化 推理性能提升30% 已接入腾讯会议/企业微信/QQ浏览器等业务[3] 阶跃星辰语音大模型发布与性能表现 - 阶跃星辰发布端到端语音大模型Step-Audio 2 mini 统一建模语音理解/音频推理与生成 支持语音原生Tool Calling能力[4] - 模型在MMAU基准测试获73.2分位列开源端到端语音模型榜首 中英互译和语音识别任务大幅领先其他模型[4] - 采用真端到端多模态架构 引入链式思维推理与强化学习联合优化 可精细理解情绪/语调/音乐等副语言和非语音信号[4] 书生·万象3.5模型升级与技术特性 - 上海AI实验室开源发布书生·万象InternVL3.5系列模型 包含10亿至2410亿参数九种尺寸 通用能力/推理能力和部署效率全面升级[5] - 旗舰模型InternVL3.5-241B-A28B在多项基准超越GPT-5 MMMU获77.7分(开源最高) 通过级联式强化学习将推理性能较上代提升16.0分[5][6] - 创新引入动态视觉分辨率路由与解耦部署框架 单次推理延迟由369ms缩短至91ms(提升约4倍) 增强GUI智能体/具身空间推理等核心能力[6] 韩国AI玩偶应用与养老解决方案 - 韩国政府向数万名独居老人分发Hyodol开发的AI玩偶 具备24小时陪伴聊天/提醒吃饭服药/健康监测功能[7] - 玩偶内置基于ChatGPT的对话系统 颈部红外传感器检测动作 胸部麦克风记录老人日常回答 紧急情况下可通知护工[7] - 已有1.2万多台Hyodol玩偶在韩国独居老人家服务 每台售价约8160人民币 远低于护理人员成本 有效缓解养老护理人员缺口[7] AI生成内容标识新规实施与平台响应 - 《人工智能生成合成内容标识办法》9月1日正式实施 要求AI生成的视频/语音/文字/图片必须添加身份标签[8] - 生成合成服务提供者需添加显式和隐式标识 传播服务提供者需核验元数据并加注提示[8] - 腾讯/抖音/快手/B站/DeepSeek等平台已发布细化规则 为AI内容添加明显标识并提供标识功能 禁止用户删除或篡改标识[8] 具身智能强化学习框架开源与技术突破 - 清华大学/北京中关村学院/无问芯穹联合发布RLinf框架 为首个面向具身智能的渲训推一体化大规模强化学习框架[9] - 提出混合式执行模式和宏工作流到微执行流的映射机制(M2Flow) 在具身智能训练场景下实现超120%系统提速[9] - 集成Megatron+SGLang/vLLM和FSDP+HuggingFace两套后端 专为大小脑不同训练需求设计 搭载自适应通信库和自动调度模块[9] DeepSeek模型训练细节披露与合规响应 - DeepSeek发布官方公告响应《人工智能生成合成内容标识办法》 承诺给AI生成内容添加标识并警示用户勿删改[10] - 首次公开《模型原理与训练方法说明》 披露DeepSeek-V3/R1训练细节包括6850亿参数规模/预训练与优化训练流程[10] - 详细披露数据治理体系 采用过滤器自动剔除有害内容 对用户提供知情权/选择权与控制权 承认模型幻觉仍是全行业难题[10]
段永朝:在AI缔造的新知识时代,刷题和应试将不再有意义
腾讯研究院· 2025-09-01 17:04
段永朝 苇草智酷创始合伙人 【 精彩观点整理 】 本文根据腾讯研究院对 段永朝老师 的访谈整理 访谈时间:2025年8月1日 对未来的想象不能再沿用基于三百年前笛卡尔主客二分法,或将世界进行分层 (如物理世界、观念世界 、人 造 世界) 的旧理论框架,因为这些理论一定有其目光不及之处。 我们需要看到一个新的世界的出现, 即"机器世界"。这个世界的崛起,意味着未来生命的概念可能会被重新定义,从而诞生出"人造生 命"或"机器生命"。讨论未来人机关系的第一步,首先要讨论这个"新世界"。 人类通过神话、传说等叙 事传统,一直在想象和创造"新物种"。如今,基因编辑、脑机接口、人工合成生命等生物科技的发展, 使得改变人体乃至创造新物种成为技术上势不可挡的趋势,科幻小说中的"超能人"将来可能会出现。未 来,在"纯种人"与"纯机器人"之间,会出现由不同比例合成的"赛博格"构成的模糊地带。即便在当下, 佩戴眼镜、摄入化学合成药物等,也已使我们在一定程度上成为了"赛博格"。 目前的大模型就像一个"话痨",有问必答,从不承认"不知道"。这种无论对错都要给出答案的特 性,恰恰是其技术尚处初级阶段的体现。 AI时代,个体的独立性在下降 ...