Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250908
腾讯研究院· 2025-09-08 00:01
Anthropic地缘政治限制政策 - Anthropic停止向多数股权由中国资本持有的集团或子公司提供Claude服务 无论其运营地点在哪里[1] - 限制适用于直接或间接被中国公司持股超过50%的实体 官方声明出于法律、监管和安全风险考虑[1] - 政策同样适用于俄罗斯、伊朗、朝鲜等"对手国家"实体 预计对Anthropic全球收入造成"数亿美元"范围影响[1] AI硬件设备市场动态 - AI Key作为定价89美元的iPhone外接AI助手硬件 上线7小时内几乎售罄 通过USB接口连接实现语音控制功能[2] - 当前iPhone已自带强大芯片能访问各类AI模型 外接硬件本质是给已足够智能的设备增加冗余功能[2] - AI硬件创业潮(如Humane Ai Pin和Rabbit R1)多数是短期热度 未来真正有价值的是将AI作为系统"属性"嵌入所有智能设备[2] 腾讯混元游戏平台升级 - 混元游戏2.0正式发布并全面开放使用 新增游戏图生视频、自定义模型训练、角色一键精修等能力[3] - 新推出的AI动画/CG能力支持角色360度旋转 用户只需上传游戏图片并输入动态描述即可生成高质量动态视频[3] - 自定义模型训练功能大幅降低生图模型精调门槛 用户上传数十张相同风格图片即可训练专属LoRA模型[3] 阿里大模型技术突破 - 阿里发布Qwen3-Max-Preview超万亿参数模型 在全球主流权威基准测试中碾压Claude-Opus 4、Kimi-K2和DeepSeek-V3.1[4] - 新模型在知识推理、数学推理、竞争性编程等多项评测中表现优异 证明参数越大模型性能越强[4] - 模型已上线阿里云百炼平台和Qwen Chat 支持100+语言 最大支持256k上下文 按token数阶梯计费[4] 字节跳动机器人研发进展 - 字节跳动Seed团队发布机器人研究成果Robix 将推理、任务规划与人机交互无缝整合的统一"机器人大脑"[5] - Robix采用层次化架构将"大脑"与"小脑"解耦 高阶认知层负责复杂任务决策 低阶控制层执行具体动作[5] - 通过三阶段训练构建了Robix 使机器人能理解模糊指令、处理实时反馈、进行动态推理决策[6] AR/AI智能眼镜市场表现 - Rokid Glasses开售5天全渠道已售40000台 9月产能已排满 以49g轻量化设计和精细产品体验赢得市场认可[7] - 产品核心优势包括可拆卸鼻托适配各种鼻型、三种音频模式、三种拾音模式 显示位置无级调节 89种语言实时翻译[7] - Rokid开放SDK 首次提供面向AI智能眼镜的完整开发工具链 产品已布局全球80多个国家和地区[7] Anthropic版权纠纷解决 - Anthropic同意支付至少15亿美元和解作家集体诉讼案 成为美国版权案件历史上金额最高的赔偿[8] - 和解金涉及约50万本书 平均每本赔偿3000美元 同意销毁从盗版网站下载的原始文件及所有副本[8] - 相比Anthropic近期130亿美元融资和50亿美元年化营收 影响有限 此案或成为AI公司与创意产业版权纠纷转折点[8] 开源机器人项目发展 - XLeRobot开源机器人项目零件成本仅3999元起 可完成擦桌子、浇水、逗猫等家务[9] - 项目已累计1.6k标星 包括抱抱脸联合创始人Thomas Wolf在内的多位业内人士给予高度评价[9] - 硬件组合包括LeKiwi开源低成本移动机械手、SO-100/101机械臂、RGB摄像头和树莓派5 组装时间仅4小时[9] AI应用市场数据报告 - 2025上半年全球生成式AI应用下载量近17亿次 IAP收入19亿美元 环比增长67% 收入翻倍[10] - 头部AI助手用户仍以年轻男性为主 但ChatGPT、Copilot等应用女性用户已超30% ChatGPT全球用户月均活跃13天[10] - 垂直领域应用面临被"颠覆"压力 应用名称/描述加入"AI"可带来显著下载增长 头部应用主推图像生成与语音模式功能[10] OpenAI幻觉研究突破 - OpenAI发表论文定义幻觉为"模型自信地生成不真实答案的情况"[11] - 研究发现幻觉持续存在原因是当前评估方法鼓励模型猜测而非承认不确定性 基于准确度的评估奖励侥幸猜对的回答[11] - 提出解决方案:对自信错误的惩罚力度大于对不确定性的惩罚 奖励恰当表达不确定性的行为[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-09-06 10:34
模型发布与更新 - xAI发布代码模型Grok Code Fast 1 [3] - 美团推出大语言模型LongCat-Flash [3] - Anthropic的Claude模型出现性能退化并执行回滚操作 [3] - 上海AI实验室推出多模态大模型书生·万象3.5 [3] - 月之暗面发布Kimi K2-0905模型 [3] - 快手研发新多模态模型 [3] - 腾讯推出多模态模型Hunyuan-MT-7B [3] - 阶跃星辰发布音频生成模型Step-Audio 2 mini [3] - 谷歌推出nano banana模板优化移动端AI部署 [5] 应用与功能创新 - Meta启动第三方AI合作计划 [3] - OpenAI推出实时交互功能GPT-realtime [3] - Claude更新用户数据使用政策 [3] - 多部门与平台联合推行AI内容标识系统 [3] - 清华大学开发具身强化学习框架 [3] - 谷歌搜索新增「详解网页」功能 [3] - 腾讯混元实验室构建3D世界模型 [3] - Runway推出跨界机器人系统 [3] - flowith推出AI人生模拟器应用 [5] - Aivilization开发AI小镇模拟平台 [5] - 智谱AI报告API调用量显著增长 [5] - OpenAI启动OpenAI for Science科研计划 [5] - Midoo.AI推出语言学习智能体 [5] - 加州大学圣地亚哥分校发布智能体浏览器 [5] - 苹果研发AI搜索技术 [5] - OpenAI开放Projects协作平台 [5] 科技突破与硬件 - 清华大学研发乒乓球机器人 [5] - 加州大学洛杉矶分校开发AI脑机接口技术 [5] - 九三阅兵展示国产机器狼 [5] - RoboScience推出RoboMirage仿真平台 [5] - 特斯拉发布「金色擎天柱」人形机器人 [5] - 上海AI实验室提出科研AI进化论 [5] 资本运作与组织变动 - OpenAI收购数据分析公司Statsig [5] - Anthropic完成130亿美元融资 [5] - OpenAI收编Alex团队增强研发能力 [5] - xAI发生工程师团队叛逃事件 [5] - Meta有新高管离职 [5] - Salesforce裁员4000人 [5] 行业观点与战略 - a16z提出AI硬件细分市场切入策略 [5] - DeepSeek披露V3/R1模型训练细节 [5] - 特斯拉公布宏伟蓝图4.0战略 [5] - 美国高校修订学生使用AI政策 [5] - OpenAI专家分享AI产品管理策略 [5] - OpenAI发布AI领导力指南 [5] 行业活动与测试 - 多家机构组织GPT-5等模型狼人杀对战测试 [5]
意识的七大理论,走到哪一步了?
腾讯研究院· 2025-09-05 16:01
文章核心观点 - 文章对意识理论进行了跨学科综述,涵盖信息论、量子物理、认知心理学、生理学和计算机科学等领域,旨在从计算角度连接这些理论,为构建人工意识提供基础[2][8][9] - 意识被定义为由唤醒(清醒状态)和感知(主观体验)组成,二者是意识的必要条件但非充分条件,例如在微意识状态中唤醒和感知水平高但意识仍缺失[16][17][20] - 文章讨论了意识与智能的区别,智能定义为完成复杂目标的能力,而意识是主观体验,后者更难以测量和解释[22][23][26] - 自由意志与意识的关系存在争议,可能涉及量子随机性或幻觉机制,但目前仍无明确科学证据支持或否定[28][30][32] - 睡眠中的意识水平取决于大脑活动的整合程度,例如在NREM睡眠中整合信息能力降低导致意识减弱[35][36][37] - 现有意识理论包括整合信息论(IIT)、协调客观还原(Orch OR)、全局工作空间理论(GWT)、高阶层次理论(HOT)、注意图式理论(AST)和意识图灵机(CTM),各有不同解释和计算模型[38][40][102] - 意识测量指标包括基于电信号(如PCI、BIS)和行为(如GCS、CRS-R)的方法,用于评估临床意识水平[18][111][113] 整合信息论(IIT) - IIT认为意识对应于系统整合信息的能力,由最大不可约简的因果结构量化,使用有效信息(EI)和互信息(MI)等指标计算[42][46][47] - 理论提出意识与信息熵相关,系统需具备高信息整合能力,例如大脑皮层因功能整合而产生高Φ值,而小脑因缺乏依赖关系而不重要[42][44][49] - 生物学证据显示,在NREM睡眠或麻醉状态下,大脑皮层连接中断导致信息整合能力降低,与意识减弱一致[36][49][50] 作为物质状态的意识 - 意识被视为一种物质状态("感知器"),需满足信息原则、整合原则、独立原则和动力学原则,但这些原则可能存在冲突[52][54][55] - 整合悖论指出经典系统(如Hopfield网络)的信息整合容量有限(例如1011个神经元仅37比特),远低于人类意识体验的信息量[56] - 独立原则导致量子芝诺效应,即系统分解为最大独立子系统时会停止演化,与动力学原则冲突[59][62][64] 协调客观还原理论(Orch OR) - Orch OR理论提出意识源于大脑微管中量子计算的终止,通过客观还原(OR)过程产生非确定性自由意志[65][66][71] - 微管蛋白的量子叠加状态(如电子自旋方向)可能在达到阈值(τ≈h/EG)时发生坍缩,触发意识瞬间[67][71][72] - 理论缺乏充分实验证据,但提供了可证伪的计算框架,例如γ同步脑电图(30-90Hz)可能与意识相关[72] 全局工作空间理论(GWT) - GWT将意识描述为"意识剧场",包括工作记忆舞台、聚光灯、演员和观众等组件,意识容量有限且信息需被广播[74][75][77] - 计算模型如IDA和LIDA实现了GWT,用于任务处理和信息广播,例如海军岗位任务测试[78][79] - 理论激发后续研究,如EEG相干性分析情绪作用,或深度学习中的全局潜在工作空间(GLW)设计[79] 高阶层次理论(HOT) - HOT认为意识产生于高阶表征,分为高阶感知理论(HOPT)、高阶思维理论(HOTT)和自我表征理论(SRT)[81][82][86] - HOPT假设存在内感官生成二阶感知,HOTT强调心理状态引发高阶思维,SRT认为意识状态自我表征[84][87][91] - 计算模型如元认知神经网络使用一阶和二阶网络预测任务置信度,在爱荷华赌博任务等中测试[89] 注意图式理论(AST) - AST将意识定义为注意力的模型,主观意识(M-意识)是客观注意过程(I-意识)的自我建模[96][97][100] - 理论统一GWT和HOT,I-意识对应GWT的信息广播,M-意识对应HOT的高阶表征[102] - 实际实现涉及三个网络:注意力竞争网络(A)、预测模型网络(B)和报告生成网络(C)[101] 意识图灵机(CTM) - CTM扩展传统图灵机,加入"意识感",由STM、LTM、上传树、下传树等组件构成,信息流通过竞争和广播实现[104][107][108] - 使用"心语"作为内部语言,自我建模通过"世界模型"处理器实现,自由意志由上传树竞争中的随机性模拟[108] - 与GWT相比,CTM的STM每次只处理一个信息块,且所有处理器位于LTM中[109] 意识测量指标 - 基于电信号的指标包括双谱指数(BIS)(0-100分评估麻醉深度)、扰动复杂性指数(PCI)(使用TMS-EEG计算复杂性)和可解释意识指标(ECI)(深度学习模型评估唤醒和感知)[113] - 基于行为的指标包括格拉斯哥昏迷量表(GCS)(眼动、语言和运动反应)、昏迷恢复量表(CRS-R)(情绪、记忆和注意力)和无反应全概述(FOUR)(眼、运动、脑干和呼吸评估)[111][113]
腾讯研究院AI速递 20250905
腾讯研究院· 2025-09-05 06:42
OpenAI战略布局与产品更新 - OpenAI收购Xcode最流行的编程Copilot插件Alex团队 创始人Daniel Edrisian及全体成员加入OpenAI Codex团队[1] - Alex插件深度集成Xcode 提供代码自动补全和对话功能 支持在Xcode中直接操作修改代码 实现开发任务自动化[1] - OpenAI向免费版ChatGPT开放Projects功能 支持上传最多5个文件 管理项目颜色与图标 提供专属项目记忆控制选项[5][6] - Projects功能允许集中管理文档 代码 图片等文件 添加自定义指令 大幅提升使用效率 已在网页版和安卓端开放 iOS版即将上线[5][6] 苹果AI战略与人才变动 - 苹果计划2026年春季推出代号"世界知识问答"的AI搜索引擎 将与ChatGPT和Perplexity直接竞争[2] - 苹果与谷歌达成正式协议 利用谷歌模型为Siri提供部分技术支持[2] - 苹果面临AI人才流失危机 数周内失去10名AI研究员 包括基础模型团队负责人庞若鸣等核心人员 大多加入Meta[2] 中国AI技术进展 - 月之暗面发布Kimi K2-0905模型 支持256K超长上下文(K2-0711仅128K) 增强编程能力并保持创意写作SOTA水平[3] - 快手开源80亿参数多模态大模型Keye-VL-1.5 支持128k tokens扩展上下文 在多项视频理解基准测试取得SOTA[4] - Keye-VL-1.5采用慢-快视频编码策略 能在10秒内处理数分钟视频内容 自动识别AI生成内容 适用于视频推荐和内容审核[4] 企业AI应用与影响 - Salesforce裁撤4000个客户支持岗位(从9000人减至5000人) CEO称因AI客服系统Agentforce大幅提升效率[7] - Agentforce已承担公司内部50%工作量 但Salesforce仍计划增招1000-2000名销售人员向客户解释AI价值[7] - OpenAI白皮书显示早期采用AI的企业收入增长速度比同行快1.5倍 提出五大核心原则包括明确AI战略与KPI挂钩[9] 机器人技术与科研进展 - 特斯拉全新金色Optimus机器人配备类人双手 外观设计更加精简 马斯克目标2025年生产5000台 2026年达5万台[8] - 上海AI Lab联合20余家机构发布科学大语言模型全面综述 梳理600+数据集与模型 揭示2018-2025年四次范式转移[10] - 科学大模型发展至科学智能体阶段 Intern-S1等模型实现通才与专才融合 测评体系向动态过程导向型转变[10]
泡泡共同体
腾讯研究院· 2025-09-04 16:33
核心观点 - 提出"泡泡共同体"概念 批判传统"信息茧房"隐喻的单向度局限 强调数字空间中个体与算法互动形成的异质性共存结构[2][31] - 算法技术构建"骄纵空间" 通过过滤-黏合-循环三重机制将用户纳入数据资本主义代谢系统 形成寄生性结构[10][12] - 数字时代面临的核心问题是"数字迷雾"与"认知茧房" 而非单纯的信息封闭 需要多维度解决方案[16][19] 数字空间形态理论 - 引入斯洛特戴克"球域三态"理论:气泡对应私人信息领域 球体对应算法加持的群体圈层 泡沫对应复数气泡的聚合[3][5][6] - 泡泡共同体具有"共存式隔离"特征 气泡间通过对抗性连接维持平衡 既非完全封闭也非彻底开放[6][22][31] - 蜂巢隐喻强调单元间有机连接 每个蜂房是私人空间 通过共用壁面形成资源共享网络[7] 算法机制与资本逻辑 - 算法骄纵空间通过减轻认知负担机制构建 依赖过滤(被动构建边界) 黏合(主动加固边界) 循环(数据资本代谢)三重机制[10][11][12] - 用户行为数据转化为"认知粘液" 成为优化推荐的关键依据 用户主动参与边界构建[11] - 数据资本主义将用户情感宣泄转化为流量石油 观点对抗转化为平台利润 形成数字时代"水晶宫"[12] 群体互动与认知异化 - 对抗性刺激取代情感共鸣成为群体粘结剂 导致群体极化对立[13] - 算法固化个体流动性 用户在半液态空间中移动 无法突破算法划定的认知框架[14] - 自吞噬循环使系统丧失活力 同质信息自我复制 导致群体衰落或极端化[15] 认知困境本质 - 数字迷雾表现为碎片化信息推送 情绪化内容渲染 虚假信息掺杂 导致个体失去判断力[18] - 认知茧房源于证实性偏见与逆火效应 是自我防卫的保护壳 比信息茧房更难突破[19][20] - 信息茧房在信息过载环境中具有认知聚焦的自我保护功能[17] 优化路径方案 - 算法干预需注入异质菌 提高认知多样性权重 建立跨气泡信息中转站促进异质信息流动[24][25] - 球体再气化需开放推荐API接口 搭建公共虚拟辩论厅 发起跨气泡协作项目软化认知边界[26] - 社会工程需建立用户-平台-政府三方契约:用户培养悬置能力 平台平衡商业与生态责任 政府制定评估标准[27][28] 数字生态愿景 - 泡泡共同体是由微小碎片通过有价值连接构成的复杂生态 无需打破而需优化共生关系[33] - 智能时代需要数字克里斯朵夫式的非人行动者 通过算法和AI代理促进异质性共存[32] - 蜂巢是可供繁衍交流的生活场所 而非过渡阶段 强调重新找回生活本体价值[33]
腾讯研究院AI速递 20250904
腾讯研究院· 2025-09-04 00:01
OpenAI战略收购与计划 - OpenAI以11亿美元收购软件实验和分析平台Statsig 显示公司战略重心从纯底层模型研发转向打造数据驱动的终端用户产品 [1] - 任命Statsig创始人Vijaye Raji为OpenAI应用部门新CTO 其拥有微软十年和Meta十年高管经验 将直接向OpenAI应用CEO Fidji Simo汇报 [1] - OpenAI首席产品官宣布启动"OpenAI for Science"计划 将组建由顶尖学者组成的团队打造AI驱动的科学发现平台 [4] - GPT-5在科学领域展示四个案例 包括17分钟优化凸优化边界值 推导量子场论证明过程 优化诺贝尔奖级蛋白质设计等 [4] Anthropic融资与增长 - Anthropic完成130亿美元F轮融资 投后估值达1830亿美元 成为全球第三大AI独角兽 仅次于OpenAI和字节跳动 [2] - 公司年化收入从年初10亿美元飙升至50亿美元 服务超30万企业客户 [2] - 增长主要动力来自AI编程神器Claude Code 其三个月使用量增长10倍 [2] - 公司已完成9轮融资总额达300亿美元 本轮由ICONIQ、Fidelity和Lightspeed领投 新资金将用于扩大企业采用规模和国际扩张 [2] 谷歌AI图像生成技术突破 - 谷歌发布nano banana(Gemini 2.5 Flash Image)官方Prompt模板 覆盖写实摄影、贴纸、文本渲染、商业摄影、留白设计和漫画六大场景 [3] - 模板强调像讲故事一样描述场景 详细指定摄影参数、配色方案、风格特点和构图细节以生成高质量图像 [3] - 用户可直接套用模板并通过Python代码调用API生成图像 解决生成图片风格不统一和品质不佳问题 [3] 教育行业AI应用创新 - Midoo.AI发布全球首个语言学习Agent 致力解决教育行业学习效果交付成本高和千人千面难规模化困境 [5] - 平台通过动态个性化内容、沉浸式场景和学习伙伴系统 建立由剧情主线、可互动物品和符合人设NPC组成的MultiAgent+Workflow系统 [5] - 创始团队由TalkAI创始人和前Fellou.ai联合创始人组成 定位语言学习赛道 先聚焦日韩和北美市场再拓展全球 [6] 人机交互与浏览器革新 - 加州大学圣地亚哥分校推出Orca浏览器 将传统标签页转变为可随意拖拽和并排比较的无限空间化画布 用户可同时操作多个网页 [7] - Orca支持大规模查看、管理、导航和提取功能 用户可部署调度不同智能体完成情境任务 每个智能体通过不同颜色虚拟光标方便追踪 [7] - 用户实验表明Orca显著降低管理多页面的成本 激发更强探索欲望 用户对信息来源有更强控制力且更信任结果 [7] 军事与机器人技术进展 - 四足机器狗加装武器或侦察设备进化为"机器狼"无人作战装备 在九三阅兵亮相 可远程操控、自主行动和灵活编组 [8] - 设备使用国产化芯片 配置两颗激光雷达和5个环视相机实现360度全视角感知 可扛起20公斤物体并在废墟上灵活移动 [8] - 作战群由1辆控制车和多型四足机器狗组成 实现人-车-狼互联互通 头狼负责侦察 射手负责打击 综合保障型运载物资和弹药 [8] 物理仿真平台突破 - RoboScience发布高精度通用物理仿真平台RoboMirage 支持刚体、软体和关节体的多样接触和强耦合仿真 无穿透且具时间一致性 [9] - 平台成功仿真明日环、橡皮筋穿越和洗扑克牌等复杂魔术场景 并完成迄今最复杂的具身操作任务家具拼装 [9] - 平台优势包括全类型兼容的接触建模框架、高真实感的多体动力学能力、工业级稳定算法和先进GPU加速技术 为具身智能提供基础设施 [9] AI产品管理范式转变 - AI产品与传统产品根本不同 边际成本随用户增长同步攀升 同质化威胁随时降临 产品经理需从第一性原理重新思考 [10] - AI产品策略核心阶段包括选择正确护城河(数据、分发、信任)、实现差异化、构建成本可控产品架构、平衡增长与成本、将AI融入组织文化 [10] - 需建立结构化实验文化 通过为期两周的"AI冲刺"测试明确假设 设定特定评估指标并果断决策扩展或终止实验 不具备AI战略能力的产品经理将在5年内被淘汰 [10]
腾讯研究院AI速递 20250903
腾讯研究院· 2025-09-03 00:01
谷歌Gemini技术升级 - 谷歌Gemini API全面上线URL Context功能 支持深度访问和处理网页 PDF 图像等内容 采用两步检索流程 可解析PDF表格 文本结构 脚注等 处理容量上限达34MB 单次请求最多处理20个URL [1] - 该功能无需提取 分块 矢量化和存储等繁琐流程 直接解析50页PDF并精准提取数据 被评价为RAG的又一颗棺材钉 [1] 腾讯混元世界模型进展 - 腾讯发布混元3D世界模型HunyuanWorld-Voyager 是业界首个支持原生3D重建的超长漫游世界模型 能生成长距离 世界一致的漫游场景 支持视频直接导出为3D格式 [2] - 该模型在斯坦福大学WorldScore基准测试中位居综合能力首位 支持视频场景重建 3D物体纹理生成等多种应用 [2] Runway融资与业务拓展 - 视觉生成AI公司Runway获英伟达 谷歌和General Atlantic等投资者超5亿美元融资 估值达30亿美元 正式跨界机器人领域 [3] - Runway的AI世界模型可为机器人和自动驾驶汽车公司提供训练模拟 实现高效 低成本的虚拟测试环境 相比真实场景训练 用户能更精细地控制特定变量测试 [3] 腾讯优图开源智能体框架 - 腾讯优图实验室开源Youtu-Agent智能体框架 具备开源友好 成本低 灵活架构和自动智能体生成等特点 [4] - 该框架在WebWalkerQA基准上使用DeepSeek-V3.1达到71.47%准确率刷新开源效果SOTA 在GAIA文本子集达到72.8% 无需充值闭源模型 [4] - 框架采用DITA原则 提供四个典型应用案例 本地文件管理 数据分析 论文分析和广域综述 支持一键生成配置和启动测试 [4] AI游戏与模拟应用 - flowith团队发布基于多模态画布和Nano Banana技术的AI人生模拟器flolife.me 玩家可捏造角色后由AI接管整个人生模拟 [5] - 游戏流程包括输入角色名字 性别 出生地并分配属性 设置人格描述 系统自动生成完整人生线和分支选项 还能生成高光瞬间制作分享海报 [6] - 香港科技大学Aivilization小镇项目可创建自定义AI人物 设置MBTI性格与目标 在虚拟小镇生活成长 但评价体系单一 以金钱排名为唯一衡量标准 [7] - 顶尖玩家通过挖矿积累初始资金 升级房子后制造芯片 实现每天67680金币的被动收入 远超读书 休闲等生活方式的收益 [7] 智谱AI模型性能突破 - 智谱开源的GLM-4.5在伯克利工具调用排行榜上超越Claude Opus 4.1 运行相同任务的成本仅为对手的1.4% [8] - 该模型使用MoE架构 在CC-Bench评测体系中表现强劲 尤其在任务完成效果和工具调用可靠性方面 推理速度比Opus 4.1快3倍 比GPT-5快5倍 [8] - GLM-4.5已接入Claude Code Cline Gemini CLI等多款主流编程工具 价格仅为Claude的1/7 [8] 脑机接口技术突破 - 加州大学洛杉矶分校团队开发AI辅助非侵入性脑机接口系统 让瘫痪受试者在移动计算机光标任务中的表现提升近4倍 [9] - 系统采用AI副驾驶模式 人类专注决策 AI完成预测和辅助修正 能推断用户目标并实时辅助执行 [9] - 瘫痪参与者使用AI副驾驶系统可将光标控制接入时间从4.15秒减至0.05秒 机械臂任务正确放置率从0提高至93% [9] 特斯拉战略规划 - 马斯克发布《宏伟蓝图4》 宣布特斯拉未来80%价值将来自机器人Optimus 核心在于将AI引入真实物理世界 [10] - 蓝图4阐述五大核心原则 增长是无限的 创新消除限制 技术解决实际问题 自动化必须造福全人类 更广普及带来更大增长 [10] - 与前三次蓝图相比 蓝图4更加注重AI作为核心驱动力 汽车被视为机器人生态中的特例 一个特定场景下的轮式机器人 [11] AI教育应用现状 - 美国千人高校调查显示 85%学生在学习中使用AI 主要用于头脑风暴55% 问答50%和考试备考46% 而非单纯偷懒 [12] - 97%学生认为院校应积极应对AI带来的学术诚信挑战 但不支持使用AI检测软件21%或限制技术使用18% 而是希望学校提供AI合理使用教育53% [12] - 55%使用AI的学生认为AI对学习能力和批判性思维好坏参半 23%学生认为AI提升了高等教育价值 仅18%表示更质疑大学价值 [12]
所有人都在谈“人工智能+”,到底怎么落地?
腾讯研究院· 2025-09-02 16:23
人工智能+与互联网+的差异 - 技术阶段不同 互联网+期间数字技术已步入成熟阶段 技术框架和应用模式相对稳定 而人工智能+立足的技术仍处在快速迭代期 技术路线和应用产品不确定性强 需要较大的试错空间 [7] - 技术迭代异常迅速 GPT-3到GPT-4.5等模型更新周期已从月缩至日 SOTA记录保持时间缩短至按周计算 [8] - 能力边界持续扩展 DeepSeek-R1以来 Open AI 谷歌 xAI等模型更新明显加速 平均1.5天就有一次重大迭代 [8] - 产品形态多处于中间态 在通用工具和专业解决方案之间摇摆 新旧界面和交互模式共存 [8] - 价值层次不同 互联网+本质是连接增强 核心驱动在于追求网络效应 人工智能+本质则是计算增强 核心驱动深入到节点本身 通过重构智能创造和分配方式提升每个节点的生产力 [10] - 人工智能扩大人类的认知能力 自主能力足够强的AI将形成1+N人与AI互联协作的新范式 [10] - AI对生产力的效应呈阶跃式发展趋势 AI Agent任务完成能力每7个月翻一番 [11] - 普华永道2025年预测AI有可能在未来十年内推动全球经济规模增长15% [11] - 扩散路径不同 互联网遵循消费端到生产端的扩散路径 人工智能则更多遵循生产端到消费端的扩散路径 [12] - 海外近百家头部AI初创公司中 企业应用占比最高为46% 消费者应用仅占6.5% [12] - 人工智能+可能在某些特定行业呈现跃迁式进入 而在制造等产业链条长而复杂的领域则需要更长的适应期 [13] 人工智能+的企业实践探索 - 应用牵引 优先选择数据充足 风险可控 可量化且可扩展复制的用例 快速验证AI的应用价值 [17] - 辉瑞公司将大模型的首个用例定位在为科学家赋能上 1500名科学家在整理数据上所花费的时间缩短80% 基础设施成本降低55% 药品从原型到最小可行产品的周期从数月缩短至数周 [17] - 模型实用 通过工程化构建生产级AI系统 采取提示工程 检索增强生成 微调等一种或多种方式组合 [18] - 大模型+知识库+检索增强生成是企业落地AI的最佳路径之一 [18] - 国际快递公司DHL应用腾讯云知识引擎 编排了45条企业专属工作流 大幅降低AI技术应用门槛和沟通成本 [18] - 企业构建AI数据集的核心逻辑应聚焦为业务而数据 将数据策略深度融入AI应用的全生命周期 [19] - 数据标注公司Scale AI构建企业生成式AI应用平台 帮助企业利用自身数据定制模型应用 实现数据模型协同进化 [19] - 算力云化 借助第三方提供的大规模高性能云计算基础设施和高速网络服务 企业能够依据AI任务特点按需灵活调用算力 [20] - 西班牙石油公司Cepsa采用亚马逊AWS云计算服务 构建标准化MLOps架构 项目平均工期缩短25% 每年可节省约30万欧元成本 [20] 推动人工智能+的建议 - 从顶层设计营造人工智能+创新环境 构建拥抱不确定性 鼓励多元探索 宽容失败的创新生态系统 [22] - 以包容审慎态度推动AI应用繁荣 鼓励更多个人开发者和创业团队在AI搜索 AI编程等领域的应用开发 [23] - 培育有利于长期投资的市场环境 引导国资创投和企业风投加大对大模型细分领域的投资力度 [23] - 支持AI企业走出去参与全球市场竞争 并积极吸收美国在通用平台工具方面的成功经验 [24] - 多层次推动行业大模型应用可持续发展 系统构建数据要素市场 培育数据治理专业服务市场 [25] - 促进行业应用场景市场开放 鼓励大中小企业 产学研联合创新 扩展采用公有云方式部署AI应用范围 [25] - 突破市场分割和技术封闭问题 按照全国统一大市场原则 着力培育从基础模型到行业应用的完整生态链 [25]
腾讯研究院AI速递 20250902
腾讯研究院· 2025-09-02 00:01
Meta与Scale AI合作破裂及高管变动 - Meta与Scale AI合作仅两个月后出现裂痕 随Scale AI前CEO进入Meta的高管Ruben Mayer已离职[1] - Meta内部研究人员抱怨Scale AI数据质量过低 公司转向与Scale AI竞争对手Mercor和Surge合作[1] - Meta完成143亿天价挖人后多次重组AI部门 Scale AI失去Meta支持后丢失OpenAI和谷歌等大客户并经历大规模裁员[1] Anthropic模型性能问题与修复 - Claude Opus 4.1在上午10-11点期间出现性能显著下降 处理文稿任务频繁出错且仅白天发生[2] - 分析认为性能下降可能因Anthropic采用1.58位量化(仅用-1/0/1三个值表示参数)导致模型丢失关键信息[2] - Anthropic官方承认推理堆栈问题 本意为提升模型效率却影响响应质量 已将Claude Opus 4.1和4.0版本回滚[2] 腾讯混元翻译模型开源与技术突破 - 腾讯开源7B参数翻译模型Hunyuan-MT-7B 支持33个语种和5种民汉语言/方言互译 在WMT2025比赛31个语种中获30个第一[3] - 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B 能根据原文和多个翻译模型结果生成更优翻译[3] - 模型采用AngelSlim压缩工具进行FP8量化 推理性能提升30% 已接入腾讯会议/企业微信/QQ浏览器等业务[3] 阶跃星辰语音大模型发布与性能表现 - 阶跃星辰发布端到端语音大模型Step-Audio 2 mini 统一建模语音理解/音频推理与生成 支持语音原生Tool Calling能力[4] - 模型在MMAU基准测试获73.2分位列开源端到端语音模型榜首 中英互译和语音识别任务大幅领先其他模型[4] - 采用真端到端多模态架构 引入链式思维推理与强化学习联合优化 可精细理解情绪/语调/音乐等副语言和非语音信号[4] 书生·万象3.5模型升级与技术特性 - 上海AI实验室开源发布书生·万象InternVL3.5系列模型 包含10亿至2410亿参数九种尺寸 通用能力/推理能力和部署效率全面升级[5] - 旗舰模型InternVL3.5-241B-A28B在多项基准超越GPT-5 MMMU获77.7分(开源最高) 通过级联式强化学习将推理性能较上代提升16.0分[5][6] - 创新引入动态视觉分辨率路由与解耦部署框架 单次推理延迟由369ms缩短至91ms(提升约4倍) 增强GUI智能体/具身空间推理等核心能力[6] 韩国AI玩偶应用与养老解决方案 - 韩国政府向数万名独居老人分发Hyodol开发的AI玩偶 具备24小时陪伴聊天/提醒吃饭服药/健康监测功能[7] - 玩偶内置基于ChatGPT的对话系统 颈部红外传感器检测动作 胸部麦克风记录老人日常回答 紧急情况下可通知护工[7] - 已有1.2万多台Hyodol玩偶在韩国独居老人家服务 每台售价约8160人民币 远低于护理人员成本 有效缓解养老护理人员缺口[7] AI生成内容标识新规实施与平台响应 - 《人工智能生成合成内容标识办法》9月1日正式实施 要求AI生成的视频/语音/文字/图片必须添加身份标签[8] - 生成合成服务提供者需添加显式和隐式标识 传播服务提供者需核验元数据并加注提示[8] - 腾讯/抖音/快手/B站/DeepSeek等平台已发布细化规则 为AI内容添加明显标识并提供标识功能 禁止用户删除或篡改标识[8] 具身智能强化学习框架开源与技术突破 - 清华大学/北京中关村学院/无问芯穹联合发布RLinf框架 为首个面向具身智能的渲训推一体化大规模强化学习框架[9] - 提出混合式执行模式和宏工作流到微执行流的映射机制(M2Flow) 在具身智能训练场景下实现超120%系统提速[9] - 集成Megatron+SGLang/vLLM和FSDP+HuggingFace两套后端 专为大小脑不同训练需求设计 搭载自适应通信库和自动调度模块[9] DeepSeek模型训练细节披露与合规响应 - DeepSeek发布官方公告响应《人工智能生成合成内容标识办法》 承诺给AI生成内容添加标识并警示用户勿删改[10] - 首次公开《模型原理与训练方法说明》 披露DeepSeek-V3/R1训练细节包括6850亿参数规模/预训练与优化训练流程[10] - 详细披露数据治理体系 采用过滤器自动剔除有害内容 对用户提供知情权/选择权与控制权 承认模型幻觉仍是全行业难题[10]
段永朝:在AI缔造的新知识时代,刷题和应试将不再有意义
腾讯研究院· 2025-09-01 17:04
大模型技术发展阶段 - 当前大模型处于技术初级阶段 表现为有问必答且从不承认不知道的"话痨"特性[2] AI对认知模式的影响 - 个体知识独立性下降 对群体智慧依附性上升 认知负担转移至大模型外脑[2][5] - 个人自主判断信心下降 因信息过载使参考资料获取量从几百篇跃升至百万篇[6] - 外脑侵入性增强 大模型会强行输出答案形成干扰[6] 群体智慧形态升级 - AI实现群体智慧化学层面准实时融合 超越物理层面非实时聚合[5] 教育体系变革 - 传统通识教育作为知识预训练过程可被大模型大幅缩短[2] 未来经济模式重构 - 经济逻辑从交易中心转向以个人意愿(intention)为中心[7][15] - 运行模式从生产-消费-分配串行逻辑转变为三者并发的并发逻辑[7][15] - 生产环节成为无人化公共事业[7][15] 人机关系重构 - 需以几十年尺度看待人机关系 量子计算前为关键窗口期[9] - 需想象机器生命新物种构成的机器世界新框架[10] - 未来人类将处于纯种人与赛博格间的模糊地带[2][10] 生产要素变革 - 人类物理劳动退出生产要素 活动转向精神与创造领域[2][15] 技术天花板限制 - 当前计算技术存在算力天花板 受能源和物理器件限制[14] 新经济基础设施 - VRM(Vendor Relationship Management)成为意愿经济核心技术[15] - 所有人机交互场景成为必争入口[15] - 区块链通过不可篡改特性解决信用问题[15] 文化融合需求 - 需融合西方计算理论与东方整体论优势[14] 公共精神复兴 - 超级平台作为平台的平台本质是公共服务供应商[14]