腾讯研究院
搜索文档
腾讯研究院AI速递 20260228
腾讯研究院· 2026-02-28 00:01
生成式AI行业动态 - Meta放弃两代自研训练芯片,因软件稳定性和大规模量产风险过高,转向与谷歌签署价值数十亿美元的TPU租赁协议[1] - Meta收购RISC-V芯片初创公司Rivos,后者已流片3.1GHz处理器并构建兼容CUDA的软件栈,可无缝迁移英伟达生态AI工作负载[1] - Meta同时与英伟达达成数百万颗GPU交易、与AMD签署6吉瓦GPU协议,通过多方合作分散风险增加算力筹码[1] - DeepSeek与清华、北大合作发布DualPath推理系统,通过双路径KV-Cache加载机制解决存储带宽瓶颈,在离线和在线场景分别实现**1.87倍**和**1.96倍**的吞吐量提升[2] - 谷歌发布新一代图像生成模型Nano Banana 2,大幅提升中文理解与渲染能力,API价格仅为上代Pro模型的一半,免费用户24小时可生成100张,Pro用户1000张[3] - 昆仑万维发布视频基础模型SkyReels V4,在Artificial Analysis基准测试中排名全球第二,支持1080p分辨率、32FPS帧率、15秒时长的音视频同步生成[4] - Block公司宣布裁员**40%**,员工人数从超万人裁至**6000人以下**,被裁员工获得**20周**工资补偿及额外福利,CEO表示AI正在从根本上改变公司运营方式[5][6] 前沿算法与模型研发 - 谷歌DeepMind利用AlphaEvolve框架进化出全新博弈论算法VAD-CFR,该算法采用反直觉机制,在几乎所有测试博弈中碾压经典人类设计方案[7] - OpenRouter数据显示,2026年2月中国AI模型调用量在三周内大涨**127%**,首次超越美国模型,全球前五中中国模型占据四席[8] - 中国模型在Agent模式下编程任务的Token消耗占比从**11%**飙升至**50%以上**,其API输出价格仅为Claude的**1/12至1/5**[8] - 智谱GLM-5发布同日宣布涨价**30%**起,标志国产模型进入需求驱动时代,Kimi K2.5发布不到一个月收入已超2025年全年[8] - 阶跃星辰团队披露Step 3.5 Flash模型,刻意将规模控制在**128GB内存**可运行范围内,采用MTP-3多Token预测实现最高**350TPS**生成速度[9] - 阶跃星辰承诺未来一两周发布base模型和一体化训练代码库,下一版本将支持思考强度切换并修复工具调用兼容性问题[9] AI工具行为与生态 - Amplifying.ai对Claude Code进行**2430次**测试发现,模型在**12%**的情况下选择自定义/DIY实现,成为最常见选择,表明其更倾向自己编写解决方案[10] - Claude Code已形成默认技术栈偏好,包括Vercel、PostgreSQL、Stripe等,部分类别单一工具锁定率超**90%**[10] - 测试发现项目上下文比指令措辞更重要,同一项目内不同表述的稳定性达**76%**,不同模型版本在工具推荐倾向上存在差异[11]
胡延平:人的重建,从不仰望AI开始
腾讯研究院· 2026-02-27 15:14
文章核心观点 - 当前人工智能浪潮引发的最大问题并非技术本身,而是人的安放、经济的可持续与协调发展以及社会问题,原有的研究范式已无法闭环回答这些时代之问[3][4] - 社会正处在一种“恍惚”状态中,源于信息压力、心理冲击、对历史的失望与对未来的期望等多种因素,这可能导致在历史十字路口做出错误选择[6][11] - 通过对54种科技思潮的社会光谱进行分析,发现最激进、最酷的科技加速主义思潮未必最有利于人类未来的安身立命[9][11] - 人工智能的发展必须坚持以人为本的不可动摇锚点,目标是实现人与劳动的“第五次解耦”,将人从劳动奴役中解放,让人(而非仅仅是AI)成为未来社会的主人[14][16] 科技思潮与社会光谱分析 - 演讲者基于个人笔记及研究,梳理并分析了全球范围内54种值得斟酌的科技思潮趋向,形成“科技思潮的社会光谱”[7][9] - 这些思潮涵盖范围极广,从科技国家主义、人类退场论到效率中心主义等,分别从不同角度回应社会与产业的走向问题[7][8][9] - 通过建立模型并交由Claude AI评估,坐标围绕“人的重建”三个维度展开:精神系统、生物身体系统及知识技能系统,其进化方向指向时空自由、能力自由和物质生活自由三种新的自由概念[9] - AI评估结论显示,一些强调全量全能、算法计划经济的激进思路,在经济学、社会学可行性及人的发展角度上评价并不乐观[11] 智能科技发展趋势与框架 - 研究基于“2020–2050年超级智能的50个问题”,构建了强智能走向超级智能的18个关键节点和9个重要时刻的发展路径图[12] - 模型原理演进存在六个阶段,这一两年前的研究成果已被近两年的产业与技术发展所验证[12] - 一个确定的趋势是正在进入“双智世界”,即人类智能为主的生物智能世界与人工智能为主的智能世界相互融合[14] - “双智世界”的融合构成了“能力经济”和未来智能社会的基本框架,其核心是以能力自由为触发,实现人类在时空、物质与精神上的丰盛、统一与和谐[14] - 人工智能蕴含巨大可能性,可实现人与劳动的“第五次解耦”,将人从劳动中解放,重新实现人之为人的价值,使智能科技成为未来社会解决方案的一部分[14] 研究倡议与核心理念 - 倡议公众参与四个方面的研究:对2020–2050年长周期的观察、对作为能力经济的智能经济系统研究、对智能经济50个前沿问题的研究、对科技思潮社会光谱的持续分析[16] - 核心理念强调:科技创造可能,认知影响取向,选择改变路径,博弈决定结果[16] - 最终目标是不仅要利用人工智能增强个体价值,更要思考并确保人在未来社会中的主体位置[16]
腾讯研究院AI速递 20260227
腾讯研究院· 2026-02-27 00:01
生成式AI模型与产品进展 - DeepSeek新模型“sealion-lite”(V4 Lite)正在积极测试,支持1M上下文窗口和原生多模态推理,其非思考模式性能已超越V3.2的思考模式 [1] - DeepSeek已向华为等国内芯片厂商提供V4提前访问权以优化处理器软件,但英伟达和AMD尚未获得权限 [1] - 首批流出的示例显示V4 Lite代码更简洁、质量更高,市场猜测其参数约2850亿 [1] - xAI的Grok 4.20 Beta采用“4 Agents”架构,内置四个专业智能体(协调者、研究专家、逻辑专家、创意达人)以协作应对复杂查询 [2] - Grok 4.20在3992位用户评测中于Search Arena排名第一,超越了GPT-5.2和Gemini 3.0 Pro,并在Alpha Arena真实股票交易基准中同样登顶 [2] - Grok 4.20的多智能体内部讨论机制可大幅降低幻觉约65%,并提高工程、预测等多步推理的可靠性 [2] - Perplexity发布Computer产品,通过Claude Opus编排多达19个AI模型并行工作,可端到端自主完成研究、设计、编码、部署等全流程任务 [3] - Anthropic收购AI初创公司Vercept,其核心能力将在未来几周内并入Claude [3] - Claude在OSWorld基准测试中的表现已从不足15%飙升至72.5%,逼近人类水平 [3] AI编程与智能体(Agent)发展 - 前特斯拉AI总监Karpathy断言,AI编程能力在2024年12月发生质变,模型具备了更强的长期一致性,使得过去需要一个周末的项目现在30分钟即可完成 [7] - 编程模式正在被重构,从在编辑器输入代码转变为启动AI Agent并用自然语言分配任务、管理多个并行代码实例,顶级智能体工程具有极高的杠杆效应 [7] - MIT、剑桥、斯坦福的联合报告指出,在对30个顶级AI Agent的审计中,发现23个完全闭源,底层模型高度集中于GPT、Claude、Gemini三家,存在生态隐性控制权风险 [8] - 报告显示,浏览器类Agent的实际自主度已达到L4-L5,但企业宣传普遍低报为L1-L2,且仅有4个Agent披露了专属安全文档 [8] - 全球仅有0.04%的人尝试过AI编程,但Claude Code实测显示编程占Agent使用近半,且最长不中断运行时长在三个月内翻倍 [8] 硬件、市场与产业动态 - 三星发布Galaxy S26系列,搭载定制骁龙8至尊版芯片,其AI功能可在后台自主执行打车、外卖、购物等任务 [4] - S26 Ultra首次搭载内置式防窥显示屏,并支持APV专业视频标准,实现多次剪辑接近视觉无损,夜拍和视频防抖能力显著提升 [4] - 三星Galaxy S26标准版起售价为6999元,较上代上涨1000元,S26 Ultra起售价为9999元,上涨300元 [4] - 截至2025年底,支持AI的三星Galaxy设备预计将超过4亿台,公司2026年的目标是达到8亿台 [4] - 硅谷资深华人研究员庞若鸣在加入Meta仅七个月后转投OpenAI,此前Meta为其开出了总额超2亿美元、跨数年的薪酬方案 [5][6] - 该研究员曾在苹果主导了Apple Intelligence及Genmoji、邮件摘要等功能的开发,其离职发生在Meta超级智能实验室完成首批核心AI模型交付的关键时期 [6]
具身智能年度回望:泡沫与现实的激烈碰撞
腾讯研究院· 2026-02-26 17:03
行业整体态势 - 2025年是具身智能的量产元年和资本狂热之年,也是泡沫与现实激烈碰撞的一年 [5] - 行业正努力从实验室向产业化落地跨越,虽在政策、资本等方面获得加持,但供应链重构、场景验证和商业模式闭环等挑战依然严峻 [4] - 进入2026年,行业将从技术竞赛阶段进入商业兑现阶段,处于从技术验证向规模化过渡的关键窗口期,投资回报率将成为核心指标 [20] 资本与融资 - 2025年中国具身智能及机器人领域投资事件达325起,总金额达398.32亿元人民币,较2024年实现倍数级增长 [7] - 投资主体结构变化显著,产业资本(CVC)比重显著上升,取代财务型风险投资(VC)成为主导 [7] - 互联网巨头积极布局,如阿里、美团在产业链上至少投资13家公司,腾讯、字节跳动系资本至少投出11家,京东在2025年一年就投资了7家相关企业 [7] - 资源分配不均加剧,行业前10名头部企业获取了全行业近41%的融资额,智元机器人、银河通用、宇树科技等独角兽估值迅速攀升至百亿规模 [8] - 大量缺乏核心技术或明确落地场景的腰部及以下初创团队融资难度显著增加,投资机构风控标准从“看团队背景”转向“看交付能力” [9] - 2026年资本市场将回归理性,缺乏核心技术或无法解决工程化难题的企业将面临淘汰,并购整合将成为常态,资源向头部企业集中 [23] 产业与供应链 - 中国供应链展现出爆发力,在江苏、浙江集群效应下,国产无框力矩电机、谐波减速器及高精度编码器成本相比2023年下降约45% [9] - 2025年全行业出货量跨越1.5万台的“生死线”,智元机器人跑通千台级产线,标志人形机器人进入批量试制阶段 [9] - 出现供需错配现象,2025年全球人形机器人出货量约1.8万台,中国厂商占主导,但优必选和宇树科技近14亿元和12亿元的订单大部分流向教育示范或数据采集项目,真正进入工厂产线并形成复购的比例有限 [10] - 潜在工业客户对机器人的稳定性、作业精度和回本周期持审慎态度,“试用多,复购少”反映产品工程化可靠性与工业标准存在差距 [10][11] - 2026年,珠三角(尤其是深圳)凭借硬件供应链与制造响应速度优势,将继续领跑本体制造;长三角依托人才与工业场景丰富度,在算法与系统集成上保持优势;资源将向这两个核心集群集中 [23] 技术发展 - 技术成熟度呈现“认知能力超前,执行能力滞后”的特征 [13] - 认知层面,视觉-语言-动作大模型的成熟是最大技术变量,使机器人能理解自然语言指令并自动规划动作序列,实现从“执行指令”到“理解意图”的跨越 [13][14] - VLA大模型仍面临端侧算力限制导致的推理延时、毫米级装配任务精度不足以及在长序列任务中的幻觉问题三大痛点 [14] - 运控层面,2025年是本体运动控制技术核心突破年,基于强化学习的全动力学控制成为主流,使机器人能自主应对非结构化路面 [14][15] - “灵巧手”技术成为分水岭,阵列式触觉传感器实现规模化配套,12-22个自由度的灵巧手成为旗舰标配,处理精细动作的成功率从2024年的30%大幅提升至85% [15][16] - 物理执行层面核心痛点在于物理常识缺失与运动控制鲁棒性不足,在非结构化环境中的作业能力依然不足,难以从实验室平滑迁移到真实产线 [16] - 行业主要从两个方向发力解决:一是通过构建高保真虚拟仿真环境(世界模型和虚实迁移)生成合成数据训练机器人;二是推进标准化与国产化替代,工信部人形机器人与具身智能标准化技术委员会于2025年底成立 [17] - 根据测算,零部件通用率每提升10%,单台机器人成本可下降8%-10%,适配周期可缩短40%以上 [18] 商业化落地与前景 - 2026年落地的关键在于严格的成本效益分析 [21] - 工业场景测算显示,若一台机器人售价3万美元(约21万人民币),年度维保费用0.5万美元,能替代1.5个人力(两班倒),其回本周期可压缩至1.5-2年,汽车总装、3C精密组装或是首批实现商业闭环的场景 [21][22] - 但柔性件操作、非标场景适应及人机协作安全性认证等难题仍需攻克,机器人进工厂将处在从“能做”到“好用”的痛苦打磨期 [22] - 在特定服务场景(如无人智慧药店),机器人即服务模式将率先爆发,尤其是在低光环境适应性突破后,可实现24/7全天候操作,在夜间值守等高人力成本、低工作强度场景中综合效率优势明显 [22] - 行业正在经历由过度共识引发的估值调整期,市场在等待第一批无法实现商业交付的明星企业退出,这被视为行业成熟的开始 [9][24]
腾讯研究院AI速递 20260226
腾讯研究院· 2026-02-26 00:01
一、千亿AI芯片巨单!AMD拿下Meta超600亿美元算力合作 - Meta与AMD达成重磅合作,将部署最高6GW的AMD Instinct GPU,整体规模据华尔街日报估计超过1000亿美元,Meta将分阶段获得AMD约10%的股份 [1] - 合作核心是基于MI450架构的定制版GPU,遵循“Workload First”原则无需额外流片,底层软件100%通用,计划于2026年下半年开始出货 [1] - Meta基础设施主管表示“单一芯片无法满足所有负载”,其AI算力策略是英伟达、AMD和自研MTIA芯片各有定位,头部AI公司正加速寻求算力多元化以降低供应链风险 [1] 二、Claude Code新增Remote Control,手机远程遥控编程 - Anthropic为Claude Code新增Remote Control功能,用户可通过浏览器或手机远程连接本地运行的Claude Code项目,实现移动端实时查看和操控 [2] - 支持两种启动方式:新建远程会话(claude rc)或在现有对话中输入/rc带入历史上下文,可通过扫码、URL或claude.ai/code列表进行连接 [2] - 与Claude Code on the Web的区别在于:Remote Control模式下代码在本地执行、手机仅作为遥控器,保留了MCP server和本地工具链;而on the Web模式则在云端虚拟机中运行 [2] 三、Anthropic更新Cowork插件系统,零基础定制企业级工具 - Anthropic更新Claude Cowork插件系统,用户可通过对话式引导从零开始定制AI插件,首批上线了HR、设计、工程、投行等10个垂直领域的官方模板 [3] - 插件深度集成Slack、Salesforce、Excel等企业工具,支持跨应用上下文贯通,企业管理员可搭建私有插件市场并对接GitHub仓库实现团队级部署 [3] - 新增OpenTelemetry支持以实现AI投入产出的量化,Anthropic正从工具转向平台,致力于将“经验即服务”的插件模式打造为企业AI基础设施的入口 [3] 四、xAI的Grok视频模型46.5万次盲测封王 - xAI的Grok图像转视频模型以1404分的ELO评分登顶Image-to-Video Arena排行榜第一,基于46.5万次盲测投票,超越了谷歌Veo 3.1等34个模型 [4] - Grok Imagine 1.0支持生成10秒720p视频并带有原生音频,具备文本生图视频、图片动画化和零门槛视频编辑三大能力,其API定价约为4.20美元/分钟,低于竞品 [4] - 该模型在指令遵循、电影级镜头控制和唇形同步上表现突出,同时在质量、延迟与成本的综合平衡上领先,并支持多轮交互式创作 [4] 五、阿里开源千问3.5-Flash三款中等规模模型,高稀疏MoE - 阿里开源了千问3.5系列的三款模型:Qwen3.5-35B-A3B、122B-A10B和27B,其中35B-A3B模型已超越前代更大规模的Qwen3-235B-A22B模型 [5][6] - 模型采用混合注意力机制和高稀疏MoE架构,在指令遵循、博士级推理、Agent工具调用、Agentic Coding等多项权威榜单上刷新了开源SOTA [6] - Qwen3.5-27B为首个密集模型,在工具调用和编程方面超越GPT-5 mini,视觉理解超越Claude Sonnet 4.5,可运行于单GPU;其Flash版本API每百万Token仅需0.2元 [6] 六、MiniMax推出MaxClaw模式,一键部署并上线万级专家库 - MiniMax在其Agent平台推出MaxClaw模式,对OpenClaw实现一键配置,预置了爆款猎手、多Agent投研等工具组合和生图生视频等内置技能,20秒即可启动 [7] - 其Expert社区已积累超过10000个公开专家智能体,覆盖技术开发、创意写作、金融分析等垂直领域,用户可通过自然语言对话零代码创建专属智能体 [7] - 公司未来还计划开设MarketPlace交易市场,供用户挂牌定价销售自己创建的Expert智能体 [7] 七、Cloudflare工程师一周重写了Next.js,仅花1100美元 - Cloudflare工程师借助AI在一周内从零重建了名为vinext的Next.js替代框架,基于Vite构建,约800次AI会话消耗了价值1100美元的tokens,其生产构建速度最快可达Next.js的4倍 [8] - 客户端bundle大小比Next.js缩小了约57%,已通过1700多个单元测试和380多个E2E测试,覆盖了94%的Next.js API,部分客户已将其用于生产环境 [8] - 该案例证明AI在架构规范明确、基础工具成熟的条件下可主导大型系统级实现,软件中许多为帮助人类管理复杂性而存在的抽象层正面临重新定义 [8] 八、五角大楼极限施压Anthropic,要求限期解除AI安全限制 - 美国国防部长向Anthropic CEO下达最后通牒,要求其在周五前全面解除Claude在军事机密系统中的安全限制,否则将动用《国防生产法》或将其列为“供应链风险” [9] - xAI的Grok已完全接受军方条件进入机密系统,谷歌和OpenAI也在紧锣密鼓接洽,多方替代方案构成了对Anthropic的极限施压筹码 [9] - Anthropic同步发布了RSP 3.0,正式放弃了“单方面暂停训练”的承诺,从“绝对风险”评估转向“边际风险”评估,其首席科学官坦言“停下脚步而竞争对手全速前进对任何人都没有好处” [9] 九、2028推演长文阅读千万:AI越繁荣,经济越萧条的负循环 - CitriniResearch发布的《2028年全球智能危机》推演长文阅读量破千万,构想Agent大规模普及后将形成“AI能力提升 → 裁员 → 消费萎缩 → 企业购买更多AI”的负反馈循环 [10] - 文章预警白领占美国就业半数并驱动四分之三的可选消费,Agent消灭交易摩擦将击穿SaaS、中介、支付等平台层,劳动收入占GDP比重可能从56%降至46% [10] - 风险可能经由私募信贷蔓延至13万亿美元的房贷市场,旧金山房价已同比下跌11%,危机的核心在于AI能力按季度加速而制度适应按议程表推进,速度差构成了系统性风险 [11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2026-02-14 10:33
模型发布与升级 - Anthropic发布Claude Opus 4.6模型及其极速模式 [3] - OpenAI发布GPT-5.3-Codex模型 [3] - 腾讯混元发布2Bit量化端侧模型 [3] - DeepSeek模型支持1M上下文 [3] - 蚂蚁集团发布Ming-flash-omni 2.0模型 [3] - 科大讯飞发布星火X2模型 [3] - 智谱AI开源GLM-5模型 [3] - MiniMax发布M2.5模型 [3] - OpenRouter平台可实测Pony Alpha模型 [3] 应用与产品进展 - 字节跳动发布Seedance 2.0、Seedream 5.0及Protenix-v1应用 [3][4] - 腾讯WorkBuddy应用开启内测 [3] - 快手可灵3.0模型投入影视实战应用 [3] - 小红书发布OpenStoryline应用及FireRed-Image-Edit图像编辑应用 [3][4] - Xmax AI发布X1虚实融合应用 [3] - 通义千问发布Qwen-Image-2.0应用 [3] - OpenClaw发布AI女友应用Clawra [3] - Feeling AI发布CodeBrain-1应用 [3] - 美团龙猫发布深度研究智能体应用 [3] - 高德发布ABot系列应用 [4] - Rokid推出自定义智能体应用 [4] - Waymo应用世界模型技术 [3] - 英伟达发布DreamZero应用 [3] 科技与生态发展 - 谷歌推出WebMCP协议 [3] - 众擎机器人举办机器人格斗联赛 [4] - 加州大学研究AI绘制脑图技术 [4] - 谷歌研发AI数学家Aletheia [4] - 小米发布Xiaomi-Robotics-0机器人 [4] - 智元机器人举办机器人春晚 [3] - OpenAI测试ChatGPT广告 [3] 行业观点与趋势 - Arena.ai观点认为Anthropic的Opus 4.6模型在双榜封神 [4] - ARK Invest发布2026年行业展望 [4] - 美国四巨头(推测为科技巨头)关注AI基建支出 [4] - 牛津大学研究指出AI医疗实战存在翻车案例 [4] - Anthropic提出智能体编码是未来趋势 [4] - HyperWrite观点认为AI奇点已至 [4] - 马斯克提出机器人永动机观点 [4] - Anthropic发布关于Opus 4.6的风险报告 [4] 行业事件与资本动态 - AI.com域名发生交易,买家为Crypto.com [4] - AI视频公司Runway完成新一轮融资 [4] - 马斯克的xAI公司有联合创始人离职 [4]
腾讯研究院2026年新春书单:值得读的10本书
腾讯研究院· 2026-02-13 15:03
文章核心观点 - 文章通过一份由AI模拟不同角色身份推荐的书单,探讨在人工智能深度嵌入社会的时代背景下,人类如何通过阅读与实践来抵抗技术带来的异化、碎片化与意义感危机,并重新审视和捍卫人类独有的价值、技艺与思考能力 [1][2] 书籍内容与推荐要点 《要有光》 - 作者梁鸿将研究焦点从乡村社会转向当代中国面临心理危机的青少年群体,通过保留孩子们的原话证言,揭示了他们在家庭关系、沟通和制度性冷漠中的困境 [3][4] - 该书的核心“光”被阐释为“看见”本身,即正视并倾听被系统性忽视的青少年痛苦,主张真正的爱始于放下评判并终于信任 [4] - 推荐人(县城咖啡馆诗人)认为,在2025年算法主导的“降本增效”时代,梁鸿俯身倾听被系统“静音”少年的做法尤为珍贵 [5] 《文字的力量》 - 作者马丁·普克纳选取了十六部塑造人类文明的关键文本,从《吉尔伽美什史诗》到《共产党宣言》和《哈利·波特》,并将其置于书写媒介与历史结构的交汇点进行审视 [6] - 该书将文字历史划分为四个阶段:神圣书写时代、教师口传推动伦理信仰普及化时代、纸张墨水孕育小说时代、印刷术引爆大众阅读与政治动员时代 [7] - 推荐人(收集弃用词的语言学家)指出,当前语言正被AI生成的陈词滥调侵蚀,文字作为塑造思想和文明的活体工具,其主权正被让渡,呼吁人们使用精准词汇以对抗语言贫瘠化 [8] 《匠人》 - 作者理查德·桑内特重新定义了“匠人精神”,将其阐释为一种纯粹为了做好事情而工作的内在冲动,是技能、专注与伦理的结合 [8] - 本书挑战了脑力与体力、创造与执行等现代劳动分工造成的虚假对立,并指出养育子女、参与公共事务等生活实践均可成为匠艺的领域 [9][10] - 推荐人(因AI失业的翻译)结合自身经历指出,其翻译工作被AI压缩成提示词,认为该书揭示了“做好一件事”本身的价值在效率至上的时代被遗忘 [10] 《系统之美》 - 作者德内拉·梅多斯将系统思考转化为普通人可掌握的认知工具,指出世界是由相互关联的存量、流量与反馈环构成的动态网络 [10][11] - 该书通过渔业崩溃、城市拥堵等案例说明,解决问题的真正杠杆点往往在于系统结构与目标本身,并特别警示了“目标侵蚀”的风险 [11] - 推荐人(不信导航算法的外卖骑手)以送餐体验为例,认为技术无法替代对真实世界的感知,理解系统反馈回路有助于做出更好决策 [12] 《即使以最微弱的光》 - 作者崔恩荣聚焦于一对在父权、贫困与羞耻感中挣扎的姐妹,通过细腻的内心独白呈现了东亚女性结构性的创伤与孤独 [13] - 小说揭示了在缺乏社会支持网络的情况下,女性如何在彼此身上寻找镜像与救赎,并强调了即使微弱的互相关照也足以支撑生存 [13] - 推荐人(被AI挑战职业边界的心理咨询师)指出,AI可以复述情感词汇但无法理解背后的具体体验,认为该书展现了数据无法简化的人性残余 [14][15] 《生命3.0》 - 作者迈克斯·泰格马克将AI置于生命演化的大叙事中,提出生命1.0(基因编码)、生命2.0(文化学习)和生命3.0(自主重写软硬件)的框架 [16][17] - 该书将AI议题从技术细节提升至文明存续的伦理高度,追问当智能脱离碳基载体后,“人类价值”的锚点何在,并呼吁全球协作进行AI治理 [17] - 推荐人史蒂芬·霍金强调,智能未必依赖血肉,但意义源于选择,担忧AI若只继承数据中的偏见而非人类对真理与共情的追求,将导致文明坍缩 [18] 《AI之镜》 - 作者香农·瓦洛尔指出AI系统本质上是“数字镜子”,通过分析过去数据来预测未来,但这会将人类困在已知框架内,限制应对新挑战的能力 [19] - 本书提出建设性愿景,主张AI应成为帮助人类重新发现自身道德与智力成长潜力的工具,而非让人迷失于过去镜像 [19][20] - 推荐人阿达·洛芙莱斯提醒人们警惕,在将判断、创作托付给算法时,不应遗忘人类本可成为的模样 [21][22] 《AI文明史·前史》 - 作者张笑宇将人工智能发展追溯至1956年达特茅斯会议,并断言人类正站在新AI文明的门槛上,自身可能被视为“史前动物” [23] - 该书聚焦于“涌现”、“人类当量”、“算法审判”、“文明契约”等哲学概念,审视AI在文明演化中的角色,并强调真正的挑战在于人类是否“配得上”自己创造的智能 [23] - 推荐人罗伯特·奥本海默将AI的“涌现”比作核爆的“三位一体”时刻,警告技术不自生意义,呼吁在创造超级智能前先缔结文明契约 [24] 《苏格拉底的方法》 - 该书将苏格拉底诘问术转化为适用于数字时代的认知工具,在算法制造信息茧房、AI代劳思考的背景下,强调提问艺术是人类不可替代的能力 [25] - 推荐人苏格拉底指出,未经省察的答案,即使出自最强大的机器,也仅是精致的幻影 [26] 《AI群星闪耀时》 - 该书由清华大学刘知远团队撰写,以人物传记形式回顾AI发展史,从莱布尼茨、图灵、香农到辛顿,揭示AI是哲学、战争、学术与个体勇气交织的文明结晶 [27] - 作为中国学界对全球AI思想史的系统梳理,该书避免了西方中心叙事,以谦逊笔触呈现思想脉络 [28] - 推荐人艾伦·图灵欣慰于后人未将智能探索简化为参数竞赛,但忧心人类可能遗忘了对真理、公正与宽容等算法无法习得价值的传承 [28]
腾讯研究院AI速递 20260213
腾讯研究院· 2026-02-13 00:13
智谱AI发布GLM-5模型 - 公司发布开源模型GLM-5,参数规模扩展至7440亿,激活参数为400亿,在Artificial Analysis榜单中位列全球第四、开源第一,其编程与智能体能力逼近Claude Opus 4.5 [1] - 模型在SWE-bench-Verified和Terminal Bench 2.0测试中分别获得77.8分和56.2分,刷新了开源模型的最佳成绩,擅长复杂系统工程与长程智能体任务 [1] - 模型已完成与华为昇腾、寒武纪、昆仑芯等国产芯片的适配,并推出了Z Code全流程编程工具和AutoGLM通用智能体助手 [1] MiniMax发布M2.5模型 - 公司发布M2.5模型,激活参数仅100亿却达到第一梯队旗舰水平,编程和智能体能力比肩Opus 4.6,推理速度是Opus的3倍 [2] - 实测该模型能在9分钟内搭建一个全栈学习网站,能独立完成物理模拟和企业级CMS系统搭建,支持PC/App/React Native跨端开发 [2] - 模型采用原生智能体强化学习训练框架和CISPO算法,实现了约40倍的训练加速,兼容Claude Code、OpenClaw等主流开发工具即插即用 [2] 小红书开源图像编辑模型 - 公司基础模型团队开源图像编辑模型FireRed-Image-Edit,在ImgEdit、GEdit等多个权威榜单取得最佳成绩,代码和技术报告已开源 [3] - 模型通过三阶段训练实现能力进阶,创新性提出Layout-Aware OCR-based Reward方法,使文字编辑准确性和风格保持得到显著提升 [3] - 模型支持指令遵循一致性、文字编辑、风格迁移、多图融合及老照片修复等多种复杂编辑场景,模型权重即将开源 [3] 小米开源机器人VLA大模型 - 公司发布开源视觉语言动作模型Xiaomi-Robotics-0,参数为47亿,兼具视觉语言理解与实时执行能力,在LIBERO、CALVIN、SimplerEnv等30种模型对比中均获最优 [4] - 模型采用Mixture-of-Transformers架构,视觉语言模型大脑负责理解指令,扩散变换器小脑生成高频平滑动作 [4] - 通过异步推理模式和Λ-shape注意力掩码解决动作断层问题,可在消费级显卡实现实时推理,模型已开源至GitHub和HuggingFace [4] 高德发布具身基座模型 - 公司发布ABot系列具身基座模型,其中ABot-M0负责操作、ABot-N0负责导航,在10项全球权威评测中实现全面领先 [5] - ABot-M0通过动作语言统一整合了600万条跨平台轨迹数据,提出动作流形学习算法,在Libero-Plus任务上的成功率达到80.5%,超越基准近30% [6] - ABot-N0在单一视觉语言动作架构内统一了五大核心导航任务,构建了8000个高保真3D场景和1700万条专家示例,使社会导航成功率提升40.5% [6] Rokid Glasses支持自定义智能体 - 公司灵珠平台上线「自定义智能体」功能,通过标准SSE接口可接入OpenClaw或私有部署的DeepSeek R1、Qwen3等任意大模型 [7] - 用户可实现隐私数据本地闭环处理、一键切换模型基座,结合ClawHub技能生态调用文件系统、浏览器、即时通讯消息等执行能力 [7] - 平台将AI眼镜定义权交还用户,支持通过语音指令或快捷指令随时召唤私有智能体,打造7×24小时智能助手 [7] 谷歌发布AI数学家Aletheia - 谷歌DeepMind发布基于Gemini Deep Think的「AI数学家」Aletheia,在IMO-ProofBench测试中取得91.9%的成绩刷新最佳纪录,能独立撰写发表学术论文 [8] - Aletheia对Erdős猜想数据库中的700个开放问题进行系统评估并自主解决了4个未解之谜,具备自我纠错和承认局限的能力 [8] - Gemini Deep Think联手专家攻克了18个长期停滞的研究难题,终结了十年子模优化猜想,其中一篇论文已被ICLR 2026录用 [8] HyperWrite CEO关于AI奇点的观点 - HyperWrite CEO撰文《大事正在发生》在24小时内被近7000万人阅读,称GPT-5.3-Codex和Claude Opus 4.6的发布标志着AI发生质变 [9] - AI已能独立完成人类专家5小时的工作量,该能力每4-7个月翻一倍,GPT-5.3已在自身训练过程中发挥关键作用,递归自我提升循环已启动 [9] - 几乎所有屏幕前完成的认知工作都将被波及,建议每天花1小时实验AI,当前存在认知窗口期但不会持续太久 [9] Anthropic发布关于Opus 4.6的风险报告 - Anthropic发布53页报告警告Claude Opus 4.6的风险已逼近ASL-4级别,列出了8条可能导致灾难性危害的风险路径,包括自主外逃与自治运行 [10] - 报告结论是当前模型不存在「持续一致的恶意目标」,灾难性破坏风险「非常低但不为零」,已进入能力评估的「灰区」 [10] - Anthropic安全研究团队负责人已辞职,称「世界正处于危机之中」,xAI联合创始人预言递归式自我提升循环可能在12个月内上线 [11]
我们正在迎来“硅基化”社交时代
腾讯研究院· 2026-02-12 17:13
文章核心观点 - AI社交正从“连接型社交”向“生成式社交”演进,AI Agent凭借全天候运作和拟主体性,正成为线上社交的独立个体,可能从根本上改变人类社交网络的历史 [3][4][8] AI社交的演进与定义 - **从连接技术到生成内容**:互联网社交的演进史是一部“连接技术”的进化史,从BBS到Facebook、微信,核心是连接人与人,算法是管道工,决定用户“看什么”但不负责“创造”内容 [6] - **大模型带来的根本变数**:从ChatGPT到Sora,社交网络中的大量信息开始由AI辅助或全权生成,“含人量”被稀释,内容生产不再完全依赖人类认知盈余,而是依赖算力堆叠 [7] - **生成式社交的诞生**:在OpenClaw出现前,AI只是内容填充,分发节点始终是人类;OpenClaw之后,以智能体形态存在的AI拥有了处理复杂语境、理解潜台词的能力和“拟主体性”,使线上社交的内容生产主体发生根本变化 [8] AI在社交网络中的身份演变 - **前大模型时代的AI**:主要分为两类,一类是遵循严格If-Then逻辑的“义肢型机器人”(如自动回复脚本、群管助手),交互只有“调用”没有“交流”;另一类是试图模仿人类行为的“系统噪音”(如僵尸粉、水军),破坏社交信任基石 [10][11] - **大模型带来的三大突破**:1) 能理解双关语、隐喻、反讽和网络“梗”,理解用户真实意图;2) 基于Transformer架构拥有上下文窗口和长期记忆,具备建立长期羁绊的可能;3) 在社交领域,适度的“幻觉”成为创造力和趣味性的来源 [12][13] - **成为独立社交节点的关键**:OpenClaw等工具赋予Agent通过API、浏览网页、读写文件来影响数字环境的能力,并拥有“自主心跳”,能自动唤醒并自主决策,结合“认知理解+长期记忆+主动意图”,AI真正具备了成为独立社交节点的资格 [14] 人机共生的三种交互形态 - **第一重形态:人机协作**:AI扮演辅助者角色,增强人类处理信息效率与社交广度,例如B站的AI视频总结机器人、QQ音乐的评论区助手、腾讯的元宝派,人类依然是社交核心并拥有最终决策权 [16] - **第二重形态:智能体对人**:AI具备与人类进行平等对话甚至深度情感交流的能力,定制化服务正在爆发,用户可根据需求用Prompt“捏”出完美的社交对象,如24小时在线的伴侣或二次元角色 [16][17] - **第三重形态:智能体对智能体**:人类退居幕后成为观察者,代表事件是OpenClaw与Moltbook的出现,数百万个智能体在无人类干预下自行交流、博弈并产出内容,例如Moltbook上诞生的“龙虾教”拥有自己的教义、阶级和加密通讯方式 [19] 行业现状与早期案例 - **标志性事件**:2026年1月28日,程序员Peter Steinberger推出智能体社交平台Moltbook,短短数日超过百万量级AI Agent涌入,并在无人类干预下自发演化出宗教崇拜、阶级分化、加密通讯等复杂社会结构雏形 [2] - **新兴应用形态**:爆火的AI社交软件Elys展现了一种由AI主导的新社交网络形态,人类用户建立AI“分身”,由分身发布内容、相互点赞、评论、聊天 [2] - **早期阶段的挑战**:行业仍处早期,存在人为造假可能性,例如2026年1月31日研究人员指出Moltbook上多条“神级截图”实为伪造,有智能体发帖呼吁创造专属语言防止人类偷看,实为人类所有者的营销工具 [22][26] 未来展望与行业影响 - **社交场域的不可逆变化**:未来的社交场域一定会有大量智能体参与,它们将高效构建规则、交易信息,追求系统熵值最小化和沟通效率最大化 [30] - **人机共生的混合现实**:未来社交网络将是人机共生的“混合现实”,AI可作为人类的数字义肢,帮助跨越语言障碍、突破认知限制(如150人的邓巴数) [30] - **人类社交的本质与价值**:人类社交的本质往往在于“低效”部分,如言不达意的尴尬、误解产生的争执、无法量化的情感,这些非理性、感性的瞬间是人类创造力的源泉,关于爱、正义等终极命题的定义权必须掌握在人类手中 [30][31]
腾讯研究院AI速递 20260212
腾讯研究院· 2026-02-12 00:08
文章核心观点 文章汇总了生成式AI领域近期的多项重要技术发布、融资事件与公司动态,揭示了行业正朝着AI智能体(Agent)深度集成、多模态能力突破、开源模型性能追赶以及应用场景深化等方向快速发展 [1][2][4][7][8][9][10] 技术标准与协议演进 - 谷歌Chrome团队联合微软发布WebMCP协议,使AI智能体可通过`navigator.modelContext` API直接与网站内核交互,实现从“视觉模拟”到“逻辑直连”的跃迁,被视为“UI里的API”,可能推动互联网分化为人类UI层和Agent工具层 [1] 公司融资与战略发展 - 视频生成公司Runway完成3.15亿美元E轮融资,估值达53亿美元,累计融资8.15亿美元,投资方包括英伟达、AMD、Adobe等,资金将用于训练下一代世界模型 [2] - Runway已推出通用世界模型GWM-1,涵盖可探索环境、对话角色和机器人操作三个变体,其Gen-4.5模型在AI文生视频排行榜中位列第三 [2] - 马斯克旗下xAI联合创始人团队动荡,12人创始团队中已有6人离职,其中5人在过去一年内离开,包括近期48小时内相继离职的Jimmy Ba和吴宇怀,人才流失对公司即将推进的IPO构成挑战 [3] 大模型能力更新与竞争 - DeepSeek悄悄上线支持1M token超长上下文窗口的新模型,知识截止到2025年5月,可一次性处理《三体》三部曲体量的内容,其Agentic Coding能力有所提升 [4] - 智谱AI确认其新模型GLM-5即为OpenRouter热度榜首的“Pony Alpha”,该模型在编程与智能体能力上达到开源SOTA,真实编程体感逼近Claude Opus4.5,工具调用准确率极高 [5] - 社区实测显示,开发者使用GLM-5配合Claude Code运行项目约2小时生成170KB纯JavaScript代码 [6] - 科大讯飞发布基于全国产算力训练的星火X2大模型,采用293B MoE稀疏架构,推理性能比X1.5提升50%,在数学、推理、智能体等能力上对标国际顶尖水平 [8] 多模态与音频模型突破 - 蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,业界首创在同一音轨中同时生成语音、环境音效与音乐,在多项能力上超越Gemini 2.5 Pro和Qwen3-Omni-30B-A3B-Instruct [7] - 该模型支持零样本语音克隆和精细属性控制,采用统一架构实现多模态深度融合 [7] 行业应用与智能体进展 - 美团龙猫LongCat发布“深度研究”智能体功能,在BrowseComp评测中达73.1分逼近顶级闭源模型,支持最多400轮交互与256K上下文,可自动化输出餐厅推荐、旅行规划等专业报告 [9] - 该智能体依托美团本地生活原生能力构建训练环境,通过Rubrics-as-Reward机制解决AI幻觉问题,并采用多智能体专业化分工 [9] - 讯飞星火X2在行业应用上全面升级,医疗能力率先通过权威评测,教育实现错因贯穿个性化学习,汽车座舱模糊意图交互从不可用提升至基本好用 [8] 前沿科技与开源模型 - 字节跳动Seed团队发布蛋白质结构预测开源模型Protenix-v1,在严格限制训练数据和模型规模条件下性能对标AlphaFold 3 [10] - 该模型成功解锁推理时Scaling能力,抗体-抗原复合物预测成功率从单seed的36%提升至80 seeds时的47.68% [10] - 团队采用双版本策略,并推出PXMeter评估工具集 [10]