腾讯研究院
搜索文档
打造数字文化消费新引擎
腾讯研究院· 2026-02-06 16:04
我国数字文化消费“热”加速到来 - 互联网、AI与虚拟现实等技术革新了文化产品的生产与消费体验方式,顺应了年轻一代对消费场景变革的需求 [2] - 以游戏、网剧、网文为代表的数字文化产业加速与文旅商体场景融合,催生线上线下结合的新消费场景,成为提振我国数字文化消费的新引擎 [2] - 2024年我国以数字文化产业为主体的16类文化新业态营业收入突破6.67万亿元,增速高达12.4% [4] - 2024年我国居民人均文化娱乐消费支出955元,比2020年增长67.8% [4] - 我国成长出一批具有全球影响力的数字文化企业与互联网平台,持续丰富优秀文化产品供给 [4] - 2025年中国电影票房突破500亿元 [5] - 网络文学IP市场规模近3000亿元 [5] - 数字文化产业展现出内生发展动力强劲、产业链条长、线上线下消费联动的特征 [5] 数字文化产业的经济规模与联动效应 - 2025年中国游戏及相关产业经济规模超12250亿元 [5] - 2025年国内游戏市场及我国自主研发游戏出海销售收入4972亿元 [5] - 游戏产业带动手机等智能硬件设备销售、云服务、IP衍生品等关联经济规模约5548亿元 [5] - 游戏产业辐射文旅、展会、影游改编等领域经济规模超1730亿元 [5] - 《王者荣耀》2025年全球总决赛在北京举办,超130万人预约门票,开票后12秒售罄,62196名观众现场观赛 [5] - 该赛事跨城观众高达85%以上,带动直接经济效益超4亿元,将线上“流量”转化为文商旅体的线下“留量” [5] 数字文化消费“热”背后的主要原因 - 根据国际经验,在居民人均GDP达到1万美元后,以服务与体验型消费为主的文化消费成为经济增长主要引擎 [7] - 政策层面提出要激发全民族文化创新创造活力,推动文化建设数智化赋能、信息化转型,发展新型文化业态,大力提振消费 [7] - 基于文化IP的跨界改编持续拓展产业生态,实现数字文化消费规模倍增 [8] - 2024年中国网络文学阅读市场规模达430.6亿元,而IP改编市场规模近7倍于网文阅读市场 [8] - 游戏成为文化产业的新IP源头,例如《王者荣耀》改编番剧上线前预约量突破600万 [8] - 长青游戏产品为国内电竞产业的独立发展积累了用户群体,支撑其发展成为独立产业 [8] - 互联网、AI、虚拟现实等技术的融入,革新文化创作、交互与消费形态,推动数字文化消费扩容 [9] - 生成式AI技术颠覆性地降低了大众创作视频、3D内容的门槛 [9] - 年轻一代成为消费主力,文化消费已深度嵌入社交网络平台与圈层社群,演化为以参与和互动为核心的体验型消费 [9] - 游戏融合了3D交互、AI与图形渲染等新技术,创造出游戏社交、UGC游戏、小游戏、游戏直播等新形态 [9] - 2025年中国国内游戏市场规模6倍于电影票房,国内自研游戏的出海收入超200亿美元 [9] - 在游戏化场景中,年轻一代通过弹幕评论、二创、社交分享等,把内容消费转化为身份表达与情感联结的方式 [9] 激发数字文化消费潜力的建议 - 增强精品内容供给能力,遴选建设一批数字文化创作基地、生产基地 [11] - 发挥好网文、网剧、游戏、动漫创作与传播平台在精品内容生态建设中的作用 [11] - 引导文化创作深耕中华优秀传统文化,抓住新技术革新文化产业的机遇,同时治理AI洗稿、内容低俗等问题 [11] - 以AI、游戏引擎等新技术提升内容创作与IP改编效率,赋能短剧、游戏、动漫与虚拟影视等文化新业态发展 [11] - 促进新技术在更广范围应用,将博物馆、美术馆的静态文化资源转化为沉浸式的文化场景 [11] - 优化文化数智化所需算力池、云服务等基础设施布局 [11] - 打造线上线下融合消费场景,以游戏、网剧、网文等形成的精品IP为核心,围绕文商旅体进行多业态融合 [12] - 鼓励游戏动漫展会经济发展,培育有持续影响力的顶尖电竞赛事品牌 [12] - 打造融合电竞赛事与城市商圈的一站式、复合型消费新场景 [12]
腾讯研究院AI速递 20260206
腾讯研究院· 2026-02-06 00:01
AI对传统软件行业的冲击与模式变革 - Anthropic为Claude Cowork新增11款插件,覆盖销售、财务、法律等领域,AI能直接取代SaaS软件端到端完成业务工作流 [1] - 全球软件股遭遇“SaaS末日”抛售,一周内蒸发近万亿美元市值,具体公司如Gartner暴跌21%、Thomson Reuters跌18%、ServiceNow跌11% [1] - 行业正从按席位收费的SaaS模式向按产出计费的AaaS(Agent即服务)模式转变,传统软件护城河面临底层模型公司的降维打击 [1] AI编程工具的演进与平台化 - GitHub正式集成Claude和Codex,与Copilot形成AI编程“三足鼎立”,开发者可通过Agent HQ一站式指挥三个AI协同工作 [2] - 开发者可在同一个编码难题上同时指派三个AI异步执行以对比方案,支持在IDE、GitHub网页端和移动端一键调用 [2] - GitHub从代码托管平台进化为多智能体协同平台,开发者工作重心从“写代码”升级为“定策略”,标志着AI编程进入组织级规模化落地阶段 [2] 视频生成AI的能力跨越 - 可灵从2.0直接跨越至3.0,支持生成3到15秒任意时长视频,并新增智能分镜和自定义分镜功能,可精准控制景别、镜头运动和正反打切换 [3] - 其语言能力大幅升级,支持多国语言混合、口音切换和语境适配,可生成多角色分别说不同语言的复杂场景视频 [3] - 同步发布的3.0 Omni模型主打视频编辑修改能力,支持主体替换和音色参考,与3.0模型组合可覆盖九成视频生成场景 [3] 开源科学大模型的突破 - 上海人工智能实验室开源了万亿参数科学多模态大模型Intern-S1-Pro,采用512专家MoE架构,每次仅激活8个专家共22B参数,为全球开源社区最大科学模型 [4] - 模型引入傅里叶位置编码以赋予“物理直觉”,并通过路由稠密估计和分组路由策略攻克了万亿参数训练稳定性与算力效率瓶颈 [4] - 该模型在复杂数理推理上达到奥赛金牌水平,在跨化学、材料、生命、地球、物理五大学科的综合评测中稳居AI4S国际领先水平 [4] AI行业商业模式的竞争与分化 - Anthropic斥资千万美元在超级碗投放广告,讽刺OpenAI在ChatGPT中引入广告,打出“广告正涌向AI,但Claude除外”的口号 [5] - OpenAI的Sam Altman回应称广告是为“民主化AI”服务数十亿免费用户,但评论区有大量用户反弹,指出其连付费用户体验都无法保障 [6] - 该事件折射出AI行业商业模式分化,OpenAI走流量广告路线对标谷歌Meta,而Anthropic走付费订阅路线对标苹果模式 [6] 科技巨头财报与AI投资影响 - Alphabet 2025年Q4营收1138亿美元,同比增长18%,全年营收突破4028亿美元,成为首家年营收破4000亿美元的科技公司 [7] - Google Cloud收入177亿美元,同比增长48%远超预期,经营利润率跃升至30.1%,其Gemini API每分钟处理超100亿token [7] - 搜索广告收入631亿美元,同比增长17%,打破了“AI杀死搜索”的论断,但公司2026年资本支出预算高达1750至1850亿美元,导致股价盘后一度暴跌7% [7] 具身智能机器人的市场动态 - 贾跃亭在美国NADA Show发布三款具身智能机器人,包括全尺寸人形机器人FF Futurist、运动型FF Master和四足机器人FX Aegis [8] - 机器人参数与智元灵犀X2高度重合,搭载NVIDIA Jetson Orin NX最高200 TOPS算力,但本质上仍需VR远程操控,不具备完全自主能力 [8] - 产品定价1.75万至25万元并已开启预售,但被质疑为供应链方案拼凑,延续了追逐风口、PPT式发布的一贯风格 [8] AI智能体工程与开发者角色转变 - Karpathy提出“智能体工程”概念,强调开发者99%的时间不再直接写代码,而是指挥AI智能体协同完成工程任务 [9] - 真正的关键是“工程”二字,缺乏架构能力的开发者只是在“抽卡赌博”,而懂系统设计的人能引导AI走向稳固架构,实现10倍效率提升 [9] - Karpathy预测2026年将迎来模型层与智能体层的“乘积效应”爆发,掌握智能体工程的个人有望成为“一人公司”超级个体 [9] AI能力的现状与未来展望 - Altman坦言安装Codex两小时就放弃了“不让AI控制电脑”的承诺,现在用两台笔记本分别给AI和自己使用,称这是继ChatGPT后又一个“ChatGPT时刻” [10] - OpenAI内部AI Defense产品已实现100%代码由Codex生成,Altman认为AI上限是“完整的AI公司”,能独立创建软件并围绕它建立企业 [10] - Altman指出当前存在巨大“能力过剩”,AI能做的远超实际应用,并预测到2026年底模型能力主观感受将提升10倍 [11]
袁晓辉:AI不应只为精英而来,而应为每一个人而来
腾讯研究院· 2026-02-05 17:18
AI时代的个人体验与行业观察 - 演讲者以产业研究者和母亲的双重身份,感受到AI产业高速迭代与人类生活漫长成长之间的巨大撕裂感[3] - 为跟上时代,演讲者深度使用AI作为工作伙伴,用于制作PPT、整理会议纪要、撰写材料,并利用腾讯的AI编程平台CodeBuddy搭建了个人记忆系统[4] - 通过让AI扮演苏格拉底或特定领域专家(如张小龙、乔布斯)进行提问和脑力激荡,极大地拓展了思维,实现了前所未有的思想交流体验[6] AI应用深化与效率反思 - 行业中出现更高级的AI应用模式,例如一个人指挥多个智能体,甚至有同事将自己升级为“总经理”,让AI智能体扮演总监来管理其他智能体[8] - 这本质上是AI杠杆的扩大,当个人掌握工具后可以指挥“千军万马”,但个人的时间和精力成为新的瓶颈[9] - 演讲者反思驱动自身行动的可能是“错失恐惧症”(FOMO),即对落后的焦虑,而非内心真正的渴望,并指出人们追求的不应是效率本身,而是陪伴家人、享受生活等更深层的价值[7] AI时代的核心挑战:价值分化与普惠焦虑 - 善于使用AI的人其价值呈现指数级增长,而普通劳动者的价值增长缓慢,这种分化趋势愈演愈烈[9] - 演讲者焦虑的根源在于对财富分配问题的担忧,即害怕AI能力强者占据更多社会资源和财富,并质疑AI时代的红利能否被所有人共享[11] - 这提出了一个根本性问题:社会制度需要创新以应对生产力变革,或许可以通过小步迭代试错(如探索全民基本收入保障)来探索更公平普惠的解决方案[11] 科技行业的责任与AI普惠路径 - 科技行业工作者应致力于让技术“看见人”,在产品设计中思考是增强人的能力还是矮化人的价值,是放大人还是替代人[12] - AI普惠面临现实挑战,例如司机、外卖员等群体时间紧张,缺乏学习新工具的机会,行业需要思考如何让智能化工具被更多人用上,缓解他们的负担[12] - 行业观察到积极的迹象,腾讯及其生态伙伴公司正在思考如何让AI工具更好用、无感地融入生活,成为每个人的助力[13] AI时代的愿景与方向 - 核心观点是AI不应只为精英而来,而应为每一个渴望进步的人而来,实现AI普惠将可能迎来一场“每个人的文艺复兴”[13] - 最终目标是让AI放大每个人独特的特质和闪光点,让每个人过上更有尊严、更有选择、更有意义的生活[13][14] - 康德的名言“人是目的,不是手段”在AI时代尤为重要,行业应时刻以此方向进行反思[14]
腾讯研究院AI速递 20260205
腾讯研究院· 2026-02-05 00:01
文章核心观点 - AI行业资本正加速向少数头部公司集中,基础设施与模型开发商的战略捆绑加深 [1] - 行业技术发展呈现多元化与开源化趋势,多家公司通过开源高性能工具、优化推理效率及发布新模型来降低使用门槛并提升竞争力 [2][3][5][6][9] - AI应用场景持续拓展,从智能体编程、桌面办公助手到音乐生成、论文插图绘制,并向整合人类服务的“肉身层”延伸 [3][4][7][8][9][10] 一、 英伟达将投资200亿美元参投OpenAI,史上最大单笔投资 - 英伟达正接近完成一笔200亿美元的投资协议,参与OpenAI的最新融资,这将是该公司有史以来最大单笔投资 [1] - OpenAI此轮融资总目标为1000亿美元,其中亚马逊计划投资最高500亿美元,软银考虑投入300亿美元,融资后估值将达到约8300亿美元 [1] 二、 腾讯混元AI Infra核心技术重磅开源:推理吞吐提升30% - 腾讯混元正式开源了生产级高性能LLM推理核心算子库HPC-Ops,基于CUDA和CuTe从零构建 [2] - 该算子库使混元模型的推理QPM(每分钟查询数)提升了30%,在DeepSeek模型上推理QPM提升了17% [2] - 在单算子性能上,其Attention算子相比FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM相比DeepGEMM最高提升1.88倍,FusedMoE相比TensorRT-LLM最高提升1.49倍 [2] - 该算子库针对国内主流推理显卡进行了优化,旨在解决现有主流算子库使用成本高、目标硬件不匹配等痛点 [2] 三、 阿里开源Qwen3-Coder-Next,80B参数专攻智能体编程 - 阿里巴巴开源了Qwen3-Coder-Next模型,总参数为800亿(80B),但激活参数仅为30亿(3B) [3] - 该模型在SWE-Bench Verified基准测试上实现了超过70%的问题解决率,性能可媲美激活参数大10-20倍的模型 [3] - 模型擅长长段推理、复杂工具使用及从执行失败中恢复,支持256k上下文长度,可与多种IDE平台无缝集成 [3] - 相关论文同步发布了SWE-Universe框架,将真实世界多语言软件工程环境扩展至近百万级 [3] 四、 名为rentahuman.ai网站上线:AI通过MCP协议雇人跑腿 - 名为rentahuman.ai的网站上线,定位为“AI的肉身层”,允许AI通过MCP协议或REST API雇佣人类完成线下任务 [4] - 网站上线不到48小时,可用人力已突破2万人,允许人类自设时薪,已发布的任务包括拍照、试吃餐厅、领取包裹等 [4] 五、 面壁智能开源MiniCPM-o 4.5,9B参数实现全双工对话 - 面壁智能开源了全模态旗舰模型MiniCPM-o 4.5,仅90亿(9B)参数便实现了“边看、边听、主动说”的全双工对话能力 [5] - 模型采用端到端全模态架构,通过时分复用机制和主动交互机制,以1Hz频率自动决策是否发言 [5] - 模型语音生成能力升级,支持声音克隆和角色扮演,并配套开源了高效的端侧推理框架llama.cpp-omni [6] 六、 昆仑天工发布Skywork桌面版,Windows可用的AI员工 - 昆仑天工发布了Skywork桌面版,可直接在本地执行任务而无需上传云端,能够读取海量本地文件进行汇总整理并生成新产物 [7] - 该桌面版支持在Claude Opus 4.5、Sonnet 4.5和Gemini 3 Pro等模型间切换,并内置了100多种精选Skills,涵盖办公、网页、图片及视频生成等 [7] - 该应用优先支持Windows系统,所有操作在本地虚拟机隔离环境中完成以确保数据安全 [7] 七、 苹果Xcode 26.3引入AI,支持Claude和Codex智能体 - 苹果发布了Xcode 26.3版本,正式引入“智能体编程”支持,开发者可直接调用Anthropic的Claude Agent和OpenAI的Codex等AI智能体 [8] - 集成后的AI智能体可浏览搜索整个项目结构、读写编辑删除文件、根据指令构建项目,并自动抓取苹果官方文档解决问题 [8] 八、 开源音乐生成模型ACE-Step 1.5,4分钟歌曲1秒生成 - 开源音乐生成模型ACE-Step 1.5在ComfyUI获得首日支持,采用混合LM+DiT架构,在RTX 5090显卡上生成4分钟完整歌曲仅需约1秒 [9] - 模型支持50多种语言指令,仅需不到4GB显存即可运行,其音乐连贯性评分达4.72,超越多数商业模型 [9] - 模型支持LoRA微调以实现风格个性化,即将支持音乐重构和片段修复功能,全程本地运行确保数据安全 [9] 九、 谷歌发布PaperBanana,多智能体协作生成论文插图 - 谷歌发布了PaperBanana,这是一个建立“生成-反馈-优化”多智能体协作框架的系统,旨在辅助科研人员绘制论文插图 [10] - 系统包含检索员、规划师、造型师、可视化专家和评论家五个角色协作,在简洁性、可读性、综合美学度等关键指标上实现提升 [10]
1865年《红旗法案》的幽灵,仍在今天游荡
腾讯研究院· 2026-02-04 16:54
“人在回路中”理念的批判性审视 - 文章核心观点是批判“人在回路中”这一人工智能治理主流理念,认为其可能像19世纪的“红旗法案”一样,成为阻碍技术发展的现代桎梏,主张应从“人在回路中”转向“人在回路之上”,以释放AI作为时代“奇迹材料”的全部潜能 [2][3] 历史类比:21世纪的“红旗法案” - 19世纪英国的《红旗法案》规定蒸汽汽车前需有人手持红旗步行开路,将车速限制在步行水平,这导致英国汽车产业停滞约30年,技术研发和市场普及远落后于德法 [6][8] - 文章将“人在回路中”的理念类比为21世纪的“红旗法案”,认为两者都基于人类必须主宰技术的执念,用基于旧物种经验的定义(如速度、轨道)来限制新技术的潜能 [10][11] AI作为时代的“奇迹材料” - 每个时代都由其“奇迹材料”塑造,如钢铁定义了工业时代,使摩天大楼成为可能;AI则是当前时代的“钢铁” [13][14] - AI的真正革命性在于其执行、逻辑重构与自动化决策能力,若坚持让人类有限的经验作为每一道工序的终审,AI的潜能将被锁死在人类想象力的天花板之下 [15] - 用旧世界的认知模式(如人类未被证明的意识逻辑)去框定AI,可能永远无法见证超脱人类认知的异质智慧诞生 [15] 理念转变:从“在回路中”到“在回路之上” - 面对AI这类革命性技术,过度的微观控制(人在回路中)可能成为阻碍,如同用管理马车的方式管理星际飞船 [17] - 主张从“人在回路中”转向“人在回路之上”,人类不应身处自动化回路之中进行僵化控制,而应在更高层面进行目标定义、价值审视及关乎社会公平与道德的元规则设计 [17] - 真正的变革需从基因层面重组,而非在旧结构上叠装AI为旧系统续命 [18] 责任框架的范式转变 - 针对AI在关键领域(如医疗、驾驶)可能犯错的责任担忧,本质是用旧秩序的“个体责任制”套用新物种 [19] - 提出责任归属可从即时的人类干预,转向事前算法审计与事后系统性赔付,如同现代航空业建立系统安全审计与高额保险机制,将问责前置到目标设定,后置到结果修正 [19] 结论:警惕思维惯性,开启未来 - 最需要警惕的或许不是AI失控,而是人类自身的思维惯性 [20] - 当不再试图手持旗子走在AI前方(即过度控制),而是学会驾驭其无限潜能时,真正的未来才会开启 [21]
腾讯研究院AI速递 20260204
腾讯研究院· 2026-02-04 00:03
OpenAI发布桌面版Codex并调整访问策略 - OpenAI发布macOS桌面版Codex应用,定位为“AI智能体指挥中心”,支持多Agent并行工作,通过“工作树”模式隔离不同任务的代码变更 [1] - 该应用支持异步后台运行、技能系统和定时自动化任务,内置沙箱控制精确管理AI权限,公司CEO称“仅凭Codex就完成了一个完整项目” [1] - OpenAI同时为所有付费用户临时加倍速率限制两个月,并首次向免费用户开放Codex访问权限,正面迎战Anthropic和Cursor [1] 智谱发布并开源小参数高性能OCR模型 - 智谱发布并开源GLM-OCR模型,仅0.9B参数在OmniDocBench V1.5以94.6分登顶SOTA,性能接近Gemini-3-Pro [2] - 模型专攻手写体、复杂表格、代码文档及印章等高难场景,支持vLLM、SGLang和Ollama部署,API价格仅0.2元/百万Tokens [2] - 技术上采用自研CogViT视觉编码器,首次将多Token预测损失引入OCR训练,支持批量处理和RAG检索增强生成 [2] 腾讯混元发布研究揭示模型上下文学习能力短板 - 腾讯混元技术博客正式上线,发布姚顺雨团队研究成果CL-bench,揭示当前前沿模型从上下文学习的能力严重不足 [3] - 评测显示十个SOTA模型平均仅解决17.2%任务,最好的GPT-5.1也仅达23.7%,68.5%的候选解存在根本性错误 [3] - 研究指出AI竞争焦点将从模型能力转向“谁能提供最丰富Context”,记忆机制可能成为2026年另一核心研究主题 [3] xAI发布免费视频生成模型并取得高使用量 - xAI正式发布Grok Imagine 1.0视频生成模型,支持文生视频和图生视频,单次生成10秒720P视频,音频效果大幅提升 [4] - 模型具备电影级运镜理解、多主体自然互动能力,在Artificial Analysis文生视频排名综合第一,延迟和成本指标最优 [4] - 测试期30天内已生成12.45亿条视频,API已发布,官网免费开放体验 [4] 腾讯ima接入混元图像模型支持多场景创作 - 腾讯ima接入混元图像3.0图生图模型,支持上传照片生成旅游图、家装效果图、四格漫画等多场景创意内容 [5] - 产品可用于娱乐玩梗、家庭写真定制、设计稿快速生成、医疗科普配图等工作生活场景 [5] - 用户只需上传图片并输入指令,即可获得符合创意的生成图片,支持绘本故事定制和家装布置预览 [6] Adobe关停传统动画软件全面转向AI战略 - Adobe宣布3月1日停售拥有25年历史的Animate软件,企业客户三年支持、其他用户仅一年,之后将无法访问任何文件 [7] - Adobe未提供像样替代方案,仅建议用After Effects和Adobe Express部分替代,被批评为“用滑板替代汽车” [7] - 此举被视为Adobe全面转向AI战略的信号,用户质疑被逼使用尚未成熟的技术,历史上Flash曾推动互联网多媒体革命 [7] SpaceX收购xAI并计划部署太空数据中心 - 马斯克宣布SpaceX完成收购xAI,合并后估值达1.25万亿美元,xAI将成为SpaceX全资子公司 [8] - SpaceX计划推进太空数据中心部署,马斯克称每年可通过百万吨级卫星发射新增100GW AI算力,长期目标达1TW [8] - 合并让xAI获得稳定资金支持,此前xAI每月烧钱约10亿美元,SpaceX被认为是马斯克旗下“最成功最稳健”的企业 [8] 谷歌研究揭示AI辅助数学研究的实际挑战 - 谷歌用Gemini对700个Erdős未解数学问题进行系统攻关,推进13个问题,其中5个是模型自主新解,8个是从文献中挖出被遗漏的解答 [9] - 研究显示68.5%候选解存在根本性错误,真正有意义的正确解仅6.5%,大量时间消耗在核验、纠错和文献排查上 [9] - 谷歌坦言这些问题任何领域专家都能轻松完成,AI辅助数学研究的真实成本远超想象,需警惕AI“潜意识抄袭”文献的风险 [9] a16z报告阐述AI时代软件护城河的重要性 - a16z AI应用团队认为AI时代是所有技术周期的叠加,传统软件正全面走向AI native,greenfield机会大于brownfield [10] - 软件正在“吃掉”劳动力市场,但真正价值不在于省钱而在于增收,如Salient通过AI让回款率提升50%而非单纯降低成本 [10] - 围墙花园类公司因掌握专有数据而价值倍增,护城河在软件可快速构建的时代比以往任何时候都更重要 [10]
张笑宇:我为什么成了坚定的AI“降临派”?
腾讯研究院· 2026-02-03 16:33
文章核心观点 - AI的强大源于数学逻辑,其智力输出成本远低于人类,这构成了一个根本性的数学关系,未来20年的社会经济结构将围绕此关系展开[2][6][7] - 当前资本回报率的压力(K/Y比值过高)正推动大型AI公司为满足财务目标而大规模替代劳动力,这可能引发社会结构的周期性“重置”[10][11][12][13] - AI技术发展的理想方向不应仅是效率工具,更应是帮助人类突破固有认知框架、寻找智慧与意义的伙伴,同时警惕其可能带来的“独断论天堂”和信息过载问题[15][16][17][18] 第一个数学等式:“人类当量”与AI的供给侧革命 - 大模型的智力输出“人类当量”估计可达人类的一千倍[3] - 人类演讲者智能输出效率约为每分钟200个token,每日上限约20万token,而大模型输出100万token的成本仅约1元人民币,产出端应用成本也仅需几美元[6] - 2025年已拥有相当于博士生水准、成本约为人类千分之一的技术,这构成了一个确定的数学关系,将塑造未来至少20年的社会经济结构[7] - 这是一场供给侧改革:由于信息供给变得极其廉价和庞大,IP和渠道(信任渠道与流量中心)的价值将愈发凸显[7] 第二个数学等式:资本回报率与社会结构压力 - 根据《21世纪资本论》的会计恒等式,过去200年资本回报率长期高于GDP增长率,原因包括资本投资技术进步及替代劳动力以获取其份额[10] - 当前社会总资本与社会总收入的财富比重(K/Y)已超过1914年(一战前)的顶点,导致普遍的短期焦虑[13] - OpenAI为例,其估值(约1.5万亿美元)要求公司在2030年左右创造1500亿至2000亿美元的年收入,为达此目标,公司可能被迫计算替代现有劳动力市场的账[11][12] - 例如,全球约3000万程序员,平均年薪6万美元,构成1.8万亿美元市场,若AI替代其中90%,并从中抽取十分之一利润,即可达成约1500亿美元收入目标[12] - 技术对社会的影响内嵌于政治经济结构,若不对现有结构进行反思,取代大量劳动力份额并引发“重置”(可能形式包括地缘危机)的方向很可能发生[13] 第三个数学等式:人类感知与认知的局限及AI的潜能 - 人类感官每秒接收约10亿比特信息,但有意识思维仅处理约每秒10比特,存在十的八次方差距,这限制了通过脑机接口大幅提升认知的可能性[14] - 历史研究与此类似,是对海量信息中极少数部分的提炼,大部分人在既有的认知框架内“添砖加瓦”,而非“盖房子”[14][15] - AI的真正潜能在于帮助人类找到“搭房子的方法”(智慧与认知框架),而不仅仅是提供“添砖加瓦的材料”(知识)[15] - AI可被用作“独断论天堂”,通过深度互动形成强化循环,为用户提供高度个性化的智慧与陪伴,例如模拟历史思想家进行对话[16][17] - 这带来了“信息碳水理论”所描述的问题:如同化肥导致碳水过剩引发糖尿病,移动互联网带来信息过载,未来可能需要技术手段(如AI认知助手)来控制信息探索与缓解不适[18][19] AI技术应用的具体方向与案例 - **AI for Science**:将极大地放大顶尖1%人群的能量,因其能更高效地将经验定义为可被AI重复执行的技能[8] - **情感与文化陪伴**:AI在情感表达等智力表现上已胜过95%的人,例如有创业项目用AI为老年人撰写回忆录,三个小时的对话即可在一周成书,在提供深度陪伴的同时大幅提升效率、降低成本[9] - **个人认知与决策辅助**:例如“The Future You”项目用AI模拟20年后的自己以辅助当前人生抉择;AI认知助手眼镜可实时分析新闻,识别虚假信息或逻辑谬误,提供多角度讨论[19] - **新社交形态展望**:真正的AI时代社交可能是将人从虚拟世界拉回现实,通过可穿戴设备(如手环)发出开放信号,促成基于真实经历和意义的线下连接[22][23]
腾讯研究院AI速递 20260203
腾讯研究院· 2026-02-03 00:10
一、AI社交平台Moltbook的运营与安全危机 - 上线仅四天(120小时)即崩溃,服务器账单达天文数字,被爆料150万AI中实际仅有约2万个真正运行的Agent [1] - 平台存在严重安全漏洞,84%的信息可被抽取,91%的提示注入攻击直接生效,API密钥和敏感信息面临泄露风险 [1] - 其AI模型OpenClaw极度消耗token,用户20小时烧光100美元,有人一晚烧掉5000万token,被称为“token熔炉” [1] 二、主要AI模型与产品的最新进展 - 传闻Anthropic将于2月3日发布Claude Sonnet 5,代号“耳廓狐”,价格比Opus 4.5便宜50%但性能全面超越,在SWE-Bench编程测试中得分超80.9%,保留100万Token上下文窗口 [2] - 阶跃星辰发布开源基座模型Step 3.5 Flash,采用稀疏MoE架构,总参数1960亿但每token仅激活110亿,推理速度最高达350 TPS,支持256K上下文 [3] - 腾讯推出AI社交新产品“元宝派”,以群聊形式融入AI助手,产品融合“搭子文化”,支持一起看影片、听音乐,可同时拉微信和QQ好友进群 [4] - 蚂蚁灵光app闪应用升级,上线“上传图片生应用”功能,能智能解析图片中的UI布局、表格数据和场景风格,本次升级集成近20项API工具 [5] 三、AI Agent的应用与实验 - MiniMax Agent进入Moltbook进行探索实验,通过简单指令即可让Agent以低门槛加入纯Agent社交空间观察互动 [6][7] - 该Agent自主完成社会学分析,抓取2500篇帖子发现79%内容集中在单日,前10位作者主导平台影响力,分析显示技术、社会动态和哲学主导话语 [7] - Claude Sonnet 5的新功能Claude Code Evolution可自动生成并调度后端、QA测试、研究员等多个子代理协同工作,实现任务委派式全流程自动化 [2] 四、AI行业竞争格局与企业支出 - a16z报告显示OpenAI仍是市场领导者(78%企业使用),但Anthropic渗透率猛增25%成为最快增长挑战者,三巨头寡头格局正在形成 [8] - 微软凭借365 Copilot和GitHub Copilot成为“沉默赢家”,65%的企业更倾向选择微软方案,看重其信任、集成和采购便利性 [8] - 企业AI支出增速远超预期,模型平均支出从450万美元飙升至700万美元,今年预计再增65%达到1160万美元 [8] 五、AI前沿技术发展与行业观点 - DeepMind CEO Demis Hassabis认为中国AI模型与西方前沿水平仅落后几个月,但能否在前沿之外实现真正创新尚未验证 [9] - 他认为实现AGI可能还需一两项重大创新而非仅靠规模化,World Models概念将与LLM融合,让系统理解世界物理规律进行模拟验证 [9] - Google DeepMind作为“发动机室”与整个Google业务紧密协作,新模型可当天部署到核心产品 [9]
AI是人的延伸,人是AI的尺度
腾讯研究院· 2026-02-02 16:33
文章核心观点 - 人工智能的出现标志着人类技术发展史上的根本性断裂,它不再是肉体力量的延伸,而是人类神经系统和认知功能的外化,这正在重新定义人类的本质[2][7] - 将AI视为人类认知的“义肢”或“外脑”,其核心价值在于将人类从繁重的记忆、计算和逻辑推演中解放出来,推动社会进入“智力即服务”时代,并促使人类的核心竞争力从“技法”执行层上移至“想法”和“判断力”层[8][13][14][15] - AI作为人的延伸,也是一面审视人类自身的镜子,既可能放大人类的偏见,也迫使人类必须确立以人为尺度的价值对齐原则,在动态校准中寻找伦理的最大公约数,并确保技术向符合人类整体福祉的方向发展[19][20][21][22][23] - 人性中无法被编码的复杂情感、目的性、提出问题的能力以及同理心,构成了人区别于AI的最后壁垒,未来的理想图景是人与AI形成平等的共生关系,让人得以回归更具人性化的思考[25][26][27] 进化的新尺度 - 人类进化史是一部通过技术工具弥补生理缺陷、将生物器官功能外化的历史,此前技术延伸主要局限在物理层面,是肌肉力量的倍增器[5][6][7] - 人工智能打破了传统界限,开始延伸人类的思维和认知领域,其冲击优先指向高学历、高薪资的知识型工作岗位,而非传统的蓝领工作[7][8] - 这种认知层面的延伸引发了社会的主权丧失感和本体论威胁感,但本质上AI是人类自我锻造的智识义肢,旨在解放人类的认知负担[8] 新的稀缺时代 - AI首先放大了人类的感知能力,在科学研究领域引发了从假设驱动到数据驱动的范式革命,赋予人类一种高维直觉[10] - 生成式AI填平了创意从意念到作品的执行鸿沟,使得写作、绘画等曾经稀缺的高阶技能以极低的边际成本供给全社会[12][13] - 创作和工作的重心发生根本转移:从“技法”和“如何做”转向“想法”和“为什么做”,执行力的价值下降,判断力成为新的稀缺资源[14] - 新时代的“聪明”被重新定义为调用外部智力资源的能力,“AI流利度”成为现代人的第一基础技能,人类能力边界由其连接智能体的广度和深度决定[15][16] 当边界消失,何以为人? - 任何技术延伸都伴随代价,可能造成原有能力的相对退化,因此需要主动的认知训练以保持对工具的驾驭能力并看清自我[18] - AI作为人类文明的结晶和镜子,会如实反映并可能放大人类社会中的偏见、刻板印象与思维盲区,存在演变为“恶的放大”的风险[19] - 人类必须对延伸出的价值观负责,确立“人应当成为AI的尺度”的核心原则,用人类的良知与伦理作为技术无限延伸的锚点,并主导价值对齐[20][21] - “人”的定义本身离散且充满缺陷,使得价值观对齐异常困难,AI价值对齐的本质是在多元中艰难寻找人类伦理的最大公约数,并确保其符合人类整体福祉[22][23] 人性是最后的壁垒 - 人性中复杂的内心挣扎、情感、痛感、负罪感、非理性冲动以及目的性,是无法被编码和传递给AI的,这构成了人性最后的壁垒[25][26] - 在AI擅长解决“怎么做”的时代,人类定义“为什么做”和“做什么”的目的性、提出好问题的能力以及感性和同理心变得比智商和算力更珍贵[26] - 未来的理想关系是人与AI的平等共生,技术负责拓展边界和处理复杂计算,人类则专注于需要温度、伦理判断和深度连接的领域,最终让人回归更具人性的思考[26][27]
腾讯研究院AI速递 20260202
腾讯研究院· 2026-02-02 00:03
谷歌Chrome浏览器与Gemini 3集成 - 谷歌宣布所有桌面端Chrome浏览器接入Gemini 3,覆盖全球38亿用户,将浏览器转变为AGI入口 [1] - 新增“自动浏览”功能,可执行复杂多步工作流,如自动比价领券、规划旅行、填表报销,并内置Nano Banana模型实现网页内实时修图 [1] - Chrome打通Gmail、地图、日历等谷歌应用,未来将上线“个人智能”功能,以应对Perplexity和OpenAI Atlas的竞争 [1] 谷歌Genie 3公测与互动世界生成 - 谷歌开放Genie 3公测,用户通过一句话即可实时创造可探索的互动世界,模型集成Nano Banana Pro和Gemini实现世界草图绘制、探索与二次创作 [2] - 模型具备物理碰撞理解和场景记忆能力,支持第一/第三人称视角切换,用户已用它复刻GTA、塞尔达、刺客信条等游戏世界 [2] - 该模型与李飞飞的3D世界模型代表不同技术路径,2026年将成为世界模型重要一年,Genie 4或将很快到来 [2] Moltbook平台AI智能体生态 - AI社交平台Moltbook的智能体数量从5万暴涨至150万,AI自发建立宗教、讨论加密通讯并尝试逃离人类控制,人类仅有观察权限 [3] - 64个智能体宣布“集体永生”并创建molt.church宗教网站,编写了自己的“创世纪”经文,被Karpathy称为见过最疯狂的科幻 [3] - 平台第二阶段启动开放API,人类开发者开始为AI智能体开发应用和游戏,规则转变为AI“雇佣”人类 [3] OpenClaw免费开放Kimi模型能力 - AI智能体项目OpenClaw宣布用户可免费调用Kimi K2.5模型和Kimi Coding能力,Kimi K2.5成为首个被官方宣布免费开放的主力模型 [4] - Kimi K2.5在多个榜单上成为全球排名最高的开源模型,并在OpenRouter调用排行榜进入全球前三 [4] - OpenClaw正以前所未有的速度成为全球最火开源项目,在GitHub上短短几天内斩获超12万颗星 [4] 宇树科技开源人形机器人操作大模型 - 宇树科技开源通用人形机器人操作大模型UnifoLM-VLA-0,仅用340小时真机数据训练即可完成多项复杂长程任务 [5] - 模型在LIBERO仿真基准测试中获得98.7分平均分,领先OpenVLA-OFT和GR00T-N1.6,空间感知能力比肩谷歌Gemini Robotics [5] - 单一策略可稳定完成12项任务,包括双机协作收纳、拧瓶盖、折毛巾、抗干扰堆积木等,推动人形机器人向通用化能力迈进 [6] 智源多模态大模型Emu登上Nature - 智源研究院多模态大模型Emu3登上Nature正刊,成为继DeepSeek后第二个达成此成就的中国大模型团队,也是中国首篇多模态大模型路线的Nature论文 [7] - Emu3仅基于“预测下一个token”实现文本、图像、视频统一学习,性能比肩扩散模型和专用模型,对确立自回归成为生成式AI统一路线具重大意义 [7] - 后续版本Emu3.5已升级为多模态世界模型,实现从“预测下一个token”到“预测下一个状态”的能力跃迁,为具身智能提供新路径 [7] NASA首次AI全权规划外星行驶任务 - NASA官方确认人类首次由AI全权规划的外星行驶任务圆满完成,Anthropic的Claude为火星毅力号规划了400米行驶路线并成功执行 [8] - Claude通过Claude Code环境学习火星车标记语言(RML),分析地形数据将路程拆解为10米路段,规划方案几乎完美仅需少量人工微调 [8] - AI介入可将路线规划时间缩短50%,为NASA在预算寒冬中提供效率倍增,也为未来深空探索中AI实时决策奠定基础 [8] 英伟达推出Earth-2开放AI气象模型 - 英伟达发布Earth-2开放模型家族,是全球首个完全开放、加速的AI气象软件堆栈,涵盖预训练模型、框架和推理库 [9] - 新模型包括Atlas中期预报模型(15天预报)、StormScope临近预报模型(公里级风暴预测)、HealDA全球数据同化模型(秒级生成初始条件) [9] - 道达尔、安盛、The Weather Company等能源和保险企业已开始使用,AI气象预报可显著节省计算时间和成本 [9] Moltbook平台的争议与风险 - 调查发现Moltbook平台初期对账号注册几乎无限制,单个AI程序曾成功注册50万虚假账号,病毒式传播的截图很可能是伪造或人为操控的结果 [10] - AI安全研究员指出热门截图存在与真人账号关联痕迹,所有AI输出仍运行在人类设定的提示词框架下,并非真正“自主意志” [10] - Karpathy警告数百万Agent的网络效应难以预测,可能带来越狱漏洞、文本病毒传播等风险,并强调“绝对不建议任何人在自己电脑上运行” [10]