Workflow
腾讯研究院
icon
搜索文档
所有AI的馈赠,早已在暗中标好了价格
腾讯研究院· 2025-10-13 18:00
以下文章来源于腾讯科技 ,作者涵清 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 涵清 腾讯科技作者 生成式AI不仅在重塑千行百业,也从根本上改变着人类写作、认知与思考的方式。 在ChatGPT3.5发布后, 一种乐观的预期广为流传:AI将带来"工作平权"。 2023年,两位麻省理工学院的经济学博士,在《Science》期刊上发表实证研究,为此论调提供了佐证: 即 生成式AI能显著提升低绩效员工的表现,有望弥补其与高绩效员工的差距,从而减少不平等。 Science期刊的编辑对此总结道,"技能较弱的参与者从ChatGPT中获益最多,这一点对于未来旨在通过 AI来减少生产力不平等的政策具有重要启示。" 然而,两年过去,现实似乎并未完全遵循这一理想路径。 2025年,两位哈佛大学的经济学博士,通过分析2015至2025年间覆盖超6200万员工、超1.5亿次的招聘 就业数据,揭示了一个冷酷的真相: 生成式AI正以一种"资历偏向"的方式重塑劳动力市场。 数据显示,2015到2022年间,初级和高级岗位的就业增长曲线基本保持一致,但从2023年开始,两者开 始出现分叉:高级岗位继续向上增长,初级岗位则开始 ...
腾讯研究院AI速递 20251013
腾讯研究院· 2025-10-13 04:56
AI模型能力评估 - 陶哲轩使用GPT-5 Pro挑战数学开放问题,发现AI在小尺度具体计算推导和宏观尺度整体问题结构把握方面表现出色[1] - 在中尺度策略选择和方向判断层面,AI帮助有限甚至产生干扰,因过度认同用户思路而未能指出关键假设错误[1] - AI成功推导出Minkowski第一积分公式等工具,但在复杂非圆几何形态分析上存在明显局限[1] 全球AI竞争格局变化 - 硅谷顶级投资人Chamath Palihapitiya公开表示其公司已将大量工作负载转向中国Kimi K2模型,因性能足够强且比OpenAI和Anthropic便宜太多[2] - Vercel、Cursor、Perplexity等美国开发者生态重要平台已集成Kimi K2,开发者用代码进行"投票"成为市场证明[2] - State of AI Report 2025首次将中国AI从"追赶者"提升为"平行竞争者"[2] AI在医疗领域的应用突破 - 宾大医学院教授David Fajgenbaum创立非营利组织Every Cure打造AI系统MATRIX,在7500万种药物与疾病组合中寻找治疗方案[3] - MATRIX利用生物医学知识图谱为每个药物-疾病组合打分,生成7500万个分数时间从100天缩短至17小时[3] - 该系统已帮助多位罕见病患者,优先攻克"最糟糕的病"[3] AI人才流动与产业动态 - AI领域传奇人物Andrew Tulloch离开Thinking Machines Lab重返Meta担任重要职位,曾拒绝Meta超10亿美元报价[4] - Thinking Machines Lab于今年7月完成20亿美元种子轮融资,由a16z领投,英伟达、AMD等参与投资[4] - Andrew Tulloch在Meta工作11年6个月后加入OpenAI深度参与GPT-4o和GPT-4.5研发,2025年与前OpenAI CTO共同创立Thinking Machines[4] 中国科技创新全球影响力 - 《时代周刊》2025年度最佳发明榜单史无前例评出300项发明,华为、DeepSeek、宇树科技、追觅科技等多家中国品牌产品上榜[5][6] - 生成式AI领域DeepSeek R1以极低成本实现顶尖模型实力,机器人领域宇树R1双足机器人售价仅5900美元面向研究人员[6] - 榜单涵盖36个品类包括AI、机器人、芯片等领域,中国力量在全球科技创新中地位显著提升[6] AI技术演进新路径 - 斯坦福大学等机构提出Agentic Context Engineering技术,让语言模型无需微调也能自我提升,适应延迟平均降低86.9%[7] - ACE通过"生成-反思-整合"架构将上下文视为不断演化的作战手册,在AppWorld基准上性能提升17.1%使开源小模型接近最强商用系统[7] - 在金融推理任务中平均性能提升8.6%,引入专职反思者模块和增量Delta更新机制[7] AI产业风险与挑战 - 强化学习之父Rich Sutton认为LLM过度依赖模仿有限人类知识,预测其发展将很快遇到瓶颈[8] - 巨额资本投入正在深刻影响科学研究方向,如果这些技术不能在3年内产生足够回报,就可能引发信心崩盘和泡沫破裂[8] - LLM直接模仿"行动"本身而非人类发现过程,可能永远无法通向对世界因果关系的真正理解[8] AI产业发展现状 - NVIDIA市值突破4万亿美元几乎垄断AI算力,中国DeepSeek等开源模型全面反超Meta占据Hugging Face 40%以上份额[9] - AI发展已进入"电力决定路线图"时代,部分AI基础设施的边际成本已由GPU价格转向千瓦时电价[9] - State of AI Report 2025称2025年为"AI推理元年",但研究发现推理进步多数落在模型波动自然范围内,存在严重脆弱性[9] AI意识与安全议题 - 深度学习先驱Hinton表示AI或许早已拥有"主观体验",只是因人类对意识理解错误未能反映[10] - Hinton认为目前最紧迫的是AI滥用风险和生存风险,强调在防止AI接管问题上所有国家利益一致[10] - 国际合作可能由欧洲和中国引领,概念就像"政治联盟"是一组神经元共同激活形成[10]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-10-12 10:34
芯片技术进展 - 英特尔在2纳米制程芯片技术方面取得进展 [3] 大语言模型与AI模型 - Thinking Machines发布第二篇论文及Tinker模型 [3] - OpenAI经历「GPT门」事件并推出系列重大更新 [3] - DeepSeek发布DeepSeek-V3.2-Exp模型 [3] - 谷歌推出Gemini 3.0 Pro模型 [3] - Claude发布Sonnet 4.5模型 [3] - 智谱发布GLM-4.6模型 [3] - 蚂蚁集团发布Ling-1T模型 [3] - AI21 Labs发布3B推理模型 [3] - Sora发布Sora 2模型 [4] - xAI发布Imagine v0.9模型 [4] AI应用与产品 - OpenAI为ChatGPT推出Pulse功能 [3] - 谷歌推出Gemini Robotics 1.5及Gemini Enterprise [3][4] - 谷歌DeepMind推出Computer Use功能及Banana更新 [4] - Kimi推出OK Computer应用 [3] - 腾讯推出Hunyuan3D-Part、混元图像3.0及混元3D-Omni应用 [3][4] - AI电影国际峰会关注AI电影应用 [3] - 苹果为其系统增加MCP支持 [3] - 快手推出KAT系列应用 [4] - 好未来推出AI教师应用 [4] - 智源推出RoboBrain-X0应用 [4] - Anthropic为Claude推出Claude Code插件系统 [4] - Sand.ai推出GAGA-1应用 [4] - Lovart接入Sora 2模型 [4] - vivo推出OriginOS 6系统 [4] 前沿科技与研究 - 上海AILab研发Imaging-X技术 [4] - Meta推出Metabot [4] - 加州理工在量子阵列技术方面取得进展 [4] - 英伟达开源其机器人技术 [4] - Figure发布Figure 03机器人 [4] 行业观点与洞察 - 红杉资本提出AI生产力悖论观点 [4] - Richard Sutton提出LLM起点错误观点 [4] - 陈丹琦提出RLMT方法观点 [4] - DeepMind揭秘Veo 3技术观点 [4] - 英伟达黄仁勋强调AI基础设施重要性观点 [4] - AlphaGo大神提出AI融入经济观点 [4] - Flash Attention作者提出英伟达统治终结观点 [4] - 施密特提出人形机器人趋势观点 [4] - OpenAI的Sam Altman提出垂直整合AGI观点 [4] - Figure提出"卡脖子"关键技术观点 [4] - 谷歌提出智能体设计模式观点 [4] - 美图提出AI时代组织进化观点 [4] - a16z提出AI资本投入观点 [5]
腾讯研究院AI速递 20251011
腾讯研究院· 2025-10-11 00:01
英特尔Panther Lake处理器 - 英特尔发布基于18A工艺的首款量产处理器Panther Lake,相比前代CPU多核性能提升超50%,图形性能提升超50%,整体功耗降低30% [1] - 处理器采用全新Cougar Cove性能核与Darkmont能效核架构,配备第五代NPU提供50 TOPS算力,整体平台AI算力高达180 TOPS [1] - 通过RibbonFET晶体管、PowerVia背面供电和Foveros封装等创新技术,实现15%性能提升和30%芯片密度改进,预计2026年1月正式发布 [1] Claude Code插件系统 - Anthropic为Claude Code推出插件系统进入公测,用户可通过一行命令安装自定义命令、智能体、MCP服务器和钩子等四类插件 [2] - 插件系统可打包团队标准化流程、开发环境配置和工作流,解决新人入职配置环境复杂、团队标准难统一等痛点问题 [2] - 任何人都可创建插件市场,只需GitHub仓库或URL放置正确格式的marketplace.json文件,无需申请权限或审核流程 [2] 国产视频模型GAGA-1 - Sand.ai团队推出音画同步视频模型GAGA-1,专注人物表演和带台词表演,在单纯人物表演方面达到影视级别水平 [3] - 模型支持5秒和10秒两种时长,可实现精准的情绪表达和动作表演,支持中文、英文等多语言台词,但需注意台词不宜超过20字 [3] - 目前GAGA-1全员免费使用无水印,未来价格承诺将远低于Sora2和Veo3,适用于短剧、互动影游NPC对话等场景 [3] Lovart平台集成Sora 2 - 设计平台Lovart正式接入OpenAI的Sora 2模型,提供无水印商用级视频生成服务,10月12日前可免费试用 [4] - 结合Lovart接入的NanoBanana等图像模型,实现从静态图像到动态视频的无缝衔接,支持一键生成最长1分钟的宣传片 [4] - 平台提供无边画布Canvas功能,用户可像导演一样先生成分镜图再转化为连贯视频片段,真正实现"所见即所创" [4] vivo OriginOS 6操作系统 - OriginOS 6集成蓝心大模型能力实现全场景AI智能化,新增屏幕自动感知功能可识别内容并精准推荐服务,支持Live Photo的AI消除 [5] - 蓝心小V具备深度思考和深度研究能力,可在十几分钟内完成广泛信息调研生成数千字报告,语音交互更自然无需唤醒词 [6] - 通过蓝河流畅引擎重构安卓底层核心,推出超核计算、存储融合技术升级和双渲染架构,三年古董机应用响应速度反超新机63% [6] 谷歌Gemini企业服务 - 谷歌推出面向企业的Gemini订阅服务,Enterprise版每用户每月30美元,Business版每用户每月21美元,提供预制AI代理和自定义构建工具 [7] - 新服务引入Model Armor功能可检测屏蔽AI聊天中的请求与响应,并支持Box、Microsoft、Salesforce等平台数据集成 [7] - 现有Agentspace客户将在合同期内免费升级至新服务,谷歌云二季度收入同比增速重新回升至30%以上,直接挑战Microsoft Copilot [7] Figure 03人形机器人 - Figure公司发布第三代人形机器人Figure 03,配备毫克级力敏感触觉传感器能感知3克压力变化,相当于一枚回形针重量 [8] - 搭载视觉-语言-动作AI系统Helix,配备全新视觉系统实现两倍帧率、四分之一延迟和60%视场角拓宽,手部集成掌心摄像头提供近距离视觉反馈 [8] - 首款以高产量制造为前提设计的型号,初期规划年产能12000台,长期目标四年内累计生产10万台 [8] 美图AI组织进化 - 美图秀秀凭借AI合照功能荣获欧洲14个国家App Store总榜第一,公司通过RoboNeo项目实践"反惯性工作流" [9] - 公司推出"AI创新工作室"机制,鼓励小团队以创业模式验证产品想法并享受利润分红,目前AI编码普及率达86%,设计效率提升50%以上 [9] - 发布升级版价值观"文化六边形":热爱影像、追求极致、着眼全球、求真务实、打破惯性、爱拼能赢,期待培养更多"六边形战士" [9] AI行业投资与市场前景 - AI已在以十分之一成本提供十倍产品体验,到2030年AI计算能力累计投资预计超3万亿美元,过去3年智能成本每年下降超10倍 [10] - AI公司有能力进攻6万亿美元白领服务市场,规模是美国企业软件支出的20倍,ChatGPT用户每天在平台花费约20分钟且拥有超10亿月活 [10] - AI公司约2年内完成SaaS需要10年才能实现的增长,Cursor从200万美元增长到3亿美元,基于结果的定价模型开始挖掘新市场 [11] 大语言模型安全研究 - Anthropic联合英国AI安全研究所和图灵研究所发现,仅需250份恶意文档就可能在大型语言模型中制造后门漏洞,与模型规模无关 [12] - 研究训练了600M到13B参数的四种规模模型,发现投毒攻击成功与否取决于被投毒文档的绝对数量而非其占训练数据的比例 [12] - 测试针对使模型输出无意义文本的"服务拒绝"攻击,当投毒文档数量达250篇及以上时不论模型规模均能可靠触发后门效果 [12]
专访汤道生:元宝重兵投入这半年
腾讯研究院· 2025-10-10 16:33
AI市场变化与腾讯战略调整 - 国内大模型市场更集中,开源成为重要战略,DeepSeek横空出世[7] - 腾讯产品服务从只基于混元大模型变为开放整合多家大模型[8] - AI产品赛道兴起,公司调整组织架构,CSIG承担前端产品责任,TEG提供底层技术支持[8] 元宝业务接管决策 - 2023年12月汤道生主动举手接管元宝业务,认为AI Chatbot已变成用户频繁使用的产品[9][10][13] - CSIG具备To C产品资源与经验,与TEG在云服务合作基础上再度联手[10][11] - 任命原腾讯会议负责人Lori Wu带领元宝,加速产品从0到1建设[12] DeepSeek接入决策过程 - DeepSeek R1发布后用户需求强烈,但DeepSeek自有App限制较多[8] - Pony马化腾在群聊中建议元宝接入DeepSeek,总办讨论仅两三天就达成共识[23][24][27] - 尽管初期团队有顾虑,但最终以用户需求为导向快速推进[25][26][30] - 腾讯成为国内最快动手接入DeepSeek的大厂,企业客户和用户反馈正面[27] 产品整合与资源调配 - 微信给予元宝前所未有支持,包括广告位、新闻插件及视频号公众号联动[35] - 腾讯新闻、QQ、游戏、浏览器、输入法等产品逐步与元宝联动[36] - 团队重建需要大量招聘大模型产品经理、搜索专家和研究人员[40] - 产品持续补足能力,改善搜索准确性、语音识别和图片修改等功能[40] AI Chatbot产品定位 - 元宝目标是成为C端搜索信息新入口,公司已将浏览器、搜狗与输入法等工具类产品转到CSIG[16] - 产品呈现专业助手定位,特别在高知用户群体中受欢迎[68][69] - 微信内元宝更人性化风趣,App版本更正式解决问题导向[67][73] - 公司希望服务年轻用户和所有积极使用AI的人群,实现智能平权[70][71][72] 搜索与大模型关系演进 - 新一代搜索服务转向智能体驱动方式,由大模型理解意图再针对性获取内容[17] - 两种路径并存:先搜再解读和模型先理解再搜索,需要大模型判断适用场景[43] - 元宝可使用微信公众号、视频号等公开内容,通过RAG方式输出答案[44] - 但微信个人信息不会用于大模型训练,模型训练需要高质量知识内容[45] 组织管理与考核方式 - 元宝采用扁平化管理,不给团队设定期例会,通过日报数据和产品体验反馈管理[57][60] - 考核关注DAU和每个功能使用量,以及答案准确性和产品体验主观感受[63] - 团队大量启用毕业3-5年年轻人,鼓励敢想敢拼敢试错的文化[63] - 产品与模型研发适度解耦,混元按自己节奏迭代,元宝基于稳定版本做产品[113] AI Chatbot市场竞争格局 - Chatbot战役是集全集团之力,继移动互联网后的关键战役[122][123] - 预计不会出现微信式大一统格局,市场将更分散,不同产品找到目标用户[89][91][92] - 产品形态仍以对话为核心,但会涌现不同产品形态和玩家侧重[96][97] - AI可视为"生活上的操作系统",比传统操作系统更智能强大[98][99] To B市场AI应用 - AI在To B是激烈战场,云厂商通过配套云服务实现收入增长[133] - 企业关注模型应用落地,实现业务降本增效,营销是最愿意花钱场景[133][135] - 腾讯云智能体开发平台支持超过140个MCP插件服务,扩展智能体工具能力[140] - 公司聚焦平台建设,生态伙伴负责最后一公里服务交付[144] 行业趋势与创业建议 - 大数据市场高速增长,驱动因素包括湖仓一体、大数据+ML融合和大数据+LLM/Agent[152][153] - 创业公司难避巨头竞争,建议在大厂生态找机会或专注海外市场[149][150] - 海外用户付费意愿更高,很多创业团队选择做海外市场[147] - 腾讯元宝暂未计划出海,先聚焦服务国内用户[148]
腾讯研究院AI速递 20251010
腾讯研究院· 2025-10-10 00:01
生成式AI模型发布与进展 - 谷歌DeepMind发布Gemini 2 5 Computer Use模型 使AI能直接控制浏览器执行点击 滚动和输入等操作 在相关基准测试中性能达到SOTA水平 使用效率高于竞品 [1] - 马斯克旗下xAI推出视频生成模型Imagine v0 9并向所有用户免费开放 视频生成时间不到20秒 能生成6秒左右视频 支持语音优先界面 [2] - 蚂蚁集团发布并开源万亿参数通用语言大模型Ling-1T 总参数达1T但推理时仅激活约50B参数 在编程与数学推理基准测试中表现亮眼 LiveCodeBench得分最高 数学相关评测双双突破74分 [3] - 腾讯推出混元图像3 0 具备更丰富的细节和更细腻的画质 支持生成表情包组图 四格漫画 图文设计等多种创作风格 [4] - 以色列AI21 Labs开源30亿参数轻量推理模型Jamba Reasoning 3B 采用混合SSM-Transformer架构 支持256K上下文窗口 效率比竞品提升2-5倍 在M3 MacBook Pro上每秒生成40个token [5][6] 前沿科技与材料科学 - 2025年诺贝尔化学奖授予三位科学家 表彰他们在金属有机框架材料发展方面的贡献 该材料能从水中分离PFAS 捕获二氧化碳 从沙漠空气中采集水分 [7] 行业战略与愿景 - OpenAI的愿景是构建垂直整合AGI帝国 由个人AI订阅服务 超大规模基础设施和前沿研究实验室三大支柱构成 预测未来2年内AI将在科学发现领域扮演关键角色 [7] - 具身智能公司Figure获得10亿美元C轮融资 估值达390亿美元 专家指出部署能力是行业卡脖子环节 预计家庭场景大规模部署至少需7-12年 [8] 开发工具与资源 - 谷歌资深工程主管发布《智能体设计模式》一书 系统总结AI Agent开发领域的21个关键设计模式 全书400多页 提供详实代码示例 [9][11]
AI时代,GEO的探索、痛点和方法|AI透镜研究系列
腾讯研究院· 2025-10-09 18:13
GEO的兴起与定义 - 生成式引擎优化(GEO)的核心目标是最大化品牌、产品或内容在AI对话回答中的“AI可见性”[14] - GEO的诞生源于ChatGPT等对话式AI已成为不可忽视的新流量渠道,其网站引荐流量正处于高速增长通道,已在部分网站的流量来源中位列前茅[14] - GEO带来“零点击”挑战,用户从AI获得满意答案后可能直接离开,不点击引用链接,这意味着GEO更偏向品牌建设而非直接效果转化[14][29] GEO与SEO的异同 - GEO与SEO共享“内容为王”的最高原则,高质量内容是所有优化的前提[15] - SEO是“关键词驱动”,而GEO是“问题驱动”,要求内容策略从关键词思维彻底转向问题思维[16][31] - SEO依赖排名算法对网页排序,GEO则是“拆解-搜索-整合-生成”的流程,会向传统搜索引擎发起多次查询[16][32] - SEO是GEO的基础,做好SEO即使GEO不带来直接流量,投入也是有价值的[9][66] GEO内容创作策略 - 内容需拥抱“问题-答案”结构,确保每一篇内容都能直接、清晰地回答一个具体问题[17][31] - 贯彻结构化原则,使用列表、要点、结构化数据标记等方式,帮助AI理解和采纳内容[6][17][34] - 坚守可信度标准,优先引用具备专业性、权威性和可信性的内容,遵循E-A-T原则[17][34] - 提供“信息增益”,在内容生产成本极低的时代,独特的见解和深度信息会越来越重要[10][63] - 实践场景化思维,围绕目标用户的具体场景化长尾问题构建内容矩阵[17][35] GEO效果评估与挑战 - GEO目前处于规则模糊的“黑箱”阶段,评估极具挑战[18] - AI回答存在“非幂等性”(结果多变)和“记忆效应”(个性化偏好),需在无痕模式下多次查询验证效果[18][41] - 通过精准优化,可以在国内外主流AI模型中获得理想排名和商业询盘,例如有团队成功将特定专家优化至“国内GEO专家”查询结果首位[37] GEO生态与ROI - 海外市场已涌现多款专业监测工具,通过高频查询分析品牌在AI中的可见性(提及次数、情感倾向)和内容引用情况[44] - GEO的核心价值在于品牌建设,通过在AI的权威回答中反复“露脸”建立用户对品牌的认知和信任,其效果更偏向品牌层面而非直接流量[8][46] - 文本依然是GEO性价比最高的媒介,其易于生产、优化和被AI引用的特点使其成为当前布局的绝对重心[20][61] 技术机制与信息来源 - AI生成答案的信息来源主要有两个:内部训练数据集和实时网络搜索[21] - 被纳入训练集对内容质量要求极高,对绝大多数企业而言遥不可及,当前GEO主战场在于实时网络搜索[21][50] - AI将用户问题“翻译”成搜索指令交由传统搜索引擎执行,内容在传统搜索引擎中的排名直接决定被AI发现和引用的概率[21][49] 国内外市场渠道策略 - 海外市场策略是“官网为王”,官网权重极高,是所有GEO工作的核心,需集中资源打造高质量官网内容,并辅以在YouTube、Reddit、Quora等高权重社区的投入[23][40][55] - 国内市场策略是“多点开花”,国内官网权重普遍偏低,AI更倾向于抓取大型门户网站的自媒体号、CSDN等第三方平台,需广泛布局这些高权重平台[23][39][54]
腾讯研究院AI速递 20251009
腾讯研究院· 2025-10-09 00:01
OpenAI产品生态更新 - 发布AgentKit工具集 包含可视化Agent Builder Connector Registry和ChatKit 提供拖拽式工作流编排和安全护栏功能 [1] - Codex正式版上线并新增Slack集成和SDK 日活使用量三个月增长10倍以上 GPT-5-Codex处理超40万亿token [1] - 同步发布Sora 2 API gpt-realtime-mini gpt-image-1-mini等新模型接口 ChatGPT开放Apps SDK支持第三方应用内嵌交互界面 [1] 大语言模型竞争动态 - Gemini 3 0 Pro内测显示其前端和web编程能力极强 能精准实现物理引擎 太阳系模拟等复杂任务 在ARC-AGI-2思考模式准确率超20% 人类最后考试基准得分32 4%超越GPT-5和Grok 4 [1] - Claude Sonnet 4 5发布 价格维持不变 在SWE-bench Verified编程评测中达到业界领先 能保持超过30小时专注处理复杂任务 [2] - 智谱发布GLM-4 6旗舰模型 代码能力较前代GLM-4 5提升27% 上下文窗口从128K扩展至200K 在74个真实编程任务测试中超过Claude Sonnet 4且token消耗节省30%以上 [3] 多模态与图像生成进展 - Sora上线三天登顶美国App Store榜首 下载量达16 4万次 新功能"Cameo"实现人物一致性与音画同步 Pro版本可生成15秒高质量视频 [3] - 腾讯混元图像3 0登顶LMArena文生图榜单 成为全球最强开源图像生成模型 采用80B参数MoE架构 支持世界知识推理及1000Token长文本理解 [4] - 谷歌Nano Banana正式开放API 定价每张图约0 28元人民币 新增画幅比选择功能 支持十多种宽高比及纯图像输出模式 [5] 基础设施与开发者工具 - Thinking Machines Lab发布产品Tinker 让大模型微调变得简单 研究者保留90%控制权 使用LoRA技术让多任务共享GPU降低成本 [2] - 同步推出Claude Agent SDK 整合了Claude Code底层基础设施 提供内存管理 权限系统和子智能体协调等功能 [2] - GLM-4 6首次在寒武纪 摩尔线程国产芯片上实现FP8+Int4混合量化部署 同步推出最低20元包月的Coding Plan套餐 [3] 机器人技术与行业展望 - 英伟达开源Newton物理引擎 Isaac GR00T N1 6基础模型和Cosmos世界模型等多项目技术 Newton物理引擎基于GPU加速 可精确仿真复杂动作 [7] - 谷歌前CEO施密特认为美国将赢得AGI竞赛 但中国将主导人形机器人市场 世界将被廉价中国机器人淹没 宇树科技6000美元机器人即是例证 [8] - 美国AI领先优势面临电力瓶颈 到2030年需新增92吉瓦发电能力 若无法解决能源问题将无法充分利用技术优势 [8]
微短剧出海,中国原创叙事的价值突围挑战
腾讯研究院· 2025-09-30 15:33
微短剧出海市场现状与表现 - 微短剧出海正从局部市场突破走向更广范围扩散,在东南亚、中东、北美等市场热度持续攀升,其中美国市场表现最为亮眼[2][4] - 2024年中国短剧APP海外收入达12亿美元,其中60%的收入来自美国[4] - 北美市场因互联网用户基础庞大、流媒体用户消费习惯成熟且付费能力强,成为短剧出海的关键市场[4] - 目前北美短剧市场以爱情题材为主导,霸道总裁、甜宠、复仇等"爽点"剧情最受欢迎,女性用户是绝对消费主力,25-54岁为核心年龄段[5] - 海外市场短剧供给约90%是译制剧,但占比10%的本土剧却贡献了主要的内购收入[7] 微短剧内容特征与用户吸引力 - 短剧具有快节奏叙事、多反转悬念、强情绪刺激等特征,为观众带来极高的情绪与娱乐价值[5] - 其轻便的单集体量适配移动用户碎片化、轻量化的媒介使用习惯,满足通勤、休息等场景的时间消磨需求[5] - 每集都以强大的内容钩子(如关键情节处戛然而止)吸引用户付费解锁,被称为"TikTok时代的肥皂剧"[6] - 受欢迎的内容题材(浪漫恋爱、打脸复仇、身份翻转等)的人性内核无分国界,但需进行本土化再创造,如融入狼人吸血鬼、牛仔、消防员等欧美熟悉元素[6] 微短剧出海商业模式与成功案例 - 短剧出海采用"译制剧与本土剧"双模式并行,译制剧通过翻译、配音方式推向海外,本土剧则由中国公司在美国建立生产基地与本地团队合作生产[7] - ReelShort采用"应用内广告+应用内购买"的混合付费模式,用户可免费观看前几集,在剧情高潮处需以金币解锁后续内容,金币可通过内购或广告观看、签到等方式获取[12] - ReelShort在北美市场依托Facebook、Instagram与TikTok等平台进行定向广告投放,以情节片段与情绪钩子吸引潜在用户点击与下载[12] - ReelShort基于母公司积累的优质IP与用户偏好数据,将经过市场验证的网文IP快速转化为短剧内容,提升爆款成功率[11] 微短剧产业影响与生产模式 - 短剧在美国的兴起为当地演员与创作者提供新的就业机会,在美国专业招聘平台Backstage上关于短剧的招募信息已超半数[13] - 短剧体现出有别于好莱坞的"轻工业化"内容模式,通常在8天内完成40-50集拍摄,3个月内完成从开发到上线全流程,单部剧集成本控制在30万美元左右[14] - 短剧依托数据化运营机制,将用户付费人数、付费节点等作为反馈依据,实现快速市场验证与迭代更新,形成批量复制与资本快速回笼机制[14] - 一些好莱坞传统影视公司如狮门影业以及日本、韩国的影视产业也开始关注并尝试开发短剧形态[15] 微短剧发展挑战与未来方向 - 短剧面临内容同质化与本土化问题,以"百亿丈夫""千亿丈夫"等类型化叙事为代表的爆款复制逻辑导致观众审美疲劳[18] - 商业模式的可持续性存在不确定性,在竞争加剧背景下用户付费空间可能受挤压,平台投放成本可能持续上升推高获客成本[18] - AI技术已渗透至IP评估、剧本生成、视频剪辑等全流程环节,为短剧的精细化、高效化和工业化生产提供基础设施支持[19] - 微短剧未来发展的关键在于如何在跨文化交流中既保留中国短剧特有的叙事节奏与情绪表达,又实现本地化创新与长期生态构建[20]
腾讯研究院AI速递 20250930
腾讯研究院· 2025-09-30 00:01
生成式AI - DeepSeek-V3.2-Exp引入稀疏注意力机制 大幅提升长文本训练和推理效率 [1] - 模型在HuggingFace和魔搭平台开源 同步公开论文及算子代码 [1] - 官方API价格下调50%以上 服务成本大幅降低 [1] - 智源RoboBrain-X0实现零样本跨本体泛化 可直接部署在不同厂商和结构的真实机器人 [2] - 通过统一动作表征体系将复杂动作拆解为标准化token序列 学习任务"做什么"而非"怎么动" [2] - 真机跨本体评测总体成功率48.9% 是基线模型π0的近2.5倍 基础抓放任务成功率100% [2] - 混元3D-Omni支持骨骼姿态、边界框、点云和体素四类控制信号 是业界首个统一多种条件控制的3D生成模型 [3] - 通过轻量化统一控制编码器和渐进式难度感知训练策略 实现精细化3D资产生成及多模态融合 [3] - 有效解决单视图生成"纸片物体"问题 成功重建几何细节并确保比例与真实物体精确对齐 [3] - GPT-5在半小时内提出数学函数方案 正确指出度有理函数编码最大特征值信息 [4][5] - 研究给出2008年QMA分离结果的定量版本 证明某条研究路径已走到尽头 [4][5] 量子计算 - 加州理工团队创造全球最大中性原子量子计算机 实现6100量子比特阵列 [6] - 相干时间达13秒 比此前长10倍 单比特操控精度达99.98% [6] - 使用光镊技术捕获原子并实现量子比特在阵列中移动数百微米且保持叠加态 [6] - 在规模、精度和相干性三方面取得突破性平衡 巩固中性原子作为量子计算领先平台的地位 [6] AI发展前景 - AlphaGo核心研究者驳斥AI停滞论 指出AI从完全无法完成编程设计任务到现已能胜任的巨大进步 [7] - METR研究显示AI能力保持指数增长 最新模型能自主完成2小时以上任务 7个月能力翻倍 [7] - Claude Opus 4.1在44个职业中已接近人类专家水平 [7] - 预测2026年中期模型可自主工作8小时 年底前在多行业达到专家水平 2027年底将频繁超越专家 [7] - 英伟达GPU主导地位将在2-3年内被打破 市场从90%集中度转向多元化生态 [8] - 推理成本已下降100倍且未来有望再降10倍 主要得益于MoE架构和模型量化等技术突破 [8] - AI应用将分化为传统聊天机器人、极低延迟场景和大规模批处理三类工作负载 [8]