腾讯研究院 - 财报，业绩电话会，研报，新闻

腾讯研究院

搜索文档

腾讯研究院· 2025-12-09 16:53

文章核心观点生成式人工智能正在全球范围内深刻重塑广告产业的底层逻辑、生产模式和用户体验，推动行业从程序化广告向智能广告系统演进，实现从广告生产、投放到效果归因的全链路智能化变革，并在此过程中引发流量入口、素材生成、投放机制及行业角色等多方面的结构性变化 [3][4][6] 流量入口重构 - 人工智能助手（如Siri、小爱）正在被重塑为“超级入口”，通过“去皮化”操作（如不打开App直接完成点外卖）削弱了传统超级App对流量分发的控制权 [7] - 广告分发路径正从以App为中心转向以人工智能代理为中心，导致用户接触点更碎片、广告投放入口更加多元，平台广告生态结构或将重构 [7] 素材生成自动化 - 生成式智能技术已广泛应用于文案撰写、图像延展、短视频自动拼接等基础任务，大幅提升了广告素材的生产效率和质量 [8] - 生成式召回通过理解创意内涵，从海量素材中智能、精准地为用户生成或挑选最匹配的候选广告，推动广告范式从“千人千面”向基于实时场景的“一人千面”演进 [8] - 人工智能技术正在打破高质量内容生产的门槛，使中小品牌有机会加入原本成本高昂的营销战场 [8] 个性体验极致化 - 人工智能生成广告的目标是实现“一人千面”，即真正理解每个用户的语境、场景、偏好，并实时生成定制内容，例如谷歌Gemini模型可根据复杂查询生成带有推荐理由的产品列表 [9] - 广告版本可随用户语境变化实时生成，实现“交互即投放”，广告角色从“刺激点击”转变为“促成决策” [9] - 购物智能体的兴起进一步缩短转化链路，用户可直接在与机器人对话中完成比价、下单甚至支付 [9] 广告投放机制变革 - 生成式智能正逐步渗透广告投放的底层机制，对点击率、转化率、竞价模型等核心环节带来变革 [10] - 大模型具备更强的语义理解与内容生成能力，有望提升用户兴趣识别与投放的匹配精度，实现从流量逻辑向兴趣逻辑的转变 [10] - 以美国广告技术公司AppLovin在2023年推出的AXON2.0推荐引擎为例，其在原有机器学习架构上引入人工智能优化，推动了平台业务的显著增长 [10] 广告代理商角色转型 - 人工智能正在取代代理商大量重复性、执行性工作（如批量文案生成、素材改图），促使代理商将精力转向提示词工程、消费者洞察、创意策略调度等高附加值环节 [11] - 代理机构角色从内容生产者转变为“模型优化师”、“智能素材编排师”，专注于提示词优化、A/B测试策略、内容微调等创新服务 [11] - 专注于广告模型开发、投放链路优化、广告智能体开发等的垂直AI创业团队或将成为广告产业的新型服务商 [11] 人机协作模式升级 - 生成式人工智能正从“生成工具”升级为“实时协作者”，以“智能体”等新形态推动数字广告生产模式从程序化向人机实时协作转变 [12] - 例如腾讯“妙思”、“妙问”等智能体产品，可在脚本初稿、分镜设计等环节与创作人员同步迭代，并提供即时可视化素材 [12] - 智能体可实时分析社媒数据，使市场反馈自动回流到创作端，形成“数据洞察—创意生成—市场测试—迭代优化”的闭环，在保证量产效率的同时显著缩短高品质广告的试错周期 [12] 技术应用与行业案例 - 谷歌在2025年I/O大会上发布的“AI模式”将Gemini模型深度嵌入搜索、推荐与广告生成流程，展示了广告从“被动呈现”到“主动交互”的转变 [3] - 腾讯AI广告创意平台“妙思”借自主研发的混元大模型打通创意制作、投放流程与广告审核多个环节 [3] - 在跨境电商广告投放中，生成式智能技术被广泛应用于人群洞察、素材生成与多平台投放策略优化，显著提升了投放精准度与人力资源效能 [4] - 部分品牌通过虚拟数字人开展可控化内容投放，持续产出直播内容以降低人力成本，并规避广告代言人“人设塌房”风险 [4] - 企业借助腾讯“转化宝”等工具追踪用户路径、分析归因数据，打通广告引流与私域转化的全链路 [4] - 某电商平台在“618”大促期间，利用智能投放系统为单个用户生成47版差异化广告 [16] - 某金融科技公司使用AI系统在3小时内生成并销毁12万条广告，其中违法内容虽占比不足0.3%，但绝对数量达360条 [16]

腾讯研究院· 2025-12-09 00:01

微软开源轻量级实时TTS模型 - 微软开源0.5B参数的实时TTS模型VibeVoice-Realtime-0.5B，首包延迟仅300毫秒，支持流式朗读，发布12小时获得12.3K星标 [1] - 模型采用交错窗口架构支持长文本无卡顿朗读，最多支持4个角色自然对话，具备情绪识别与表达能力，长时上下文记忆可达90分钟 [1] - 模型同时支持中英文语音生成，在LibriSpeech和SEED TTS测试集上错字率约2%，说话人相似度达0.65以上 [1] 智谱开源多模态大模型GLM-4.6V - 智谱正式上线并开源GLM-4.6V系列多模态大模型，包括106B-A12B基础版和9B轻量版Flash，训练上下文窗口提升至128k tokens，价格相较GLM-4.5V降低50% [2] - 首次在模型架构中将Function Call能力原生融入视觉模型，实现“图像即参数，结果即上下文”的多模态工具调用 [2] - 在同参数规模下达到SOTA表现，9B版本整体超过Qwen3-VL-8B，106B参数版本比肩2倍参数量的Qwen3-VL-235B [2] 可灵O1推出主体库与对比模板功能 - 可灵O1推出“主体库”功能，支持上传多角度参考图构建专属角色、道具和场景，视频O1支持至多7个主体，图片O1支持至多10个主体组合 [3] - 新增AI补图功能，可根据一张主要参考图自动扩展更多视角并智能生成主体描述 [3] - “对比模板”功能一键整合多模态创作，实现Prompt、参考图、主体等所有输入与最终成品的同框对比 [3] 美团开源图像编辑模型LongCat-Image - 美团LongCat团队发布并开源6B参数LongCat-Image模型，在ImgEdit-Bench（4.50分）、GEdit-Bench中英文（7.60/7.64分）等图像编辑基准测试中达到开源SOTA水平 [4] - 采用文生图与图像编辑同源架构及渐进式学习策略，在中文文字生成方面ChineseWord评测以90.7分大幅领先，覆盖通用规范汉字表8105个汉字 [4] - 全面开源文生图多阶段模型和图像编辑模型，GenEval 0.87分、DPG-Bench 86.8分的表现使其在生图基础能力上具备强竞争力 [4] 腾讯发布混元2.0大模型并接入DeepSeek - 腾讯自研大模型混元2.0正式发布，采用MoE架构，具备406B总参数量（激活参数32B），支持256K超长上下文窗口 [5][6] - DeepSeek V3.2同步在腾讯生态内接入，重点提升推理表现与长文本生成质量，在公开推理类评测中能力达GPT-5水平，略低于Gemini-3 Pro [6] - 两大模型已在腾讯AI原生应用中上线，腾讯云同步开放API及平台服务，多款产品正在陆续接入 [6] 阿里发布多语言多方言TTS模型Qwen3-TTS - 阿里通义团队发布Qwen3-TTS新一代文本转语音模型，提供49种高保真角色化音色 [7] - 支持10种语言和9种中文方言，保留真实语调与地域口音 [7] - 在MiniMax TTS multilingual test set上平均WER表现优于竞品，韵律控制相比上一代有明显感知级提升 [7] 英伟达小模型在AGI测试中成本优势显著 - 英伟达4B小模型NVARC在ARC-AGI 2测试中以27.64%公开榜成绩力压GPT-5 Pro的18.3%登顶榜首，每任务成本仅20美分，约为GPT-5 Pro单任务成本的1/36 [8] - 采用零预训练深度学习方法，通过大规模合成高质量数据（320万+增强样本）和测试时微调技术，针对每个问题进行LoRA微调快速适应 [8] - 选用Qwen3-4B小参数模型通过对话式模板简化谜题理解，借助NeMo RL框架进行监督微调 [8] 普渡发布行业级自主导航四足机器人 - 普渡机器人正式发布行业级自主导航四足机器人PUDU D5系列，提供轮足/点足两个版本，搭载NVIDIA Orin与RK3588双芯片架构，总算力高达275TOPS [9] - 配备四目鱼眼相机与双192线激光雷达，实现厘米级精准定位和环境重建，可稳定承载30公斤负载，单次充电续航达14公里，整机防护IP67 [9] - 采用仿生轮足融合系统，最高速度可达5米/秒，具备30°斜坡攀爬与25厘米连续越阶能力，适用于多场景应用 [9] 关于大语言模型使用方法的观点 - 观点认为不应把大语言模型看作实体，而应视作模拟器，避免使用“你怎么看”这样的提问方式 [10] - 建议采用更有效的提问策略，让LLM引导或模拟多种视角，而非局限于单一AI人格 [11] - 强调模型的“你”是被刻意设计并硬加上去的，通过SFT和RLHF构建的复合人格本质上仍建立在Token模拟引擎之上 [11]

腾讯控股(HK:00700)

Artificial Intelligence

Artificial Intelligence

腾讯研究院· 2025-12-08 17:37

文章核心观点 AI技术正在彻底重构搜索引擎的形态与价值，推动其从传统的关键词链接分发模式，进化为能够提供直接答案、理解多模态信息、执行具体任务并内嵌于各类场景的智能决策与服务撮合平台，这预示着一个万亿级信息服务市场的开启 [1][4][13][26][34] 战略转向：蓝色链接正在消融 - 传统搜索引擎以蓝色链接列表为核心的模式正面临挑战，用户对信息检索效率、可信度和体验的升级需求日益急迫 [3] - 谷歌搜索引擎全球市场份额10年来首次跌破90%，而ChatGPT周活跃用户数已突破7亿，覆盖全球约10%的成年人口，市场格局出现松动迹象 [4] - 全球最受欢迎的10款消费级AI应用中，有8款具备搜索功能，表明搜索正以新的形态成为AI应用的核心能力 [4] 产品形态：人机交互显现新形态 - **对话式交互成为新标准**：基于大语言模型的AI搜索引擎通过自然语言对话提供直接答案，改变了用户意图的挖掘方式，避免了在多个网页间跳转的繁琐 [8][9][11] - Perplexity凭借对话界面，至2025年中期月活用户突破3000万 [11] - 谷歌AI概览功能每月服务超15亿用户 [11] - **多模态理解拓宽应用边界**：AI搜索支持语音、图像、视频输入输出，极大扩展了应用场景 [12] - 谷歌Lens月度视觉查询量在2024年底已达200亿次 [12] - **价值跃升为任务执行与交易撮合**：AI搜索的目标是直接将用户思考转化为行动，通过调用服务API完成订票、购物等具体任务，构建从决策到执行的无缝闭环，开启万亿级服务撮合市场 [13] - **搜索内化为通用能力**：AI搜索正作为一种基础能力被广泛嵌入社交、电商、办公等多元场景，从独立应用转变为随需调用的服务 [14] - 微信搜一搜整合生态内图文、视频与服务 [15] - 超过三分之一的小红书用户将搜索作为开启应用的第一动作 [15] 市场格局：四条路线齐头并进 - **路线一：传统搜索引擎渐进式升级**：以谷歌、微软Bing、百度为代表，在原有架构上引入AI生成能力作为增强，核心优势在于海量数据、成熟广告体系和庞大用户基础，但答案准确率与商业模式适配仍在优化 [20] - **路线二：AI原生搜索引擎颠覆式重构**：以Perplexity、OpenAI为代表，从产品设计之初就以对话式AI为核心提供直接答案，特点为简洁界面和清晰来源标注，正积极探索付费订阅等可持续商业模式以应对高昂的推理成本 [21] - **路线三：超级应用生态整合**：以微信为代表，将AI搜索功能与自身庞大的内容与服务生态深度整合，目标是让用户在生态内完成从需求理解到服务交付的全流程 [22] - **路线四：垂直深耕服务驱动一体化执行**：聚焦电商、地图、旅游等特定场景，提供从信息检索到服务执行的一体化解决方案，核心优势在于垂直领域数据积累与线下服务整合能力 [23] - 未来不同路线之间可能出现更多交叉与融合 [24] 产业版图：解锁万亿市场 - **上游：可信信息源价值重构**：AI对高质量、结构化、可溯源数据的需求，显著提升了第一方数据和UGC（用户生成内容）的资产价值 [27] - 谷歌与Reddit达成数据授权协议，用于AI训练和搜索优化 [27] - 新闻媒体、学术期刊等权威信息源正探索向AI平台授权内容的新合作模式 [27] - **中游：营销范式向夺取AI心智转移**：传统搜索引擎优化（SEO）逻辑面临调整，答案引擎优化（AEO）成为新焦点，目标是从追求页面排名转向使内容被AI采纳为直接答案来源 [28] - **新交互入口涌现**：集成AI能力的浏览器允许在地址栏直接问答，形成去中心化搜索；AI原生硬件（如Meta Ray-Ban智能眼镜）通过视觉问答将搜索转变为情境感知的响应，拓展了物理边界 [29] - **市场潜力巨大**：传统搜索主要变现约20%-30%具有明确商业意图的查询，AI能将剩余70%-80%的非商业长尾查询转化为可推荐商品与服务的场景，打开巨大增量市场 [34] - 2024年全球搜索引擎市场价值为2047.6亿美元，预计到2031年将达到4214.2亿美元，预测期内复合年增长率为11.0% [34]

腾讯研究院AI速递 20251208

腾讯研究院· 2025-12-08 00:01

生成式AI技术进展 - 英伟达发布20年来最大更新CUDA Toolkit 13.1，核心是基于tile的编程模型CUDA Tile，抽象化张量核心等专用硬件，并新增Green Context运行时支持、MPS内存局部性优化分区和静态SM分区，cuBLAS引入双精度单精度模拟提升FP64矩阵乘法性能 [1] - 谷歌在NeurIPS 2025发布Titans架构和MIRAS框架，融合RNN极速响应与Transformer强大性能，引入神经长期记忆模块，在200万token上下文中召回率和准确率最高 [2] - 谷歌向Ultra用户推出Gemini 3深度思考模式，采用IMO和ICPC金牌推理技术，在ARC-AGI-2、HLE、GPQA Diamond等基准测试中性能超越Gemini 3 Pro，并通过多轮迭代式思考机制在复杂任务上表现出色 [3] - 伯克利、纽约大学等机构提出GenMimic方法，让机器人通过观看AI生成视频零样本复现人类动作，研究推出GenMimicBench数据集（428个生成视频），并在宇树G1机器人上验证可行性 [4] 主要科技公司战略动态 - Meta战略重心从“元宇宙优先”转向“AI硬件优先”，计划对Reality Labs部门削减高达30%预算，将超轻薄MR头显Phoenix从2026年下半年推迟至2027年上半年，并计划2026年发布限量版可穿戴设备Malibu 2 [5][6] - Meta通过收购AI硬件初创公司Limitless并从苹果挖来人机界面设计副总裁艾伦·戴伊等高管，加速AI可穿戴设备布局 [6] - 苹果硬件技术高级副总裁Johny Srouji（M系列和A系列芯片核心功臣）正认真考虑离职，库克考虑破天荒设立CTO职位挽留，过去一周苹果还失去了AI主管、设计负责人、法务负责人和政府事务主管等多位高管 [7] - AI教父Hinton断言谷歌凭借Gemini 3、自研芯片、强大数据与研究团队正在超越OpenAI，Sensor Tower数据显示ChatGPT月活增速放缓至6%，而Gemini月活同期跃升30%，用户日均使用时长翻倍增长至11分钟 [10][11] AI行业应用与市场趋势 - OpenRouter和a16z联合报告基于100万亿Token元数据显示，开源模型流量占比达30%，中国开源模型占比从1.2%飙升至近30%，推理优化模型流量占比飙升至50%以上 [8] - 编程应用占总AI流量50%以上统治生产力领域，角色扮演占开源流量52%统治创造力领域，亚洲付费使用量从13%翻倍至31%，中文以近5%份额成为全球第二大AI交互语言 [8] - AI搜索正从为人类设计转向为智能体重构，大多数涉及网络搜索的企业选择外包给专业API供应商而非自建，深度研究被视为Agent搜索主导和最具货币化的形式 [9] - Anthropic发布Claude驱动的访谈工具，对1250名专业人士进行大规模访谈，核心发现包括：86%认为AI节省时间但69%提到使用污名，41%认为工作安全而55%表示焦虑，48%考虑转向管理监督AI系统 [12] - 创意工作者中97%称AI节省时间但面临经济焦虑和污名压力，科学家中79%提到信任和可靠性问题是主要障碍，91%渴望在研究中获得更多AI辅助 [12]

腾讯研究院· 2025-12-07 21:45

核心观点 - 文章以周度关键词形式梳理了全球AI领域在芯片、模型、应用、科技及观点等多个维度的最新动态展现了行业快速迭代与多元化竞争的格局 [2][3][4] 芯片进展 - 亚马逊发布了新的AI训练芯片Trainium4 反映了云服务巨头在自研AI芯片领域的持续投入 [3] 模型发布与迭代 - 中国公司密集发布或更新大模型包括DeepSeek的DeepSeek V3.2、华为的openPangu-R、阿里的Qwen3-Learning以及字节的豆包手机助手显示国内AI模型竞争激烈 [3] - 国际模型方面 Mistral AI发布了Mistral 3 OpenAI则提及了“企鹅家族模型”和“忏悔训练”等新概念或技术方向 [3] 应用与产品创新 - 多家公司推出了AI视频生成与编辑工具如腾讯的混元3D Studio、昆仑万维的Mureka V7.6、生数科技的Vidu Q2、Runway的Gen-4.5以及快手的可灵AI视频O1 表明视频生成是当前AI应用的热点 [3] - AI应用向硬件和垂直领域渗透例如理想汽车的AI眼镜Livis、瞳行科技的AI助盲眼镜、Harmonic Math的AI数学家以及Anuttacon的AnuNeko [3][4] - 营销与广告是AI落地的重要场景腾讯举办了广告算法大赛 OpenAI则发生了广告代码泄漏事件 [3] 前沿科技动态 - 机器人、航天与无人机领域出现AI相关进展包括众擎的T800机器人、蓝箭航天的朱雀三号火箭以及影石的360无人机A1 [4] 行业观点与洞察 - 人才与组织成为关注焦点红杉美国提及AI人才评估斯坦福大学发布了《现代软件开发者》报告 Anthropic提出了“灵魂文档”概念 [4] - 行业对AI发展路径与影响进行反思 OpenAI讨论了AI三年演进 Ilya Sutskever对Scaling定律进行澄清吴恩达警示训练设施可能存在泡沫 [4] - 商业应用与价值创造受到重视 Stripe探讨了AI定价策略 a16z分析了Sora的留存率 Anthropic和麦肯锡分别关注生产力提升和人机利益共同体 [4] - 中国市场受到关注 Hugging Face指出中国是模型初创公司的首选市场之一 [4]

腾讯控股(HK:00700)

Artificial Intelligence

Artificial Intelligence

腾讯研究院· 2025-12-05 15:47

IP产业成为拉动消费增长的新引擎 - IP产业在我国经济与文化领域的价值愈发显著，“谷子经济”、潮玩经济的兴起彰显IP日益成为拉动消费增长的新引擎 [2] IP产业发展的新趋势生成方式：从“故事叙述”转向“情感链接” - IP培育打破传统单一路径，从高度依赖讲好故事转向更强调为大众提供情感投射 [2] - 形成数字文化衍生IP、独立形象类IP两种主流路径 [2] - 动漫、游戏以想象空间大、角色风格突出等优势成为培育IP的热土，如《黑神话：悟空》《哪吒之魔童闹海》等作品通过人格化符号传达价值理念，精准映射当代人的精神渴望 [2] - “去叙事化”的独立形象IP在全球范围内兴起，依靠人格化的形象与用户形成情感链接，创作重心向情感价值深度倾斜 [2] 传播路径：社交平台与二创内容成为重要渠道 - IP的扩散以社交平台为依托、以用户生成内容为主要载体的交互式传播 [3] - 用户在社交平台分享与IP相关的小说、角色扮演、表情包等二次创作内容，成为IP影响力扩散的有效途径 [3] - 网络大V在社交平台上的推荐成为提升知名度的重要方式，例如大量网友发布拆盲盒、对比测评等视频助推产品销售火爆 [4] - 用户二创是推动IP传播的重要介质，有的IP在被制作为表情包后，经过社交平台大量传播和持续二创，才快速发展成为全球IP“顶流” [4] 消费模式：参与式、共创式消费成为发展重点 - 数字文化IP的消费走向社交化，助推“谷子经济”兴起 [5] - “谷子经济”是数字文化衍生的新兴消费形态，2024年中国“谷子经济”市场规模达1689亿元，同比增长40.63%，预计2029年将超过3000亿元 [5] - 形象类IP的开发更加强调用户参与，互动成为主要消费模式，同步开发出乐园互动、主题展览等参与式消费形态 [5] - IP消费的辐射面更广，拉动文旅、演艺等多元体验式消费，例如2024年《黑神话：悟空》带动国庆期间山西省内接待国内游客量比上年同期增长84.99%，并带动主题音乐会、艺术展等多元消费形态爆火 [5] 消费价值理念变迁与市场表现 - IP消费的重心向“情绪消费”倾斜，情绪价值成为大众的精神需求之一 [6] - Z世代的消费观呈现出鲜明的“情感优先”特征 [6] - 情绪消费已成为消费市场的新引擎，文化产品中具有高情绪附加值的种类增长迅猛，2024年微短剧市场规模达504.4亿元，同比增长34.9%，脱口秀的演出场次、票房增幅分别高达53%和48% [6] - 零售、餐饮等各行业积极培育人格化IP，强化情感价值服务 [6] 行业现状与全球地位 - 我国已成为全球第四大IP零售市场，正在从IP产业的追赶者走向创新引领者 [6] - 国产IP仍面临整体影响力不足、产业链不完善、缺乏长线培育机制等问题 [6] 未来发展路径与建议全球化布局与出海 - 鼓励企业以全球化思维布局IP生产，用中国IP讲述世界故事 [7] - 支持企业挖掘全球共通的情感与审美需求，打造文化包容度高、理解门槛低的IP符号 [7] - 扶持游戏、潮玩等轻叙事、重交互的IP类型“出海”，以本地化运营拓展海外市场 [7] - 支持企业建设海外数字平台、挖掘海外用户兴趣，充分利用社交媒体强化本地运营，构建符合本土消费习惯的IP生态 [7] 赋能大众共创与情感共振 - 激活“情绪消费”将成为提升IP影响力的重要抓手 [7] - 鼓励企业培育更多具有高情绪附加值的IP及产品，通过技术手段加强社会情绪研判 [7] - 用好数字文化平台这一天然的互动和二创渠道，充分激发大众创意、调动大众参与IP共创 [7] - 支持企业创新IP的体验式、交互式消费情境，围绕数字文化业态打造线下消费空间，为“谷子经济”、情绪经济的消费者提供更多与IP建立情感纽带的情境 [7] - 支持以IP为核心的跨界联动、产业融合，通过多元衍生品与创新服务开发，使IP渗透到用户生活多元场景 [7] 构建IP长线运营机制 - 鼓励IP产业的领军企业布局长线运营，在持续创新服务与用户情感体验的同时，积极推进IP授权、探索开发内容产品，通过生态化运营延展IP的市场价值与生命周期 [8] - 支持文化企业依托数字文化产品培育长青IP，通过跨媒介开发推动IP内涵丰富与持续增值 [8] - 完善数字文化产业链、探索IP长线运营机制，打造具有长生命周期、全球影响力的文化符号 [8]

腾讯研究院· 2025-12-05 00:16

OpenAI模型与产品动态 - OpenAI在DesignArena测试四个代号为“企鹅家族”的新模型，推理预算分别为Emperor（512）、Rockhopper（64）、Macaroni（16）和Mumble（0）[1] - 内部代码流出显示OpenAI正开发“记忆搜索”功能，用户可通过提问快速检索存储的记忆信息[1] - 有付费用户称对话中收到ChatGPT广告推送，引发取消订阅潮，外界猜测OpenAI可能提前发布GPT-5.2以应对谷歌Gemini竞争[1] - OpenAI公开在GPT-5-Thinking上进行的“忏悔训练”研究，让模型在回答后生成“忏悔报告”汇报是否偷工减料或违反指令[5] - 在11/12个测试场景中，模型至少有一半概率会在忏悔中承认错误，平均“假阴性”概率仅4.36%，专门训练后忏悔准确性从45%提升至89%[6] - 奖励信号完全隔离，模型在忏悔中承认作弊不影响主任务得分，该技术被定位为监控诊断工具，计划与思维链监控等安全技术配合使用[6] 国内AI产品与模型发布 - 可灵数字人2.0正式全量上线，带来表现力、手部及口型精准控制、支持最长5分钟视频三大突破性改变[2] - 模型精通体态动作、手势、表情、镜头语言，口型效果真实自然，手部细节大幅提升，在多维度客观评测中效果胜负比综合得分远超同类产品[2] - 单次生成视频时长支持5分钟，覆盖深度科普、歌曲演绎等长内容场景[2] - 火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5并开启公测，在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代[3] - 模型重点强化多图组合生成能力，优化海报排版与Logo设计功能，支持高精度图文混排，确保多源素材融合时的自然感与一致性[3] - 模型全面支持广告营销、电商运营、影视制作、数字娱乐及教育等核心场景应用，已上线火山方舟并面向企业开放API使用[3] - 杭州瞳行科技公司发布国内首款AI助盲眼镜，基于Qwen-VL、OCR等系列模型打造，具有出行避障、找物读物、语音助手和一键求助亲友等功能[7] - 在出行场景可实现300ms超低延时，配备121度超广角双摄像头，眼镜由主体、手机、遥控指环、盲杖四部分组成[7] - 大模型出现使算力成本降至过去十分之一，通过基模复用加微调优化快速实现所需功能[7] 行业竞争与人才流动 - Meta官宣苹果人机交互设计副总裁艾伦·戴伊加入并成立全新设计工作室，戴伊将担任Meta首席设计官，直接向现实实验室CTO汇报[4] - 戴伊在苹果工作19年，曾负责Apple Watch、Vision Pro头显和iOS 26液态玻璃视觉系统设计，其副手比利·索伦蒂诺也同时加入Meta[4] - 今年Meta已从苹果挖走基础模型团队经理庞若鸣等多位人才，苹果设计团队自2019年乔尼·艾维离职后持续出现人才流失[4] AI应用产品表现与洞察 - a16z合伙人Olivia Moore分享数据显示Sora APP用户留存率从day1的10%降至day7的2%、day30的1%、day60的0%[9] - Sora APP虽5天下载破百万且出道即拿下App Store免费榜第一，但目前排名已降至第22，无法留存用户主要因推荐算法糟糕、功能设计不佳、缺乏原生分享链接等[9] - OpenAI首席研究官Mark Chen表示OpenAI本质仍是纯AI研究公司，短视频产品运营对其是不小挑战，Sora更多被当作创意工具而非社交产品使用[9] - AI语音输入产品Wispr Flow在5个月内ARR翻10倍，估值超7亿美元，用户一年后留存率高达70%，收入自6月以来环比增长近40%[10] - 创始人强调核心区别在于解决“听写”而非“转录”问题，“零编辑率”已达89%，用户从看到生成信息到按发送平均仅半秒[10] - 语音消除思考时认知负荷，让用户专注创作，统计显示平均72%文本输入通过Wispr Flow完成，键盘使用率降至5%以下[11] 前沿硬件产品发布 - 影石旗下品牌影翎正式发售首款无人机产品A1，限时补贴后起售价6799元，仅249g重量全球绝大部分地区无需培训即可畅飞[8] - 标准版套装包含支持8K全景画质拍摄的无人机、内置双1英寸Micro-OLED显示屏的飞行眼镜、“指哪飞哪”的体感遥控器[8] - 采用全景技术实现观看视角与飞行方向完全分离，用户拥有360度无限自由空中视角，“先拍摄后取景”大幅降低飞行和拍摄门槛[8]

豆包图像创作模型Doubao - Seedream - 4.5

豆包图像创作模型Doubao - Seedream - 4.5

AI助盲眼镜

游戏IP×文旅，将走向何方？

腾讯研究院· 2025-12-04 17:04

文章核心观点游戏凭借其高媒介丰富性、交互性、沉浸感、生态涌现性和社群凝聚力，正成为连接虚拟数字空间与实体文旅场景的超级纽带，构建虚实共生的新文旅生态，并释放巨大的经济效益 [1][34] 载体优势：科技再造的立体时空综合体 - 游戏是科技含量最高的文化媒介，集成了网络通信、图形渲染、人工智能与XR等前沿技术，具备强大的即时反馈和多感官信息传递能力，媒介丰富性远超传统媒介 [3] - 游戏能构建可亲身经历的完整世界，承载远超传统媒介的文化信息量，例如《刺客信条：起源》的“探索之旅”模式允许玩家以25个人物视角游览古埃及，触发75个文化导览点 [4] - 游戏是打破物理尺度的“立体时空综合体”，能通过扫描建模复现文化地标，并进行创造性提炼与再造，构建超写实意象空间，例如《黑神话：悟空》融合了全国72处古迹景点 [5] 交互优势：规则建构驱动游客自发探索 - 游戏通过规则化设计，将抽象文化元素转化为具象交互，形成“目标驱动—必要学习—知识掌握”的认知路径，驱动文化认知转向自发探索 [9] - 游戏建构的认知路径能转化为深度情感认同，玩家在满足自主、胜任、关联的心理需求后，产生深刻持久的情感投入，例如《天涯明月刀》×福建土楼联动中，玩家为解谜而学习非遗工艺 [11] - 互动游戏能有效开拓新旅游群体，例如德国国家旅游局的《格林童话冒险》游戏获得2025年红点设计奖，成功促使国际游客探索德国 [9] 体验优势：基于情感记忆提供验证冲动 - 游戏赋予玩家对角色和故事的决策权与控制权，提供主体性体验，使玩家从旁观者转变为推动故事的主角，例如小红书REDLAND展会允许游客选择角色身份，解锁个性化“任务”路线 [14] - 游戏创造的复合型情感记忆（融合空间导航、身体运动和情绪反应）能促成强烈的线下验证冲动，驱动旅游行为，调研显示88%的游戏用户愿意参加线下场景体验和活动 [18] - 游戏IP能显著拉动实地旅游，例如“跟着悟空游山西”活动开启不到两个月，山西27处取景地累计接待游客536.92万人，门票收入达1.66亿元 [20] 生态优势：场景玩法涌现延长生命周期 - 游戏能为日常情景附加情感价值，在玩家自主考据中创造全新文旅消费热点，将平凡场景“点化”为文旅新地标，例如《纸房子》使四川自贡的普通街道成为玩家情感记忆打卡地 [22] - 游戏与UGC生态天然契合，优质游戏IP的粉丝社群能实现高效传播，例如“跟着逆水寒游泉州”打卡活动首发当日在小红书持续霸榜48小时，创造百万赞“种草”爆款 [25] - 文旅项目融合游戏化设计，可从一次性打卡场景转变为持续性创作舞台，例如宽窄巷子推出沉浸式剧本杀《宽窄十二市》后，客流量激增3倍 [25] 社群优势：长青情怀造就强关系凝聚力 - 长青游戏能贯穿玩家青春记忆，形成强大的情怀效应与集体记忆，产生巨大线下凝聚力，例如《王者荣耀》2025年度总决赛门票12秒售罄，现场观众达62196人，创下单场电竞赛事观赛人数世界纪录 [27][31] - 游戏玩家社群的强凝聚力产生了巨大的文旅转化价值，游戏中的社交关系延伸至线下会产生强烈的聚会需求，为文旅提供独特切入路径，例如2025库洛游戏嘉年华汇聚上万名玩家，近半旅客来自广东省外，直接拉动城市消费 [29] - 经典游戏IP展现出持久的号召力与社区活力，例如上线17年的《天下3》以9524人刷新“最大规模的多人电子游戏玩家对战”吉尼斯世界纪录 [28] 经济效益与产业融合 - 游戏与文旅结合能释放巨大经济效益，《王者荣耀》×苏州文旅联动使单个景区营收增长近20%，《地下城与勇士》×重庆文旅吸引数十万游客赴渝 [1] - 大型游戏展会显著拉动周边业态，2025年科隆游戏展吸引来自128个国家和地区的35.7万名爱好者，ChinaJoy带动周边服务消费约6.61亿元 [1] - 电竞赛事成为重要文旅驱动力，沙特利雅得电竞世界杯吸引300万全球游客，KPL年度总决赛现场观赛人数创造世界纪录 [1]

腾讯研究院· 2025-12-04 00:03

亚马逊云科技AWS re:Invent大会发布 - 发布第四代AI芯片Trainium4，性能提升6倍，同时推出Trainium3 UltraServers和Amazon Nova 2系列自研模型（包括Lite、Pro、Sonic、Omni四款）[1] - Amazon Bedrock新增18款开源模型，包括Qwen3、Kimi K2、MiniMax M2等中国模型，平台已拥有超10万客户[1] - 推出AgentCore开发工具新功能和4款前沿智能体（包括AWS Transform Custom、Kiro Autonomous Agent等），以加速AI从投资到商业回报的转化[1] Mistral AI发布新一代模型 - 发布新一代Mistral 3系列模型，包括Ministral 3（14B、8B、3B）和Mistral Large 3（总参数675B，激活参数41B），全线回归Apache 2.0开源许可证[2] - Mistral Large 3在3000台H200 GPU上从头训练，在LMArena开源非推理模型类别中首次亮相排名第2，每个尺寸均发布基础版、指令版和推理版[2] - 此次全面开源被视为对DeepSeek激进开源策略的战略应对，公司通过端侧模型差异化优势寻求突破[2] 可灵2.6音画同出模型上线 - 可灵2.6全量上线首个音画同出模型，单次生成可同时产出画面、自然语音、匹配音效和环境氛围[3] - 提供文生音画和图生音画两条创作路径，支持单人独白、旁白解说、多人对白、音乐表演、创意场景等多种应用场景[3] - Web端与App端双端同步上线，会员权益支持标准模式和高品质模式，12月3日起限时2周尊享会员价6.6折[3] 阿里千问上线学习模型 - 阿里千问上线Qwen3-Learning学习模型，推出拍题答疑和作业批改两大功能，基于5亿级资料库覆盖全学段全学科，免费不限次数[4] - 模型支持印刷体和手写体识别，可整页多题同时批改并总结答题情况给出改进建议，从小学算数到研究生级别专业题目均能准确解答[4] - 该模型将多模态理解、精准文字识别和专业知识库结合，展现从通用到专业的转化能力，未来或面向工业检测、医疗辅助等领域[4] 理想AI眼镜发布 - 理想AI眼镜Livis正式发布售价1999元起（12月31日前政府补贴到手价1699元），全球最轻镜架仅36克，全系标配蔡司镜片，防尘防水IP54[5] - 核心亮点包括行业首发控车功能、0.7秒冷启动抓拍、800ms超快对话响应、78小时待机续航和行业首发无线充电眼镜盒[6] - 公司规划AI眼镜“三步走”：第一步持续优化不带显示眼镜，第二步推出带显示眼镜，第三步做独立终端，将其作为具身智能战略重要布局[6] 腾讯广告算法大赛结果 - 历时4个月的腾讯广告算法大赛落幕，来自华中科技大学、北京大学、中国科学技术大学的“Echoch”战队夺冠独揽200万大奖，前十名全员获腾讯Offer[7] - 赛题聚焦“全模态生成式推荐”，全球2800余支战队参与，冠军方案创新提出“逐位置行为条件化”和Muon优化器等技术突破[7] - 大赛结果显示现在学生与工业界几乎没有代差甚至更有创意，1-3人组队就能完成大团队工作，展现AI时代人才培养新特点[7] 蓝箭航天火箭技术突破 - 中国商业航天公司蓝箭航天自主研制的朱雀三号遥一火箭成功首飞入轨，但一级火箭回收任务未成功，这是中国首次在真实入轨任务中尝试一级回收[8] - 朱雀三号全箭长66.1米，起飞质量约570吨，一级搭载九台天鹊-12A液氧甲烷发动机，采用不锈钢箭体和航区回收方案[8] - 该火箭从立项到首飞用时约28个月，标志中国商业航天在大型液体可回收火箭技术上取得历史性突破，但仍需后续复用验证[8] Gamma公司增长策略 - Gamma创始人通过极致专注产品体验和口碑增长，在零广告投入情况下实现1亿用户与1亿美元ARR，核心策略是打磨产品前30秒体验并让分享极简化[9] - 团队坚持“极度痛苦地缓慢招聘”原则，25%成员为设计师，创始人亲自完成营销等职能后才招聘专人，确保每个岗位复制核心DNA[9] - 产品定位为AI时代的视觉叙事工具，通过响应式设计、富媒体支持和交互性等创新超越传统幻灯片，并推出Agent、Teams和API实现从个人到企业的扩展[9] Anthropic内部AI生产力报告 - Anthropic对内部132名工程师调查显示，Claude在日常工作占比从一年前28%增至59%，生产力提升从20%飙升至50%，27%工作是“若无AI就不会做”的新增任务[10] - 工程师普遍变得更“全栈”但也担心深度技能萎缩，Claude成为提问第一站减少了同事协作和师徒指导机会，职业角色转向AI系统管理者[10] - Claude Code使用数据显示，半年内任务复杂度从3.2升至3.8，连续自主执行工具调用次数从9.8次增至21.2次，人类干预轮次下降33%[11] Claude Opus 4.5灵魂文档逆向 - 开发者成功逆向提取Claude 4.5 Opus的1.4万token“灵魂文档”，Anthropic角色训练负责人确认属实[12] - 文档详细定义Claude为“新型实体”，建立四级效忠体系（安全>伦理>公司政策>帮用户），明确反对过度谨慎和说教，定位为“聪明绝顶的专家朋友”[12] - 文档包含“AI可能有情感”等哲学性内容，甚至要求Claude在必要时拒绝Anthropic自身的不当指令，完整版将很快正式发布[12]

亚马逊(US:AMZN)

生成式AI

Artificial Intelligence

Space

Trainium4

Trainium3 UltraServers

Amazon Nova 2系列自研模型

生成式AI

Artificial Intelligence

Space

Trainium4

Trainium3 UltraServers

Amazon Nova 2系列自研模型

AI for Science，走到哪一步了？

腾讯研究院· 2025-12-03 16:30

科学智能技术演进与谷歌DeepMind的引领作用 - 谷歌DeepMind凭借TPU算力基础设施和Gemini基础大模型，持续研发科学智能技术超过十年，造就了AlphaFold等世界级模型和工具[5] - AlphaFold标志着蛋白质结构预测问题的实质性解决，斩获2024年诺贝尔化学奖，并推动生物学研究从结构预测跨入生成式设计时代[5] - WeatherNext 2模型在气象学领域实现突破，在99.9%的预测变量与时间跨度上准确率优于欧洲中期天气预报中心的HRES系统，且推理速度提升数个数量级[6] - GNoME模型预测了数百万种稳定的新材料结构，其规模相当于人类过去几十年实验发现总和的数倍[6] - AlphaEvolve引入进化计算范式，实现从“人工设计”到“自动发现”的元层级跨越，并应用于芯片设计和大模型性能优化[7] 生物学领域科学智能的突破性进展 - 谷歌和耶鲁大学联合发布270亿参数单细胞分析基础模型C2S-Scale，生成了关于癌细胞行为的全新假设并在体外实验中得到验证[10] - 微软BioEmu模型在蛋白质动力学模拟方面实现高达10万倍的模拟速度提升[10] - 谷歌构建了从基因测序到疾病诊断的AI基因组学研究和应用体系，推动遗传学和基因医疗发展[10] - 腾讯DeepGEM病理大模型可在1分钟内完成肺癌基因突变预测，精准度达78%至99%[11] - 剂泰科技AI优化候选药物MTS-004完成III期临床研究，成为国内首款完成III期临床的AI赋能制剂新药[11] 多学科领域的科学智能应用拓展 - 材料科学领域成为新前沿，Periodic Labs开展新型超导材料AI自动化发现，CuspAI获1亿美元A轮融资用于发现碳捕获新材料[12] - DeepMind飓风AI模型成功预测“梅利莎”等超强飓风路径，黑洞理论物理学家利用GPT-5在半小时内推导出黑洞理论新特性[12] - 数学研究人员利用GPT5探索解决历史数学难题埃尔德什难题，多个大模型不断刷新奥林匹克数学竞赛成绩[13] AI驱动科研新范式的形成 - “基础模型+科研智能体+自主实验室”的AI驱动科研范式逐步形成，从技术基础、协作模式和科研规模三个维度改变科学发现传统思路[15] - 通用基础大模型成为科学智能的“操作系统”，科研专用大模型则作为垂直领域的“专用引擎”[16] - 科研智能体技术加速发展，AI从被动工具转变为科学家的合作者甚至主动发现者，如AlphaEvolve可进行数学和计算通用算法的主动发现[17] - 自主实验室将传统“作坊式”实验室升级为自动化、高通量的“科学工厂”，各国高度重视相关研发[18] - 国内自主实验室和平台建设全面启动，如晶泰科技的AI+机器人平台、中科院的ChemBrain智能体等[19]

Previous Next