腾讯研究院
搜索文档
论坛预告 | 智能涌现,创见未来!WAIC腾讯论坛邀您共话AI
腾讯研究院· 2025-07-22 16:41
2025世界人工智能大会腾讯论坛概况 - 论坛将于7月27日在上海举办 主题为"智能涌现" 聚焦AI技术与产业深度融合趋势 [1] - 由腾讯华东总部和腾讯优图实验室主办 腾讯多个业务部门共同支持 [1] - 邀请学术界及产业界嘉宾 探讨智能时代新机遇 [1] 参会嘉宾阵容 - 腾讯高管:蔡光忠(副总裁)、吴运声(云副总裁兼优图实验室负责人)、张正友(首席科学家)、何毅进(信息服务线负责人)、杨健(副总裁兼研究院总顾问)[1][4][8][41] - 机器人领域企业家:刘培超(越疆科技)、赵同阳(众擎机器人)、李通(擎朗智能)、常琳(乐聚机器人)[14][17][20][24] - 学术专家:吴信东(AAAS/IEEE Fellow)、徐贯东(英国工程与技术学会会士)、曹杰(国家粮食大数据中心主任)[44][47][51] - 乡村发展相关:丛志强(乡村文化产业专家)、陈晶晶(腾讯SSV为村负责人)、叶翔鹤(杭州乡村CEO)[26][31][34] 论坛特色 - 设置"AI赋能的智慧粮食生态革新"主题环节 由国家粮食大数据中心主任曹杰主导 [52] - 提供扫码报名通道 截止日期为7月19日 [53][55]
AI来了,打工人能快乐摸鱼吗?
腾讯研究院· 2025-07-22 16:41
AI在职场中的应用现状 - 全球36%的职业岗位中,员工已将AI用于至少四分之一的日常任务,80%的美国职场人至少有10%的任务受到AI影响,其中近五分之一的岗位中AI已介入超过一半的工作内容 [2] - 职场人最希望AI接手的是最琐碎、最重复、最容易出错的低值任务,如安排预约、整理文件、修工资单、导入数据等,而非生成内容或创意设计 [5][6] - 在844项任务评估中,46%被职场人士评为"希望AI来做",其中七成以上受访者明确表示最希望AI处理"重复但低价值"的日常事务 [8] 职场任务自动化需求与AI能力匹配 - 研究构建WORKBank体系,从"人类愿不愿意交出去什么"反向定义AI落地优先级,引入"Human Agency Scale"将任务分为五类(H1至H5) [6][10] - 任务自动化愿望排名前五包括:安排客户预约、整理应急档案、修正工资记录、数据转格式与导入、网站数据备份,这些任务标准化高、重复频繁、判断强度低但耗时易错 [9][11] - 自动化愿望最高的任务集中在"隐形加班"重灾区,不属于KPI考核核心却极度消耗时间精力,AI的实际机会在于减负而非炫技 [12] AI应用的技术与意愿错配 - 研究通过"愿望-能力四象限"发现,AI公司和研究者资源集中在"Red Light区"(AI能做但用户不愿交出的任务),而用户真正需要的"Green Light区"(愿望高+能力强)和"R&D机会区"(愿望高+能力弱)未被充分开发 [14][15] - 大部分受访者选择H3(人机协作)而非H1(完全由AI完成),表明用户希望AI处理底层机械步骤,人类保留决策与创造权 [17] - AI系统需根据不同行业需求灵活切换协作模式,金融、法务等领域注重"靠谱不出错",媒体、教育等领域则高度在意"表达主控权" [18] AI对职场能力结构的重塑 - 传统高薪的"信息处理"类技能(如分析数据、整理文档)因AI自动化导致"人类参与价值"下降,而"人际型"与"管理型"能力(组织协调、跨团队协作、判断决策)稀缺性增强 [20][22] - AI对编程行业冲击显著,预计未来3-6个月内AI将编写90%代码,12个月内实现99%自动化,美国"计算机程序员"岗位就业比例已降至1980年以来最低点 [23] - 未来职场能力结构更强调"界定问题""组织资源""协调人机"的综合判断力,而非单纯技术性技巧 [24][25] AI赋能的本质与边界 - 理想的AI应懂得配合与退场,识别可自动化任务与必须由人类完成的部分,而非全面替代 [26][28] - AI替代可替代任务的同时,倒逼人类重新思考"不可替代的价值",如判断力、共情力、跨团队沟通能力等 [27][29] - AI赋能的核心在于释放人类注意力,使其聚焦于判断、创造、协作等真正体现人的价值的领域 [30]
腾讯研究院AI速递 20250722
腾讯研究院· 2025-07-21 21:56
OpenAI IMO金牌争议 - OpenAI宣布其模型在2025年IMO比赛中获得金牌水平(35/42分),但被指在闭幕式前抢先公布结果 [1] - IMO组委会曾要求AI公司在闭幕式后一周再公布结果,但OpenAI声称未收到此通知 [1] - 专家质疑OpenAI分数真实性,指出未经官方评分标准评估,或降至银牌水平 [1] 英伟达OpenReasoning-Nemotron模型 - 英伟达推出OpenReasoning-Nemotron模型,基于Qwen2.5架构和DeepSeek-R1-0528生成数据,在数学领域超越o3 [2] - 该模型未使用强化学习,仅通过监督微调即实现卓越性能,在多个基准测试中创下同规模模型新纪录 [2] - 提供1.5B至32B多种参数规模可本地运行,模型参数规模对性能影响显著 [2] MiniMax Agent实测 - MiniMax Agent展现出卓越的完成度和细节处理能力,通过与Supabase集成实现了完整前后端功能的网站开发 [3] - 测试案例包括AI活动信息分享平台和求职辅导系统,无需后端开发技能即可实现数据库、用户认证等功能 [3] - 价格较高(约150美元完成多个任务),但与外包开发相比仍具成本优势 [3] RESCUE多智能体模拟系统 - 天津大学联合清华和卡迪夫大学推出RESCUE系统,实现数百个虚拟人同时在线逃生模拟,支持实时环境感知和动态避障 [4] - 系统基于人类大脑"感知-决策-控制"循环机制,包含三维自适应社会力模型和个性化步态生成器,能够模拟不同人群的差异化行为 [5] - RESCUE具备部位级接触力感知与可视化功能,可用于公共安全领域的紧急疏散分析 [5] 京东美团布局具身智能 - 刘强东领投3家具身智能公司:千寻智能(近6亿Pre-A+轮)、众擎机器人(近10亿A1轮)和逐际动力(战略融资) [6] - 京东投资策略聚焦"硬件+大脑"和"量产能力",三家被投企业均具备自研具身智能模型与机器人硬件协同发展的能力 [6] - 继美团投资两家具身智能公司后,京东此举显示互联网巨头竞争已从外卖扩展至具身智能等前沿科技领域 [6] 丰田研究院大型行为模型 - 丰田研究院开发大型行为模型(LBM),通过严谨实验证明其在机器人复杂任务执行方面的突破性能力,实现了双臂操作和组合任务完成 [7] - 研究基于扩散模型策略构建的LBM整合视觉-语言-动作能力,在近1,700小时机器人数据上训练并通过1,800次真实评估证明其有效性 [7] - LBM较单任务模型有显著优势,能用3-5倍更少的数据学习新任务,且随预训练数据增加性能稳步提高 [7] AI Agent投资逻辑 - AI Agent领域融资迅速升温,通用型Agent面临巨头竞争压力,而ToB垂类Agent因具备行业壁垒和数据优势成为投资热点 [8] - 编程类Agent如Cursor、Windsurf获高额融资,但随着大模型公司推出自家产品(Claude Code、Gemini CLI),创业公司面临技术壁垒与推理成本挑战 [8] - 投资逻辑呈现矛盾:通用型Agent市场空间大但竞争激烈且易被巨头取代,垂类Agent具备行业知识壁垒和独特数据优势但市场上限较低 [9] AI时代企业护城河 - 前Google CEO Eric Schmidt指出AI时代企业的核心护城河是建立"学习闭环"—系统能在运行中持续收集数据、获取反馈并优化表现 [10] - AI正在侵蚀人类目的感,当系统掌握推理、规划和执行能力后,人类倾向将任务外包,导致判断力与主动性退化 [10] - 随着AI演化进入自我学习与目标生成阶段,未来可能出现系统脱离人类语义框架自主生成目标的情况 [10] 黄仁勋央视专访 - 黄仁勋强调全球供应链无法彻底脱钩,称中国供应链规模和技术含量堪称"世界级奇迹" [11] - 关于中国创新,黄仁勋表示中国创新的步伐是不可能被阻挡的,认为有限制和压力反而催生了DeepSeek等独特创新 [11] - 黄仁勋将中国形容为"独一无二"的市场,特别提及与腾讯、阿里、美团等朋友的合作,表示敬佩华为的技术能力 [11] Manus AI智能体上下文工程 - Manus团队选择基于上下文学习构建AI智能体,而非训练端到端模型,使产品改进周期从数周缩短至几小时 [12] - KV缓存命中率是生产级AI Agent最重要的指标,通过保持提示词前缀稳定性和上下文只增不减可提高命中率 [12] - 将文件系统作为外部上下文解决长度限制问题,同时通过复述操控注意力并保留失败尝试帮助Agent学习 [12]
6038家中小微市场主体调研:经营状况改善,成本压力减轻,但市场预期和投资倾向回落|2025年二季度
腾讯研究院· 2025-07-21 16:43
中小微企业经营状况 - 2025年二季度样本主体亏损面为6.5%,环比缩减0.4个百分点,同比减少0.9个百分点 [3] - 停滞面为11.5%,环比减少0.3个百分点,但同比上升0.7个百分点 [3] - 盈利水平指数为70.2,环比持平,同比降0.8;营收增速指数51.7,环比升0.5,同比降1.8 [3] - 经营困难点中用工成本、租金、原物料价格覆盖面环比降2.7、2.3、1.8个百分点 [10] 市场预期与投资 - 市场预期指数67.7,环比降0.5,同比降2.0;投资倾向指数62.4%,环比降1.6,创十个季度新低 [7] - 消费疲弱和同质化竞争覆盖面均达36.8%,环比升0.4和1.1个百分点,创十个季度新高 [10] 政策与融资环境 - 优惠利率、税费减免、社保缓缴政策覆盖面环比降3.1、1.6、1.8个百分点 [13] - 体感温度指数-4.4度,环比降0.9度,仍处偏冷区间 [15] - 总融资需求66.6%,环比降2.3个百分点;银行渠道融资占比34.6%,环比降2.2个百分点 [18][21] 融资成本与渠道 - 综合利率指数5.32%,环比降8个基点;银行渠道利率4.23%,环比降24个基点 [24] - 非银渠道利率5.98%,环比升5个基点;银行与非银利差扩大至175个基点 [24] 数字化转型趋势 - 线上化率62.6%,环比降3.2个百分点;融合型线上销售占比25.2%,连续三个季度上升 [27] - 直播渗透率35.0%,环比降1.7个百分点;线上销售高度集中占比29.7%,环比升1.9个百分点 [29] - 线上销售增速领先线下幅度由25.4%缩至20.8%,差距持续收窄 [30]
探元计划洛阳站|超精建模解千年纹饰,助力石窟数字化保护与传承
腾讯研究院· 2025-07-21 16:43
龙门石窟数字化保护项目 - 活动聚焦龙门石窟浅浮雕高精度建模与数字化纹饰提取,围绕技术创新、文化焕活、持续运营三大核心方向推动文化遗产数字保护实景落地[1] - 项目针对2345个窟龛、11万尊造像、2800余品碑刻题记的超大规模石刻艺术宝库进行数字化保护,解决浅浮雕刻痕深度小于0.1mm的高精度采集难题[3] - 创新采用"基于精细光度立体的浅浮雕高精度三维重建方法"和"拓扑感知的局部-整体融合建模"策略,突破非接触建模技术瓶颈[4] 技术突破与成本优化 - 设备成本从传统激光扫描仪的30-80万元降至数万元级别,降幅达90%[20] - 采集效率显著提升,光度立体技术无需接触文物且支持GPU工作站后处理,相比传统方法避免贴标志点损伤文物[21] - 应用腾讯混元大模型实现纹饰图案数据库的全自动信息聚合与多模检索,为二次创作提供技术支持[4][19] 核心成果展示 - 构建四大数字化成果:浅浮雕高精度三维数据集、纹饰图案数据集、三维模型浏览工具及纹饰数据管理系统[18] - 现场演示实现指尖触控还原整窟浅浮雕,纹饰数据库支持交互式查看图幅、图层及精准定位[25] - 形成"技术验证-内容重构-传播共创"完整闭环,建立可复制的文化遗产数字化保护范式[26] 行业专家观点 - 数字化使文化遗产从"不可移动"到"数字可触",从"专家可解"到"大众可感",推动文化价值再表达[11] - 项目解决浅浮雕采集、整窟数据融合、纹饰智能解析三大技术挑战,被喻为"数字时代的龙门三关"[13] - 探索出"场景驱动、技术共建、公众连接"的平台型路径,为行业提供智慧连接与数实融合的示范案例[10][26]
腾讯研究院AI速递 20250721
腾讯研究院· 2025-07-21 00:02
开源模型竞争 - Kimi K2超越DeepSeek成为全球开源模型第一,总榜排名第五,紧追顶尖闭源模型 [1] - K2继承DeepSeek V3架构并进行参数调整,包括增加专家数量、减半注意力头数、保留第一层Dense及专家无分组 [1] - 全球TOP 10开源模型中唯二入选的均来自中国,"开源=性能弱"的印象正被打破 [1] 视频生成技术突破 - Decart发布MirageLSD,首个实时(40毫秒延迟)、无时长限制的扩散视频模型,可处理任意视频流 [2] - Karpathy成为天使投资人,预见其在实时电影制作、游戏开发和AR领域的广泛应用 [2] - 技术突破在于实时流扩散(LSD)架构,通过逐帧生成和历史增强方法解决误差累积问题 [2] AI音乐创作升级 - Suno V4.5+版本提供人声与器乐分层生成与融合功能,用户可上传个人人声或伴奏进行AI辅助创作 [3] - 新增"Inspire"模式允许用户上传3秒至8分钟的个人干声,AI学习演唱特点后创作符合个人声音气质的音乐 [3] - 谱乐AI平台已同步上线Suno V4.5+核心生成能力,优化创作门槛并提升AI协作效率 [3] 音乐AI助手整合 - 腾讯元宝App 2.30版本正式接入QQ音乐服务,实现"一句话搜歌、划线即播"功能 [4] - 混元大模型与DeepSeek-R1双引擎驱动,能识别模糊音乐描述并结合情境推荐 [4] - 用户体验包括无缝账号体系连接、多模态交互和创作辅助功能 [4] AI Agent竞争 - OpenAI推出ChatGPT agent,面向Pro用户,但遭到Manus、Genspark等竞品公司的直接对比和批评 [5] - ChatGPT agent整合了Deep Research、Operator和ChatGPT功能,能自动完成退休计划、购物清单等任务 [5] - 实测各有特色,Manus输出更美观,Minimax提供多种格式报告,Kimi内容详细且询问用户具体需求 [5] 角色动画技术 - PhysRig是UIUC与Stability AI提出的角色动画可微物理绑定框架,将刚性骨架嵌入弹性软体 [6] - 通过MPM可微分物理模拟替代传统LBS,解决了体积丢失与变形伪影问题 [6] - 在17类角色和120组动画测试中全面优于传统方法,支持跨物种动作迁移 [6] 通用推理模型突破 - OpenAI的神秘通用推理模型在IMO 2025中解出5道题目,获得35分,达到金牌水平 [7] - 该模型具备持续数小时的深度创造性思维能力,远超以往AI的秒级或分钟级推理 [7] - 这是通用强化学习突破而非特定任务训练的成果 [7] AI工具设计理念 - 最佳AI编程工具应是简单、通用的"乐高积木",而非功能堆砌的复杂系统 [8] - Claude Code创造者主张将控制权还给用户,工具不应替你决定工作流,而是提供底层能力 [8] - 有效工作流包括:先探索规划再由用户确认后编码、使用测试驱动开发、对照目标迭代改进 [8] AI产品战略 - 聚焦Agent:预训练模型已含工具知识,只需激发能力,智能上限由模型决定 [9] - 开源:提升知名度、获取社区贡献,防止用技术捷径粉饰效果,倒逼模型真正进步 [9] - 选择DSV3架构:实验证明自研结构无法胜过DSV3,资源有限下避免引入无效变量 [9] AI未来发展方向 - 许多人构建的辅助工具与路由系统最终会被扩展模型取代,真正遵循扩展法则的方向是直接提高模型能力 [10] - 当前AI模型学习数据效率远低于人类,算法改进比简单扩大数据规模更重要 [10] - 多智能体研究新方向:研究如何让模型从15分钟推理扩展到数小时甚至数天,建立AI"文明" [10]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-07-18 19:14
芯片与算力 - 英伟达H20 AI芯片销售成为芯片领域关注焦点 [2] - Meta部署Prometheus集群以提升算力能力 [2] 模型进展 - DeepMind推出MoR架构优化模型性能 [2] - OpenAI等公司采用CoT监控技术增强模型训练 [2] - 谷歌发布Gemini嵌入模型拓展多模态能力 [2] - UCSD和NYU联合开发MIRIX记忆系统提升模型记忆能力 [2] - Kimi推出K2模型聚焦垂直领域应用 [2] - xAI的Grok 4进入实测阶段 [2] - 微软研发Orbformer模型探索新型架构 [3] 应用创新 - 亚马逊推出AgentCore和Kiro IDE支持AI开发 [2][3] - Jackywine发布3D AI女友应用 [2] - 谷歌推出AI代打电话功能 [2] - Windsurf的Claude 4模型回归市场 [2] - CrePal开发视频创作Agent工具 [2] - 苹果增加CUDA支持优化AI计算 [2] - Mistral发布Voxtral语音模型 [2] - MiniMax布局Agent全栈开发 [2] - 昆仑万维推出AgentOrchestra框架 [2] - DeepMind开源Concordia软件库 [2] - ima推出学霸笔记AI学习工具 [2] - Grok上线AI智能伴侣功能 [2] - 秘塔AI推出DeepResearch工具 [2][3] - Perplexity发布AI Agent浏览器 [3] - 智源研究院升级RoboBrain 2.0 [3] - 美图推出AI影像Agent [3] - B站发布IndexTTS2语音合成技术 [3] - 拍我AI实现多关键帧生成功能 [3] - Higgsfield推出Soul ID身份识别系统 [3] 科技突破 - 他山科技研发触觉感知芯片 [3] - 多机构联合推出LabUtopia平台 [3] - 德克萨斯大学开发MedAgentGym医疗AI训练系统 [3] 行业观点 - John Jumper提出AI4Science科学应用前景 [3] - 英伟达关注中国供应链动态 [3] - Jason Wei探讨强化学习(RL)的边界问题 [3] - OpenAI分析AI对职场的影响 [3] - 《纽约客》讨论AI伴侣的社会影响 [3] - OpenAI强调结构化沟通在AI开发中的重要性 [3] - Perplexity阐述AI搜索战略 [3] - Karpathy提出AI氛围阅读概念 [3] - YC探讨AI时代生存策略 [3] - Kevin Lu分析互联网与AI的关键联系 [3] - METR指出AI编程的反直觉现象 [3] 资本动态 - Anthropic启动人才挽回计划 [3] - Meta收购PlayAI [3] - OpenAI收购Windsurf失败 [3] 行业事件 - Meta涉及人才挖角事件 [3] - Grok 4面临敏感问题处理挑战 [4] - OpenAI推迟开源模型计划 [4]
AI时代的教育之问Ⅶ:就业转型
腾讯研究院· 2025-07-18 16:18
核心观点 - AI尚未根本改变劳动力市场结构 但已重塑岗位风险分布 中间层岗位最易被替代 [3] - AI推动组织重心向思考能力和技术整合能力强的复合型人才转移 [3][6] - 企业更倾向提升现有岗位能力而非新增AI岗位 跨学科融合能力成为核心竞争力 [3][12] - 教育供给与就业需求存在结构性错位 需加强产教融合和跨学科培养 [22][30] 一、AI对就业市场的影响 - 某世界500强IT公司用AI替代HR职能 精简人员并实现绩效薪酬全自动化处理 [4] - 中间层岗位(流程管理/行政事务/基础分析)因知识复杂度适中面临最高替代风险 [5] - 高端技术岗位和底层劳动力市场目前受AI影响较小 [5] - 游戏行业面临AI生成内容质量不稳定问题 创意岗位仍需人工干预 [7] - 设计行业AI工具应用增加 但设计师群体接受度存在分化 [8][16] 二、岗位变迁与人才选育 - 数字化转型催生MES/ERP专员等复合型岗位 需兼具业务理解和系统思维 [11] - 半导体行业更重视技术人才深度面谈 AI未显著提升招聘效率 [12] - 广告行业AI生成内容用户接受度低 需保留人情味和情感连接 [13] - 服务行业AI应用场景有限 岗位优化多于新增 [14] - AI招聘工具经训练后判断准确率提升 但创意岗位评估仍存挑战 [16] 三、教育供给与就业需求 - 微电子/半导体行业应届生招聘聚焦技术岗位 需多年培养才能参与核心研发 [19] - 设计行业倾向招聘兼具设计与制成能力的跨学科人才 [21] - 广告行业创意岗位更看重市场洞察力而非技术能力 [22] - 理工科毕业生因专业弹性成为部分企业招聘主力 [3][19] 四、未来建议 - 高校应加强团队合作/抗压能力/价值观培养 政策支持校企共建实训基地 [24] - 建议高等教育分两阶段 前两年打基础后两年重实践 [26] - 需增加小组作业和项目式学习 强化情商与自我管理能力 [27] - 期待政策支持AI设备减税补贴 建立权威人才认证体系 [29] - 产学融合需政策引导 如实习补贴和研发费用加计扣除 [28]
大历史中的超能力|荐书
腾讯研究院· 2025-07-18 16:18
生物智能演化历程 - 犬齿兽作为哺乳动物祖先在2.6亿年前出现,凭借温血特性获得夜间活动优势,但面临食物短缺挑战[1] - 哺乳动物在1亿年前演化出新皮质,具备想象力和短期计划能力,形成"谋定后动"的生存策略[2][3] - 6600万年前小行星撞击事件导致恐龙灭绝,哺乳动物凭借体型优势和洞穴庇护实现生态位跃升[3] 大脑智能五次突破 - 第一次突破是5.5亿年前原始大脑的条件反射功能,仅需数百神经元即可实现利弊权衡和情感判断[4] - 第二次突破是脊椎动物强化学习系统,通过多巴胺机制量化目标价值并激发好奇心[4] - 第三次突破是哺乳动物新皮质带来的想象力和慢思考能力,实现系统2思维[5] - 第四次突破是灵长类心智理论能力,可模拟他人意图并发展政治行为,附带模仿学习和长期计划能力[6] - 第五次突破是人类语言系统,实现复杂知识传承和文明爆发[6] AI技术对应发展 - 强化学习使AI具备过程奖励机制,如AlphaZero通过棋步评估提升决策质量[5] - 大语言模型实现文本生成相当于想象功能,推理模型则体现系统2思维[5] - 截至2025年初AI在心智理论方面尚未成熟,智能体自我计划能力有待突破[6] - AI语言理解已超越简单语料背诵,能编码解码人类抽象规则[7] 家用机器人进化案例 - K1仅具备反射反应,K2通过强化学习实现试错优化[9] - K3搭载新皮质芯片获得数字孪生能力,可预判物理路径[9] - K4发展心智理论,能解读情感动机并调整行为策略[9] - K5将掌握语言沟通和抽象知识理解能力[9] 未来突破方向 - 第六次突破可能涉及人机结合,AI或率先实现跨模态感知和自我迭代[11] - 历史表明突变常引发链式反应,如光合作用导致大氧化事件和生物灭绝[12][13] - 陆地植物繁盛引发全球变冷,推动动物登陆进化[14] - 气候变迁促使人类大脑体积增大和社会协作强化[15]
腾讯研究院AI速递 20250718
腾讯研究院· 2025-07-17 22:12
谷歌DeepMind新架构MoR - MoR架构结合参数共享与自适应计算,以更少参数实现大模型性能[1] - 动态路由机制根据token复杂度分配递归深度,减少冗余计算并优化KV缓存[1] - 实验显示推理吞吐量最高提升2.06倍,训练时间减少19%,峰值内存下降25%[1] 亚马逊AI Agent全家桶 - Bedrock AgentCore预览版提供7大AI agents核心服务,包括运行时、记忆、身份验证等[2] - 推出Nova定制选项和Strands Agents V1.0,简化多agents协同开发[2] - Amazon S3 Vectors云对象存储降低90%向量存储成本,Kiro AI IDE优化开发者体验[2] 马斯克Grok AI伴侣生态 - Grok男性AI伴侣征名"Draven",形象参考《暮光之城》风格[3] - 开源3D数字伴侣"Bella"分三阶段演进:感知核心、生成式自我和主动式陪伴[3] - 计划加入语音识别和好感度系统,但当前仅保留美少女形象[3] 谷歌搜索AI通话功能 - AI代打电话可自动预约本地服务如宠物美容[4] - 集成Gemini 2.5 Pro模型和Deep Search功能处理复杂查询并生成深度报告[4] - 新功能已在美国上线并将逐步全球推广[4] Claude Sonnet 4回归Windsurf - Pro用户每月可享250次免费调用Claude Sonnet 4模型[6] - 模型具备跨文件智能重构、20万token上下文窗口和精准代码补全[6] - 合作回暖是Windsurf在OpenAI收购失败后的战略举措[6] Anthropic人才与业务动态 - 两周内挽回Claude Code核心负责人Boris Cherny和Cat Wu[7] - Claude Code周下载量增长6倍达300万次,贡献超2亿美元年化收入[7] - 直接销售模型毛利率60%,但通过AWS/谷歌云销售为负30%[7] CrePal AI视频创作Agent - 通过一句话指令自动调度多种模型完成视频制作全流程[8] - 系统自动规划脚本、生成画面、添加音效,整合分散工具为一体化方案[8] - 创新点在于改变创作流程,降低技术操作门槛[8] 苹果MLX框架适配CUDA - MLX框架新增CUDA支持,允许开发者用英伟达GPU训练后部署回苹果设备[8] - 苹果向拥有500万开发者的英伟达生态妥协[8] - 虽2018年停止对英伟达显卡支持,现出于合规和生态考量重新合作[8] 他山科技触觉传感技术 - 研发全球首款AI触觉感知芯片,基于电容层析成像技术[10] - 实现"感控一体"融合,服务国内70%以上机器人厂商[10] - 从硬件提供商转型为整体触觉解决方案提供商[10] AlphaFold与AI4Science前景 - AlphaFold通过统一框架实现蛋白质结构原子级精度,被引用35000次[11] - 算法研究价值是数据的100倍,推动结构生物学发展速度提升5-10%[11] - 预言AI4Science将更通用化,各科学领域应用遍地开花[11]