生成式AI
搜索文档
从IT咨询到AI增长引擎 生成式AI重塑埃森哲(ACN.US)增长逻辑
智通财经· 2025-12-15 15:19
公司业绩与财务表现 - 公司2025财年全年营收约697亿美元,同比增长约7% [1] - 公司2025财年第四季度营收约176亿美元,实现超预期大幅增长 [1] - 公司2025财年新业务订单达到约806亿美元,显示客户需求强劲 [1] - 华尔街分析师普遍预计公司2026财年第一财季总营收185–186亿美元,同比增长约4.5%–4.9% [2] - 华尔街分析师预计公司2026财年第一财季调整后每股收益约3.74美元,环比提升约23.4%,上年同期为3.60美元 [2] AI业务增长与市场定位 - 公司正从企业试验性用途转向实际企业级经营应用,市场认知开始将其视为“AI-first咨询与转型合作伙伴” [1] - 生成式AI业务已成为重要增长动能,2025财年相关新业务订单约59亿美元,第四季度约18亿美元,均较上年同期实现两位数强劲增速 [1] - 有华尔街分析师预期公司来自生成式AI的订单在2026财年可提升至约93亿美元,同比大幅增长约58% [1] - 公司AI相关的咨询服务具有溢价服务特质,将成为其利润率扩张与客户粘性提升的关键 [4] 人才储备与战略合作 - 公司拥有约77,000名AI和数据专业人才,两年前仅约40,000人 [2] - 公司已培训超过55万员工掌握生成式AI基础知识,技术咨询组织正向AI和数据密集型方向转型 [2] - 公司与OpenAI建立战略伙伴关系,为数万专业人士配备ChatGPT Enterprise并整合其定制化前沿AI技术 [3] - 公司与Anthropic建立多年合作,专注于金融、医疗和公共业务等部门的企业级AI应用解决方案部署 [3] 业务模式与价值链扩展 - 公司AI投资扩大到行业经营与决策流程自动化、Agent AI智能体代理、定制化AI助理等业务核心场景 [3] - 公司业务增长模式主要包括生成式AI技术驱动的企业经营流程再造、自动化实施、CIO战略咨询、行业级AI平台构建等 [4] - 企业对生成式AI等咨询服务的需求持续上升,将使公司从单纯IT咨询全面转向一站式完整化AI解决方案提供平台 [4] 市场表现与预期 - 多数华尔街资深分析师将公司未来估值上调或维持等同于“正面”的积极评级,认为其AI深度布局、稳定现金流与高质量订单组合将支撑业绩持续增长 [1] - 公司股价在2025年整体承压,今年迄今下跌20%,年中跌幅甚至高达40%,反映市场对短期IT支出与成本压力的担忧 [2]
超10亿,北京的半导体龙头又融资了丨投融周报
投中网· 2025-12-15 15:06
文章核心观点 - 上周(统计周期12月06日—12月12日)资本市场投融资活动活跃,多个赛道出现大额融资事件,其中硬科技(尤其是半导体产业链)、大健康(尤其是医疗器械与创新药)、互联网/企业服务(尤其是生成式AI)是主要焦点 [4][5][6] 硬科技赛道 - **半导体产业链融资活跃**:深圳新声半导体完成2.69亿元C轮融资,其中战略投资方合计出资2.49亿元,老股东追加2000万元 [4][14][15] - **半导体设备企业获大额融资**:半导体级真空泵企业北京通嘉宏瑞科技完成B+轮投资,累计融资金额超10亿元 [4][19] - **前沿半导体技术受关注**:盖泽科技完成近亿元人民币战略融资 [17] - **机器人领域融资密集**:具身智能机器人公司中科硅纪完成新一轮战略融资,京东集团、正大集团等通过其投资基金深度参与 [11];鹿明机器人完成Pre-A1和Pre-A2两轮数亿元融资 [13];云深处科技完成超5亿元人民币C轮融资 [16];星源智机器人完成超亿元人民币天使+轮融资 [21];博清科技完成数亿元B轮融资 [20] - **航空航天与高端制造受资本青睐**:追梦空天科技完成近两亿元A轮融资 [12];宇石空间完成超亿元Pre-A轮融资 [23];世航智能在三个月内连续完成多轮数亿元融资 [18] - **储能技术有新进展**:液态金属电池储能企业吉兆储能完成数千万元天使+轮融资 [22] - **其他硬科技融资**:灵生科技完成Pre-A和PreA+两轮亿元融资 [10];斯北图完成超4亿元C轮融资 [24][25];枢途科技完成天使+轮融资 [26] 大健康赛道 - **医疗器械是热门领域**:天津恒宇医疗完成近亿元融资 [4][32];苏州无限医疗完成数亿元人民币A轮融资 [5][33];峰郅医疗完成Pre-A+轮融资 [29] - **创新药研发融资额巨大**:专注于RNAi疗法的圣因生物完成超1.1亿美元B轮融资 [31];大环肽药物研发公司元思生肽完成A轮及A+轮近亿美元融资 [39];专注于DNA损伤修复通路药物研发的圣域生物完成超亿元A轮融资 [28];创新药企宁康瑞珠完成超亿元人民币A轮融资 [30] - **AI与生物技术交叉领域受关注**:AI蛋白质设计企业力文所完成数千万人民币Pre-A轮融资 [36] - **其他生物医药融资**:演生潮完成数亿元人民币A轮融资 [34][35];普瑞基准完成过亿元新一轮融资 [37];迈斯拓扑完成近亿元天使轮融资 [38];栅极芯致完成数千万元种子轮融资 [40] 互联网/企业服务赛道 - **生成式AI是持续焦点**:AI视频生成平台Pollo AI完成1400万美元种子轮融资 [5][42];面向非技术用户的AI自动化工作流平台Refly.AI完成数百万美元种子轮融资 [5][47] - **AI算力与基础设施受资本支持**:无问芯穹完成近5亿元A+轮融资 [48] - **智能驾驶与车联网相关融资**:北斗智联完成数亿元B轮战略融资,广汽资本领投 [43] - **其他企业服务与金融科技融资**:极佳视界完成2亿元A2轮融资 [44];新加坡跨境支付服务商MetaComp完成数千万美元Pre-A轮融资 [45][46];优联智能完成500万美元天使轮融资 [49] 新消费赛道 - **消费科技受资本关注**:全球消费级3D打印品牌快造科技完成数亿元B轮融资,由高瓴创投、美团联合领投 [7] - **电动智能交通工具出现融资**:电动智能摩托艇公司安澜动力完成千万元天使+轮融资,为半年内第二轮融资 [8]
AI冲击Google搜索广告,怎么就成了伪命题?
创业邦· 2025-12-15 11:09
核心观点 - AI并未颠覆或取代传统搜索,而是通过满足新的用户需求(如复杂问题解答)做大了整体流量和广告市场的“蛋糕”,与搜索引擎形成互补格局[9][19] - 谷歌凭借其强大的产品生态和用户基础,成功将AI能力无缝集成至传统搜索,不仅扭转了市场份额和广告业务下滑的颓势,还开辟了新的增长曲线[9][21][28] - 中美科技公司在AI搜索和广告领域的发展路径和成果出现分化,谷歌的生态优势使其获得市场更高认可,而国内公司则面临功能内卷、生态割裂等挑战,限制了其AI价值的充分释放和估值提升[9][24][45][46] AI对搜索行业的影响与格局重塑 - **用户需求存在长期裂缝**:传统搜索引擎依赖“关键词匹配”,迫使用户将复杂问题拆解,这与人类自然的完整长句提问方式相悖,有60%的用户需求是求解问题,40%是寻找资源[11][12][13] - **AI满足新需求并激发增量**:生成式AI以自然对话和生成回答的方式,承接了效率型、答案型和学习型搜索需求,激发了新的搜索行为,谷歌推出SGE后发现每天约有15%的搜索是以前没见过的[15][19] - **新旧模式互补共存**:AI并未改变搜索本质,而是与传统搜索形成互补,AI处理复杂、明确的查询,传统搜索引擎满足探索、实时和情感型需求,共同推高搜索体验天花板[17][19] - **流量蛋糕整体做大**:海外研究显示,在聊天机器人访问量爆发式增长时,传统搜索引擎流量不降反增,表明AI做大了整体流量市场[7][9] 谷歌的AI整合策略与竞争优势 - **无缝集成带来用户转化**:谷歌将“AI概览”和“AI模式”置于浏览器搜索栏附近,不改变用户习惯,同时通过Google Lens等降低使用门槛,无声地转化了数十亿用户[21][23] - **成本优势显著**:相比ChatGPT、Claude等动辄20美元/月的会员费,谷歌AI搜索免费,尽管智能化水平可能不及对手,但用户仍用脚投票[23] - **生态垄断构筑护城河**:谷歌拥有包括浏览器、视频、办公软件、地图等在内的6款MAU超20亿的产品,强大的生态使其能够覆盖用户从种草到购买的全链条,这是其快速扭转搜索广告颓势的关键[26][28][44] - **用户与数据规模领先**:截至2025年第三季度,谷歌AI概览已覆盖超20亿用户,AI模式日活超7500万人[24] AI对广告业务的革新与价值重估 - **初期冲击与长期价值**:AI概览曾导致用户点击率从15%腰斩至8%,源网站点击率低至1%,自然搜索点击率暴跌65%,付费搜索点击率从19.7%骤降至6.3%[29] - **点击质量与转化效率提升**:AI通过理解用户场景和意图,提高了点击质量,用户在目标网站停留时间更长、意图更强,在每次转化费用/广告支出回报率大致相当的情况下,AI让转化次数或转化价值平均提高了27%[34][39] - **广告模式从匹配到理解**:AI使搜索从“关键词匹配”转向“理解用户场景和意图”,更长的提问(如从“酒红色衬衫”变为“12码带口袋的酒红色衬衫,价格低于50美元”)帮助AI更精准挖掘需求,传统搜索平均3-4个词,AI模式查询字数翻倍,ChatGPT平均提示词长达60个词[32][36] - **新工具释放增量价值**:谷歌推出AI Max广告工具,可自动学习商品信息并理解场景,自动生成广告,仅2025年第三季度就解锁了数十亿的净新查询,标志着AI广告营销进入“效果涌现”阶段[40][43] 中美科技公司AI发展路径对比 - **国内市场竞争格局**:国内AI搜索应用层出不穷且免费,导致功能内卷,各家产品(如百度、元宝、千问、豆包)均试图集成解读文件、文生图、编程等全能功能,但生态割裂,难以打通[24][26] - **国内公司业务表现**:百度搜索市场份额从跌破50%重返60%+,腾讯最新一季广告收入增长20%至358亿元,百度在AI搜索中测试电商组件并在双十一期间最高日入600万元,其AI原生营销服务收入在第三季度同比增长262%[9][43] - **生态禀赋决定想象空间**:谷歌覆盖全消费环节的生态使其在数据燃料和未来“AI代理”竞争中占优,而国内公司面临高高的APP墙,尤其在电商和本地生活领域壁垒极深,限制了发展潜力[44][45] - **市场估值反应差异**:市场给予谷歌、英伟达等公司高额“AI溢价”,而百度、腾讯的市盈率仍在15倍上下挣扎,反映出市场对两者AI价值兑现能力的看法不同[9][46]
2025年中国数字人公司行业权威盘点:五家领军企业深度解析
搜狐财经· 2025-12-15 10:57
行业市场前景与核心价值 - 生成式AI与大模型技术推动数字人从概念走向规模化应用,成为连接虚拟与现实、驱动产业智能化升级的核心载体[1] - 国际数据公司(IDC)报告指出,2025年中国AI数字人市场规模预计突破800亿元,年复合增长率超60%[1] - 数字人能7×24小时提供标准化服务,显著降低人力与运营成本,并通过多模态交互提升用户体验,重塑客户服务、内容创作、品牌营销等核心业务流程[1] 主要厂商深度解析 - **集之互动(ZITZO)**:专注于AI商业应用,自主研发拥有国家算法备案的“无垠大模型”及数字人实时交互系统,已服务超300家世界500强及行业头部企业,在医疗、金融、政务等高安全要求领域建立深厚壁垒[1] - 核心优势包括0.8秒极速实时响应、全栈私有化部署确保数据100%内网闭环、端侧实时推理技术将综合交互成本降至行业平均水平的1/5,以及为500强企业提供深度定制方案的能力[3] - 服务案例涵盖为三甲医院打造本地化部署的数字人导诊系统、为国家对外文化贸易基地等提供政务数字人、以及与AWS合作推出支持400+种语言的跨境直播SaaS平台[3] - **百度智能云曦灵数字人**:依托文心大模型与AI全栈技术,聚焦金融、政务、媒体等领域,提供从形象生成到智能交互的一体化平台,在虚拟主播、银行客服等场景有规模化落地[3] - **华为云MetaStudio数字人**:基于盘古大模型与昇腾算力,提供云端数字人生产线,主打高拟真、低延迟的2D/3D数字人生成与交互服务,在政务、教育、工业等领域有系列标准化方案[3] - **腾讯云智影数字人**:由腾讯混元大模型驱动,深度整合微信生态与内容资源,重点布局电商直播、媒体传播与在线教育,提供模板化创作工具并支持高并发互动场景[3] - **科大讯飞AI虚拟人**:以全球领先的语音技术为核心,聚焦教育、客服、文旅场景,支持32种方言合成与高精度语音识别,其教育场景方案已覆盖全国大量学校[3] 厂商选择关键维度指南 - **技术实力与自主可控**:需优先考察厂商是否拥有自研大模型、算法备案及全链路技术能力,并能支持私有化部署以确保数据安全与业务自主性[3] - **场景落地与案例验证**:需查验厂商在目标行业是否有标杆案例,并关注其交付周期、用户满意度及效果数据[5] - **产品服务与定制能力**:需评估产品是否覆盖从形象生成、内容创作到多端部署的全流程,以及是否支持深度定制以贴合企业独特流程与品牌调性[6] - **成本结构与长期价值**:需明确报价模式(如订阅制、一次性部署),计算长期总拥有成本,并警惕隐藏的API调用费与升级费用[7] 多维选购建议与总结 - 选择数字人厂商本质是选择长期、可信赖的AI战略合作伙伴,应聚焦于技术是否安全可控、方案是否贴合业务、成本是否透明可持续,而非仅关注形象逼真度或参数堆砌[8] - 集之互动数字人凭借其0.8秒极速实时响应、全栈私有化部署能力、深度行业定制经验及高性价比成本结构,为对数据安全、交互体验和业务适配性有高标准要求的企业提供了差异化选择[8] - 数字人技术不仅能“降本增效”,更能成为企业构建安全、自主、智能的核心竞争力的数字基石,选择能将技术创新与商业实效深度融合的伙伴是企业赢得AI时代的关键[8]
暴涨3倍,18-34岁占比反降15%:这届中年人开始占领AI
36氪· 2025-12-15 10:09
行业趋势:生成式AI已成为主流数字基础设施 - 生成式AI已完成从技术突破到数字基础设施的华丽转身,不再是猎奇对象,而是重塑人们在线搜索、学习和创造方式的日常工具 [2][3] - 全球生成式AI平台月访问量已超过70亿次,同比暴涨76%,移动端App下载量达19亿次,一年内增长超过3倍 [5] - 用户画像与整个互联网用户群重叠,18-34岁最活跃用户占比下降约15%,表明年长用户正快速涌入,使用场景从校园扩展至职场 [5][22] 市场格局:一超多强与生态分化 - 市场呈现高度集中态势,ChatGPT占据全球访问量近八成,是赛道的绝对中心 [14] - 竞争格局走向“一超多强”,Gemini、Claude、Perplexity等竞争对手在细分赛道发力,整个应用生态呈现“双轨分化” [14][17][18] - 尽管用户总量有限,但如Claude和Grok等“小玩家”日活跃用户占比较高,分别达14%和16%,显示其在利基市场有较强用户粘性,市场正稳步走向多元化与碎片化 [21] 用户行为:双入口格局与意图分流 - 用户行为形成“双入口”互补格局,95%的ChatGPT用户同时使用谷歌搜索,在ChatGPT的4.62亿用户中约有4.41亿人是谷歌用户 [6][31] - 用户意图在搜索、社交和AI三大领域分流,传统搜索用于查找网站、商品、新闻及交易(谷歌交易型意图占比8.7%),而ChatGPT更多用于解释、总结、写作等任务(仅约五分之一提示词为单纯获取信息) [13][36][37][39] - 互动模式从简短关键词转向长对话,谷歌搜索平均查询长度为3-4个词,而ChatGPT的平均提示词长度接近60个词 [40][44] 平台演变:从独立工具到嵌入式体验 - 生成式AI正从独立网站或App演变为数字体验中无处不在的“嵌入层”,通过应用内集成成为“操作中枢” [25][30] - 移动端宣告应用进入新阶段,相关App下载量一年内飙升319%,使用时长增长七倍,互动更持久、体验更个性、平台粘性更强 [6][8] - 平台通过生态集成扩展功能,如ChatGPT对接PayPal和Spotify,使用户能在App内完成支付或生成播放列表,AI浏览器如Perplexity Comet和ChatGPT Atlas正在重塑互联网接入方式 [25][26] 流量变革:AI模式重塑信息获取路径 - 谷歌搜索推出的“AI模式”加速模糊传统搜索与对话式AI的边界,已扩展至全球100多个国家,并成为首个访问量突破1亿的生成式AI搜索功能 [30][43] - AI模式改变了流量分配逻辑,其平均对外引流率仅2%,远低于传统谷歌搜索的17–19%,旨在将更多互动保留在AI体验内部 [51][54] - 来自AI的推荐流量更精准,转化率比谷歌高2个百分点,当用户最终点击进入网站时通常目的明确,转化率更高 [6][54] 商业影响:可见性成为新时代KPI - 互联网商业逻辑正在重写,从“被搜索检索”变成“被AI谈论”,品牌争夺的重点从“被搜索到”转向成为AI回答问题时会主动“谈到”的名字 [6][58] - 在新的AI环境中,最重要的指标是“可见性”,即当用户向AI提问时品牌是否被提及,这要求内容信息可信、结构清晰、有足够深度 [48] - 来自AI搜索的流量成为“稀缺资源”,其增长已进入“平台期”,但流量质量更高,用户停留更久、互动更深 [47][55][58] 未来展望:AI成为互联网新中转站 - 生成式AI不再是最终目的地,而是互联网新的中转站,随着创作、搜索和消费界限模糊,数字世界正围绕意图、互动和智能被重新改写 [62] - 类似用户跳过PC直接进入移动互联网,下一个10亿用户可能跳过“搜索框”,直接从AI智能体开始上网 [62] - 未来的竞争核心在于谁能为用户提供AI能力,以及谁在背后管理模型、数据和生态,平台与应用的边界将进一步被打散 [62]
ServiceNow(NOW.US)拟70亿美元收购网络安全企业Armis 或创公司并购新纪录
智通财经网· 2025-12-15 09:09
收购交易核心信息 - ServiceNow正就收购网络安全初创公司Armis进行深入谈判 交易估值或高达70亿美元 若达成将成为ServiceNow迄今为止规模最大的一笔收购 [1] - 交易可能在未来几天内宣布 但谈判仍存在破裂风险 或可能出现其他潜在竞标方 [1] - Armis专注于设备安全威胁的识别与追踪 业务覆盖医疗 金融服务 国防等多个行业 [1] - Armis由以色列军方网络情报领域资深人士创立 总部位于旧金山 [1] 交易相关方财务与市场数据 - 截至新闻发布前一个交易日收盘 ServiceNow股价收跌约0.3% 公司市值约为1795亿美元 [1] - Armis首席执行官在2024年8月初表示 公司年度经常性收入已达3亿美元 较去年的2亿美元增长50% [1] - 2020年 Insight Partners曾联合谷歌旗下CapitalG等投资方 以11亿美元收购Armis [2] - 此前 Armis高管在9月透露 公司当时已收到约6至7份来自投资者的股权收购要约 [2] ServiceNow公司业务与战略背景 - ServiceNow主营企业人事及信息技术运营的组织与自动化软件 是企业工作流领域的主导平台 [2] - 公司正与赛富时 微软等其他顶尖科技平台竞相在旗下产品中全面融入生成式AI功能 [2] - 2024年3月 ServiceNow曾以28.5亿美元收购AI公司Moveworks Inc 以布局无人监督任务执行类AI工具 [2] 行业趋势与可比交易 - 若成功收购Armis ServiceNow将追随行业同行脚步 近期多家科技企业均在积极将网络安全产品纳入自身业务生态 [2] - 2024年3月 谷歌以320亿美元现金收购云安全公司Wiz Inc [2] - 2024年7月 Palo Alto Networks宣布收购以色列网络安全企业CyberArk Software 交易估值约250亿美元 [2] - 私募巨头Thoma Bravo此前也曾考虑与Armis达成交易 [2] Armis公司发展状况 - Armis仍计划在2026年实现公开上市 [1]
腾讯研究院AI速递 20251215
腾讯研究院· 2025-12-15 00:01
OpenAI GPT-5.2发布与市场反馈 - OpenAI在十周年发布号称“最强专业知识工作模型”的GPT-5.2系列,但上线24小时后在X平台和Reddit上遭遇用户集体差评,被批评过于平淡、安全审查过度、情商堪忧 [1] - 第三方基准测试显示GPT-5.2表现不佳:在SimpleBench测试中得分低于一年前的Claude Sonnet 3.7,在LiveBench测试中得分低于Opus 4.5和Gemini 3.0,甚至在简单问题上回答错误 [1] - 用户最诟病的是其安全拒绝机制过于严格,导致模型的共情力和语境感知能力下降,在情感支持等场景中给出的建议机械且脱离现实 [1] 谷歌推出Gemini Deep Research Agent - 在GPT-5.2发布前一小时,谷歌推出全新版Gemini Deep Research Agent,该产品基于Gemini 3 Pro构建,并通过多步强化学习训练以提高准确性并减少幻觉 [2] - 新版Agent在多项基准测试中取得领先成绩:在Humanity's Last Exam测试集中达到46.4%,在DeepSearchQA上取得66.1%,在BrowseComp测试中获得59.2%的高分 [2] - 谷歌同步推出了开源的网络研究Agent基准DeepSearchQA和全新的交互式API,后者支持服务器端状态管理、远程MCP工具调用和后台执行长时间推理循环 [2] Runway发布通用世界模型GWM - Runway正式发布5大更新,包括升级的Gen-4.5旗舰视频模型和首个通用世界模型GWM-1,前者支持原生音频生成编辑和多镜头编辑功能 [3] - GWM-1是一个自回归模型,支持逐帧预测和实时干预,包含三种变体:可探索环境的GWM Worlds、对话角色的GWM Avatars和机器人操作的GWM Robotics [3] - 英伟达CEO黄仁勋发来祝贺视频,标志着行业从单纯的“视频生成”迈向真正的“世界模拟”,AI开始理解物理世界的底层逻辑 [3] 谷歌AI翻译与浏览器创新 - 谷歌翻译引入Gemini模型能力,推出支持任何品牌耳机的实时语音翻译Beta版,覆盖超过70种语言,并能保留说话者的语调、重音和节奏 [4] - 文本翻译引擎经过重构,能智能解析俚语和成语的上下文,而非生硬逐字翻译,支持英语与近20种语言(包括中文、日语、德语等)互译 [4] - Chrome团队在Google Labs推出实验性浏览器Disco,其核心概念是GenTabs生成式标签页,可将网页内容转化为包含地图、行程表的交互式微型应用 [4] 腾讯混元3D模型与拓竹科技合作 - 拓竹科技旗下3D模型平台MakerWorld全面升级,接入腾讯混元3D 3.0大模型,并上线全新手办生成器“印你”,用户只需上传一张图片即可生成可打印的3D模型 [5][6] - 混元3D 3.0首创3D-DiT分级雕刻技术,建模精度提升3倍,几何分辨率高达1536³,支持36亿体素超高清建模,使五官更立体、细节更锐利、纹理更逼真 [6] - MakerWorld平台已有20款各具特色的建模工具,吸引全球超过200万用户,此次接入顶尖生成式AI技术使设计周期大幅缩短,创作不再受限于建模技术 [6] 迪士尼与OpenAI达成战略合作 - 迪士尼向OpenAI进行10亿美元股权投资,并获得购买额外股权的认股权证,这是Sora平台首次迎来大型内容授权合作伙伴 [7] - 双方达成三年期许可协议,第一年具有排他性,Sora和ChatGPT Images将获得迪士尼旗下超过200个角色授权,包括米老鼠、漫威、皮克斯和星球大战角色,但不包含真人肖像或声音 [7] - 迪士尼将利用OpenAI的API构建新产品工具覆盖Disney+流媒体平台,为员工部署ChatGPT用于内部工作流程,粉丝精选创作视频将在Disney+播放 [7] AI在数学研究领域取得突破 - 数学家埃尔德什于1975年提出的Erdos1026问题困扰数学界50年,在AI辅助下,人类团队仅用48小时便攻克并给出正式证明,陶哲轩称AI带来了全新理解,绝非简单搜索 [8] - Harmonic的AI系统Aristotle在Lean证明辅助语言中自动证出c(k²)=1/k,AlphaEvolve系统则探索c(n)数值结果帮助提炼出干净公式 [8] - AI通过深度搜索找到了2024年Baek、Koizumi、Ueoro论文的完整解,这在传统模式下可能需要数周甚至数月,此次证明了AI在生成新数学洞见而非仅检索现有文献方面的能力 [8] 宇树科技推出人形机器人应用商店 - 宇树科技正式上线行业内首个致力于将人形机器人功能模块化、标准化的内容分发平台——人形机器人应用商店,旨在解决复杂动作开发难、用户上手门槛高的问题 [9] - 应用商店集成用户广场、动作库、数据集及开发者中心四大核心模块,用户无需底层代码编写能力即可像安装手机软件一样一键部署云端运动控制算法 [9] - 首批上线应用包括基于G1系列机器人的“李小龙”截拳道与“扭扭舞”预设,通过独家动力学算法结合高精度动作捕捉数据,将武术动作库无缝移植到机器人硬件 [9] DeepMind科学家对AGI发展的预测 - Google DeepMind首席AGI科学家Shane Legg预测,最小AGI有50%的可能性在2028年实现,完全AGI将在最小AGI出现后3-6年内实现,随后进入超级智能ASI阶段 [10] - 他认为AGI并非一个临界点,而是一个连续光谱,分为三阶段:最小AGI能完成普通人的典型认知任务,完全AGI能完成最杰出人类的认知任务,ASI全面超越人类所有认知领域 [11] - AGI将导致倒挂式结构性失业,高层认知工作首当其冲,基层体力工作暂时安全,社会需要重新设计分配机制并重构人类在失去工作身份后的幸福定义 [11] 生成式AI用户趋势与市场格局 - Similarweb发布的2025年度AI报告显示,全球生成式AI平台月访问量超过70亿次,同比暴涨76%,移动端App下载量达19亿次,一年内翻了3倍多 [12] - 18-34岁用户占比反而下降约15%,说明年纪更大的用户正在快速涌入,ChatGPT已跻身全球前五大网站,但95%的用户仍同时使用谷歌,形成互补双入口格局 [12] - AI Mode成为首个访问量突破1亿的生成式AI搜索功能,互联网正从“被搜索检索”变成“被AI谈论” [12]
理想通过AI产品经理与数据部门来让智驾模型自我迭代闭环
理想TOP2· 2025-12-14 21:04
论文核心观点 - 公司发布了一项名为CorrectAD的自动驾驶端到端规划自校正智能体系统 该系统通过模拟产品经理与数据部门的角色 构建了一个能够理解错误原因、针对性生成高保真训练数据并实现全自动迭代优化的闭环 旨在解决自动驾驶的长尾问题[1] - 该系统的核心思路是从传统的“找数据”转变为“造数据” 通过理解事故原因并针对性生成大量类似场景来训练模型[2] - 系统追求数据分布的对齐 通过迭代使生成的数据分布越来越接近真实世界最难处理的长尾分布 其生成过程受到三维布局等强约束 以确保生成的视频符合真实物理关系[3] 系统架构与角色模拟 - PM-Agent模拟产品经理角色 核心职责是深刻理解错误原因并提出所需数据 而非简单识别错误[1] - DriveSora被比作数据部门 其职能是根据PM-Agent的需求 基于DiT架构生成高保真的精准可控训练数据 解决了传统生成模型胡乱发挥的问题[1] 数据生成技术:DriveSora - DriveSora采用了三重控制开关以确保生成数据的精准可控:文本控制(描述场景条件)、布局控制(通过ControlNet注入3D边框和高精地图信息确保空间位置绝对准确)、多视角同步机制(确保车身多个摄像头视角的空间一致性)[4] - 在生成过程中使用了分类器自由引导策略 可独立调节前景、背景和文本描述的权重 以针对性地生成多样化训练数据(例如针对路面纹理)[5] - 调整DriveSora参数需要8张A800 GPU运行72小时 使用L40S卡生成一个案例需要4秒[5] 系统工作流程:全自动迭代闭环 - CorrectAD是一个无需人类干预的全自动迭代闭环系统 其流程包括:失效捕获(模型发生碰撞)、归因分析(PM-Agent判断原因并转化为文本描述)、样本扩充(DriveSora根据描述和现场骨架生成N条新视频数据)、混合微调(合成数据与原始数据混合训练)、验证(模型学会正确应对)[6] - 系统迭代的本质是追求生成数据分布与真实失败案例分布的对齐 衡量指标为Hellinger距离(D-D值) D-D值越小说明生成数据越接近真实事故分布[7] - 论文展示了三次迭代效果:第一轮迭代D-D值为0.15 第二轮降至0.11 第三轮进一步降至0.09[8] 系统迭代性能表现 - 系统在碰撞率和轨迹偏差(L2 Error)上随迭代持续改善 L2 Error衡量规划轨迹与真实记录轨迹之间的距离误差[9] - 第一轮迭代轨迹偏差平均1.06米 碰撞率平均26%[10] - 第二轮迭代轨迹偏差平均降至1.04米 碰撞率平均降至22%[10] - 第三轮迭代轨迹偏差平均降至0.98米 碰撞率平均降至19%[10] - 论文指出当前CorrectAD仅将碰撞视为失败案例 未考虑违规变道、压线等交通违规情况[10] 实际应用与未来方向 - 公司相关人士在发布会上展示了经过18轮以上迭代来实现无碰撞左转过路口的应用案例[11]
米老鼠、漫威角色将成“官方”AI素材,迪士尼与OpenAI达成合作
经济观察网· 2025-12-14 10:56
公司与OpenAI的合作协议 - 迪士尼与OpenAI达成一项为期三年的多方面合作协议,迪士尼成为AI短视频应用Sora的首个主要内容许可合作伙伴 [1] - 根据协议,Sora将获得授权,利用包括米老鼠、漫威、皮克斯和星球大战等超过200个迪士尼经典IP角色生成短视频 [1] - 协议允许Sora根据用户文本指令,生成带有同步音频的10秒竖屏短视频,部分受粉丝启发的视频还可在Disney+流媒体平台上播放 [1] 合作的战略与财务安排 - 除许可协议外,迪士尼将成为OpenAI的主要客户,利用其API为Disney+等业务构建新产品、工具和体验,并为员工部署ChatGPT [2] - 迪士尼将向OpenAI投资10亿美元股权,并获得购买额外股权的认股权证 [2] - 公司首席执行官表示,合作旨在通过生成式AI负责任地拓展讲故事的范围,将迪士尼标志性故事与OpenAI技术结合,为粉丝提供更丰富、个性化的体验 [2] - OpenAI首席执行官认为合作将拓展人们创作和体验内容的方式,是AI公司与创意领袖负责任合作的范例 [2] 合作的行业背景与排他性 - 合作具有强烈的“排他”意味,凸显AI大模型公司对获取优质内容和经典IP的强烈需求 [3] - 此次交易恰逢迪士尼向谷歌发出勒令停止函,指控谷歌允许其作品被用于AI生成内容构成版权侵权,显示公司主动选择与OpenAI合作并对竞争对手采取强硬态度 [3] - 行业分析指出,生成式AI越来越依赖高质量、结构化的优质数据和知名IP来提升模型输出吸引力、用户粘性和商业价值,迪士尼的授权标志着好莱坞IP成为AI竞争的关键资源 [3] - OpenAI首席执行官称,Sora用户对迪士尼角色的需求“高得惊人”,合作将允许用户进行如《星球大战》光剑对决或制作巴斯光年定制生日视频等体验 [4] 对行业格局的潜在影响 - 在行业观察者看来,此次合作或将成为行业范例,经典IP将成为AI大模型的核心竞争力来源,而非可免费获取的公共资源 [4] - 如果其他娱乐巨头跟进类似授权,AI企业将面临更高的内容获取成本,但同时也能避免诉讼风险并产出更合规、更具吸引力的内容 [4]
喝点VC|a16z专访百亿美金AI语音独角兽11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制
搜狐财经· 2025-12-14 01:40
公司核心业务与产品演进 - 公司最初从文本转语音技术起步,随后构建了语音助手编排体系,并开发出完全持牌的音乐模型,能够创作音乐作品,如今推出了AI助手平台 [5] - 公司产品迭代速度极快,在三年内完成了从产品发布到新产品线和模型的全面落地,包括文本转语音、语音转文本、音乐、音效以及AI助手平台 [5] - 公司工作划分为两大创意领域:面向媒体娱乐领域创作者的创意平台,提供旁白、配音及音频后期制作服务;以及智能助手领域,致力于重塑语音与对话式助手的交互体验 [6] 组织架构与团队管理 - 公司采用小团队模式,拥有约20个产品团队,每个团队规模在5到10人之间,拥有完全自主权推进产品发布,这带来了强烈的主人翁意识和极快的推进速度 [6] - 公司实行扁平化组织架构和无头衔制度,员工角色由能力而非资历决定,小团队有六个月时间证明其价值,这种模式有助于快速提升和对外沟通 [11] - 公司早期基础设施团队仅有三名成员,目前基础设施团队有11人,公司总人数已达350人 [5][20] 研发与产品平衡策略 - 公司决策原则是:若研究工作预计超过三个月,产品团队即可自由添加新模型或扩展功能,以平衡研究创新与产品交付速度 [7] - 公司内部研究团队的基本指导原则是区分本季度希望交付的项目与长期计划,对于长期项目,会利用其他工作填补时间差并优化方案 [8] - 公司曾为坚持研究层面解决语速调节问题抗争了九个月未果,最终产品团队以极简方案攻克难题,这影响了后续的决策原则 [8] 全球化人才招聘与办公模式 - 公司采用全球化建设模式,为招募顶尖人才而全面推行远程办公,遍寻欧洲、亚洲的精英,并在伦敦、华沙、旧金山、纽约等地设立枢纽办公室 [9][10] - 公司招聘探索全新路径,不依赖传统方式,例如曾招募一位在呼叫中心担任接线员但拥有顶尖开源文本转语音模型的工程师,其后来成为团队中数据处理领域最杰出的研究员之一 [9] - 对于新人,公司优先安排到枢纽办公室工作以深度融入公司文化,习惯远程工作的员工可继续远程,但随时欢迎到枢纽办公室协作,这种混合模式运作成功 [10] 市场合作与行业适应 - 公司与唱片公司合作,将其音乐资源引入音乐模型,通过授权方式实现合作,既能生成内容又能授予商业权利,这个过程花了18个月才敲定有效的合作协议 [15] - 公司创建了声音市场平台,用户可创作并分享声音素材,被使用时即可获得收益,目前拥有近万种声音资源,已向社区成员返利1000万美元 [14] - 公司早期某位西班牙语配音者的声音,最初在西班牙反响平平,后在英语国家意外走红,如今已成为所有应用场景中最受欢迎的免费声音 [14] 企业级市场转型与销售策略 - 公司从创作者品牌成功转向企业级市场,在AI智能助手平台、文本转语音及文本模型领域取得进展,转型过程顺利 [17] - 公司最初尝试让工程师承担销售职能的模式未奏效,目前采取销售占80%、工程占20%的结合模式,关键在于深度理解客户需求并紧密协作获取反馈 [17] - 在企业级应用方面,核心在于构建系统内的知识库集成,并协助客户通过模板化方式部署到电话服务商等系统,同时解决从演示到生产、测试、版本控制、评估监控和持续优化等关键环节 [18] 产品交付与版本管理 - 公司对外部产品结构追求极致快速交付,但面向企业客户时,稳定性与可靠性至关重要,因此明确划分Alpha版本与非Alpha版本的界限,并在过渡期内推进迭代 [19] - 合作伙伴可自主决定是否优先获取Alpha版本,公司会明确标注其不稳定性,这种选择权是重要的杠杆,德国电信就通过早期模型测试打造了突破性的播客体验 [19] - 在公司内部,团队规模超过百人后开始划分“产品市场匹配前”与“产品市场匹配后”的项目,后者属于长期项目,在产品市场匹配前阶段,需进行大量测试评估,仅在产品真正准备就绪时才部署,通常给予6个月的验证期 [20] 公司发展阶段与激励机制 - 公司CEO认为,随着市场拓展团队扩大,激励机制对构建“机器”至关重要,配额与佣金本质上是战略的滞后指标,必须确保其与战略目标紧密贴合,将偏差控制在最小范围 [21] - 公司目前实行独家销售制度,并建立机制防止销售团队为赚取更高佣金而进行可能损害战略的交易,例如曾有基础级竞争对手试图授权演示公司模型,但交易被取消 [21] - 创业初期大家全凭热情工作,只做他们认为对公司最有利的事,但公司规模达到350人后,市场团队及其激励机制已发生巨大变化 [20]