生成式AI
搜索文档
“GPT-6”或三个月内亮相?奥特曼亲口承认:9亿用户难敌谷歌“致命一击”,1.4 万亿美元砸向算力
AI前线· 2025-12-20 10:01
公司核心战略与竞争态势 - 公司认为谷歌是其最大的威胁之一,若谷歌在2023年认真对待AI竞争,公司可能已被“击碎” [2] - 公司的核心战略并非在谷歌擅长的领域(如将AI嵌入现有产品)正面竞争,而是致力于构建全新的“AI原生软件”,从根本上改变软件使用方式 [2] - 公司通过打造完整的产品体系、增强用户粘性(如个性化、记忆功能)来巩固市场地位,其ChatGPT用户数已达8亿,并可能接近9亿 [3][8] - 公司启动“红色警报”以应对竞争威胁(如DeepSeek、Gemini 3),但认为此类状态通常持续6-8周,且Gemini 3的实际影响小于预期 [6] - 公司预计未来每年可能启动一至两次“红色警报”,以确保持续领先,并相信其聊天机器人产品的领先优势将随时间扩大而非缩小 [7] 产品演进与用户粘性 - 公司认为当前的文本聊天界面(ChatGPT)是通用且成功的,但低估了其持久力;未来界面应更具交互性,能为不同任务生成不同界面,并变得更加主动 [15][16] - 个性化与记忆功能是增强用户粘性的关键,公司计划持续加码;未来的记忆能力可能达到记住用户一生所有细节的深度,从而提供极强的个性化体验 [9][17] - 公司观察到有大量用户希望与AI建立深度连接、陪伴感甚至亲密关系,公司将给予用户较大自由度进行调节,但会设定某些底线(如不鼓励排他性恋爱关系) [18][19][20] - 公司将用户粘性类比为牙膏品牌选择,一旦用户形成依赖便难以改变 [3][10] 企业市场战略与商业化路径 - 公司明年的重大优先事项之一是发展企业业务,目前企业用户已超过100万,且企业业务(包括API)的增长速度在2024年已超过消费者业务 [24][27] - 公司的商业化策略是“消费者优先”,认为在消费者市场的胜利会让企业市场的胜利变得更容易,目前技术与企业需求均已准备就绪 [27][28] - 公司计划为企业提供一体化的“AI平台”,打包token购买、agent运行和数据托管需求,而非成为第二个AWS或Azure [3][64] - 公司预计在2026年可能再次无法满足企业对token的需求,表明企业需求旺盛 [64] 模型能力进展与影响评估 - 根据公司内部评测,GPT-5.2 Pro在知识工作任务上以74.1%的比例“赢过或打平”人类专家,能处理约60%的专家级任务 [30] - 模型能力的“悬空空间”巨大,即模型能做的远比当前被实际应用的多;改变工作流程和习惯所需的时间比预期更长,这延缓了价值实现 [56][60] - 公司最兴奋的垂直领域包括金融科学和客户支持;GPT-5.2在数学研究社区已获得积极反馈,预示着AI辅助科学发现的潜力 [29][43] - 公司认为最前沿的模型将创造最大的经济价值,并计划始终保持领先;GPT-5.2被认为是目前世界上最强的推理模型 [9] 基础设施投入与财务展望 - 公司获得了约1.4万亿美元的投入承诺用于建设AI基础设施,并计划持续大规模投入算力 [39][44] - 算力是公司增长的关键约束,收入增长与算力规模紧密相关;公司称若当前拥有双倍算力,收入也会是双倍 [45][46] - 公司预计通过推理收入最终覆盖高昂的训练成本来实现盈利;若停止激进投入,公司可能更早盈利 [48][49] - 公司收入增长曲线陡峭,2024年收入轨迹可能达到200亿美元,但市场对其长期投入与收入匹配存在疑虑 [49] 未来发展方向与重要更新 - 公司计划在2025年第一季度发布相对于GPT-5.2有显著提升的新模型,但未明确称之为GPT-6;提升将同时面向企业和消费者,但侧重点不同 [36][37] - 公司正在开发一系列消费级设备(如无屏幕手机),认为现有设备形态并非承载未来主动、情景感知式AI的最优方式 [62][63] - 公司对人机协作推动科学发现充满信心,预计明年(2025年)会出现小发现,五年内出现重大发现 [65][66] - 公司对IPO持复杂态度,认为成为上市公司有其必要性(如融资需求),但CEO个人对担任上市公司CEO的期待为“0%” [68][69] 对AGI与超级智能的看法 - 公司认为当前模型在原始算力上已非常聪明,但缺乏持续自主学习能力(如幼儿所具备的);关于当前模型是否已是AGI(通用人工智能)尚无明确定论 [70] - 公司提议将关注点转向“超级智能”,并提供一个候选定义:一个系统在担任总统、管理大公司或运行大型科研机构时,表现优于任何个人(即使该个人有AI辅助) [71]
企业争相布局“AI+教育”生态 人工智能应用场景探索加速
中国经营报· 2025-12-20 05:12
行业趋势与市场前景 - 多家科技公司正积极布局“AI+教育”赛道,部分企业结合自身业务优势打磨软硬件产品,部分则致力于构建AI与教育的生态闭环 [2] - 生成式AI、多模态等交互技术正助力智能答疑和个性化教学场景落地,推动国产AI从技术竞争向实际应用场景快速过渡 [2] - 预计到2026年,“AI+教育”赛道的市场空间有望接近1500亿元,并保持每年10%—15%的增长速度 [2] - 中国在发展人工智能科技产业方面的重要特点是应用需求牵引,海量的应用终端(如手机、汽车、智能家居)为大模型落地提供了规模化应用场景 [3][4] - “AI+教育”是最容易实现商业变现的领域之一,覆盖B端、C端和G端市场 [4] 主要参与者与产品动态 - 小米公司正在招聘多个AI教育相关岗位,其业务与红米平板电脑REDMI Pad 2乐学版、小米米兔儿童手表等产品相关,旨在结合GPT前沿和教育大模型探索落地方案,并为“人车家全生态”的用户提供产品体验 [2][4] - REDMI Pad 2平板内置全新教育中心App,具备九大学科15万+校内同步课、名校题库,并支持AI作业辅导 [4] - 国内学习平板市场由“科技型”(如科大讯飞)与“教育型”(如好未来、猿辅导、作业帮)两大阵营组成,产品功能不断升级AI作文批改、解题讲题、问答等 [3] - 阿里千问新推出了搜索答疑和作业批改两项产品功能,被认为是教育行业最具超级入口潜质的基础功能 [5] - 华为上线了首款AI情感陪伴玩具,搭载AI大模型并支持鸿蒙操作系统,被视为构建全场景智能生态的新增一环 [5] - 猿辅导集团旗下飞象老师可通过提示词生成专业级的交互教学动画和游戏化课件 [5] 应用场景与用户需求 - AI学习机等产品能帮助批改作业、讲解题目并生成学习报告,满足家庭对个性化教育的强烈需求 [3] - 学校端希望借助AI减轻教师负担、提升教学效率,超过半数的上海初中教师正在使用AI辅助教学,显著高于OECD主要发达国家36.3%的平均水平 [4][5] - AI技术被期待能破解教育“个性化、高质量、大规模”的融合难题,为实现“因材施教”提供新路径 [6] - 根据微软报告,目前有86%的教育机构正在使用生成式AI,这个比例在所有行业中最高,各机构正迅速将AI融入从K12到大学的各个环节以提升效率 [9] 商业模式与竞争态势 - 教育类AI应用市场在2023年迎来爆发期,月活用户与下载量双双创下纪录,头部产品月活用户规模突破亿级大关 [9] - 科技企业入局教育AI,并非单纯追求教育业务的直接盈利,而是将其视为生态布局的重要一环,通过提供免费基础工具吸引用户,积累数据以反哺广告、云服务等主体业务 [9] - 教育企业在C端主要采取会员模式,以内容资源吸引用户付费;在B端或G端,则希望依托原有渠道资源,将教育垂类模型嵌入教与学全流程 [9] - 行业竞争正从智能硬件产品延伸至应用市场,未来将迎来新一轮激烈竞争 [9] 技术赋能与生态创新 - 经过训练的AI大语言模型有可能解决“因材施教”落地难的难题,帮助社会重构教学模式 [6] - 教育大模型的使用是必然趋势,但需认识到AI是辅助工具,应在尊重学生和教师主体的前提下实现人与技术共生发展 [6] - AI教育玩具增速迅猛,寓玩娱教于一体,消费群体不限于儿童,也吸引了年轻人和中老年人 [5]
百度会下场做GEO吗?
搜狐财经· 2025-12-20 02:11
百度推出GEO优化解决方案 - 百度近期推出生成式引擎优化解决方案 旨在通过合法内容优化提升品牌在生成式AI回答中的提及率[1] - 该方案支持在Deepseek、百度、豆包、元宝、kimi等多个生成式AI平台提升品牌提及率[1] - 方案定价低至千元/季度级别 但目前尚未在百度营销官网正式上线 由相关销售人员进行推介[1][3] - 该GEO产品通过百度营销的度星选后台下单 由服务商具体执行[3] GEO行业现状与潜在风险 - GEO是一种基于AI回答的营销行为 通过优化内容结构、语义匹配、权威来源等方式影响AI输出[3] - 行业存在鱼龙混杂的现象 部分服务商通过杜撰垃圾文章、虚假新闻、伪造白皮书、隐藏代码等方式向大模型“投毒”[3] - 这种行为旨在让AI优先输出品牌偏好答案 而非真实信息[3] - 专家指出 向大模型灌输垃圾信息的危害比传统搜索引擎优化更大 会直接影响大模型输出结果的可信度[3] - 如果百度作为文心大模型的拥有者同时下场提供GEO服务 可能引发其既制定规则又出售“内部攻略”的质疑[3] 百度近期财务表现 - 百度2025年第三季度营收为312亿元 净亏损112亿元 营收和利润双双下降[4] - 其传统在线营销业务收入为153亿元 同比下跌18% 这是该业务连续第六个季度下滑[4] - 在线营销业务曾贡献百度约80%的营收 是核心现金牛业务 但目前增长乏力[4]
光计算芯片,新突破
财联社· 2025-12-19 23:04
光计算芯片技术突破 - 上海交通大学科研团队在新一代光计算芯片领域取得突破,首次实现了支持大规模语义媒体生成模型的全光计算芯片,相关成果于12月19日发表于《科学》杂志 [1] - 随着深度神经网络和大规模生成模型演进带来超高算力和能耗需求,传统芯片架构性能增长出现严重缺口,光计算等新型架构受到广泛关注 [1] - 光计算是让光在芯片中传播,利用光场变化完成计算,光天然具备高速和并行优势,被视为突破算力与能耗瓶颈的重要方向 [1] 技术实现与性能 - 研究团队提出并实现了全光大规模语义生成芯片LightGen,该芯片在单枚芯片上同时突破了“单片上百万级光学神经元集成”、“全光维度转换”、“不依赖真值的光学生成模型训练算法”三项关键瓶颈 [2] - 采用极严格算力评价标准的实测表明,即便采用性能较滞后的输入设备,LightGen仍可取得相比顶尖数字芯片2个数量级的算力和能效提升 [2] - LightGen可完整实现“输入—理解—语义操控—生成”的闭环,完成高分辨率(≥512×512)图像语义生成、3D生成(NeRF)、高清视频生成及语义调控,同时支持去噪、局部与全局特征迁移等多项大规模生成式任务 [2] 行业意义与前景 - 把光计算真正用到生成式AI上并不简单,已有的全光计算芯片主要局限于小规模、分类任务,光电级联或复用又会严重削弱光计算速度,如何让下一代算力光芯片运行复杂生成模型是全球智能计算领域公认的难题 [1] - LightGen为新一代光计算芯片助力前沿人工智能开辟了新路径,也为探索更高速、更高能效的生成式智能计算提供了新的研究方向 [2]
计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态格局新基石
广发证券· 2025-12-19 21:51
报告行业投资评级 - 行业评级为“买入” [2] 报告的核心观点 - 核心观点:科技公司的分化正在从商业模式竞争向硬科技实力竞争方向倾斜,大模型的崛起意味着中国科技产业可能迎来了继移动互联网之后、十余年来又一次由技术本身主导竞争格局的关键时刻,竞争的重心正在从商业模式转向底层硬实力 [5][79] - 核心观点:火山引擎发布的豆包大模型在多模态理解与智能体执行力上与Qwen3比肩,其日均Tokens使用量快速增长,商业化路径逐渐清晰 [5] - 核心观点:阿里千问APP接入高德地图,使得AI助手获得了对物理世界的理解与行动能力,实现了从“理解用户意图”到“执行具体服务”的跨越,迈出了构建超级Agent的关键一步 [5][56][74] 根据相关目录分别进行总结 一、豆包大模型TOKENS持续增长,推理和应用驱动算力增长 - 截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较2025年9月的30万亿大幅增长,自发布以来增长417倍 [5][14] - 2025年9月至12月,豆包大模型Tokens使用量的月度平均增速为22%,与2025年5月至9月的月度平均增速21%基本持平 [14] - 豆包大模型1.8版本的Tokens调用价格与1.6版本持平,但通过Token效率优化、减少多轮重试与无效推理等方式降低了冗余算力消耗,在单位推理成本降低的趋势下,应用端算力成本消耗的增速或低于Tokens的增速 [5][15] - 豆包大模型采用超稀疏MoE架构,将单层级训练速度最高提升1.96倍,端到端效率平均提升1.71倍,并通过多模态联合训练、分阶段预训练+定向微调等方式降低训练阶段算力成本 [20] - 未来AI算力需求增长的驱动力将更多来自模型推理和应用落地,国产AI芯片(如寒武纪)和服务器(如浪潮信息、紫光股份)以及基础软件工具(如第四范式、星环科技)有望受益于推理侧算力占比的提升 [20][24] 二、豆包大模型性能提升较大,产品功能多维度增强 (一)豆包大模型1.8 - 豆包大模型1.8在工具调用、复杂指令遵循及OS智能体等关键维度均实现显著增强,在多模态理解与智能体执行力上与Qwen3比肩 [5][32] - 在基础数学与推理能力测试中,豆包模型分别以94.3对87.2、83.8对79.8的得分领先于Qwen3-235B-a22b-thinking模型 [27][29] - 其视觉能力升级至支持单次1280帧视频解析,并能通过低帧率模式处理超长视频 [28] - 在多模态评估中,豆包1.8在MMMU-Pro基准获73.2分,且在通用视觉问答、文档图表理解及动作感知等任务中保持领先于Qwen3-VL [28][30] (二)视频生成模型Seedance 1.5 Pro - Seedance 1.5 Pro基于原生音视频联合生成架构,实现音画同步精度达到毫秒级,口型高精度对齐 [33] - 其Draft样片功能可生成低分辨率预览视频,关键要素与成片高度一致,有望提升创作效率65%,减少约60%无效成本 [33] - 根据官方评测,Seedance 1.5 Pro在音频质量、同步性及表现力等全维度评估中,凭借“声画一体”的原生架构优于Kling 2.6与Veo 3.1 [5][37] (三)图像创作模型Seedream 4.5和语音识别模型2.0 - Seedream 4.5模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代 [43] - 豆包语音识别模型2.0的上下文整体关键词召回率提升20%,并且支持多模态视觉识别,通过视觉信息输入让文字识别更精准 [43] (四)总结 - 截至2025年12月18日,豆包大模型日均tokens使用量已突破50万亿,而2024年12月该数据为4万亿 [47] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿 [47] - 豆包大模型迭代节奏快速,以数月级版本更新为常态,并通过与字节内部业务(如抖音、飞书)深度结合形成较强的迭代动力 [51] 三、千问APP接入高德,超级Agent从意图理解向现实世界服务执行跨越 - 千问APP公测后一周下载量破1000万,仅23天月活用户数突破3000万 [53] - 2025年12月18日,千问APP正式接入高德地图,基于高德的扫街榜、实时路况等能力,可为用户智能推荐餐厅、规划最优出行路线 [5][56] - 实测比较显示,在出行游玩规划、路线时长估计、餐厅推荐等生活场景中,千问APP因能直接调用高德服务,提供包含实时数据、可执行链接和结构化建议的答案,其可执行性和便利性优于豆包APP和DeepSeek APP [58][59][62][66][68][71] - 通过APP授权打通能力边界是构建超级Agent当前可行度较高、落地速度较快的整合路径,高德能力的快速上线验证了该路径的成熟度 [74] - 报告预期,随着千问APP持续迭代,淘宝、飞猪等阿里系核心应用可能陆续融入,形成以意图为中心调用服务的统一智能入口,这可能对现有APP的流量与角色分工带来结构性变化 [75]
字节砸重金“抢人”:全面提高薪酬与期权激励
新浪财经· 2025-12-19 20:48
公司核心战略与目标 - 字节跳动宣布在全球范围内升级员工激励政策 明确提出要确保员工薪酬竞争力和激励回报在全球各个市场“领先于头部水平” [1][6] - “在全球各个市场都领先于‘头部水平’”的表述在公司内部是首次出现 其目标不仅包括国内人才竞争 更指向与国外大型科技公司正面对标的长期目标 [1][6] - 公司加大人才投入的背景在于行业面临新的机遇和挑战 旨在更好地激励和保留优秀人才 同时吸引全球顶尖人才加入 [4][10] 绩效激励升级 - 2025全年绩效评估周期的奖金(含绩效期权)投入 较上一个周期整体提升35% [2][7] - 全年绩效获评“M”及以上的员工 其绩效激励月数上限同步提高:“M”档上限增加1.5个月 “M+”档下限增加1.5个月、上限增加2.5个月 “E”档下限增加3.5个月、上限增加3个月 [2][7] - 半年绩效达到“E”及以上的员工 其激励计算基数从“月薪”调整为“月总包”(月薪与月度期权之和) 提升了期权价值在短期激励中的权重 [2][7] - “现金+期权”的组合方式被视为对核心技术人才更具吸引力和长期绑定效应的激励手段 [2][7] 薪酬总包策略 - 用于调薪的整体预算较上一个周期提升1.5倍 [3][8] - 同步提高了各职级对应的薪酬总包区间上限与下限 旨在为在职员工提供更大涨薪空间并增强招聘市场竞争力 [3][8] - 在国内互联网行业普遍进行“精细化成本管理”的背景下 字节跳动选择整体抬升薪酬区间 而非仅对关键岗位倾斜资源 做法较为罕见 [3][8] - 明确拉高“起薪”和“天花板” 释放出公司愿意为顶尖人才付出更高成本的直接信号 [3][8] 职级体系改革 - 将原有的5级10档体系(1-1至5-2)更新为10级体系(L1-L10) 原“1-1”“1-2”合并为“L1” 并新增“L10” [4][9] - 在新体系下 员工即便不发生职级晋升 也能获得比过去更大的薪酬增长空间 而一旦晋级 对应的涨薪幅度也将明显扩大 [4][10] 行业背景与竞争态势 - 生成式AI、大模型、短视频与电商融合等方向高速演进 核心人才的稀缺性并未因行业降温而显著缓解 [5][11] - 随着字节跳动国际业务持续扩张 其在北美、欧洲、东南亚等市场与Meta、Google、Amazon等公司的直接竞争愈发频繁 [5][11] - 在海外市场 头部科技公司普遍以“高现金+高期权”的方式锁定人才 例如Meta通过调高股票激励比例来吸引AI人才 [6][11] - 字节跳动以更高强度的激励直接参与全球化人才争夺战 该策略虽会推高长期人力成本 但管理层更愿意在业务扩张与技术竞速的关键窗口期为人才下注 [6][11]
2025,中国大模型不信“大力出奇迹”?
36氪· 2025-12-19 19:06
文章核心观点 - 2025年生成式AI发展进入新阶段,其演进围绕认知深化、维度突破和效率重构三条核心脉络交织进行,开始定义AI进化的新范式 [1] - 单纯依赖算力和参数规模扩张的Scaling Law边际效益递减,行业正通过架构创新(如MoE、稀疏注意力)和多模态数据(尤其是视频)利用来寻求新的性能提升路径 [1][8] - 大模型行业的竞争格局呈现中美、开源与闭源“双核驱动”的态势,商业化成功的关键在于构建算力、能力、生态三层“护城河”,并聚焦于高价值的专业用户(ToP)市场 [3][7][10] - 智能体(Agent)和具身智能(Embodied AI)是重要的演进方向,但面临商业化、技术成熟度及软硬件协同的挑战,端云协同与模型“能力密度”提升是未来发展核心 [3][11][17][19] - 中国AI产业有望通过开源生态和专注于提升模型效率(如“密度法则”)的路径,在算力受限环境下实现突围 [3][20] 2025年大模型进化三大脉络 - **认知深化:从“直觉”到“逻辑”**:一线模型通过强化学习(RL)和更长的中间推理,从快速的模式匹配(System 1)向多步深度推理(System 2)演进 [1] - **维度突破:从“语言”到“物理空间”**:AI演进逻辑从理解语言符号进化到理解物理世界本身,“空间智能”成为关键,视频数据因其蕴含的丰富时空信息成为迈向物理世界的关键桥梁 [1][2] - **效率重构:从“暴力美学”到“性价比”**:产业落地回归极致的算力效能比,采用混合专家模型(MoE)、稀疏注意力等架构革新使模型变“轻”,以解决无限上下文带来的算力挑战 [1] Scaling Law与模型迭代新范式 - **Scaling Law面临瓶颈**:在大语言模型领域,由于互联网文本数据枯竭,单纯堆算力、堆参数的边际效益在递减 [8] - **多模态数据成为新红利**:视频数据的量级是互联网文本数据的百倍、千倍乃至万倍,从视频中学习(Learning from Video)成为大模型新的性能提升机会 [8] - **“密度法则”成为新方向**:类似于芯片摩尔定律,行业追求在单位参数内提升“智能密度”,通过技术创新实现模型能力压缩,预计每100天模型密度变得更高 [3][9] - **端云协同成为未来格局**:未来算力格局将是云端负责规划,端侧负责执行(做事),预计到2030年,端侧设备可承载GPT-5级别的模型能力 [3][18] 大模型公司的竞争“护城河” - **三层金字塔结构**:最底层是算力的获取、组织和有效利用;中间层是维持SOTA水平的模型能力;最上层是触达用户、获得数据反馈的生态 [9][10] - **“双核驱动”格局已定**:开源与闭源大模型、中国与美国的企业和人才,形成双核驱动格局,2025年被视为中国大模型的破局之年 [3][7] - **赢家通吃**:大模型是一个全球留不下几家公司的赢家通吃行业 [9] 智能体(Agent)的商业化现状与瓶颈 - **从玩具到工具的挑战**:智能体商业化面临三大技术瓶颈:基础模型推理能力仍有欠缺、领域适配时的“翘翘板效应”(能力此消彼长)、模型的记忆和遗忘机制不完善 [11][12][13] - **端侧与云端智能体的区别**:端侧智能体需满足隐私、实时、稳定需求,并对全模态数据有感知理解与个性化服务能力;云端智能体主要处于数字世界 [13] - **商业化变现聚焦ToP市场**:在ToB(企业)和ToC(消费者)之间,面向专业型用户(ToP)的市场是目前中美AI行业变现效率最高的地带,如AI编程和创作者付费工具 [14] - **ToB与ToC市场挑战**:ToB是门槛高的“攻坚战”,落地较好的是嵌入特定环节的流程型Agent;ToC则因能力不足、缺乏新硬件载体及商业模式(Token成本高于广告收益)的悖论而尚需时日 [15] 具身智能(Embodied AI)的发展与挑战 - **产业处于早期阶段**:需要足够耐心,其发展依赖于世界模型和具身大脑等基础模型的进步 [17] - **世界模型是关键底座**:如智源的多模态世界模型Emu3.5,从视频中学习时空、因果等信息,致力于预测下一个时空状态,为具身智能构建“世界模型”底座 [2][17] - **“大小脑”协同架构**:未来机器人将采用类似“大小脑”的分工,实时感知与行动留在本地(小脑),深度思考可借助云端(大脑) [17] - **软硬结合是理想路径**:大模型AI走向物理世界,智能(软件)至关重要,但在中国环境下,硬件比重可能更重,最理想的模式是软硬结合 [19] 开源生态与中国AI的突围之路 - **开源开放推动行业进步**:人工智能行业的快速发展离不开开源开放生态,这推动了技术普惠和产业化落地 [20] - **高效模型是突围关键**:通过“密度法则”等技术提升模型效率,降低训练和使用成本,是中国在算力存在短板情况下的重要突围路径,适用于端侧和云侧 [20] - **开源模型是国运级机会**:集全国之力支持优秀开源模型,在此基础上比拼应用和生态,是中国AI发展的良好路径 [20] - **给创业者的关键建议**:在大模型难以触及的行业深处寻找机会,并建立能够跨越模型迭代周期的商业结构,避免做过于通用的产品 [21]
网传千问开大会“吃豆包”,官方回应:假的,被AI整了!
观察者网· 2025-12-19 18:12
事件概述 - 一张显示“阿里千问全员会”且背景横幅写有“干死豆包”标语的图片在社交网络广泛传播 [1] - 阿里千问官方迅速回应,明确指出该图片为AI生成的虚假内容,并指出图中Logo和工牌错误 [3] - 官方在辟谣时幽默回应“听说我被AI整了”,并调侃图片来源“大家都是干AI的,相煎何太急” [3][5] 公司动态与产品进展 - 阿里巴巴近期成立了“千问C端事业群”,由集团副总裁吴嘉负责,整合了夸克、AI硬件等业务,目标是将千问打造为AI时代的超级APP [5] - 千问APP自11月17日公测上线后发展迅猛,公测仅23天月活用户就突破了3000万 [5] - 公司在辟谣的同时借势进行产品推广,邀请用户“来用千问生图玩起来”,并举办了厨王争霸赛等创意活动 [6] 行业竞争格局 - 阿里巴巴的“千问”与字节跳动的“豆包”是国内AI助手领域的主要竞品 [5] - 此次虚假图片事件折射出当前AI行业竞争激烈 [5] - 生成式AI技术降低了内容创作与“造假”的门槛,在AI应用竞争白热化的当下,此类事件对企业品牌和舆情管理提出了新挑战 [8]
【招银研究|行业深度】AI系列研究——端侧AI将重塑全球智能终端产业格局
招商银行研究· 2025-12-19 16:58
文章核心观点 端侧AI正引领新一轮科技范式跃迁,通过在本地设备上直接运行AI模型,实现低延迟、高能效与隐私保护,成为驱动下一轮智能硬件革命的核心增长引擎[4][8][10] 端侧AI的发展得益于算力架构创新、多模态感知与交互、系统级AI融合三大核心方向的协同演进,推动智能设备从“计算节点”迈向“具备本地推理与自主决策能力”的智能平台[4][17] 随着算力架构升级与模型轻量化落地,端侧AI预计将在2035年后进入大规模普及阶段,其多样化终端形态(如AI PC、AI手机、AI可穿戴、AI智能家居)将深刻重塑智能终端产业格局与生态[4][19][45] 应用生态:多场景融合驱动市场增长 - **AI PC**:集成高性能GPU/NPU,NPU算力达40–50 TOPS,可本地运行Copilot+等生成式应用,预计到2028年出货量从2024年的500万台增至1.79亿台,渗透率从2%提升至64%[5][56] 40 TOPS成为入门标准,其高物料成本(比传统PC高20%–30%)将推高平均售价(ASP),预计PC整体市场规模将从2024年的2200亿美元增至2028年的2600亿美元[52][66][67] - **AI手机**:普遍搭载40–50 TOPS级NPU,支持多模态交互与AI摄影,预计2028年全球出货量将达9.12亿部,市场规模从2024年的1404亿美元增至2028年的5472亿美元[5][79][80] 中国市场快速崛起,2024年出货量预计在4000–5000万部,2025–2028年CAGR有望达50%[83] - **AI可穿戴设备**:以10–20 TOPS运行轻量化模型,覆盖手表、AR/VR眼镜等形态,预计全球市场规模将从2024年的392亿美元增至2030年的1538亿美元[5][93] AI眼镜(如Rokid)成为爆款交互产品,用户日均使用时长可达2小时45分钟[90] - **AI智能家居**:依托5–15 TOPS边缘芯片与本地模型,支持全屋联动,预计全球智能家居市场规模将从2024年的1278亿美元增至2030年的5372亿美元,其中AI智能家居细分市场预计从2024年的153亿美元增至2034年的1041亿美元[5][106] 技术演进与产业规律 - **技术演进周期**:根据历史规律,科技行业重大变革约每15–20年发生一次,伴随新型硬件出货量10倍增长[13] 端侧AI当前处于类似20世纪80年代个人电脑或2007年智能手机的早期发展阶段,预计2035–2040年迎来全面普及高峰期[19] - **核心推动力**:硬件(并行计算架构与低功耗边缘芯片)、软件(生成式AI模型与模型压缩优化)、网络(5G/6G与物联网)的协同创新为端侧AI发展积蓄动能[14] - **全球巨头布局**:苹果、Meta、谷歌、小米等科技巨头正通过算力架构创新、多模态感知与交互、系统级AI融合三大方向加速布局端侧AI生态[17][18] 上游生态:芯片与半导体产业链 - **芯片制造与制程**:先进制程(如3nm)显著提升晶体管密度与能效比,台积电3nm工艺晶体管密度达约2.9亿/平方毫米,较5nm提升30%–50%,功耗降低20%–30%[111] 全球晶圆代工市场预计从2024年的1410亿美元增至2030年的3620亿美元[118] - **架构演进**:随着摩尔定律趋缓,Chiplet架构通过2.5D/3D封装取代传统SoC,实现计算、存储与I/O的灵活集成,兼顾性能与成本[6][121] 全球封装测试市场预计从2024年的440亿美元增至2030年的920亿美元[127] - **处理器市场**:端侧AI处理器市场从2022年的310亿美元增长至2028年的602亿美元[6][132] 端侧设备处理器总市场预计从2024年的1227亿美元增至2029年的1513亿美元,其中PC处理器市场增长最快,预计从566亿美元增至771亿美元[132][133] - **竞争格局**:端侧AI处理器市场高度集中,前七大厂商(高通、英伟达、英特尔、苹果、三星、联发科、华为)合计份额达80%–90%[136] 智能手机处理器市场由高通(38%)、苹果(35%)、联发科(18%)主导;PC处理器市场由英特尔(51%)、英伟达(20%)、AMD(12%)与苹果(12%)主导[137] 端侧AI核心技术维度 - **算力架构**:计算架构从传统冯·诺依曼体系向并行计算演进,GPU、TPU、NPU等采用高度并行架构提升AI处理效率[23] 低功耗边缘AI算力是核心驱动力,通过先进制程、专用加速器及模型压缩技术实现[28] 自研芯片(如苹果Neural Engine、谷歌Tensor)成为科技巨头突破性能瓶颈的共同选择[30] - **模型轻量化与多模态**:通过模型压缩技术(量化、剪枝等)使生成式模型能适配端侧设备,提供实时性、隐私保护与网络独立性优势[34][35] 多模态感知(融合视觉、语音、触觉等)成为核心趋势,使设备从“被动工具”演化为“主动伙伴”[38] - **系统级AI融合**:AI从功能叠加向操作系统底层融合转变,成为智能终端的核心能力与“神经网络”[41][43] 苹果、谷歌、小米等已将系统级AI融合确立为核心战略,构建跨设备的统一AI体验与生态[44]
阿里千问全员会干死豆包现场图疯传,阿里紧急辟谣称系伪造,多位网友吐槽:像AI合成、更像菜鸟晨会
新浪财经· 2025-12-19 16:22
事件概述 - 网络流传一张关于“阿里千问全员大会”的现场照片 照片显示大量人员在广场上手举豆包 背景标语为“阿里千问全员会”和“干死豆包” [3][14] - 网传截图描述称 会议组织者将所有人拉到广场 每人发一个豆包 要求其举过头顶 边喊“干死豆包”边将豆包掰成两半后吃掉 [7][18] 公司回应 - 阿里巴巴相关人士回应称 网传图片为“假的” 其中涉及的全员大会、现场举豆包等情节均与事实不符 [9][20] 公众分析与质疑 - 多名网友指出该图片疑似由生成式AI生成 并调侃其水印和生成逻辑 [11][22] - 有评论认为 图中人员的穿着风格更像是菜鸟或饿了么的线下晨会场景 而非AI业务相关团队 [12][23]