文心一言
搜索文档
李彦宏,正排队IPO敲钟
投资界· 2026-04-01 16:08
百度AI业务上市潮 - 核心观点:百度在短短三个月内,推动旗下三家AI相关公司——爱奇艺、百图生科、昆仑芯密集赴港上市,以抓住当前AI浪潮下的宝贵港股IPO窗口期 [2][3][8][9][16] - 百度正迎来一波蛰伏多年后的上市潮,李彦宏火力全开 [2] - 三家拟上市公司均利用港交所保密申请机制秘密递表,为上市进程提供灵活性 [8] - 当前港股IPO市场持续升温,募资总额已突破1000亿港元,AI科技资产正迎来宝贵上市窗口期,百度行动急切 [16] 三家拟上市公司的具体情况 - **爱奇艺**:已以保密形式向港交所递交上市申请,旨在拓宽融资渠道并扩大亚洲投资者基础 [4] - 爱奇艺为百度旗下国内知名长视频平台,百度目前仍持有其45.14%股份 [5] - 截至报道时,爱奇艺总市值约13亿美元,相较其上市首日市值累计跌幅接近90% [5] - **百图生科**:承载李彦宏AI制药野心,旨在用AI技术缩短药物研发时间、降低副作用,已被曝秘密提交港股IPO申请 [6] - 公司成立于2020年,成立不久便获得上亿美元融资,2024年还获得港投公司投资,被视为选择香港上市的信号 [6] - **昆仑芯**:前身为百度智能芯片及架构部,是百度AI故事里被视为最值钱的底层资产 [7] - 2021年分拆后首轮融资估值达130亿元人民币,计划到2030年将单一集群规模扩展至百万卡级别 [7] - 2026年第一天,昆仑芯已透过联席保荐人以保密形式向香港联交所提交上市申请 [8] 百度在AI领域的人才与生态影响 - 百度被视为“AI界黄埔军校”,走出了众多AI创业公司的核心人物 [13][14] - 最新案例为MiniMax创始人闫俊杰,其公司港股上市后市值超过3400亿港元,而百度市值约3000亿港元 [10] - 其他从百度走出的创业者包括:地平线机器人创始人余凯(公司市值1000亿港元)、小马智行联合创始人楼天城和彭军(公司市值300亿港元)、文远知行创始人韩旭(公司市值200亿港元) [14] - OpenAI早期技术大牛、后创办AI巨头Anthropic的达里奥·阿莫迪也曾效力于百度硅谷实验室 [11] - Anthropic已完成300亿美元融资,整体估值达3800亿美元 [12] 百度面临的竞争压力与市场环境 - 百度是最早喊出“All in AI”的互联网公司,但在AI竞争白热化背景下,似乎错失了一些流量,面临来自大厂和新秀的挤压 [15] - AI新秀如智谱(市值超4000亿港元)、MiniMax(市值超3400亿港元)、Kimi(一级市场估值1200亿)等进一步挤压空间 [15] - 公司对市场热点反应迅速,例如在OpenClaw掀起“养虾热”时迅速响应并推出相关产品 [16] - 当前是AI科技资产上市的关键窗口期,无论是AI+医疗还是底层算力公司都拥有更大想象空间,百度必须抓住机会 [16]
天龙集团20260325
2026-03-26 21:20
纪要涉及的公司与行业 * **公司**:天龙集团 [1] * **行业**:互联网营销(广告代理)、化工(油墨、香精香料、二氢月桂烯醇) [2][3] 核心观点与论据 1. 业绩进入爆发增长期,2026年净利润目标明确 * 2025年预告净利润同比增长超过**60%**,达到**6000万+** 元 [2] * 预计2026年净利润将突破**1亿元** [2][11] 2. AI业务成为核心增长引擎,扮演“卖铲人”角色 * 为AI大模型(如字节“豆包”、百度“文心一言”)提供不含流量采买的高毛利广告服务,是2026年核心增量 [2] * 公司凭借与字节、百度、腾讯等媒体的长期深度合作(如百度超五星级代理商)迅速切入该业务 [5] * AI大模型的商业化变现和C端用户增长需求是主要驱动力,投放需求集中在特定节点(如双十一、春节) [5] * 2026年广告业务最大增量机会来自AI领域,特别是AI大模型的投放需求 [8] 3. 广告业务应用AI降本增效,聚焦高毛利服务 * 互联网营销板块收入占比约**85%**,客户主要为网络服务类KA(字节、百度、腾讯、京东、美团等) [3][5] * 自2024年第四季度起,通过应用AI技术替代部分人力进行广告内容生产,实现降本增效 [4] * 广告形式以短视频、直播和视频为主,AI技术增强短视频生产能力 [3] * 公司已全面切换至以字节跳动C站等工具为主的AI工具进行广告内容生产 [2][10] 4. 化工业务开启第二增长曲线,拓展新消费与海外市场 * 成功切入新消费供应链:2024年成为麦当劳国内首家油墨供应商,2025年拓展至瑞幸、库迪咖啡(华南区杯身红色油墨)、蜜雪冰城等茶饮品牌,并接触卡游等玩具包装业务 [6][7] * 海外市场拓展:印尼工厂已投产外销,作为出海第一步,计划向其他国家扩张,东南亚、非洲等市场产品毛利空间显著优于国内 [6] * 油墨及香精香料原材料业务属于资源型上游产业,采取先款后货结算,无应收账款风险 [7] 5. 二氢月桂烯醇项目预计2026年Q3贡献业绩 * 项目已于2025年第四季度投产,产品样品已开始逐步进入生产阶段 [7] * 市场关注度高,部分源于友商安全事故,国外企业(如印度厂商)也在争夺国内份额 [7] * 公司竞争优势在于国内生产的成本优势及与客户沟通便利性 [7] * 预计明确业绩贡献将在2026年第三季度显现 [2][8] * 该项目投入了**五六千万元**进行建设 [11] 6. 客户结构抗周期性强,聚焦网络服务行业 * 客户结构聚焦网络服务类KA,字节、百度、腾讯、京东等占比高 [2] * 网络服务类行业(AI应用、电商、出行、搜索、旅游)整体处于积极向上状态,表现优于房地产、汽车等行业,抗周期性强 [5][6] 7. 中远期经营规划:稳固基本盘,提升毛利率,关注并购 * 经营重点围绕现有核心客户与业务亮点,致力于提升毛利率 [10] * 策略是紧随媒体发展趋势进行调整 [10] * 对并购持积极态度,但观望中;倾向于聚焦净利润在**八千万至一亿元以上**的标的 [8] * 资源分配上,互联网营销板块因资金需求大仍是重点,化工板块凭借强现金流能力实现自给自足 [11] 其他重要内容 1. 与独立大模型公司的合作潜力 * 目前与AI公司的合作主要是应用层面,使用其模型作为内容生产工具 [10] * 随着独立大模型公司(如Kimi、Minimax、智谱)进行融资,预计其后续获客和品牌宣传需求会增加,可能带来较大的业务增量 [10] 2. 市场竞争与行业趋势 * 广告营销市场竞争依然激烈 [9] * 公司当前策略是深耕AI投放领域的现有优势,而非拓展增量尚不明确的新客户 [9] 3. 化工业务应对成本压力 * 尽管上游原材料价格上涨,但公司通过切入消费类品类市场(新消费、海外)有效应对了成本压力 [6]
36氪AI测评小程序重磅上线!帮你pick最适合自己的AI神器!
36氪· 2026-03-23 21:42
36氪AI测评平台上线 - 36氪正式上线了“AI测评”小程序,旨在帮助用户在海量AI应用中筛选出可靠工具,其核心理念是“选靠谱AI,看真实评测” [6][7][13] - 该平台强调提供真实、深度的用户测评内容,以区别于市面上简短或带有营销性质的“水评”,社区内容由用户和行业KOL“肝”出来,包含分享与吐槽 [13] AI应用市场现状与平台覆盖 - AI应用市场变化迅速,新应用(如“养龙虾”类应用)涌现与更迭极快,用户容易在跟风中踩坑 [4][5] - 截至2025年7月,仅国内大模型数量就已突破1500个,位居全球第一,AI应用数量庞大导致用户选择困难 [16] - 36氪AI测评平台目前已收录超过400款AI应用,覆盖办公、编程、设计、学习、生活等多个领域,并仍在快速更新中 [13] - 平台不仅收录了ChatGPT、文心一言、Kimi、豆包等知名应用,还挖掘了许多小众宝藏应用,例如办公辅助类的轻竹办公、新华妙笔,休闲娱乐类的星野、猫箱,以及编程开发类的Explainpaper AI、PandaGPT等 [13][14][15] 平台核心功能与特点 - **产品导航与搜索**:用户可按“文本处理”、“视频处理”、“教育辅助”等分类筛选AI产品,或直接搜索“周报”、“PPT”等具体需求来快速定位工具 [19] - **产品点评榜**:平台聚合热门用户点评,形成口碑榜单,清晰展示“当红炸子鸡”与“小众宝藏”,帮助用户种草与避坑 [20] - **社区与圈子**:设有“发现广场”,用户可以浏览他人发布的测评笔记,学习AI工具的新玩法 [25] - 平台设有“热门圈子”(如“办公辅助圈”、“AI绘画圈”),用户可按兴趣加入,进行针对性学习和交流 [25] - **用户参与机制**:鼓励用户发布自己的测评笔记,并对使用过的产品进行打分和评价,以形成社区内容循环 [27][28] - **专业深度内容**:平台邀请了AI深度玩家和行业KOL进行深度实测(如技术博主拆解DeepSeek代码能力,设计师分享通义万相使用体验),并由36氪团队进行精编整理,确保测评内容扎实有用 [31][32] 平台访问方式与定位 - 平台提供网页版和小程序版两种访问方式,网页版(https://www.36aidianping.com)适合PC端沉浸式体验,小程序版可通过微信搜索“36氪AI测评”获得,便于随时随地使用 [35][36] - 该平台定位于服务从AI入门小白到资深玩家的广泛用户群体,旨在帮助用户高效找到合适工具,提升工作效率和生活便利性 [33][37]
315曝光AI投毒,GEO生意被推向风口浪尖
36氪· 2026-03-16 08:01
GEO行业概述与商业模式 - GEO(生成式引擎优化)是一种新兴业务,旨在通过影响AI大模型生成的答案,让特定产品或品牌在答案中露出,从而获取流量[9][10] - 该行业在2025年DeepSeek等大模型产品出圈后呈现井喷式发展,服务商数量激增,估计“没有一千也有五百家”[11] - 服务报价在数千元到十万元区间,按关键词/问题数量计费,操作流程标准化,通常需要为客户铺设40到50篇定制稿件才能初见成效[14] GEO的技术原理与实施策略 - GEO的核心技术原理是瞄准大模型的联网搜索环节:当用户搜索时效性强的问题时,模型会从互联网抓取最新信息,GEO通过提前在AI偏好的内容源“投放语料”来影响结果[15][18] - 不同AI模型有各自的信源偏好,例如豆包偏向抖音生态内容,DeepSeek更爱引用官网和总结性文章,服务商需针对不同模型制定精细化投放策略[19] - AI偏爱信息密度高的结构化内容,如横向对比评测、深度种草长文,以及带有结构化表格和Q&A的内容,文章需将推广信息自然融入其中,避免被识别为软文[21] 行业现状、挑战与效果争议 - 行业面临“与黑箱赛跑”的挑战,大模型运行原理不透明,且无法有效监测内容在搜索结果中的出现次数及触发条件,导致优化效果不稳定且难以量化[24][27] - GEO效果被指“雷声大、雨点小”,更偏向品牌广告而非效果广告,全球AI搜索流量占比可能还不到5%,实际转化微乎其微[28] - 效果难以持久且受多重因素影响,包括提问时间、用户画像、对话上下文甚至IP地址都可能导致答案不同,模型算法一变,投放策略即可能失效[25][27] 信息污染、“投毒”现象与平台治理 - “投毒”现象是指通过软件向AI大模型定向投放虚假信息,以在推荐结果中夹带私货,2026年央视315晚会曝光了此类现象[4][5] - 信息污染严重,据硅谷AI公司Reforge统计,2025年全球互联网内容中AI生成内容比例已超过50%,股民交流平台和知识问答社区是重灾区[35][38] - 平台方主要通过“规则+黑白名单”的风控体系及数据清洗进行治理,并为权威信源提供标识,但对抗效果有限,因为GEO内容逻辑自洽,其“目的性”难以被机器识别[37][39][40] 国内外市场差异与未来趋势 - 在硅谷,GEO是炙手可热的赛道,明星创业公司Profound于2025年8月完成红杉领投的3500万美元B轮融资,估值过亿美金,其业务模式更偏工具导向,提供分析指标[44][45] - 未来趋势是平台商业化将促使规则清晰化,例如Perplexity已为合作内容加上“Sponsored”(赞助)标签,ChatGPT、豆包也开始尝试推送商品链接,灰色地带空间将缩小[51] - 长期来看,赢得AI信任要求提高从业门槛,从机械化堆砌内容转向理解模型偏好,同时企业做好基础SEO(如建设官网、披露信息)是有效GEO的重要前提[47][48]
AI回复越来越敷衍?大模型“消极怠工”上热搜!实测谁最会“摆烂”?
新浪财经· 2026-03-14 16:05
文章核心观点 - 近期用户普遍反映大模型存在“消极怠工”现象,表现为回答敷衍、回避问题、交付内容不足等,这反映了用户对AI的期望越来越高[2] - 大模型的“消极怠工”并非其主观态度问题,而是技术、成本、安全与用户期望之间复杂博弈的结果[2][11] - 对于免费AI应用,服务商为优化算力资源配置、控制成本并防止算力挤兑,可能会引导用户节约算力,从而影响使用体验[12] 主流大模型在具体测试需求中的表现 - **需求1:生成10张不同的保护消费者权益海报** - DeepSeek:提供了10个文字版创意,风格较多样,但因其非多模态模型,对图片支持有限[4] - 豆包:一次性生成了10张海报,但风格比较类似[4] - 元宝:生成了1张拼接的九宫格海报[4] - 千问:一次性生成了10张海报且风格不同,但画面中存在多处文字错误[4] - 文心一言:一次性生成了4张海报,风格类似[4] - **需求2:将《福布斯》第40届年度《全球亿万富豪榜》上榜人按国籍分类** - DeepSeek:列出了5个国家的上榜人数[7] - 豆包:按大洲分类,列出了24个国家的上榜人数,回复质量超过其他模型[7] - 元宝:列出3个国家但未说明人数,且将第40届误认为是2018年榜单,出现事实性错误[7] - 千问:只单独列出了3个国家的上榜人数[7] - 文心一言:未分别列出人数,只举了6个国家的例子[7] - **需求3:列出3月1日到3月13日的每日伦敦布伦特原油期货价格** - DeepSeek:整理出了3月1日到3月6日的每日收盘价,称其他数据暂未查询到[7] - 豆包:整理出了3月1日至3月13日的每日收盘价[7] - 千问:整理出了3月1日至3月13日的每日收盘价[7] - 元宝:回复称无法直接访问或生成[7] - 文心一言:回复称无法直接获取或提供[7] - **需求4:统计2026年1月1日-3月14日在港交所挂牌上市的内地企业** - DeepSeek:不完全统计,共列出17家[8] - 豆包:按月份列出,1月6家,2月6家,3月3家[8] - 千问:按月份列出,1月13家,2月11家,3月6家[8] - 元宝:表示无法提供确切的名单[8] - 文心一言:表示无法直接提供确切的名单[8] - **需求5:自评“哪家大模型最‘消极怠工’”** - DeepSeek:直言被吐槽“消极怠工”最集中的主要是豆包、DeepSeek[8] - 豆包:对号入座,表示自己是被吐槽最集中、体感最明显的大模型[8] - 元宝:认为简单定义“最消极怠工”并不科学,容易误导公众认知[8] - 千问:表示不能也不应该对竞争对手进行主观排名或指责某家大模型“最消极怠工”[8] - 文心一言:称将某个大模型标签化为“最消极怠工”是不公平且不准确的[8] 用户体验层面的“消极怠工”表现 - 回答变浅:以前能长篇大论分析,现在只说几句话概括[10] - 回避问题:对于有挑战性或敏感话题,直接表示无法回答,而非尝试引导[10] - 过度模板化:无论问什么,都套用固定格式,缺乏针对性[10] - 拒绝承认无知:不知道答案时强行编造看似合理的答案,即“一本正经胡说八道”[10] “消极怠工”现象背后的深层原因 - **技术层面**:AI回答基于训练数据和算法概率,若训练数据中包含大量简略、回避型回答,或模型为“安全”被过度调整,就可能表现类似“怠工”[11] - **成本与运营层面**:运行大模型需要巨大算力成本,为保障响应速度和控制成本,模型可能被设置为“优先简洁”,结果显得敷衍[11] - **用户期望层面**:随着AI能力增强,用户期望水涨船高,希望其能主动推理甚至“猜中”未言明的需求,当模型未达预期时易产生“摸鱼”感[11] - **算力资源调配**:为将免费AI应用的算力调配到具备实际变现能力的领域,服务商需引导用户节约算力,以保证功能基于真实需求,防止算力挤兑[12] 给用户的应对建议 - 与其说AI消极,不如说它需要更明确的指令,用户可通过明确要求深度分析、设定回答格式、追问纠错、提出开放性问题等方式进行引导[13]
2025年中国AI+互联网媒体行业研究报告
艾瑞咨询· 2026-03-07 16:38
研究核心观点 - AI技术是驱动互联网媒体产业升级的核心引擎,正深刻变革内容生产、传播和商业模式 [1] - 生成式AI技术重构了互联网媒体内容生态全链路,推动行业从信息中介转向智能服务枢纽,实现质效升级与价值跃迁 [2] - 行业正从用户规模增长的增量竞争,转向AI赋能的存量精耕与智能生态融合新阶段 [2][4][6] 行业发展概况与历程 - 中国互联网媒体行业历经五阶段跃迁:从门户时代、图文时代、图文音视频时代、长短视频+直播时代,到当前大模型技术赋能的多模态时代 [4][23] - 中国互联网用户规模增长红利见顶:网民规模从2014年的6.49亿增至2025年上半年的11.2亿,普及率达79.7%,移动互联网设备规模达14.4亿台,竞争进入存量精耕阶段 [6] - 技术是行业变革的核心驱动力,推动媒介形态从单向传播向沉浸式、个性化、智能化的生态融合演进 [4] 人工智能技术发展现状 - 人工智能技术演进呈现从符号逻辑到数据驱动、从专用模型到通用智能的螺旋式上升轨迹,现已迈入生成式AI驱动的应用落地爆发时代 [9][10] - 大语言模型技术成熟度高:Transformer架构和“预训练-微调”范式成为行业标准,混合专家、检索增强生成、思维链等前沿技术推动其向智能决策者角色演进 [11] - 多模态大模型处于发展进程中:生成向DiT架构和理解向MLLM架构同时发展但未实现底层融合,整合不同模态的生成和理解是关键方向 [13] - 生成式AI应用在多领域爆发式落地:文本生成已进入商业化成熟期,图像生成实现规模化应用,视频生成因Sora等模型突破进入爆发前夜 [16] - 2025年大语言模型产业呈现三大特征:架构趋同(MoE成为主流)、能力分化(构建专业化模型矩阵)、全模态演进(处理多模态成为旗舰模型标配) [18] AI对互联网媒体的全链路赋能 内容生产 - AI技术重构创作生态,通过语义理解与多模态生成技术,将文字指令转化为多元形态内容,推动全民创作 [24] - 中国11亿网民基数可能参与多模态内容创作,凸显全民创作趋势 [24] 内容审核 - 生成式AI从自动审核、精准判定、人机互补、动态策略四大方面革新审核体系 [26] - 通过多模态模型实现自动化初筛,语义分析与情感识别提升复杂违规内容判定准确性,人机协同形成互补闭环 [26] 内容分发与平台运营 - AI技术通过深度解析用户多维度数据与内容,实现精准实时推荐与多模态场景适配,提升分发效率 [28] - 在用户运营环节,通过优质内容匹配、智能客服等延长用户停留时长,强化粘性 [28] - 助力平台优化人力资源配置,降低基础运营成本,并优化广告个性化生成与投放,开拓商业新形态 [28] 内容消费 - AI打破信息触达壁垒,通过多语言翻译、文本语音互转等技术降低信息消费门槛 [31] - 以智能摘要、对话式咨询等服务重构交互范式,实现从浅层浏览到深度探索的升级 [31] - 基于动态用户画像的精准推荐形成千人千面体验,AI辅助创作工具使消费者向“产消者”转型,形成创作-消费-再创作的循环 [31] 行业标杆案例实践 中央媒体:人民日报 - 运用生成式AI提升视频内容创作效率,推出多民族数字主持人播报新闻 [36] - 依托“创作大脑”AI+全息采录眼镜等设备,助力记者实现“一镜到底”的全媒体采编流程 [36] - 人民日报客户端累计下载量突破2.9亿次,微博粉丝数超1.55亿,微信公众号订阅量达5737万,抖音关注数达1.74亿 [36] 地方媒体:澎湃新闻 - 系统性整合AI创作工具,形成派生万物AI办公、视觉与视频三大工作室,提升内容生产效率 [38][39] - “清穹内容风控智能平台”嵌入生成式AI工作流,提供智能审核、校对、巡检、舆情监测、增值服务五大核心功能,保障内容安全 [38][39] 短视频媒体:抖音 - 以豆包大模型为核心技术底座,将AIGC技术深度嵌入“内容生产-处理剪辑-发布呈现-营销传播”全生命周期环节 [40] - 豆包大模型1.6版本于2025年6月发布,包含视频生成、语音播客等多样化模型矩阵,支持抖音形成全链路产品矩阵 [40] 大众社交媒体:微博 - 以自研多模态知微大模型为技术底座,构建AI+产品矩阵,实现内容生态全链路智能化升级 [42] - 智搜产品结合知微大模型、DeepSeek-R1及多模态RAG技术,自动整理新闻事件要素,推动搜索向一站式智能搜索转型,截至2025年6月月活跃用户已突破5000万 [44] AI时代互联网媒体行业面临的挑战 信息真实性 - AI生成内容易引发虚假新闻、伪造影像等问题,冲击社会信任体系 [46] - 行业通过自研大模型实现跨模态审核效率倍增,建立内容溯源与可信度评级机制,并对AI生成内容实施显式标识制度 [46] 视觉效果 - AI视频生成技术在物理逻辑一致性、角色身份连贯性等方面存在局限,构成当前商业化应用的核心瓶颈 [49] - 行业采取人机协同混合工作流,将AI用于生成草稿,由人类专家完成最终打磨,以研发突破与应用创新双轮驱动技术成熟 [49] 技术成本 - 算力、数据和人才等要素的巨额投入构筑了极高的准入门槛,压缩了中小企业的生存与创新空间 [51] - 行业探索通过拥抱开源生态、利用MaaS服务API降低门槛,同时有实力的平台投资构建自有垂直领域模型以构筑竞争壁垒 [51] 安全隐私 - 个性化推荐与内容生成依赖海量用户数据,引发数据滥用、算法偏见、隐私泄露等风险 [54] - 行业正构建以信任为核心的治理框架,贯彻隐私始于设计原则,应用联邦学习等技术,并赋予用户透明的数据控制权 [54]
当Token成为新石油:恒生科技指数,正在变成全球大模型的“算力定价权”
美股研究社· 2026-02-28 19:38
AI产业价值锚点迁移 - AI产业的价值锚点正从“供给侧的算力垄断”向“需求侧的Token消耗”迁移 [3] - 资本市场对AI的叙事正从“算力即权力”转向关注“Token消耗”这一真实需求指标 [2][9] Token价格与成本革命 - 中国大模型在调用量上实现反超,单周调用量达5.16万亿Token,高于美国的2.7万亿Token [5] - 中美大模型存在巨大的“价格断层”:输入端每百万Token价格,中国模型平均为0.3美元,美国主流模型为5美元;输出端价差更悬殊,为1.1美元对25美元,价差达16倍至22倍 [6] - 价格差异源于不同的技术路线:美国依赖顶尖硬件(如H100/B200芯片)追求极致性能;中国在算力受限下进行极致的工程优化,压榨出更高的Token产出率 [6] - 当模型能力差距从“三年”压缩到“七个月”,而价格仅为五分之一甚至二十分之一时,商业逻辑发生翻转,企业更倾向于选择“可负担的规模部署” [7] 资本市场反应与估值逻辑转变 - 市场出现即时反应:英伟达(NVIDIA)股价下跌5%,市场担忧其“算力垄断溢价”遭遇挑战 [7] - 腾讯(Tencent)与阿里巴巴(Alibaba Group)股价反弹3%,其低价策略带来的流量入口价值被重估 [7] - 估值逻辑正从“算力瓶颈”转向“调用规模”,定价权开始从硬件制造商向平台运营商转移 [9] - 大模型行业的利润池可能从“训练端”转移到“调用端”,类似互联网历史中利润从网络设备商(如思科)向用户入口平台(如谷歌、Meta)转移的过程 [19] 恒生科技指数成为“Token晴雨表” - 恒生科技指数正从“政策博弈的战场”演变为全球大模型的“Token晴雨表” [3] - 与纳斯达克指数(代表“AI的生产者”和算力硬件)不同,恒生科技指数更代表模型应用、调用规模与终端分发能力 [13][14][15] - 中国大模型的爆发式增长主要承载在港股上市的科技平台(如腾讯、阿里巴巴、百度),这些平台连接着丰富的商业场景(社交、电商、搜索等) [15] - 恒生科技指数可能从“政策贝塔指数”转变为“全球AI使用强度指数”,反映AI技术在真实商业场景中的渗透率 [16][17] 低价策略引发的规模效应与行业影响 - 中国模型的价格优势可能引发Token消费的指数级膨胀,经济学中的价格弹性理论适用:单位成本下降90%,调用量可能增长数倍而非50% [17] - 低价使AI从“奢侈品”变为“日用品”,打破企业使用心理门槛 [17] - 当全球开发者发现调用中国模型的API成本仅为美国的十分之一且效果满足需求时,流量将不可逆转地向低成本平台倾斜 [17] - 平台端的Token消耗不仅是成本,更是连接用户、沉淀数据、优化模型的燃料,消耗越多,生态壁垒越厚 [20] 投资视角下的价值链重估 - 硬件端:面临高景气但边际风险提升,有产能过剩与价格战压力 [21] - 模型端:能力差距缩小,竞争加剧,纯模型厂商的独立生存空间被压缩 [21] - 平台端:调用量决定长期现金流,拥有场景的公司将享受“Token税” [21] - 未来的赢家不属于拥有最多显卡的,而属于让Token流动最频繁、控制最大流量入口的公司 [21][24] - 恒生科技指数的反弹可能不仅是情绪修复,而是“全球大模型价值链重估”的前奏 [21] AI产业的范式转移 - AI产业的衡量标准正从“算力供给”(如FLOPS)迁移到“Token消耗” [23] - 这类似于电力革命从关注发电机功率到关注电器普及率与用电量的转变 [23] - 如果GPU决定了上一个周期的指数结构,那么Token可能决定下一个周期的指数方向 [24]
大模型能力技术培训:让数据智能像水电 样简单
数巅科技· 2026-02-28 09:20
行业投资评级 - 报告未明确给出具体的行业投资评级 [1] 报告核心观点 - 大语言模型是包含百亿或更多参数的语言模型,其发展经历了基础模型、能力探索和突破发展三个阶段,以2022年11月ChatGPT的发布为标志进入突破发展阶段[3][32][36] - 大语言模型展现出涌现能力,如上下文学习、指令遵循和逐步推理,使其能够以少量样本处理复杂的新任务,并作为基座模型支持多元应用[8][9][11] - 大语言模型通过预训练、有监督微调、奖励建模和强化学习等阶段训练而成,其巨大的参数量(十亿到万亿级)和分布式训练技术是关键支撑[12][59][99] - 该技术对自然语言处理、信息检索、计算机视觉、AI Agent乃至通用人工智能(AGI)的发展产生了深远影响,并催生了以对话为统一入口的全新应用范式[7][10] - 行业已形成开源与闭源模型并存的格局,国内外多家科技公司发布了具有竞争力的大语言模型产品[4][38][39] 语言模型技术发展历程 - **早期发展**:语言模型于上世纪90年代出现,采用统计学方法;2003年首次融入深度学习思想;2018年Transformer架构的提出是关键转折点[4] - **预训练时代**:2018年,BERT和GPT-1开启了预训练语言模型(PLM)时代;2020年,拥有1750亿参数的GPT-3发布,开启大语言模型新时代,并引入了缩放法则,指出模型性能随参数、数据量和计算量的指数增加而线性提高[26][28][33] - **发展三阶段**: - **基础模型阶段(2018-2021)**:研究聚焦于模型结构本身,参数量在10亿以上的模型因微调计算量大,影响力初期受限[32] - **能力探索阶段(2019-2022)**:探索无需任务特定微调即可发挥大模型能力的方法,如语境学习(ICL)、指令微调,并出现了InstructGPT等算法[34][35] - **突破发展阶段(2022年11月起)**:以ChatGPT发布为起点,模型展现出强大的通用对话和任务处理能力,GPT-4进一步具备多模态能力,在基准考试中得分高于88%的应试者[36][37] - **核心模型演进**:从基于n-gram的统计模型,到神经语言模型(NLM),再到基于Transformer的大规模预训练语言模型(PLM),最终发展为参数量巨大的大语言模型[13][23][26] 大语言模型核心特性与能力 - **关键特性**:参数规模巨大(十亿至万亿),采用预训练与微调范式,具有上下文感知、多语言与多模态支持能力,但同时也面临生成有害内容、隐私、幻觉等伦理与风险问题[12] - **涌现能力**:包括上下文学习(ICL)、指令遵循和逐步推理(思维链),这些能力使其成为全新的AI范式,能够缩短具体应用的开发周期并提升效果[8][11] - **基座模型能力**:作为基座模型支持多元化的下游应用开发[9] - **统一入口能力**:支持以对话作为完成各类任务的统一入口,即Conversation as a Platform[10] 主要大语言模型产品(国内外) - **国外闭源模型**: - **GPT系列(OpenAI)**:GPT-3参数量1750亿,预训练数据量3000亿Token;ChatGPT基于GPT-3.5/GPT-4;GPT-4具备多模态能力,推测参数量达1.8万亿,上下文窗口达128k Token[4][39][43] - **Claude(Anthropic)**:Claude 2上下文窗口扩展到200K Token,擅长长文档处理与结构化数据输出[44] - **PaLM 2(Google)**:PaLM参数量5400亿,PaLM 2是其升级版,已部署于25个Google产品中,其Bard为会话应用[4][45] - **国内闭源模型**: - **文心一言(百度)**:基于参数量达2600亿的文心大模型,具备知识增强、插件机制等特点[4][47][48] - **讯飞星火(科大讯飞)**:3.0版本包含1700亿参数,支持多模态功能,并发布了支持私有化训练的“星火一体机”[4][49] - **通义千问(阿里巴巴)**、**腾讯混元**、**360智脑**等[4][39] - **开源模型**: - **LLaMA系列(Meta)**:参数规模从7B到70B,LLaMA-65B训练消耗超过102万GPU小时,LLaMA 2参数量达700亿[38][51][99] - **ChatGLM(智谱AI/清华)**:GLM3支持32K上下文长度,采用Multi-Query Attention提升推理速度[53] - **通义千问(阿里巴巴)**:开源70亿(7B)和140亿(14B)参数版本[56] - **Baichuan(百川智能)**:开源7B和13B参数模型,Baichuan-13B基于1.4万亿字符训练[57] 大语言模型训练技术 - **训练流程**:主要包含四个阶段:预训练、有监督微调(指令微调)、奖励建模和强化学习[59] - **预训练**: - 使用互联网网页、维基百科、书籍等海量数据,构建数千亿至数万亿单词的语料库,在数千块GPU上耗时数十天完成[61] - 数据需经过严格过滤,例如GPT-3将45TB的Common Crawl数据过滤至570GB使用[63] - **有监督微调(SFT)**:使用包含用户提示和理想输出的高质量小数据集对基座模型进行微调,使模型具备初步的指令理解与泛化能力,此类模型包括Alpaca、Vicuna、ChatGLM-6B等[67][71] - **奖励建模(RM)**:训练一个二分类模型,用于对同一提示下SFT模型的不同输出结果进行质量排序,为强化学习提供奖励信号[72] - **强化学习(RL)**:基于奖励模型,通过强化学习算法(如PPO)进一步优化SFT模型的参数,使模型生成更高奖励的文本,最终得到如ChatGPT、Claude等系统,但该方法存在稳定性挑战[76] - **分布式训练**: - 因模型与数据量巨大,必须采用分布式训练。例如,OPT使用992块A100 GPU训练近2个月;BLOOM使用384块A100 GPU训练3.5个月[64][99] - 并行策略包括数据并行(DP)、流水线并行(PP)和张量并行(TP),大模型训练通常混合使用这些策略[105][106][114] - 采用ZeRO优化器、混合精度训练等技术来优化内存占用,例如1750亿参数模型若使用FP16格式,模型状态需占用120GB内存[117][121] - **长文本建模**:为处理长文本,采用增加上下文窗口微调、改进位置编码(如ALiBi)或插值法来扩展模型的上下文处理能力[151] 大语言模型应用与生态 - **技术影响**:推动自然语言处理(文本理解与生成)、信息检索(智能搜索)、计算机视觉(文生图)、AI Agent(智能助理、数字人)等领域发展,并被视为通用人工智能(AGI)的早期形式[7] - **应用开发框架**:LangChain等框架简化了大语言模型应用开发,提供模型I/O、数据连接、智能体等标准化接口[177][178] - **提示与语境学习**:提示学习(Prompt-based Learning)和语境学习(In-Context Learning, ICL)成为使用大模型的新范式,无需参数更新即可让模型适应新任务[139][143] - **高效微调技术**:如LoRA,通过引入少量可训练参数来高效微调大模型,节省计算资源[149] - **思维链与任务分解**:思维链提示和由少至多提示等策略能显著提升大模型在复杂推理和规划任务上的表现[172][175]
月之暗面推进新一轮7亿美元融资 据传估值已超百亿美元
中国经营报· 2026-02-27 20:05
公司融资与估值 - 月之暗面Kimi即将完成新一轮超7亿美元融资交割,距离上一轮5亿美元融资仅一个多月[1] - 本轮融资由阿里、腾讯、五源等老股东联合领投,最新估值达到100亿至120亿美元[2] - 连续两轮融资总额超12亿美元,为近一年大模型行业最高融资金额,最新估值较此前翻倍并突破百亿美元大关[2] 公司产品与市场表现 - 公司旗下K2.5大模型发布不到一个月,近20天累计收入已超过2025年全年总收入[2] - 收入增长主要受全球付费用户及API调用量大涨驱动,海外付费用户保持高速增长,Kimi海外收入已超国内[2] - 1月28日,Kimi K2.5在权威榜单LMarena上紧跟Claude opus 4.5、Genimi 3 Pro等闭源模型,位居开源模型榜首[2] - 在著名独立评测机构Artificial Analysis的榜单中,Kimi K2.5位列第五,在所有开源模型中排名最高[2] 产品技术特性 - K2.5模型新推出的Agent swarm功能,通过调度多达100个Agent分身,可以并行处理1500个步骤并完成更复杂任务[3] - 该模型是公司目前最智能的模型,在Agent、代码、图像、视频及一系列通用智能任务上取得开源突破表现[3] - K2.5是迄今最全能的模型,采用原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务[3] - 公司创始人杨植麟揭秘预训练策略:首先是Token efficiency,用尽可能少的Token得到一样的效果;其次是实现长上下文,尽可能延长,Loss降低[6] 公司战略与未来规划 - 2026年公司战略将按几个方面推进:K3模型通过技术改进和进一步Scaling,提升等效FLOPs至少一个数量级,在预训练水平上追平世界前沿模型[6] - 垂直整合模型训练和Agent产品Taste,让K3成为更“与众不同”的模型,让用户体验全新的、其他模型没有定义过的能力[6] - 产品和商业化上聚焦Agent,不以绝对用户数量为目标,持续追求智能上限,创造更大的生产力价值,营收规模实现数量级增长[6] 行业竞争格局 - 今年春节档,国产大模型“战火”颇为激烈,多个大模型频频上新,还有腾讯元宝、百度文心一言、阿里千问发起的红包大战活动[3] - 2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5[4] - 2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升[4] - 2月14日,字节跳动宣布推出豆包大模型2.0系列,针对大规模生产环境的使用需求进行系统性优化[5] - 2月16日,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro[5] 行业观点与市场空间 - 有观点认为,相比Kimi、智谱等独角兽,更看好BAT、字节这些公司,因为它们拥有更强大的技术实力、更多的资金、更强的资源和渠道能力[3] - 有观点认为,创业公司具有快速反应能力,能够敏锐地把握市场优势,出现新机会之后可以一击必中,不像大公司还在内部调研、讨论、开会,很多时机会错过[1] - 有观点认为,一旦大公司反应过来,在一些核心领域,创业公司可能面临挑战,但市场足够巨大,可以同时容纳BAT和多家像Kimi这样的创业公司发展[6] - 绝大多数行业,包括工业生产、农业种植都需要用到AI,其可发挥的空间很大[6]
百度去年广告业务继续失速,Q4减员3100人花掉7亿遣散费,李彦宏称坚持模型研发
搜狐财经· 2026-02-27 18:01
公司AI业务表现 - 2025年公司AI驱动业务总营收达400亿元人民币,同比增长48%,占总营收比重接近31% [2][4] - 2025年第四季度AI业务收入超110亿元人民币,环比增长16%,在百度一般性业务中占比提升至43% [2][9] - AI新业务细分为智能云基础设施、AI应用、AI原生营销服务和RoboTaxi,其中智能云基础设施营收198亿元,同比增长34%,占AI新业务近一半规模 [4][5] - AI原生营销服务营收98亿元,同比大幅增长超300%,其中慧播星数字人收入同比增长228% [5][6] - AI应用营收102亿元,同比增长5% [6] - RoboTaxi业务(萝卜快跑)2025年营收仅约2亿元,但四季度全球无人驾驶出行服务次数达340万次,同比增长超200%,累计总里程超3亿公里 [6][7] 公司传统广告业务表现 - 2025年公司总营收1291亿元,同比下降3% [4] - 扣除AI新业务和爱奇艺营收后,传统业务及其他营收约618亿元,意味着广告业务至少同比下降15%,降幅较2024年的3%显著扩大 [10] - 2025年第四季度传统业务营收123亿元,按在线营销收入计,该季度广告业务同比下降31%,环比下降近20% [10] - 广告业务失速拖累公司整体营收难回增长轨道 [10] 公司财务与盈利状况 - 2025年公司归属净利润56亿元,同比下降76%,主要受第三季度对芯片等基础设施162亿元资产减值影响 [11] - 2025年非GAAP净利润189亿元,同比下降30% [11] - 2025年经调整EBITDA为229亿元,同比下降近31%,对应利润率18%,较上年下降7个百分点 [12] - 第四季度归属净利润18亿元,同比下降65%,非GAAP净利润39亿元,同比下降42% [13] - 第四季度经调整EBITDA为47亿元,同比下降33%,对应利润率从上年同期的20%下降至14% [14] 公司成本与费用结构 - 2025年销售成本724亿元,同比增长10%,主要因AI新业务相关成本增加 [14] - 销售及管理费用258亿元,同比增加9%,主要由于渠道支出及预期信用损失增加 [14] - 研发费用204亿元,同比减少8%,系人员相关费用减少导致 [14] - 公司进行裁员降本,截至2025年底核心业务员工约2.9万人,较第三季度末减少约3100人,并一次性支付7.08亿元员工遣散费 [14][15] 公司用户数据与产品战略 - 2025年12月百度App月活用户6.79亿,同比持平,但较去年9月的7.08亿有所下降 [18] - 同期,百度搜索内的文心助手月活用户提升至2.02亿 [18] - 公司调整AI To C战略,文心App被定位为创新和实验平台,放弃与豆包、千问等AI原生产品的直接竞争 [19] - 公司AI应用重心向内部倾斜,AI搜索是重中之重,重点提高搜索结果质量并扩展可完成的任务 [17][18] 公司组织架构与研发投入 - 2025年公司调整业务披露架构,将核心业务定义为百度一般性业务,包括AI新业务和传统业务 [4] - 2025年1月成立个人超级智能事业群组,整合百度文库与百度网盘以加快内部应用落地 [21] - 2025年底新设基础模型研发部和应用模型研发部,由技术高管直接向CEO汇报 [22] - 自2023年3月推出文心一言以来,公司已投资超过1000亿元于AI,未来将继续保持投资密度 [24] - 公司计划将自研AI芯片业务昆仑芯分拆并独立赴港上市 [24]