开源模型
搜索文档
腾讯混元开源翻译模型1.5
每日经济新闻· 2025-12-30 16:44
公司动态 - 腾讯混元于12月30日正式开源其翻译模型1.5版本 [2] - 开源模型包含两个具体型号:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B [2] - 模型已上线腾讯混元官网,并可在开源社区直接下载使用 [2] 产品与技术 - 开源翻译模型支持33个语种互译 [2] - 模型额外支持5种民汉或方言翻译 [2] - 支持语种不仅包括中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种 [2]
腾讯混元开源翻译模型1.5 端侧可部署
第一财经· 2025-12-30 16:27
公司动态 - 腾讯混元宣布推出并开源翻译模型1.5版本 该版本包含两个具体模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B [1] - 新推出的翻译模型支持33个语种互译以及5种民汉或方言 除中文、英语、日语等常见语种外 还包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种 [1] - 模型已在腾讯混元官网上线 同时通过开源社区可以直接下载使用 [1] 行业技术 - 公司开源了其翻译大模型 具体包含1.8B和7B两种参数规模的版本 [1] - 模型在语言覆盖范围上具有显著特点 支持多达33种语言的互译 并涵盖多种小语种及方言 [1]
英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出
量子位· 2025-12-26 14:35
英伟达发布开源模型Nemotron 3 - 公司发布名为Nemotron 3的“最高效的开放模型家族”,其特点包括混合Mamba-Transformer MoE架构以及采用NVFP4低精度训练 [1] 开源策略 - 公司不仅开放模型权重,还将公开超过10万亿token的训练数据、预训练与后训练软件以及训练配方 [3] 架构创新:混合Mamba-Transformer - 模型架构旨在最大化推理效率,使用大量Mamba-2层替代传统Transformer的自注意力层,以解决KV Cache随序列长度线性增长带来的计算开销问题 [7][8][9] - 以Nano型号为例,模型主要由交替堆叠的Mamba-2层和MoE层构成,仅保留少数自注意力层 [10] - 在8k输入、16k输出的典型推理场景下,Nemotron 3 Nano 30B-A3B的吞吐量是Qwen3-30B-A3B的3.3倍,且序列越长优势越明显 [12] - 在长上下文任务上,Nemotron 3 Nano基座模型在100万token输入长度的RULER基准测试中得分为68.2分,远高于同样条件下训练的Nemotron 2 Nano 12B的23.43分,显示其长度外推鲁棒性更好 [14] 架构创新:LatentMoE - 针对Super和Ultra大模型,公司提出LatentMoE架构,在潜在空间中进行专家计算以解决MoE部署瓶颈 [15] - LatentMoE将token从原始隐藏维度d投影到更小的潜在维度ℓ(通常为d的四分之一),在此低维空间完成专家路由和计算,再投影回原始维度,从而降低权重加载和通信开销 [16][17] - 标准MoE使用128个专家、激活6个,而LatentMoE使用512个专家、激活22个,两者总参数量和激活参数量相近(约8B激活、73B总参),但LatentMoE在所有下游任务上表现更优:MMLU-Pro从48.30%提升至52.87%,代码任务从51.95%提升至55.14%,数学任务从78.32%提升至80.19% [18][20][21] 低精度训练技术 - Super和Ultra模型采用NVFP4(4位浮点)格式进行训练,在GB300上其峰值吞吐量是FP8的3倍 [22] - 团队已用NVFP4格式稳定训练高达25万亿token,与BF16训练相比,Nano模型的损失差距控制在1%以内,8B激活参数的更大模型差距缩小到0.6%以内 [22] - 并非所有层都量化至NVFP4,Mamba输出投影层保留在MXFP8精度,QKV投影和注意力投影保留在BF16,网络最后15%的层也保持高精度以确保稳定性 [23] 后训练方法 - 模型后训练采用多环境强化学习,同步训练数学推理、竞赛编程、指令遵循等多种任务,该方法更稳定且能避免能力退化问题 [24][25][26] - 在此方法下,AIME25数学分数从80提升到90,LiveCodeBench从65提升到72,τ²-Bench工具使用从40提升到50左右 [27] - 在MMLU、GSM8K、HumanEval等下游任务上,NVFP4训练的模型与BF16版本的准确率曲线几乎重合 [28] - 高效的推理吞吐量对生成海量RL rollout样本至关重要,团队采用异步RL架构和多token预测来加速,并使用GRPO配合masked importance sampling算法 [30][31] - 整个后训练软件栈以Apache 2.0协议开源,包括NeMo-RL和NeMo-Gym [32] 推理功能 - 模型支持推理时的思维预算控制,用户可指定思维链的最大token数,当达到预算时,模型可基于部分思维链生成最终回答 [33][34] - 论文提供了准确率与平均生成token数之间的权衡曲线,为部署中的效率-精度平衡提供细粒度控制 [35]
8点1氪:官方回应吸毒记录封存相关问题;强生爽身粉致癌案判赔女子约110亿元;俞敏洪敲定东方甄选接班人
36氪· 2025-12-25 08:26
科技与人工智能 - 小米发布自研开源推理模型MiMo-V2-Flash,总参数309B,激活参数15B,在多个Agent测评基准上排在全球开源模型前二 [8] - 字节跳动推出形式化数学推理专用模型Seed Prover 1.5,在16.5小时内针对IMO 2025前5题生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到金牌分数线 [27] - 阿里升级新一代语音模型Qwen3-TTS,发布音色创造和音色克隆两款新模型,可实现DIY声音设计和像素级音色模仿 [28] - 猿辅导素养课发布新一代“AI课堂2.0”,经AI赋能,学生学习效率提升20%,留存率提升10%,满意度提升37% [29] - 字节跳动旗下AI产品“豆包”的日均活跃用户数(DAU)已突破1亿,据内部人士透露,其推广费用是字节历史上所有破亿DAU产品中花费最低的 [30][31] - 杭州云深处科技股份有限公司正式启动上市辅导,辅导机构为中信建投证券 [23] - AI初创公司“深势科技”完成总额超8亿元人民币的C轮融资 [32] - 桌面级激光加工设备科技企业“壹粟创新”完成亿元Pre-A轮融资 [33] - OPPO ColorOS智慧产品研发总监姜昱辰透露,公司正与支付宝进行深度合作,并计划于明年1月官宣与另一个重要伙伴的战略合作 [9] 消费电子与硬件 - 消息称苹果计划从iPhone 18系列开始调整发布策略,2026年秋季将推出iPhone 18 Pro、iPhone 18 Pro Max及折叠屏iPhone,基础款iPhone 18和iPhone 18e则安排在2027年春季上市,iPhone 18 Pro系列可能新增咖啡色、紫色、酒红色三款配色 [12][13] - 三星电子、SK海力士等存储供应商已上调明年HBM3E价格,涨幅接近20% [17] - 苹果与巴西反垄断机构达成和解,将允许在巴西的iOS系统中运营第三方应用商店,并允许应用开发者推广外部优惠和提供其他购买方式 [17][18] - 影石创新表示,其首款全景无人机上市两周内,网络上涌现超过2500条恶意不实攻击信息,公司已固定证据并获公安机关正式立案,同时发起最高10万元奖励的线索悬赏 [7][8] - B站否认“全面付费观看”传闻,造谣人员已被警方依法予以行政拘留 [7][8] 汽车与出行 - 理想汽车合并第一、二产品线,由原第一产品线总裁汤靖管理,第二产品线负责人张骁主动离职 [18] - 美国汽车安全监管机构对约179,071辆2022年款特斯拉Model 3展开缺陷调查,原因是担心紧急车门释放控制装置可能不易触及或无法清晰识别 [19] - 阿维塔澄清旗下车型阿维塔12将在南极经历16个月以上的适应性测试,以验证极地不同季节及环境变化下的车辆性能 [19][20] - 现代汽车美国公司因拖车灯故障和电路短路隐患,在美国市场召回51,587辆汽车 [18] - 长城汽车董事长魏建军回应魏牌频繁换帅,称中国汽车品牌高端化仍在探索阶段,运营汽车品牌体系复杂度高 [15] - 长安汽车发布声明,否认网传“公司废轻铁拍卖疑致国有资产流失”等信息为不实信息 [20] 消费品与零售 - 贵州茅台酒价格全线上涨,12月24日,25年飞天茅台原箱批价报1600元/瓶,较上一日涨40元;25年飞天茅台散瓶报1590元/瓶,较上一日涨40元 [14] - 京东旗下餐饮平台“七鲜小厨”自今年开出首店后,用4个月时间在北京开出30家门店,基本实现五环内主要城区全覆盖 [10] - 德国平价超市品牌奥乐齐目前在华门店数量为80多家,预计明年一季度在中国市场的门店数量将达到100家,2025年新开店数量约30家,约90%为自有品牌商品 [16] - 新乡胖东来三胖店试营业,店内售卖梅西、姆巴佩、库里等球星的亲笔签名球衣,价格从数千元到数万元不等,最贵球衣售价13.8万元 [21] - 岁末美妆消费潮带动市场,国货化妆品品牌交易额占比已达55.2%,爱企查数据显示,中国今年年内新增化妆品相关企业超400万家,已超越去年全年注册量 [34] 互联网与平台 - 微信公众号正式上线“付费加热”功能,创作者可选择提升阅读量或增加新关注,例如500个微信豆(约合50元人民币)可选择新增阅读125-500人,估算新增一个阅读成本约0.1-0.4元 [15] - 意大利竞争与市场管理局对Meta扩大调查范围,新增对WhatsApp商业解决方案条款的审查,并已对Meta、WhatsApp及Facebook实施临时措施,调查其是否存在滥用市场支配地位的行为 [16] 医药与健康 - 美国马里兰州陪审团裁定,强生公司需向一名因使用其婴儿爽身粉罹患间皮瘤的女性支付15.6亿美元(约合人民币110亿元)赔偿,创下强生滑石粉致癌诉讼15年来单一原告获赔最高纪录,强生公司表示将上诉 [7] - 辉瑞公司表示,一名参与其血友病药物Hympavzi长期研究的患者出现严重副作用后死亡,公司正在收集信息以了解情况,该消息导致辉瑞当天股价收盘下跌超过1% [21][22] 房地产与政策 - 北京市优化调整住房限购政策,放宽非京籍家庭购房条件,将非京籍家庭购买五环内商品住房的社保或个税缴纳年限由“3年”调减为“2年”,购买五环外商品住房的由“2年”调减为“1年”,同时支持多子女家庭住房需求,允许其在五环内多购买一套商品住房 [13] 资本市场与公司动态 - 友邦吊顶公告,公司实际控制人正在筹划控制权变更事项,可能导致公司控股股东、实际控制人发生变更,公司股票自12月24日起停牌,预计停牌时间不超过2个交易日 [11] - 深圳四方精创资讯股份有限公司、苏州优乐赛共享服务股份有限公司、北京宇信科技集团股份有限公司均向港交所提交上市申请书 [24][25][26] - 苹果公司首席执行官蒂姆·库克斥资约295万美元买入50,000股耐克股票,交易后共持有105,480股耐克股票 [21] - 美股三大指数集体收涨,均录得日线5连涨,道指涨0.6%,标普500指数涨0.32%,纳指涨0.22%,其中标普500指数和道指均创历史收盘新高 [22] - 东方甄选方面确认,俞敏洪已敲定由新东方教育科技集团副总裁孙进担任东方甄选执行总裁 [7] - 日本东京电力公司宣布,将于明年1月20日重启柏崎刈羽核电站6号机组反应堆,这将是2011年福岛核事故后,东京电力公司旗下首个重启的核电机组 [16]
8点1氪|官方回应吸毒记录封存相关问题;强生爽身粉致癌案判赔女子约110亿元;俞敏洪敲定东方甄选接班人
36氪· 2025-12-25 07:57
法律与监管 - 修订后的《治安管理处罚法》将于2026年1月1日起施行,其中第136条规定了治安违法记录封存制度,适用于包括吸毒在内的未成年人治安违法行为 [2][3] - 官方澄清治安违法记录封存是一种信息管控措施,并非消除记录,被封存的信息不得随意查询、提供或披露,但为国家机关办案需要或根据国家规定查询的除外 [4][5] - 明确吸毒行为在中国法律中属于治安违法行为而非刑事犯罪,治理重点在于戒毒,相关戒毒人员信息一直依法处于保密和受管控状态 [6][8][9] 科技与人工智能 - 小米发布自研开源推理模型MiMo-V2-Flash,总参数309B,在多个Agent测评基准上排名全球开源模型前二 [12] - 字节跳动豆包AI的日均活跃用户数(DAU)已突破1亿,据称是字节历史上推广费用最少的破亿DAU产品 [33] - 字节跳动Seed团队推出形式化数学推理专用模型Seed Prover 1.5,该模型在16.5小时内对IMO 2025前5题生成了可验证的证明代码,换算成绩达到金牌分数线 [30] - 阿里升级语音模型Qwen3-TTS,发布音色创造和音色克隆两款新模型,可实现DIY声音设计和像素级音色模仿 [31] - 猿辅导素养课发布“AI课堂2.0”,称经AI赋能后学生学习效率提升20%,留存率提升10%,满意度提升37% [32] 消费电子与汽车 - 消息称苹果计划从iPhone 18系列开始调整发布策略,2026年秋季推出iPhone 18 Pro、Pro Max及折叠屏机型,基础款iPhone 18和18e则安排在2027年春季上市,iPhone 18 Pro系列可能新增咖啡色、紫色、酒红色配色 [15] - 苹果与巴西反垄断机构达成和解,同意在巴西的iOS系统中允许第三方应用商店运营,并允许应用开发者推广外部优惠 [20] - 理想汽车合并第一、第二产品线,由副总裁汤靖管理,原第二产品线负责人张骁被报道将主动离职 [21] - 阿维塔澄清其车型阿维塔12将在南极进行为期16个月以上的适应性测试,以经历极地不同季节及环境变化 [22] - 现代汽车美国公司因拖车灯故障和电路短路隐患,在美国召回51,587辆汽车 [20] - 美国汽车安全监管机构对约179,071辆2022年款特斯拉Model 3展开缺陷调查,涉及紧急车门释放装置可能不易触及或识别 [21] 互联网与社交媒体 - B站否认“全面付费观看”传言,相关造谣人员已被警方行政拘留 [11] - 微信公众号正式上线“付费加热”功能,创作者可付费提升内容阅读量或增加新关注,估算新增一个阅读成本约0.1-0.4元 [17] - 意大利竞争与市场管理局对Meta采取临时措施,调查其将Meta AI服务整合至WhatsApp过程中是否存在滥用市场支配地位的行为 [19] 零售与消费品 - 京东旗下餐饮平台“七鲜小厨”在北京已开出30家门店,基本实现五环内主要城区全覆盖 [13] - 德国平价超市奥乐齐计划在2025年一季度将中国门店数量扩至100家,目前其在华门店约80多家,2025年计划新开约30家 [18][19] - 胖东来新店售卖梅西、姆巴佩、库里等球星的亲笔签名球衣,价格从数千元到数万元不等,最贵球衣售价13.8万元 [24] - 根据“今日酒价”数据,12月24日茅台价格全线上涨,25年飞天茅台原箱批价报1600元/瓶,较前一日涨40元;24年飞天茅台原箱报1630元/瓶,较前一日涨30元 [16] 金融与资本市场 - 美股三大指数集体收涨并录得日线5连涨,道指涨0.6%,标普500指数涨0.32%,纳指涨0.22%,其中标普500指数和道指均创历史收盘新高 [25] - 多家公司启动上市进程:杭州云深处科技启动A股上市辅导 [26];四方精创 [27]、优乐赛 [28]、宇信科技 [29] 向港交所提交上市申请书 - 友邦吊顶公告实际控制人正在筹划控制权变更事项,公司股票自12月24日起停牌,预计不超过2个交易日 [14] 医药与健康 - 强生公司在一起爽身粉致癌诉讼中被美国马里兰州陪审团裁定,需向一名女性支付15.6亿美元(约合人民币110亿元)赔偿,创下其同类诉讼15年来单一原告最高赔偿纪录 [10] - 辉瑞公司一款血友病长效凝血因子疗法Hympavzi在长期研究中出现一例患者死亡,该患者于12月14日因中风后脑出血死亡,辉瑞股价当日收盘下跌超1% [24] 公司动态与人事 - 东方甄选确认俞敏洪已敲定接班人,由新东方教育科技集团副总裁孙进担任东方甄选执行总裁 [10] - 影石创新针对其新品无人机遭遇超过2500条恶意不实攻击信息,发起最高10万元悬赏征集“黑公关”线索,并表示已获公安机关正式立案 [11] - OPPO ColorOS智慧产品研发总监否认拒绝与字节跳动就“豆包AI手机”合作,称对任何合作持开放态度,并透露正与支付宝深度合作,计划明年1月官宣与另一重要伙伴的战略合作 [12] - 长城汽车董事长魏建军回应魏牌频繁换帅,称打造成功高端品牌对CEO要求全面,中国品牌高端化仍在探索阶段 [17] - 长安汽车发布声明,否认“公司废轻铁拍卖疑致国有资产流失”的网络信息为不实信息 [23] - 苹果公司CEO蒂姆·库克斥资约295万美元买入5万股耐克股票,交易后共持有105,480股耐克股票 [24] 能源与工业 - 日本东京电力公司宣布将于2026年1月20日重启柏崎刈羽核电站6号机组反应堆,这将是福岛核事故后其旗下首个重启的核电机组 [19] - 据韩媒报道,三星电子和SK海力士已上调明年HBM3E价格,涨幅接近20% [20] 房地产政策 - 北京市四部门联合发文优化调整住房限购政策:非京籍家庭购买五环内商品住房的社保或个税缴纳年限由3年减为2年,五环外由2年减为1年;支持二孩及以上多子女家庭在五环内多购买一套商品住房 [15] 投融资 - 桌面级激光加工设备科技企业“壹粟创新”宣布完成亿元Pre-A轮融资,由同创伟业联合元钛基金、协立资本共同参与,资金将用于技术迭代、产品线拓展及全球化布局 [34][35]
中国大模型公司,开始扎堆上市
搜狐财经· 2025-12-23 12:45
上市进程与行业意义 - 智谱于12月17日通过港交所上市聆讯,12月19日披露招股书;MiniMax紧随其后,于12月21日刊发招股书,两家公司几乎同时冲刺IPO,拉开“全球大模型第一股”资本盛宴的帷幕 [2] - 智谱是“大模型六小虎”中首家启动IPO流程的公司,最早于2025年4月办理辅导备案;MiniMax目标是在2026年1月登陆资本市场 [3] - 两家公司的上市将为行业首次提供可量化的二级市场估值基准,其市盈率、市销率将成为后续大模型企业融资的参照标准,引导行业关注“可规模化的商业场景” [14] 公司背景与技术路径 - 智谱源自清华大学计算机系知识工程实验室的技术成果转化,专注于AGI研发,其GLM系列模型基于自回归填空的全国产预训练架构,已适配40余款国产芯片 [3] - 智谱构建了全面的产品矩阵,覆盖从边缘小模型到百亿参数旗舰大模型,功能涵盖对话、通用智能体、代码生成、图像理解、文生图/视频及语音交互等多个场景 [3] - MiniMax聚焦于“模型—多模态—应用”的一体化发展,在AI视频生成、语音合成等多模态模型感知层面展现强大爆发力,其视频生成模型“海螺AI”曾创下全球内容播放量纪录 [5] 资本与估值情况 - 智谱自2019年成立以来已完成多轮融资,投资者包括高瓴资本、启明创投、君联资本等知名机构及美团、阿里、腾讯、小米等互联网巨头,仅在2024年12月以来的半年内就密集完成超50亿元人民币融资 [5] - 截至最近,智谱的估值已达到400亿元人民币 [6] - MiniMax于2025年7月完成新一轮近3亿美元的C轮融资,由上海国资母基金等机构出资,股东包括阿里、腾讯、米哈游、高瓴、IDG、红杉中国等,公司估值已超过40亿美元(约300亿元人民币) [6] - 高瓴资本同时投资了两家公司,展现出对中国大模型赛道头部公司的全面布局 [6] 商业化进展与财务数据 - 智谱CEO透露,截至12月,公司面向开发者的软件工具和模型业务已获得超过1亿元的年度经常性收入 [8] - 智谱优先发展模型应用及API业务,希望将API业务收入占比提升至总营收的一半,其API业务平台已服务超过270万付费客户,并已在马来西亚、新加坡、阿联酋、沙特等地落地大模型基础设施 [9] - 智谱的财务数据显示,2022年至2024年营收分别为5740万元、1.25亿元和3.12亿元;同期亏损额分别为1.44亿元、7.88亿元和29.58亿元,累计亏损达38.9亿元;2024年计算能力服务费用达15.52亿元,约为同期营收的五倍;截至2025年6月底,现金及现金等价物为25.52亿元 [9] - MiniMax的商业化主要有两种形式:面向B端的MiniMax开放平台和产品内的广告机制,其开放平台已有超过三万家企业客户和开发者 [11] - 海外市场是MiniMax的主要收入来源,贡献了超过70%的收入;2025年前九个月,公司营收同比增长超过170%,同期销售及营销开支同比下降26%,实现了高速增长下的亏损有效收窄 [11] 产品与用户规模 - 截至2025年9月30日,MiniMax的AI原生产品矩阵已拥有超过200个国家及地区的逾2.12亿名个人用户,以及超过100个国家的13万家企业客户 [5] 开源战略与技术进步 - 2025年中国大模型领域“开源之战”进入白热化,智谱在12月8日至14日期间密集发布了GLM多模态和智能体系列模型,其开源的AutoGLM模型被视为全球首个具备“手机操作”能力的AI智能体,能稳定完成外卖点单、机票预订等长达数十步的复杂操作 [12] - MiniMax于10月底发布了新一代开源文本大模型M2,该模型在Artificial Analysis基准测试中位列全球前五,是开源模型中的第一位,这是中国开源模型首次与OpenAI和谷歌等公司一同跻身排行榜前列;公司还发布了全新升级的语音模型Speech2.6和音乐模型Music2.0 [12]
智谱GLM-4.7上线并开源
第一财经· 2025-12-23 09:25
公司动态 - 智谱公司宣布其大语言模型GLM-4.7正式上线并开源 [1] - 新版本GLM-4.7已通过BigModel.cn平台提供API服务 [1] - 新版本在z.ai全栈开发模式中上线了Skills模块,该模块支持多模态任务的统一规划与协作 [1] 产品技术 - GLM-4.7新版本主要面向Coding场景,重点强化了编码能力、长程任务规划与工具协同能力 [1] - 该模型在多项主流公开基准测试中取得了开源模型中的领先表现 [1]
观察 | 到底谁才是国内AI大模型的真第一?
未可知人工智能研究院· 2025-12-22 12:01
文章核心观点 - 近期三份报告分别将科大讯飞、字节豆包和DeepSeek列为中国AI大模型领域的“第一”,差异源于衡量标准不同,分别对应营收、调用量和全球开发者选择[1][2][18] - 三个“第一名”代表了中国大模型行业三种不同的商业路线和竞争维度,行业格局尚未定型,存在并行发展的可能性[18][31] - 理解这些差异对于职业选择、创业工具选型和投资判断具有直接指导意义[3][25] 根据相关目录分别进行总结 三份报告及其衡量标准 - **智谱招股书(营收标准)**:根据智谱公司递交港交所的招股书,2024年中国大模型厂商以收入排名,公司A(推断为科大讯飞)以0.44(单位:人民币十亿元,即4.4亿人民币)的收入和9.4%的市场份额位列第一,其2024年大模型相关收入超过五亿人民币,中标项目行业第一[4][6][7][8] - **IDC报告(调用量标准)**:根据IDC本月发布的报告,以用户调用次数和消耗的Token量为标准,火山引擎(字节豆包)占据49.2%的市场份额,接近半壁江山,阿里云占27%,百度智能云占17%[9][10][12];豆包的日均Token调用量从今年4月的16万亿增长至年底的50万亿[13] - **A16Z & OpenRouter报告(全球开发者选择标准)**:根据A16Z和OpenRouter基于100万亿真实Token使用数据发布的报告,DeepSeek以14.37万亿Token的使用量位居全球开源模型第一,是第二名阿里Qwen(5.59万亿)的近三倍,也高于Meta的Llama(3.96万亿)[15][18] 不同“第一”背后的商业逻辑与行业路线 - **科大讯飞代表的“政企路线”**:优势在于长期耕耘政企市场,依靠关系、解决方案和落地能力获得高客单价订单,2024年大模型项目中标金额超五亿人民币,但模式依赖关系型销售,规模化较难且To C市场存在感弱[19][24][27] - **字节豆包代表的“流量路线”**:优势在于背靠抖音、今日头条等超级App的庞大流量导入,采用低价策略(比行业均价便宜六成多)快速抢占市场份额,调用量巨大但现阶段不等于盈利能力强,已开始向奔驰、比亚迪、招商银行等企业市场渗透[19][23][27] - **DeepSeek代表的“技术路线”**:优势在于开源、性能强、成本低,深受全球开发者欢迎,其流量中67%用于娱乐和角色扮演场景,在技术社区影响力大,但商业化模式仍在探索,其背后投资方幻方量化通过其他方式(如股市打新)实现高效盈利[20][21][23][27] 对行业参与者的启示与影响 - **对求职者**:不同路线对应不同能力要求,政企路线需懂方案、客户与行业,流量路线需能抗压、快速迭代与处理海量数据,技术路线需技术过硬、钻研精神与理想主义,选择与自身匹配的赛道至关重要[25] - **对创业者与企业主**:选择AI工具应基于核心需求而非榜单排名,需权衡数据安全、成本、标准化与定制化等因素,例如政企项目可选科大讯飞或华为云,成本敏感且可接受数据出境可选豆包或DeepSeek,高度定制化则可能基于开源模型自研[26][32] - **对投资者**:行业仍处早期竞争阶段,公司普遍“烧钱”抢市场,盈利者少,例如智谱2024年营收三亿多却亏损二十多亿,科大讯飞增收不增利,投资需关注长期壁垒与清晰变现路径,市场份额的含金量需结合商业模式(如毛利率、客单价)评估[28][32] 行业格局与未来展望 - 中国大模型行业正经历分化,To B、To C、To G、To D等不同市场玩法各异,可能形成多个并行“第一名”的格局,类似电商领域淘宝、京东、拼多多并存的局面[31] - 中国大模型技术已得到全球认可,中国开源模型的全球市场份额从去年底的1.2%飙升至今年中的近30%,表明中国力量正在重塑全球AI生态,在某些细分领域已处于全球并跑甚至领跑位置[33][34]
金融大家评 | 中国农业银行董事长、党委书记 谷澍:提升AI应用普惠性的若干思考
清华金融评论· 2025-12-18 17:46
文章核心观点 - 金融业应主动融入国家“人工智能+”行动,通过平衡开源与闭源模型、协同决策式与生成式AI、优化算力供给与保障安全性等多维路径,提升人工智能应用的普惠性,推动技术与业务深度融合,最终提升金融服务质效和内部管理效能 [3][4][5][8][9] 开源模型与闭源模型 - 开源模型意味着技术平权和自主可控,通过分布式协同创新降低企业应用成本,提升AI普惠性,但存在模型迭代速度较慢、幻觉率较高的特点 [4] - 闭源模型在稳定性和可靠性上相对更高,同等参数规模下性能可能更优,服务支持更成熟,但自主定制化程度受限且模型透明度较低 [4] - 金融业应重点考虑“AI+”应用而非自建大模型,融合开源与闭源优势,围绕场景建设提升服务质效和管理效能 [4] - 以农业银行为例,采取“两条腿走路”策略:在普惠服务、办公等领域加快探索应用开源模型以提高普及率;同时通过本地化部署闭源模型,在客户服务、知识优化推荐等场景确保数据隐私和极致体验 [4] 决策式AI与生成式AI - 决策式AI擅长“确定性优化”,在强可解释性和准确性要求高的场景中仍是最优选择,目前金融业应用占比超过八成,主导风险评估、算法交易和欺诈检测等核心业务领域 [5] - 生成式AI擅长“可能性涌现”,在开放式和创意性场景中泛化能力更好,主要应用于智能客服、知识助手、报告撰写等非核心业务领域 [5] - 随着大模型能力增强、生态完善和算力突破,生成式AI应用可能实现指数级增长,并与决策式AI协同,形成以智能体为主的通用范式,二者边界趋于模糊 [5] - 多智能体配合的“双AI”编排协作模式能更好实现AI能力普惠化,例如在客户营销中,用决策式AI构建客户画像,用生成式AI形成个性化服务方案,提升服务精准性和获得感 [5] AI普惠与算力供给 - AI普惠性提升导致数据处理规模和复杂度指数级增长,数据中心计算量膨胀速度将远大于CPU处理效率进化速度,AI大规模应用意味着进入加速计算时代 [7] - GPU凭借强大并行计算能力能高效应对计算密集型任务,未来通用计算将退化为“控制平面”,高时效高计算负载场景由专用加速计算实现 [7] - AI加速普及过程中,GPU算力需求与供给将始终处于“紧平衡”状态,从绿色发展角度看这种平衡是必要的 [8] - 需从存量挖潜和增量扩容两端发力平衡矛盾:一方面通过算力灵活调度、参数合理匹配、模型压缩加速等工程化手段降低运行成本;另一方面加快建设支持AI高性能计算的智算中心 [8] - 以农业银行为例,依托“农银智+”平台构建参数多样、能力丰富的模型矩阵,通过模型蒸馏、微调等手段精细化匹配业务并充分利用GPU资源,同时建设支持多类型GPU组合的算力云平台,保障AI算力弹性、韧性和可持续供给 [8] 普惠性与安全性 - 提升AI应用普惠性同时必须高度重视安全性,需强化AI稳定性以保障大众利益,未来AI将成为数字世界“基础设施”,需建立模型安全护栏、主动防御等技术手段应对提示词注入、资源消耗攻击等风险,保障AI稳定运行和业务连续性 [9] - 需提升数据质量以增强模型可信度,在AI广泛应用背景下,数据来源更丰富、结构更复杂,数据倾斜、数据投毒等问题会加剧模型决策偏差,引发公众信任危机,需建立全生命周期模型评测和监控体系,加强算法公平性约束,提升模型稳定性和可解释性 [9] - 需避免模型共振以防范系统性风险,随着竞争加剧,市场主流大模型集中度会越来越高,商业银行依赖的模型算法逐步趋同,局部缺陷可能形成机构间模型共振并引发系统性风险,需加快构建更可靠知识体系,开展差异化模型训练,提升金融系统整体韧性 [9]