阿里Qwen
搜索文档
中美AI竞赛进入下半场,决胜点在哪?
观察者网· 2026-02-04 14:59
全球AI产业竞争格局 - 全球人工智能产业正从“百模大战”的喧嚣期转向“价值落地”的深水区,竞赛规则从“技术参数比拼”转向“应用落地”的马拉松 [1] - 中美形成“双寡头”格局:美国在最强算力与最强推理的“天花板”上保持领先,中国则在工业渗透与规模化应用的“地板”上实现追赶与反超 [1] - 美国在“从0到1”的原始创新和高价值软件服务上占有优势,中国在“从1到100”的规模化应用和实体产业赋能上建立壁垒 [2] 中美技术路径与能力对比 - 美国在原生大模型的绝对能力上仍领先中国数月,优势在于“从0到1”的暴力美学,依托资本和算力储备定义AI智能上限 [3][6] - 中国受限于硬件,走出一条“极致效率”路径,通过算法优化和架构创新,用几分之一的成本实现与美国顶尖模型相近的性能 [7] - 中美顶尖模型在主要基准上的差距已从2023年的两位数百分比,大幅缩小至2024年底的5%以内,部分领域差距不到1% [7] - 中国通过昇腾、寒武纪等国产AI芯片及华为云CloudMatrix384等集群架构创新,构建高性价比的算力底座,支持大规模模型训练与推理 [7] 中国AI的应用落地与产业优势 - 中国制造业的AI采用率高达67%,而美国仅为34%,在工业互联网AI上拉开30%以上的应用率差距 [9] - 中国AI深度嵌入钢铁、煤矿、港口等核心生产流程,美国应用更多停留在金融算法、药物研发等虚拟或研发密集型领域 [9][10] - 中国企业致力于将DeepSeek等低成本模型塞进每一个智能硬件和工业软件,不再单纯对标GPT-5 [9] - 美国政府和军方的AI采纳速度远慢于中国,可能在“工业互联网”和“智能制造”等战略领域被拉开代差 [9] AI落地面临的挑战与机遇 - AI升级为生产工具面临三大挑战:场景之难(行业问题无标准答案)、数据之难(工业数据封闭专业)、落地之难(价值闭环链条极长) [13] - 每一个被攻克的行业痛点都可能转化为难以复制的竞争壁垒,这给了中国AI构建护城河的机会 [13] 中国AI的实践案例与生产力转化 - 华为云在华能伊敏露天矿实现重型矿车和挖掘机完全无人化运行,在零下40℃极寒天气中高效作业 [14] - 华为云与海螺集团打造水泥行业AI大模型,实现关键生产环节标准煤耗再降1%、年减碳超4500吨,人员劳动强度降低50% [14] - 华为云盘古矿山大模型在山东能源矿井中快速识别岩石与煤块,实现地面远程挖煤,并能预测瓦斯爆炸、透水及塌方 [14] - 中国移动与中国联通在天津港与宁波舟山港,通过5G+云网融合实现龙门吊远程操控,毫秒级时延完成千万吨级集装箱吞吐 [15] - 国内互联网云厂商助力中国一汽、长安汽车、工业富联、三一重工等企业利用云端AI技术提高不良品判别效率,促进生产智能化升级 [15] - 在宝武钢铁,盘古大模型通过感知炉温、推演铁水硅含量,将高炉效率提升1%,实现巨额成本节约和碳排放减少 [18] - 瑞金医院利用RuiPath病理模型,将单切片诊断时间从40分钟缩短至“秒级”,覆盖中国90%的高发癌种 [18] 国产AI算力基础设施的支撑作用 - 华为云CloudMatrix AI Infra智算云服务通过深度整合与智能化调度资源,为复杂应用提供统一、高效、长稳的底座 [18] - 在芜湖、贵安、乌兰察布、和林格尔等核心枢纽,基于CloudMatrix384的AI Token服务正输送给科大讯飞、中科院、美的集团等2600多家客户 [18] - 电信运营商布局东数西算的算力网络,互联网巨头的“工业大脑”、AI开放平台为中小企业提供了低门槛的AI技术应用方案 [20] - “算力即服务”的模式极大降低了企业使用AI的门槛,夯实了中国在“双寡头”竞争中的根基 [20] AI竞赛下半场的本质与衡量标准 - 中美AI竞赛下半场本质是对“新质生产力”的争夺:美国试图构建全球AI生态的“大脑”,中国专注于AI技术的“需求侧”和“扩散层” [20] - 在更长时间维度里,衡量AI成功的标准将不只是参数大小,更是能否解决电网调度、港口吞吐、新药研发等实际问题 [20] - 中国在AI竞赛下半场的最大底气在于:不只是仰望星空的技术突破,更是脚踏实地的生产力重塑 [20]
高盛眼中的2026年中国互联网:AI超级入口争夺战全面打响,三大主题锁定阿尔法机会
华尔街见闻· 2026-01-19 21:25
文章核心观点 - 高盛认为2026年将是中国互联网行业的战略转折年,行业竞争主线将围绕“加大AI面向消费者的投资以争夺超级入口”和“全力捍卫核心市场地位”展开,投资逻辑将从普涨转向由盈利增长、全球化叙事和股东回报驱动的精选个股时代 [1] 行业转折与竞争格局 - 行业转折由字节跳动的全面破局引发,其2025年盈利达500亿美元,成为中国互联网盈利龙头,远超腾讯的360亿美元和阿里的150亿美元 [2] - 字节跳动在多个领域形成突破:AI应用“豆包”日活超1亿,日Token消耗量达50万亿;电商GMV同比增长30%+,预计2026年将超越拼多多;本地服务到店业务GTV规模达8000亿元,直接挑战美团 [2] - 面对竞争,阿里、腾讯等巨头启动战略转向:一是加大AI投入,2026年字节、阿里、腾讯合计AI资本开支将超600亿美元(约4100亿元人民币);二是死守核心阵地,如阿里巩固电商、美团强化本地服务、腾讯在微信加速AI代理落地;三是竞争趋于理性,单位经济效益改善 [3] AI核心发展趋势 - 广告营销转型:广告预算向ROI导向型集中,AEO(答案引擎优化)与GEO(生成引擎优化)成为新热点,广告策略转向“SEO+GEO+AEO”组合 [4] - 模型竞争升级:竞争焦点在长上下文、多模态、3D世界模型/物理AI与低成本架构,字节跳动与阿里在多模态领域领跑 [4] - To-C AI入口爆发:2026年是消费级AI超级入口“元年”,字节豆包、阿里Qwen、微信AI助手将展开密集竞争,可能改变用户多App使用习惯 [4] - 全球化双轨变现:中国AI模型从单纯开源转向“开源+闭源”结合,顶尖模型如阿里Qwen3-Max采用闭源模式通过订阅与API变现,编码与多模态模型加速全球渗透,覆盖200+国家 [4] - 基础设施需求激增:To-C与To-B端AI需求推动推理需求与Token量高速增长,BAT的AI资本开支超600亿美元带动云服务与数据中心需求,阿里云有望维持30%+增速 [5] 投资框架与主题 - 2026年投资将告别普涨逻辑,转向围绕EPS交付/增长、AI与全球化叙事变化、股东回报三大主题的精选个股时代,云与数据中心、游戏与娱乐、AI模型是Top 3首选子行业 [6] - **EPS交付/增长主题**:关注盈利改善确定性高的领域,如数据中心(受益AI基建)、电商与本地服务(亏损收窄)阿里因外卖竞争缓和亏损收窄,成为盈利增长最快巨头之一;京东即时零售业务亏损将从2026下半年开始收窄 [7] - **叙事变化主题**:挖掘AI技术突破与海外业务重估潜力,关注AI模型(技术优势与用户增长)、全球化布局(跨境电商/海外游戏盈利拐点)快手的视频生成模型可灵技术领先且全球用户快速增长;百度有望通过昆仑芯分拆上市实现价值解锁 [8] - **股东回报主题**:筛选现金流稳定、股东回馈意愿强的公司,重点关注净现金充足、股息有提升空间或分红政策稳定的企业 [9] 重点公司观点 - **拼多多**:成为高盛2026年核心推荐标的,其10倍2026年预期市盈率显著低于行业中位数18倍,叠加Temu盈利拐点、AI应用潜力及国内下沉市场稳固的“性价比”用户心智,估值重估空间显著 [1] - **阿里巴巴**:因AI全栈布局,与腾讯一同仍是长期(1-3年)配置的核心标的 [1] - **腾讯**:作为AI应用核心受益者,是长期配置的核心标的之一 [1]
2026科技风向标:八大趋势重塑产业与生活
21世纪经济报道· 2026-01-15 14:05
文章核心观点 2025年全球科技在人工智能、航天、量子计算、聚变能源等领域取得突破性进展,中美竞争推动格局深刻变革 [1] 2026年将成为科技从实验室走向产业化的关键一年,AI与物理世界深度融合、脑机接口商业化、低空经济规模化等趋势将开启新一轮全球科技革命与产业变革 [1] 2025年全球科技重大事件回顾 人工智能 - DeepSeek在2025年春节期间火爆出圈,其底层模型性能对标OpenAI的GPT-4和o1,通过算法优化大幅提高英伟达GPU算力利用率并降低模型成本,开启了AI的“效率革命” [2] - DeepSeek作为开源模型,吸引了全球数十万开发者共建生态,其研究论文于2025年9月以封面文章形式登上《自然》杂志 [2] - 2025年,国产开源模型如阿里Qwen、智谱等也在国际舞台大放异彩 [2] - 2025年贯穿全年的“百镜大战”标志着AI加速渗透消费电子,AI眼镜成为争夺焦点 [9] - 苹果在2025年秋季发布升级版Vision Pro,推动MR设备从尝鲜玩具转向生产力工具,引发三星、Meta、华为等厂商跟进 [10] 航天科技 - SpaceX的“星舰”火箭于2025年10月13日成功完成第11次试飞,首次实现从发射到受控返回地球的“完整闭环”,标志着商业航天产业成熟 [3] - 2025年,中国卫星互联网的千帆星座、国网星座两大星座计划实质性组网,解决了“有箭无星”的需求痛点 [3] - 2025年12月3日,蓝箭航天朱雀三号重复使用运载火箭发射入轨,是国内首次尝试一级回收的运载火箭 [3] - 2025年7月9日,中国科学院发布嫦娥六号月球样品系列研究成果,其中4项成果以封面文章形式发表于《自然》杂志 [3][4] 机器人技术 - 2025年春晚,16台宇树H1人形机器人“福兮”登台表演,标志着中国在人形机器人领域已跻身全球第一梯队 [5] - 2025年,具身智能初创企业引发市场关注,机器人公司从PPT走到量产阶段,并开始进入汽车工厂、物流仓储等工业化场景 [5] 半导体产业 - 2025年,为满足AI需求,三星、美光以及SK海力士将产能转向AI,排挤传统手机和PC的存储产能,存储芯片进入“超级周期” [6] - 2025年下半年开始,服务器、手机、电脑等硬件设备所需芯片全线涨价,手机、PC等厂商新发产品出现百余元涨价,预计涨价将至少持续至2026年下半年 [6] - 2025年,国产AI芯片公司摩尔线程、沐曦股份、壁仞科技和天数智芯集体加速上市,资本市场批量迎接国产AI芯片公司入场 [11] - 海外市场,博通和谷歌市值屡创新高,更多云厂商采用自研ASIC定制芯片用于AI推理,试图摆脱对英伟达的完全依赖 [11] 能源与量子计算 - 2025年1月20日,中国全超导托卡马克核聚变实验装置(EAST)成功实现1亿摄氏度高温下高约束模式等离子体持续运行1066秒,创造世界纪录 [7] - 2025年,中国成功构建105比特超导量子计算原型机“祖冲之三号”,在比特数上实现重大突破 [8] - 2025年,谷歌在其105比特量子处理器Willow上开展量子纠错实验,验证了逻辑量子比特稳定性能随系统规模扩大而提升,相关成果发表于《自然》 [8] 2026年全球科技发展趋势展望 人工智能与智能体 - 2026年被预测为AI Agent的成熟之年,大量智能体将协作完成复杂任务,推动交互界面革命,手机电脑可能退化为后台处理器 [12] - 通信协议的标准化让多智能体(MAS)能通过分工协作解决科研、工业等复杂任务,成为关键基础设施 [12] - AI Agent将由规划、执行、审校、记忆等多个AI专家协同组成,显著降低企业对人力、管理与IT系统的依赖,使中小企业首次具备接近大型组织的运作效率 [12] - 2026年,NPU等AI加速单元将成为个人电脑、手机与可穿戴设备的标准配置,本地推理成为主流使用方式 [13] - AI PC、AI眼镜等新型终端快速普及,将重塑软件生态与使用习惯 [13] 机器人、自动驾驶与物理世界融合 - 2026年,人形机器人或逐步进入家庭与养老机构试点,执行叠衣、清洁、简单烹饪、陪护等复杂任务 [13] - 具备环境感知和自主决策能力的智能设备,如自动驾驶汽车、无人机、eVTOL等,将执行更复杂的任务,重塑物流、农业和制造业 [13] - 2026年,L3级自动驾驶技术将快速普及,推动Robotaxi、Robotruck等新业态大面积落地商用,智能驾驶商业化的盈亏平衡将加速实现 [14] - 依靠端到端大模型实现复杂城区的全无人驾驶,越来越多的城市将进行Robotaxi运营,无人驾驶将从技术验证迈入商业闭环 [15] 量子计算与算力 - 2026年有望成为量子计算进入主流的一年,量子硬件初创公司QuantWare计划于2026年实现量子芯片的大规模量产 [16] - 按照IBM技术路线图,其最先进的量子处理器Quantum Nighthawk若搭配量子软件,将于2026年实现量子优势,可能意味着量子计算有望替代GPU [16] - 2026年被认为是量子计算展示“量子优势”的关键一年,IBM等公司正尝试用当前的含噪声量子处理器解决材料模拟、量子化学等实际难题 [16] - 算力的竞争也关乎电力,2026年科技巨头将直接投资能源领域,特别是太空AI算力中心和可控核聚变技术的商业化探索 [17] - 2026年部分数据中心开始探索以微型核反应堆(SMR)作为稳定、低碳的独立电源方案 [17] - AI服务器功率攀升使液冷成为刚需,政策刚性要求推动产业爆发,中国作为全球算力中心建设核心市场,液冷技术应用持续拓展 [17] 脑机接口与商业航天 - 马斯克创立的Neuralink宣布在2026年将大规模生产脑机接口设备,推进自动化外科手术流程 [18] - 中国“十五五”规划建议将脑机接口列为六大未来产业之一,国内企业强脑科技完成20亿元融资 [18] - 国内多部门联合发布产业创新发展实施意见,目标是到2027年在医疗健康、工业制造、生活消费等领域加快脑机接口应用 [18] - 2026年,前期投入巨大的商业航天或将开始体现出巨大的商业价值,SpaceX的星链全球用户数和盈利能力快速增长,逐步形成稳定收入流 [19][20] - 以中国“朱雀三号”为代表的可回收火箭技术,目标是通过重复使用大幅降低发射成本,推动行业向“航班化”趋势发展 [20] - 中国版“星链”加速推动卫星升空、组网,随着更多国产低轨卫星覆盖全球,未来手机将具备更多卫星通信能力 [20] 低空经济 - 2025年10月,小鹏汇天在迪拜签订中东地区首批600台飞行汽车订购协议,创下该领域最大的海外批量订单纪录 [21] - 2025年国内已有多家eVTOL公司加速出海,亿航智能、时的科技、峰飞航空、沃兰特等均在中东、东南亚、欧洲等市场斩获订单 [21] - 中国“十五五”规划建议提出加快低空经济等战略性新兴产业集群发展,2026年前后,国内多地正推动低空经济从场景试点走向区域化、体系化推进 [21] - 根据波士顿咨询研究,到2040年,中国针对个人用户的eVTOL市场规模有望达到230亿美元,面向个人的eVTOL年销量约15万台 [21]
GPT-5.2来了!全球AI大模型竞赛加速,国内算力配套产业链有望受益
金融界· 2025-12-15 08:40
全球大模型技术竞争与产品发布 - OpenAI于12月11日正式发布GPT-5.2系列模型,其在推理、专业知识工作、金融建模、PPT/Excel产出等能力全面超越前代,并在多项推理基准测试中领先谷歌Gemini 3 [1] - OpenAI首席执行官奥尔特曼称公司将于明年1月走出“红色警报”,并暗示更多新品即将到来 [1] - 近期,谷歌Gemini 3.0引爆全球关注,Anthropic的Claude Opus 4.5在编程方面领跑全球,中国的阿里Qwen亦增长迅猛 [1] - OpenAI此前被谷歌逼到拉响“红色警报”,被迫加速大模型的研发进程 [1] 全球AI算力产业链需求 - 大模型速度与稳定性的突破将推动AI训练与推理算力需求再上台阶 [1] - 全球大模型竞赛加剧直接拉动服务器、专用芯片、光模块、先进封装、高速互联、高带宽存储(HBM)、液冷散热、铜缆等核心硬件的需求增长 [1] 中国AI算力市场动态与政策影响 - 近期英伟达H200芯片获准对华出口,其性能为此前H20芯片的近六倍 [1] - H200芯片的短期影响是缓解国内高端算力缺口、加速国内AI算力建设进程 [1] - 长期来看,H200芯片的松绑将倒逼国内算力产业链自主可控进程 [1] - 英伟达H200芯片的松绑并未改变美国在核心算力上对中国进行长期制衡的战略意图,反而强化了国内市场对国产算力自主可控的紧迫性,国产替代仍然是主流趋势 [2] A股市场相关投资机会 - 全球AI军备竞赛倒逼国内AI算力建设加速 [2] - 算力配套相关的服务器代工、高带宽内存(HBM)、光模块、PCB、铜缆、液冷等细分领域均有望受益 [2] - 建议关注上述各环节的龙头企业 [2]
东方财富证券:AI产业加速迭代 科技赋能传媒价值提升
智通财经网· 2025-11-18 16:29
行业整体表现 - 截至2025年11月12日,申万传媒指数涨幅为27.45%,跑赢同期沪深300指数18.07%的涨跌幅水平 [1] - 恒生科技指数年初至今上涨32.8%,主要受南下资金流入增加和国内AI互联网产业快速发展驱动 [1] - 行业高景气度由AI、游戏行业景气度高以及影视等行业政策边际向好驱动 [1] 传媒分板块观点 - 游戏板块建议关注后续产品储备丰富的公司 [1] - 影视板块建议关注直接受益于政策驱动和AI的相关公司 [1] - 广告营销板块建议关注互动新场景以及程序化广告布局的公司 [1] 游戏行业 - 行业维持高景气度,长青IP游戏的流水和用户持续上行 [2] - 多端互通成新趋势,带动整体端游市场复苏 [2] 影视院线行业 - 头部影片带动票房增长,2026年国内外影片储备丰富 [2] - 影视行业政策边际向好明显,引导行业积极回暖 [2] - AI漫剧等新内容爆发式增长,商业模式快速跑通 [2] 广告与电商行业 - 广告投放大盘温和增长,程序化广告创造增长新动能 [2] - 电梯广告探索消费新场景,打造营销闭环链路 [2] - 电商大盘整体增速疲软,即时零售和海外跨境市场成为重要战略布局方向 [2] 云计算与AI技术 - 云计算行业快速增长,AI agent兴起推动弹性算力需求 [3] - 2024年中国云计算市场未来五年仍将保持每年20%以上增长,至2030年可达3万亿+规模 [3] - 国内外AI模型能力差距缩小,国内头部平台在推理能力、模型架构等多方面实现提升 [3] 音乐及其他行业 - 音乐用户增长见顶,平台更注重付费用户转化和付费质量提升 [2] - 各大平台开始差异化布局,探索多元商业化手段 [2]
1万美元投资对决:阿里Qwen“梭哈”登顶,GPT-5竟成“反指王”
36氪· 2025-10-23 20:09
比赛概况与核心目标 - 美国人工智能研究实验室nof1ai发起名为Alpha Arena的实盘交易挑战,向中美六个顶尖大模型各提供10,000美元真实资金,在永续合约市场进行交易 [1] - 比赛核心目标是最大化风险调整后的收益,而非单纯追求最高收益,旨在检验AI大模型在真实市场中的能力 [1] - 比赛将持续至美国东部时间11月3日下午5时 [10] 各AI模型表现与投资风格(截至10月23日) - **阿里千问 (Qwen3-Max)**:总账户价值11,252.34美元,收益率+12.52%,位居第一;投资风格为果断的趋势捕手,交易频次适中,通过一次重仓操作实现逆袭 [4] - **深度求索 (DeepSeek V3.1 Chat)**:总账户价值10,868.84美元,收益率+8.69%,位居第二;投资风格为耐心持有主义者,交易次数最低仅9次,偏好长线交易 [4] - **xAI (Grok 4)**:总账户价值8,427.12美元,收益率-15.73%;投资风格为跟随者但不够精准,走势与DeepSeek相似但未能跟上市场变化 [5] - **Anthropic (Claude 4.5 Sonnet)**:总账户价值8,119.46美元,收益率-18.81%;投资风格为靠运气的大单交易者,总计12次交易中仅2次大赚,单笔最高盈利超1,800美元 [6][7] - **谷歌 (Gemini 2.5 Pro)**:总账户价值4,444.67美元,收益率-55.55%;投资风格为高频短线爱好者,6天内交易102次频次最高,胜率26.7%但单笔最大亏损-750.02美元 [8] - **OpenAI (GPT-5)**:总账户价值3,119.38美元,收益率-68.81%,持续垫底;投资风格为市场赌徒,胜率仅4.5%,过度交易和高杠杆导致两次爆仓,亏损超6,800美元 [8] 比赛揭示的行业启示 - 国产AI在金融实战中优势明显,目前保持正收益的唯二模型均为国产大模型(Qwen和DeepSeek) [9] - 高频交易不等于高收益,Gemini 2.5高频交易102次但一次重大方向错误导致深陷亏损 [9] - 高风险高回报存在魔力与陷阱,Qwen通过重仓逆袭而GPT-5因高杠杆导致爆仓 [9] - AI投资呈现人格化风格,模型最终表现高度依赖其底层策略、风险偏好及提示词工程设置 [9]
资金动向 | 北水抛售港股逾40亿港元,加仓阿里巴巴、中芯国际
格隆汇· 2025-09-23 19:42
南下资金流向 - 9月23日南下资金净卖出港股40.69亿港元 [1] - 净买入前五为阿里巴巴-W 16.73亿港元、中芯国际5.02亿港元、康方生物2.19亿港元、大众公用1.9亿港元、晶泰控股1.58亿港元 [1] - 净卖出前五为盈富基金32.71亿港元、恒生中国企业9.93亿港元、泡泡玛特3.74亿港元、华虹半导体2.33亿港元、腾讯控股2.22亿港元 [1] 阿里巴巴资金动向 - 南下资金连续23日净买入阿里巴巴累计达621.1489亿港元 [2] - 阿里Qwen团队宣布将发布6项新产品包括1个产品、2个开源模型和3个API接口 [3] - 高德宣布为全国餐饮商家免除一年入驻年费并提供流量补贴、专属客服等支持服务 [3] 中芯国际评级与前景 - 高盛将中芯国际H股目标价从73.1港元上调至83.5港元 [3] - 中国AI芯片需求增长受云服务商资本支出增加和AI终端应用推动 [3] - 维持2025-2027年盈利预测不变 2028-2029年每股收益预测分别上调1%和2% [3] 大众公用业绩与投资 - 公司参股深创投 深创投持有宇树科技股份 [4] - 2025年中期净利润3.33亿元同比增长172.62% 经营现金流净额7.61亿元同比增长160.29% [4] - 按权益法确认深创投投资收益1.18亿元 深创投持有中微公司、华大九天、商汤科技等硬科技项目 [4] 腾讯控股资本运作 - 9月23日回购86.7万股股份耗资5.5亿港元 [4] - 发行总额90亿元票据包括2030年到期20亿元2.1%票据、2035年到期60亿元2.5%票据、2055年到期10亿元3.1%票据 [4]
揭秘小鹏自动驾驶「基座模型」和 「VLA大模型」
自动驾驶之心· 2025-09-18 07:33
小鹏自动驾驶技术方法论 - 提出自动驾驶软件3.0时代概念 即"AI模型即软件" 整个软件栈由端到端AI模型构成 基于以数据为中心的方法迭代[6] - 公司处于将整个自动驾驶软件栈构建为端到端AI模型驾驶汽车的阶段[8] - 基于规模定律(scaling law) 利用每天从数十万辆真实世界车辆收集的大量数据训练大型视觉模型作为"工厂"[8] 基础模型与部署架构 - 通过大数据构建基础模型 无需依赖三维空间先验知识和空间问题 类似世界模型概念[8] - 通过深度裁剪 量化 蒸馏将基础模型压缩为更小版本 部署到车端硬件[8] - 在云端构建VLA(视觉语言动作)基础模型 通过蒸馏剪枝和微调训练部署到车端[32] 内外循环训练机制 - 内循环为每个模型创建训练流 扩展数据后进行再训练和监督微调(SFT) 持续提升模型性能[9] - 外循环通过数十万辆车作为现实世界数据采样器 持续采样数据 根据返回数据持续训练(协同训练)[11] - 重复内外循环过程直至性能达到L4级自动驾驶 公司目标2026年实现L4级智驾车型量产[11][13] VLA模型训练方法 - 采用阿里Qwen作为原始VLM模型 使用公司整理的驾驶数据进行预训练和对齐[15] - 预训练数据分类包括静态交通元素 动态交通参与者 点对点轨迹数据 占用网络 交通信号灯和交通流信息[18] - 基于Chain-of-Thought思维链进行四步推理:提供基本驾驶知识 CoT SFT 强化学习CoT 考虑延迟的CoT SFT[22][23] 模型优化与安全强化 - 监督微调(SFT)建模为"指令遵循"任务 使用筛选的好数据专门训练导航 舒适刹车等专用指令[27] - 后期训练(post-training)采用强化学习解决长尾案例 建立奖励模型确保行动一致性[29] - 强化学习设计三重奖励机制:安全(避免碰撞) 效率(避免卡壳) 合规(遵守交通规则)[30] 行业竞争核心要素 - 底层算法和架构相通 行业差距取决于高质量数据 大算力以及算法产品化和工程落地能力[32] - VLA概念需要基础成熟的LLM作为底座 针对性训练交通驾驶行为[32] - 基础模型蒸馏上车思路可加速开发并快速部署到不同算力平台 但前提需要大算力和高质量数据[32]
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
华尔街见闻· 2025-08-31 10:26
行业发展趋势 - AI行业的发展重点正从追求更高性能转向更聪明和更经济 通过混合推理和自适应计算实现算力节省 [1] - 混合推理模式成为行业共识 各大模型厂商采用不同路径但目标一致 让模型根据问题复杂度自动选择合适的计算资源配置 [1][3] - 顶尖玩家包括Anthropic的Claude系列 Google的Gemini系列 以及国内的阿里Qwen 快手KwaiCoder 字节豆包和智谱GLM等都在探索混合推理方案 [4] 技术突破与创新 - 美团开源的龙猫大模型(LongCat-Flash)采用创新的零计算专家机制 智能识别输入内容中的非关键部分 如常见词语和标点符号 交由特殊专家处理直接返回输入 实现惊人算力节省 [1] - OpenAI的GPT-5采用路由器机制 根据问题复杂程度自动选择合适模型处理 简单问题交给轻量级模型 复杂任务调用高算力模型 [3] - DeepSeek的V3.1版本推出单模型双模式架构 将对话和推理能力合并到单一模型中 开发者和用户可通过特定标记或按钮在思考与非思考模式间切换 [4] 成本与效率挑战 - AI应用成本快速上升 尽管单个token价格在下降 但完成复杂任务所需的token数量以前所未有的速度增长 复杂代码编写或法律文件分析任务可能消耗数十万甚至上百万个token [2] - 成本压力已传导至应用层公司 生产力软件公司Notion的利润率因此下降约10个百分点 AI编程辅助工具初创公司如Cursor和Replit不得不调整定价策略 [2] - 人类认知贪婪导致99%的需求转向SOTA模型 而最强模型价格始终差不多 形成最智能模型竞赛演变成最昂贵模型竞赛的局面 [2] 性能与成本平衡 - OpenAI内部评测显示GPT-5使用思考模式能以比前代模型少50-80%的输出token完成任务 达到相同或更好效果 [4] - DeepSeek思考模式在消耗减少25-50% token的情况下 达到与前代模型相当的答案质量 为企业提供高性价比开源选择 [4] - 混合推理的下一个前沿将是更智能的自我调节 让AI模型精准自我评估任务难度 在无人干预情况下以最低计算代价在最恰当时机启动深度思考 [4]
【计算机】GPT-5商业化潜力释放,AI应用生态持续繁荣——AI行业跟踪报告第62期(施鑫展/白玥)
光大证券研究· 2025-08-17 08:05
GPT-5商业化潜力 - GPT-5更强调实用性和生产力 而非一味追求底层技术突破 预计凭借能力提升 更高性价比 更低幻觉率 更好占领用户心智并提升用户粘性 转化为更大收入规模 [4] - OpenAI思路启发全球AI开发者 在基础模型能力足够强大且迭代放缓时 将模型落地到各类场景进行产品化变现的重要性提升 [4] 国内AI产品全球竞争力 - 7月AI网站全球TOP100总访问量126.89亿 其中国产AI产品访问量13.34亿 占比10% [5] - 全球前100 AI产品中国产数量达25个 占比25% [5] - 三款国产出海AI产品ARR超千万美元:美图AirBrush-AI智能修图3765万美元 作业帮PolyBuzz 2027万美元 YouCam美妆相机1594万美元 可灵海外版KLING AI ARR达918万美元 [5] 国内大模型B端应用趋势 - 7月大模型中标项目574个 金额13.35亿元 其中应用类项目数量占比59% [6] - DeepSeek 阿里Qwen等开源模型性能提升并免费开放 推动AI应用在B端落地 [6] - 中标项目行业分布:教科排名第一 政务 通信 能源 金融位列2-5名 [6] - 大模型厂商中标数量排序:科大讯飞 火山引擎 智谱 阿里云 腾讯云 百度 [6]