Workflow
开源模型
icon
搜索文档
中国AI猛追美国
日经中文网· 2025-08-05 10:43
阿里巴巴集团重点展示了"开源"的AI(7月26日,上海市) 中国国内完成备案的AI模型数量半年增加了4成,斯坦福大学的研究报告指出"中国的模型正逐渐赶上美 国"。由于中国的AI多为开源模型,日本AI开发中也在大量采用。美国试图遏制中国AI发展。但专家 称"能否遏制中国崛起仍是未知数"…… 中国的生成式AI(人工智能)正在猛追美国。中国国内完成备案的AI模型数量半年增加了4成,与美国 企业的性能差距也在缩小。7月26日在上海开幕的"世界人工智能大会"的参加企业比去年增加6成,阿里 巴巴集团等展示了最新技术。在美国试图关闭人才交流大门的背景下,中国则寻求在相关领域获得引领 世界的地位。 2018年开始举办的世界人工智能大会今年约有800家企业参加,比2024年增加了约300家。除了40多款 AI模型之外,还展示了60多款机器人,在性能和创新方面展开了竞争。 据路透社报道,中国国务院总理李强在开幕式发表演讲时指出,全球人工智能治理仍然分散。虽然没有 提到美国,但指出人工智能可能成为少数国家和企业的排他性游戏。还提出芯片供应短缺和人才交流受 限等课题,提倡成立AI相关的合作组织。 针对生成式AI,中国提出了在监管的同 ...
大模型年中报告:Anthropic 市场份额超 OpenAI,开源模型企业采用率下降
Founder Park· 2025-08-04 21:38
基础大模型发展趋势 - 基础大模型正成为生成式AI核心引擎并重塑计算未来 其能力与成本控制的演进将推动系统 应用及产业格局变革 [2] - 模型API支出在6个月内从35亿美元增长至84亿美元 企业重心从训练微调转向模型推理 标志阶段性转折 [2] - 代码生成成为首个大规模爆发的AI应用场景 基础模型能力升级路径新增"带验证器的强化学习"(RLHF with verifiers) [2] 市场竞争格局变化 - Anthropic以32%企业使用率超越OpenAI(25%)和Google(20%) 成为市场新领跑者 Meta Llama占9% DeepSeek仅1% [9] - Anthropic崛起始于2024年6月Claude Sonnet 3 5发布 2025年系列版本(Claude Sonnet 3 7/4 Opus 4 Claude Code)巩固领先地位 [12] - 企业投入集中流向少数高性能闭源模型 开源采用趋势因前沿突破放缓而减弱 [3] Anthropic成功驱动因素 - 代码生成领域占据42%市场份额(OpenAI为21%) 催生19亿美元生态系统及AI IDE 应用构建工具等新形态产品 [13][14] - 采用带可验证奖励的强化学习(RLVR)突破数据瓶颈 成为提升模型可靠性与实际能力的关键路径 [15] - 率先实现Agent范式突破 通过多轮自我优化及工具调用提升模型执行力 2025年被称为"Agent之年" [16] 开源模型发展现状 - 开源模型运行任务占比从19%降至13% Meta Llama仍领先但Llama 4表现未达预期 [17] - 中国公司贡献突出开源模型(DeepSeek 字节跳动 阿里巴巴等) 但性能落后前沿闭源模型9-12个月 叠加部署复杂度导致份额停滞 [17][20] - 开源吸引力在于定制化 成本优势及私有化部署 但初创企业生产负载正加速转向闭源 [20] 企业模型选择行为 - 66%开发者选择原供应商升级 仅11%切换供应商 性能(非价格)是核心决策因素 [24][27] - 性能优先逻辑下 旧模型即使降价十倍也无法挽回用户 Claude 4发布一个月内即抢占45%用户 [27][30] - AI支出从训练转向推理 初创企业推理任务占比从48%升至74% 近半数企业主要计算任务由推理驱动 [31]
具有“开源精神”的投研团队是什么样的?
点拾投资· 2025-08-01 15:03
导读:2025年大概率是人工智能真正的元年。在这一年的春节前后,DeepSeek推出的V3和R1模型震撼了全球,不仅是因为这个模型仅仅用了7天 就突破了一亿用户数,而且还采用了完全开源的方式,实现了知识的平权。 7月,世界人工智能大会上,不少开源大模型登上了展台,关于AI大模型的"开源与闭源"之争再次成为焦点话题之一,来自全球的科技领袖、企业家 和学者就此展开深入探讨。 其实,在DeepSeek模型推出后没几天,Open AI首席执行官Sam Altman就承认Open AI选择闭源模型,是"站在了历史的错误一边"。那么,为什 么开源模型那么重要,以及为什么是中国在开源模型上发展迅速呢? 在此前的一次访谈中, 诺安基金研究部总经理邓心怡把模型开源比作"科技民主化", 原来只能"厨师做菜",通过模型的开源每一个人都可以根据自 己的喜好"做菜",并且二次销售出去。邓心怡认为,"科技每一次技术变革都不会是孤岛式的,而是体系化的,通过体系化的科技变革,将启发新的 经济范式革新。" "开源"是每一次科技革命背后的第一推动力,也是诺安科技组的底层价值观。他们在近期的世界人工智能大会上,对各类科技创新产品做了长达5个 小时 ...
基模下半场:开源、人才、模型评估,今天的关键问题到底是什么?
Founder Park· 2025-07-31 22:57
中国开源模型的崛起 - 中国开源模型如Kimi、Qwen、智谱GLM-4.5等近期密集发布,Hugging Face热门榜几乎被中国模型垄断[1][3] - 中国模型发展速度惊人,一旦模式被验证可行,中国擅长集中资源快速工程化实现[5][8] - 中国开源模型可能成为发展中国家的模型标准,尤其在"全球南方"市场占据优势[6][7] 中美AI竞争格局 - 大模型竞争已演变为中美之间的比拼,开源标准可能转向中国模型[3] - 美国如Meta等公司正加大投入,但中国在公私合作和资源投入方面更具优势[8][10] - 中国机构如清华大学已拥有先进语言模型,而美国部分高校资源相对不足[8][10] 模型训练与人才 - 不同机构间人才差异并不显著,模型好坏更多取决于资源利用效率[15][16] - 顶尖实验室内部普遍存在混乱,但关键在于能否产出有效模型[19][20] - 实验速度和基础设施比单纯追求"天才"更重要,需要重视团队协作价值[21][22] 模型评测与基准测试 - 当前更需要好的基准测试来评估模型能力,而非仅关注技术细节[3][24] - 制作高质量评测的门槛越来越高,但可能带来新的话语权[24][25] - 评测领域存在巨大蓝海机会,定义新任务不需要庞大算力[26] 强化学习与推理技术 - RL无法泛化到数学和代码之外的说法被夸大,这些领域只是更容易验证[32] - GSPO算法通过分组序列策略优化显著提升样本效率[28][29] - 模型推理研究进展有限,蒸馏小模型比RL更实用[27] 未来挑战与趋势 - 验证难度将越来越大,特别是在科学发现等复杂领域[36][37] - 智能体相关能力可能成为未来关键基准,参数规模扩张不再是主要路径[23] - 行业需要改变模型优势的传达方式,超越单纯基准测试分数[24]
湘财证券晨会纪要-20250728
湘财证券· 2025-07-28 10:58
核心观点 报告对宏观策略、北交所、电子、银行、医药、半导体等领域进行分析,认为 A 股市场总体呈“慢牛”态势,8 月或震荡下行调整;北交所流动性上升;电子、银行、医药行业有投资机会;迈富时公司发展前景良好 [5][7][9][19][23][30][36]。 宏观策略 宏观政策 - 2025.07.21 - 2025.07.25 公布公共财政支出、LPR 等宏观数据,6 月公共财政支出当月同比增速 0.38%,上半年累计增速 3.4%,上半年财政收支差额累计 - 25,705.00 亿元高于 2024 年同期,7 月 LPR 保持不变,1 年期 3.00%,5 年期 3.50%,符合市场预期 [2]。 沪深股市 - 2025.07.21 - 2025.07.25,6 个 A 股指数震荡上行,上证指数涨 1.67%、深证成指涨 2.33%等,周振幅最大的是科创综指 4.36% [3]。 - 近期市场上行动力来自雅鲁藏布江下游水电工程推动基建板块及科技板块发力,二季度宏观数据略超预期,上半年 GDP 累积同比增长 5.3%,大盘短期调整压力上升,但总体保持“慢牛”态势 [5]。 - 31 个申万一级行业上周涨多跌少,建筑材料、煤炭周涨幅居前,银行、通信居后;124 个申万二级行业(扣除林业)小金属、水泥周涨幅居前,农商行Ⅱ、股份制银行Ⅱ周跌幅居前 [5][6]。 - 投资建议:长维度 A 股市场大概率“慢牛”运行;中维度关注科技、绿色、消费、基建领域;短维度 8 月市场大概率震荡下行调整,建议关注长期资金入市红利板块及消费相关板块 [7]。 北交所 市场总览 - 截至 2025 年 7 月 25 日,北交所 268 家股票上市交易,本周新增 0 家;总股本均值 378.77 亿股无变化,总自由流通股本均值 151.44 亿股增 0.18%,总市值均值 8520.87 亿元增 2.36%,总自由流通市值均值 3255.09 亿元增 3.00% [9]。 流动性 - 本周北交所流动性较前一周明显上升,总成交量均值 14.27 亿股,上升 39.13%;总成交额均值 310.82 亿元,上升 42.36%;算术平均换手率均值 7.04%,上升 1.98 个百分点;按总市值加权平均换手率均值 6.49%,上升 1.76 个百分点 [10]。 行情及指数走势 - 268 只股票中 190 只上涨,恒立钻具涨幅最高 184.05%,*ST 云创跌幅最高 10.61%;254 只股票累计上涨,星图测控涨幅最高 1317.79%,14 只累计下跌,连城数控跌幅最高 76.19% [11]。 - 7 月 25 日,北证 50 收盘 1458.98 点,涨 2.85%;北证湘财研究全指数收盘 1835.28 点,涨 3.09% [11]。 分行业 - 上周 268 只股票涉及 24 个申万一级行业,建筑装饰、医药生物涨跌幅靠前,交通运输、石油石化靠后 [12]。 估值表现 - 北证 50 当前估值(PETTM)68.19 倍,科创 50 为 143.58 倍,沪深 300 为 13.59 倍;2022 年 4 月 29 日以来,北证 50 处于 95%估值分位数,科创 50 处于 99%,沪深 300 处于 100% [13]。 行业公司 电子 - 市场表现:上周中证人工智能产业指数报收 1479.24 点,涨 1.72%;国证算力基础设施主题指数报收 5805.86 点,涨 3.23%;万得智能体概念指数报收 1897.37 点,涨 2.62% [14]。 - 估值:上周中证人工智能产业指数 PE(TTM,剔除负值)为 41.06X,环比上升 1.03X,PB(LF)为 5.10X,环比上升 0.13X,PE 处于近 7 年 45.89%分位数,PB 处于 52.66%分位数 [16]。 - 行业动态点评:通义千问更新 Qwen3 模型,通用能力显著提升,在多语言长尾知识覆盖等方面进步,长文本提升到 256K,开源模型能力接近顶尖闭源模型,有望推动 AI 应用加速发展 [17][18]。 - 投资建议:看好 AI 基建、端侧 SOC、AI 应用投资机会,维持电子行业“增持”评级,AI 基建关注寒武纪等,端侧 SOC 关注瑞芯微等 [19]。 银行业 - 信贷流向重点支持领域:实体经济融资成本降低,1 - 6 月新发放企业贷款加权平均利率约 3.3%,个人住房贷款利率约 3.1%;重点领域信贷增长快,5 月末普惠小微贷款等均高于全部贷款增速;消费金融有望温和复苏 [21]。 - 投资建议:银行信贷有望平稳增长,息差或趋稳,资产质量将巩固,建议从“高股息 + 区域增长”配置银行股,维持行业“增持”评级 [23]。 医药行业 - 核心要点:关注细分 ADC CDMO 机遇,CXO 板块补涨动力足,全球 ADC 药物市场爆发式增长,催生全链条产业机遇,ADC 技术壁垒高,CDMO 服务成刚需,传统小分子企业布局 ADC CDMO,XDC 开辟新蓝海 [25][26][27]。 - 投资建议:维持医疗服务“买入”评级,建议关注具有 ADC 相关技术储备的 CDMO 公司药明康德等 [30]。 半导体 - 迈富时公司:AI + SaaS 战略驱动平台化、一体化发展,2024 年 AI + SaaS 业务收入 8.42 亿元,占营收 54%,服务客户超 26,600 户,2025 年推动产品升级;精准营销业务构建一站式服务体系,2024 年收入 7.16 亿元,占营收 46% [32][34]。 - 投资建议:预计 2025 - 2027 年公司归母净利润及增速,首次覆盖给予公司“买入”评级 [36]。
中国开源AI三连发,爆击美国闭源高墙
搜狐财经· 2025-07-26 21:16
阿里巴巴AI模型发布 - 公司在2025年7月22日至26日连续发布三款AI模型,包括Qwen3基础模型、Qwen3-Coder编程模型和Qwen3推理模型 [3] - 三款模型分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军 [3] - Qwen3基础模型被权威AI研究机构Artificial Analysis评为"全球最智能的非思考基础模型" [6] - Qwen3-Coder编程模型使新手程序员一天能完成资深程序员一周的工作,生成品牌官网最快仅需5分钟 [9] - Qwen3推理模型性能比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型 [3][9] 技术实力与市场表现 - 公司AI模型API调用量在过去几天突破1000亿Tokens,在OpenRouter趋势榜上包揽全球前三 [11] - 阿里云AI相关收入连续七个季度保持三位数增长 [12] - 公司运营着中国最大、亚太第一规模的AI基础设施,具备从硬件到软件的垂直整合能力 [11] - 通义实验室是中国AI人才最密集、AI产出最丰厚的AI Lab [12] 开源战略 - 公司本周发布的三款模型全部开源,目前已有三百多个重要模型对外开源 [13][14] - 开源模型可供中国企业免费商用,美国、法国、德国等发达国家的公司也能接入 [14] - 公司开源战略与"让天下没有难做的生意"的愿景一脉相承 [14] - Qwen3-Coder的开源掀起"AI编程"热潮,获得推特创始人和Perplexity CEO等业内人士点赞 [14] 行业竞争格局 - 中国AI开源模型(阿里通义千问、deepseek)与美国闭源模型(GPT、Claude、Gemini)形成对比 [13] - 公司计划未来三年投入3800亿元人民币建设云和AI硬件基础设施,总额超过去十年总和 [15] - 2008年公司提出"去IOE"战略,用云计算替代传统IT架构 [15] - 公司被视为中国参与全球AI全栈体系竞争的重要选手 [15]
实测爆火的阶跃星辰Step 3,性能SOTA,开源多模态推理之王
机器之心· 2025-07-26 16:19
核心观点 - 阶跃星辰在WAIC 2025发布新一代开源多模态基座模型Step 3,性能超越同类开源模型并接近顶尖闭源模型[1][2] - Step 3以"多开好省"为核心设计理念,解决AI商业化应用的三大瓶颈:推理成本高、场景适配难、多模态能力调用不全[7][8][11] - 模型在国产芯片上实现突破性成本优化,推理效率达竞品3倍,为国产算力生态注入强心剂[32][47][52] - 公司联合10家芯片厂商成立"模芯生态创新联盟",推动底层技术协同创新[51][52][59] - 2025年上半年智能终端业务环比增长超800%,预计全年收入近10亿元[54][55] 技术架构 - 采用原创MFA架构:多矩阵分解注意力设计,KV量仅为Qwen GQA的1/3,计算量仅为DeepSeek MLA的1/4[29][31][32] - MoE混合专家架构:总参数量321B(LLM 316B+视觉编码器5B),激活参数量38B,性能对标DeepSeek[33][34][35] - AFD分布式推理方案:比DeepSeek"大EP"模式更先进,实现Attention与FFN计算资源精准匹配[38] - 原生多模态设计:支持文本/视觉输入,具备深度推理能力,在MMMU等基准超越ERNIE 4.5等竞品[39][41] 性能表现 - 基准测试:在MMMU、MathVision等多项多模态基准超越开源竞品[1][41] - 实测案例: - 准确完成"视觉称重"任务,识别三花猫品种并估算体重[14][15] - 解析"Who's Adam?"网络热梗,总结AI研究者审稿质量焦虑[16][17] - 根据主机贴纸照片完成复杂空间推理[19] - 实时识别桌游"Splendor"并处理对话打断[25][26] - 效率指标:国产芯片推理成本为行业领先开源模型的1/3,Hopper架构芯片吞吐量提升70%[18][47] 商业化进展 - 智能终端:Top10国产手机厂商过半已合作,多模态能力落地量产旗舰机型[54] - 汽车领域:端到端语音大模型在吉利银河M9首发上车,联合发布智能座舱Agent OS[54] - 生态布局:与华为昇腾、沐曦等10家芯片厂商成立创新联盟,推动算力-模型协同优化[51][52] - 收入增长:2025H1智能终端调用量环比增800%,全年收入预计10亿元[54][55] 战略演进 - 产品迭代路径:Step-1对标GPT-3.5→Step-2逼近GPT-4→Step-3聚焦商业化效率[45][46] - 行业定位转变:从"多模态卷王"(20/26款为多模态模型)转向推理时代"最优解"提供者[57][58] - 商业模式创新:通过技术而非补贴实现成本革命,避免API价格战[44][59]
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
量子位· 2025-07-26 13:06
模型性能突破 - 通义千问开源Qwen3-235B-A22B-Thinking-2507推理模型,在MMLU-Pro(84.4)、GPQA(81.1)、AIME25(92.3)等基准测试中超越DeepSeek-R1和OpenAI o4-mini,登顶开源SOTA [3][10][12][15] - 新模型在"人类最后考试"HLE测试得分从11.8提升至18.2,超越DeepSeek-R1(17.7)和o4-mini高性能模式(18.1) [13][14] - 支持256K原生上下文,在逻辑推理、数学、编码等复杂任务中性能显著提升,编程能力超越Gemini-2.5 Pro等闭源标杆 [16][17] 开源战略布局 - 一周内连续开源Qwen3基础模型(235B参数)、Qwen3-Coder编程模型和Qwen3-235B推理模型,形成技术矩阵 [6][22][26] - Qwen3-Coder在SWE-bench测试中达到69.6分,超越Claude Sonnet 4(70.4)和DeepSeek-V3(38.8),刷新AI编程SOTA [26][27] - 基础模型Qwen3-235B-A22B-Instruct-2507在GPQA、LiveCodeBench等12项测评中超越Claude4非思考版,登顶开源第一 [32] 市场影响与行业地位 - 通义千问API调用量突破1000亿Tokens,在OpenRouter平台包揽全球前三热门模型 [31] - 阿里已开源300余款大模型,通义千问衍生模型突破14万个,超越Llama成为全球最大开源模型家族 [37] - 公司计划未来三年投入3800亿元建设AI基础设施,持续升级全栈能力 [38] 中国开源生态崛起 - DeepSeek、Qwen、Kimi等中国开源模型引领全球风潮,在Llama4表现不佳后成为行业新标杆 [34][35] - 中国开源模型发展速度被黄仁勋公开认可,技术差距与闭源模型快速缩小 [36][39] - 开源三连击战略使中国AI技术首次实现在基础模型、编程模型、推理模型三个维度同时达到世界前沿水平 [7][33][37]
硅谷华人能不能站起来把钱挣了?
虎嗅· 2025-07-25 07:24
美国AI行业动态 - 马斯克旗下XAI发布grok4模型 部分能力显著提升但编程能力仍有局限 写作能力出现倒退[1] - Meta人工智能部门进行大规模重组 高薪引进新人才同时裁撤原有团队 核心团队44人中至少50%为华人[4][6] - 美国AI行业炒作热点从AGI(通用人工智能)转向SSI(超级人工智能) 概念定义模糊但商业价值显著[22][24] Meta技术路线调整 - Llama系列开源模型表现下滑 从Llama3开始被中国开源模型超越 Llama4因应对竞争仓促调整导致性能不佳[2][3] - 原首席科学家Yann LeCun被替换 因其公开质疑当前大模型架构无法实现AGI 主张需要全新架构[6] - 新任AI部门主管Alexander Wang来自Scale AI(数据标注公司) 缺乏大模型研发经验引发行业质疑[7][8] 中美AI竞争格局 - 中国开源模型如DeepSeek冲击美国闭源商业模式 通过开源降低行业利润 公布推理过程实现技术祛魅[25][26] - 美国AI企业高度依赖华人人才 Grok4团队几乎全为华人 顶级AI会议参会者至少50%为华人[10][12] - 部分美国企业采取技术封锁策略 Llama3/4刻意弱化中文支持 政治因素影响技术决策[12][16] 行业人才结构 - Meta新组建团队包含大量OpenAI/DeepMind前员工 22位研究科学家中有14位华人 主要毕业于清华/MIT/斯坦福等名校[5][6] - 美国AI领域存在显著族裔不平等 华人技术贡献与职业地位不匹配 高管层仍以白人为主[10][11] - 英伟达等芯片企业同样依赖华人人才 黄仁勋公开承认这一事实[12] 开源与闭源之争 - Meta可能放弃开源路线 转向闭源开发 中国成为开源生态主要维护者[16][31] - 美国企业开发"符合价值观"的基准测试(如R1-1776) 将技术问题政治化[19][26] - 开源模式冲击闭源商业逻辑 迫使OpenAI等公司提高免费用户额度[31]
21对话|全球网络峰会创始人:中国正在赢得科技竞赛
21世纪经济报道· 2025-07-24 10:06
美股科技股表现 - 美股"七巨头"(英伟达、微软等)股价和市值持续刷新历史新高,4月至7月资金以16年来最快速度涌入美国科技股 [1] - 目前美股"七巨头"在标普500的市值占比已达到三分之一 [1] AI领域竞争格局 - 硅谷巨头难以长久维持技术领先,AI未来属于开源模型,DeepSeek的出现预示这一趋势 [1] - 中国在AI学术研究文献引用量全球领先,美国排名第二,且美国高质量AI研究中近三分之一引用来自中国 [3][4] - 闭源大模型难以持续发展,中国AI公司坚持的开源模式是正确方向 [4] - 西方投资者吹捧的"数十亿甚至万亿美金"AI造富神话难以长期维系 [4] 全球科技竞争态势 - 在《自然》杂志研究领导者榜单中,中国有7所科研院校进入前十,美国仅1所,四五年前中国仅2所 [5] - 中国在先进材料、通信、AI、能源等50多个关键科技领域占据主导地位,美国仅在8%-9%领域领先 [5] - 中国科研投入增速亮眼,企业将利润再投资于研发和设备采购,而西方企业更多用于股票回购等短期操作 [6] 能源与汽车行业 - 中国转向可再生能源与清洁技术,发展中国家清洁技术投资增长迅猛,中国是该领域领头羊 [7] - 中国商飞是重要初创企业,未来中国飞机有望进入全球市场,提供更便宜、燃油效率更高的机型 [12] - 中国新能源汽车行业竞争激烈,虽然未来市场会集中,但目前竞争推动创新和定价能力 [15] 航天与通信技术 - 中国在低轨卫星领域有潜力,早期部署的卫星具备更强数据传输能力和更快速度 [12] - 中国在激光信息光传输技术领先,未来可能出现多家中国公司与SpaceX星链竞争 [12] 行业泡沫风险 - 西方对AI过度依赖和看重存在泡沫化趋势,"FIRE"行业(金融、保险、房地产)也存在泡沫 [13] - 中国制造业广泛应用工业机器人,在该领域引领全球发展,这是中国制造保持竞争力的原因之一 [13] 市场竞争格局 - 中国市场参与者众多推动创新潜力,如汽车产业竞争将公司创新和定价能力推向极限 [15] - 西方国家市场集中度高,各行业公司数量处于历史低点 [15]