开源大模型

搜索文档
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
36氪· 2025-09-10 20:19
全球最快的开源大模型来了——速度达到了每秒2000个tokens! 虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。 它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)和初创公司G42 AI合作推出的K2 Think。 名字是不是有点熟悉? 没错,它和月之暗面前不久推出的Kimi K2在命名上是有点小撞车,不过阿联酋这个多了个"Think"。 但非常有意思的一点是,在K2 Think的背后,确实有"made in China"的味道。 因为从HuggingFace中的Model tree来看,K2 Think是基于Qwen 2.5-32B打造的: 而且"全球最快开源AI模型"之外,MBZUAI官方还称自家的K2 Think是"有史以来最先进的开源 AI 推理系统"。 那么它的实力到底几何?我们继续往下看。 实测速度均超过2000 tokens/秒 目前,K2 Think已经给出了可以体验的地址(见文末)。 我们先小试牛刀测试一把IMO的试题: Let a_n = 6^n + 8^n. Determine the remainder when dividing a_ ...
影视ETF(516620)大涨超3%,AI应用与内容复苏双线驱动
每日经济新闻· 2025-09-05 14:24
行业趋势 - 传媒行业明线为AI应用起势 暗线为内容输出带来的文化自信 [1] - 2025年成为中国开源大模型爆发及应用格局重塑之年 [1] - AI技术如谷歌nano banana模型在图像编辑领域表现惊艳 有望在影视、游戏等领域加速落地应用 [1] 影视院线表现 - 2025年暑期档票房达110.02亿元 全年总票房383.28亿元 [1] - 观影人次达8.87亿 国产影片市场份额89.20% [1] - 票房大盘恢复约85% 观影人次恢复约76% [1] 游戏板块发展 - 游戏板块中报业绩亮眼 Q3业绩高增拐点可期 [1] - 版号发放数量创下新高 多端产品趋势上升 [1] IP领域前景 - 长线看好2B转授权业务及2C渠道驱动增长 [1] 影视ETF特征 - 跟踪中证影视指数(930781)从沪深市场选取影视内容提供、发行及渠道业务上市公司 [1] - 涵盖影视制作、网络剧与动漫等多个领域 [1] - 行业配置以通信服务为主 同时包含可选消费、工业和信息技术等行业 [1]
游戏ETF(516010)涨超3%,游戏行业景气度与估值空间引关注
每日经济新闻· 2025-09-05 12:45
行业观点 - 传媒行业明线为AI应用起势 暗线为内容输出带来的文化自信 看好今年成为中国开源大模型的爆发及应用格局重塑之年 [1] - 游戏行业中报业绩整体亮眼 持续看好板块景气度 Q3业绩高增拐点可期 [1] - AI方面 谷歌推出的Nano Banana图像模型在电商、广告、设计、影视、游戏等领域加速落地应用 核心优势在于图片一致性强、生成效率高及使用门槛下降 [1] - IP领域长线看好2B转授权业务增速及2C渠道驱动增长 [1] 指数产品 - 游戏ETF(516010)跟踪动漫游戏指数(930901) 该指数从沪深市场选取涉及游戏开发与发行、动漫制作及衍生品等业务的上市公司证券作为样本 [1] - 动漫游戏指数聚焦文化娱乐和数字创意产业 体现中国动漫游戏产业发展趋势和市场动态 [1] - 无股票账户投资者可关注国泰中证动漫游戏ETF联接A(012728)和国泰中证动漫游戏ETF联接C(012729) [1]
中国GenAI市场洞察:企业级大模型调用全景研究
头豹研究院· 2025-09-03 20:31
报告行业投资评级 - 报告未明确给出行业投资评级 [1][2][3] 核心观点 - 中国企业级大模型市场呈现爆发式增长 2025年上半年日均调用量达101,865亿tokens 较2024年下半年21,999亿tokens增长约363% [8][9][11] - 开源模型快速获得企业认可 调用占比从2024年下半年未明确基数提升至2025年上半年的44.4% 接近闭源模型的55.6% [9][11] - 企业选型从追求单一最强模型转向业务场景适配 注重算力性价比 系统灵活性与安全可控性平衡 [5][6][13] - 开源模型凭借性能与闭源收敛 后训练灵活性及成本优势成为企业实现自主可控的优选路径 [5][13][16] - 闭源模型以商业闭环 黑盒可控 集中优化与高服务稳定性满足高可靠性需求企业 [13][24][26] - 阿里通义系列大模型以17.7%调用占比成为市场首选 字节豆包(14.1%)和DeepSeek(10.3%)分列二三位 [10][11] 中国企业级大模型发展综述 - 大模型形成开源与闭源并行发展的双轨格局 开源模型凭借算力性价比最优 系统集成灵活及透明可验特征成为企业低成本落地与自主可控优选路径 [13] - 闭源模型以商业闭环 黑盒可控 集中优化与高成本壁垒为特征 适合高可靠性需求企业客户 [13] - 开源模型正逐步取代闭源方案成为生态主导力量 2023年全球149个基础模型中开源占比达65.7% [15] - 参数规模轻量化趋势显著降低算力门槛 推动大模型向垂直行业与中小企业场景加速渗透 [16] - 预计超过80%企业将在智能化建设中采用开源大模型 开源生态成为驱动产业普及化与数字化转型核心力量 [16] 中国企业级大模型调用现状及趋势 - 调用量激增驱动因素包括供给端模型与算力扩容(如DeepSeek 通义等开源体系突破) 需求端金融 政务 制造等行业场景化渗透提速 以及生态外溢效应形成的规模扩散 [19] - 产业进入规模化应用驱动新阶段 竞争焦点从模型性能比拼转向算力保障 数据合规 生态整合与行业深度适配 [20] 中国企业级大模型调用行为分析 - 企业选型核心出发点为业务价值 闭源模型胜在省心可靠(稳定性能 成熟生态 技术支持) 开源模型更契合灵活性及自主可控性需求 [24][26][27] - 开源模型选择TOP因素:性能表现更佳 完整掌握模型知识产权 更容易进行定制 最佳实践丰富 [25] - 闭源模型选择TOP因素:性能表现更佳 最佳实践丰富 更新迭代快 品牌知名度 [25]
中国企业大模型日均调用量破10万亿Tokens,通义豆包DeepSeek领跑市场
搜狐财经· 2025-09-01 17:05
中国企业级大模型市场总体规模 - 2025年上半年中国企业级大模型日均消耗量达到10.2万亿Tokens [1] - 日均大模型调用量较2024年下半年激增363% [1] - 阿里通义 字节豆包 DeepSeek三大平台合计市场份额超40% 份额分别为17.7% 14.1% 10.3% [1] 行业调研覆盖范围 - 调研覆盖金融 制造 互联网 消费电子 汽车等多个关键行业 [1] - 共调研国内700家企业 涵盖不同营收规模和AI投入水平 [1] 部署方式偏好趋势 - 70%企业倾向于在公有云上部署或调用大模型 [3] - 71%使用公有云的企业表示将增加公有云形态的生成式AI服务 [3] - 企业从追求单一最强模型转向为特定业务场景寻求最优解 [3] 开源模型发展态势 - 开源模型与国际顶级闭源模型性能差距大幅缩小 [3] - 千问Qwen DeepSeek等国产模型持续推动开源生态发展 [3] - 超过80%企业未来将采用开源大模型 [3] - 开源模型具有尺寸多样 类别丰富 企业可完全掌握自主权等优势 [3]
中国力量在自动驾驶与通用AI领域集体崛起
环球网· 2025-09-01 17:00
小马智行 - 公司首席执行官彭军入选《时代》2025全球AI百大影响力人物 成为唯一以自动驾驶行业代表身份登榜的领袖 [1] - 公司目标2025年实现千台规模无人出租车落地 推动L4级自动驾驶走向规模化运营 [1] - 被《时代》评价为"自动驾驶革命的引领者" 过去十年持续引领技术攻关与商业化实践 [1] 中国AI企业全球影响力 - 深度求索首席执行官梁文锋凭借开源大模型与通用AI领域突破入选 其DeepSeek-V3模型获全球开发者认可 [2] - 宇树科技首席执行官王兴兴以机器人方向登榜 公司占据全球三分之二机器狗市场份额 [2] - 多位中国科技领袖共同入选 展现中国在多元化AI赛道应用落地与前沿探索的全球影响力 [1][2]
沙利文最新报告:中国企业调用大模型日均超10万亿Tokens,阿里通义份额第一
证券时报网· 2025-09-01 12:21
中国企业级GenAI市场增长态势 - 2025年上半年中国企业级大模型日均总消耗量达10.2万亿Tokens [1] - 较2024年下半年日均调用量暴增363% [1] - 七成企业选择公有云部署或调用大模型 71%企业计划增加公有云生成式AI服务 [2] 头部厂商市场份额格局 - 阿里通义以17.7%占比位列市场第一 字节豆包占14.1% DeepSeek占10.3% [1] - 前三名厂商合计市场份额超40% [1] - 阿里千问模型全球市场份额最高达12.3% 居全球第四位 [3] 开源模型成为核心驱动力 - 开源模型与国际顶级闭源模型性能差距几近抹平 [2] - 未来超过80%企业将采用开源大模型 [2] - 阿里巴巴已开源300多个模型 千问模型衍生开发超14万个模型 [3] 技术路线与部署模式演变 - 企业从追求单一最强模型转向为特定业务场景寻求最优解 [2] - 对多模态/多尺寸/多场景匹配需求进一步爆发 [2] - Qwen3-Coder调用量一周暴增1474% 位列编程领域全球第二 [3] 阿里巴巴开源生态领先优势 - 通义千问成为全球第一开源模型 超越美国Llama系列 [3] - 开源产品覆盖指令微调/推理/编程/文生图/视频生成等多模态模型 [3] - 推动"全尺寸+全模态+多场景"全面开源战略 [3]
中国企业调用大模型日均超10万亿Tokens,阿里通义份额17.7%第一,字节豆包14.1%第二,DeepSeek为10.3%第三
格隆汇· 2025-09-01 11:46
中国企业级大模型调用增长态势 - 2025年上半年日均调用量较2024年底增长363% 目前超10万亿Tokens [1] - 阿里通义以17.7%的占比位列中国企业选择最多的大模型 [1] 开源模型市场发展趋势 - 千问Qwen、DeepSeek等国产模型持续开源 性能差距与国际顶级闭源模型几近抹平 [1] - 预计未来超过80%的企业将采用开源大模型 开源模型将驱动企业级市场新一轮增长 [1]
国产开源大模型霸榜Design Arena,前十五名全数上榜展现强劲实力
搜狐财经· 2025-08-25 23:25
国内开源大模型在Design Arena平台表现 - 在Design Arena平台开源模型排名前15位全部由中国国产模型占据 其中DeepSeek-R1-0528位居榜首 智谱GLM-4.5和阿里Qwen 3 Coder 480B分列二三位[1][2] - 具体排名数据显示:DeepSeek-V3.1以1258分位列第9位 胜率58.3% 阿里Qwen3 Coder 30B A3B Instruct以1258分位列第10位 胜率58.3% GLM 4 32B以1237分位列第11位 胜率55.3%[3] - 开源模型前15名中 阿里贡献6款模型 DeepSeek贡献5款 智谱贡献3款 Kimi的K2模型占据1席[3] 国内开源大模型生态发展 - 7月国内AI社区开源成果显著 Hugging Face平台收录包括阿里、智谱、昆仑万维等厂商的33款开源大模型[4] - Interconnects机构汇总国内19家顶尖开源模型实验室 涵盖DeepSeek、Qwen、Moonshot AI(Kimi)、智谱(Z.AI)等知名机构及新兴学术实验室[4] - 国产开源大模型集群式崛起重塑全球AI版图 Qwen和DeepSeek等模型已能与闭源顶尖模型抗衡 推动应用端公司转向模型调优和应用优化[4] 技术评测机制特点 - Design Arena采用基于Elo Rating等级分制度的众包评测机制 用户通过投票对模型生成回答进行评分 确保排名公正性和动态性[2] - 该平台评测数据量较大 例如Kimi K2模型获得1231分 基于798胜/668负对战记录 胜率54.4% 总对战次数达1466次[3]
全球开源大模型,前十五名全是中国的
机器之心· 2025-08-25 17:10
国产开源大模型在Design Arena排行榜的领先表现 - Design Arena排行榜前15名开源AI模型全部来自中国公司[1][3] - 排名第一的DeepSeek-R1-0528模型Elo评分达1332分 胜率68.1% 参战1798场[4] - 智谱GLM-4.5和阿里的Qwen 3 Coder 480B分别以1318分和1318分位列第二、三名 胜率分别为66.4%和66.4%[4] 主要厂商模型分布及性能数据 - 前15名中阿里占6款 DeepSeek占5款 智谱占3款 Kimi占1款[6] - DeepSeek-V3-0324模型Elo评分1299分 胜率63.9% 参战2122场[4] - 阿里Qwen3-30B-A3B模型胜率43.7% 参战1961场 响应时间34.65秒[6] - OpenAI的GPT OSS 120B仅排第16名 Elo评分1150分 胜率42.9%[6] 中国开源生态的规模扩张 - 7月多家厂商在Hugging Face开源33款大模型 包括阿里、智谱、昆仑万维、月之暗面、腾讯、阶跃星辰等[7] - 行业统计显示中国有19个主要开源模型实验室 涵盖DeepSeek、Qwen、Moonshot AI、Zhipu、腾讯混元、小红书RedNote等机构[9] - 开源模型正推动技术进展 改变以往以GPT系列为代表的闭源模型主导格局[9] 行业影响及认知转变 - DeepSeek等开源模型已达到与闭源顶尖模型竞争水平 使应用端公司可聚焦模型调优和应用优化[10] - 开源趋势可能改变AI研究社区发展路径 使最先进模型开源成为必然选择[10] - 国际观察者认为中国AI崛起与数学基础优势相关 东亚人在数学领域已占据主导地位[10]