开源大模型 - 财报，业绩电话会，研报，新闻 - Reportify

开源大模型

搜索文档

国产开源大模型霸榜Design Arena，前十五名全数上榜展现强劲实力

搜狐财经· 2025-08-25 23:25

国内开源大模型在Design Arena平台表现 - 在Design Arena平台开源模型排名前15位全部由中国国产模型占据其中DeepSeek-R1-0528位居榜首智谱GLM-4.5和阿里Qwen 3 Coder 480B分列二三位[1][2] - 具体排名数据显示：DeepSeek-V3.1以1258分位列第9位胜率58.3% 阿里Qwen3 Coder 30B A3B Instruct以1258分位列第10位胜率58.3% GLM 4 32B以1237分位列第11位胜率55.3%[3] - 开源模型前15名中阿里贡献6款模型 DeepSeek贡献5款智谱贡献3款 Kimi的K2模型占据1席[3] 国内开源大模型生态发展 - 7月国内AI社区开源成果显著 Hugging Face平台收录包括阿里、智谱、昆仑万维等厂商的33款开源大模型[4] - Interconnects机构汇总国内19家顶尖开源模型实验室涵盖DeepSeek、Qwen、Moonshot AI（Kimi）、智谱（Z.AI）等知名机构及新兴学术实验室[4] - 国产开源大模型集群式崛起重塑全球AI版图 Qwen和DeepSeek等模型已能与闭源顶尖模型抗衡推动应用端公司转向模型调优和应用优化[4] 技术评测机制特点 - Design Arena采用基于Elo Rating等级分制度的众包评测机制用户通过投票对模型生成回答进行评分确保排名公正性和动态性[2] - 该平台评测数据量较大例如Kimi K2模型获得1231分基于798胜/668负对战记录胜率54.4% 总对战次数达1466次[3]

开源大模型

Qwen系列模型

DeepSeek系列模型

GLM系列模型

开源大模型

Qwen系列模型

DeepSeek系列模型

GLM系列模型

全球开源大模型，前十五名全是中国的

机器之心· 2025-08-25 17:10

国产开源大模型在Design Arena排行榜的领先表现 - Design Arena排行榜前15名开源AI模型全部来自中国公司[1][3] - 排名第一的DeepSeek-R1-0528模型Elo评分达1332分胜率68.1% 参战1798场[4] - 智谱GLM-4.5和阿里的Qwen 3 Coder 480B分别以1318分和1318分位列第二、三名胜率分别为66.4%和66.4%[4] 主要厂商模型分布及性能数据 - 前15名中阿里占6款 DeepSeek占5款智谱占3款 Kimi占1款[6] - DeepSeek-V3-0324模型Elo评分1299分胜率63.9% 参战2122场[4] - 阿里Qwen3-30B-A3B模型胜率43.7% 参战1961场响应时间34.65秒[6] - OpenAI的GPT OSS 120B仅排第16名 Elo评分1150分胜率42.9%[6] 中国开源生态的规模扩张 - 7月多家厂商在Hugging Face开源33款大模型包括阿里、智谱、昆仑万维、月之暗面、腾讯、阶跃星辰等[7] - 行业统计显示中国有19个主要开源模型实验室涵盖DeepSeek、Qwen、Moonshot AI、Zhipu、腾讯混元、小红书RedNote等机构[9] - 开源模型正推动技术进展改变以往以GPT系列为代表的闭源模型主导格局[9] 行业影响及认知转变 - DeepSeek等开源模型已达到与闭源顶尖模型竞争水平使应用端公司可聚焦模型调优和应用优化[10] - 开源趋势可能改变AI研究社区发展路径使最先进模型开源成为必然选择[10] - 国际观察者认为中国AI崛起与数学基础优势相关东亚人在数学领域已占据主导地位[10]

开源大模型

DeepSeek-R1-0528

Qwen 3 Coder 480B

开源大模型

DeepSeek-R1-0528

Qwen 3 Coder 480B

传媒行业周观察（20250818-20250822）：关注中报超预期标的及港股流动性变化，看好后续游戏、AI、IP、影视行情

华创证券· 2025-08-25 14:31

行业投资评级 - 推荐（维持）[1] 核心观点 - 关注中报超预期标的及港股流动性变化看好后续游戏、AI、IP、影视行情[1] - 传媒板块明线为AI应用起势暗线为内容输出带来的文化自信需要锐度和配置并重[5] - 看好今年成为中国开源大模型的爆发及应用格局重塑之年分三步推进：公有云价值重塑+产业重回增长→有平台有用户有场景但缺少大模型能力赋能的企业→C端场景不断落地[5] - 港股恒科近期或受流动性拖累但部分互联网权重资产位置仍不高看好后续反弹优势[5] 市场表现回顾 - 上周传媒（申万）指数整体上涨5.17% 同期沪深300指数上涨4.18% 板块跑赢沪深300指数0.99% 位列所有板块第6位[6] - 个股涨幅前五：果麦文化（24.79%）顺网科技（24.16%）昆仑万维（23.48%）科德教育（22.25%）智度股份（20.49%）[9] - 港股科技板块涨幅前五：蔚来-SW（27.75%）小鹏汽车-W（18.73%）阅文集团（9.35%）华虹半导体（9.16%）中芯国际（7.87%）[12] 游戏市场表现 - iOS畅销榜腾讯系产品占优《王者荣耀》稳定榜首《和平精英》稳定前三《三角洲行动》稳定前五《无畏契约：源能行动》稳定前十[14] - 巨人网络《超自然行动组》8月17日新商业化版本更新后畅销榜跃升至第4 并持续维持在Top20内[5] - 恺英网络《热血江湖：归来》将于8月27日上线[5] - 下周新品：《巴别塔圣歌》将于8月26日海外上线[16] 电影市场表现 - 截至8月22日 2025年电影大盘票房（不含服务费）341.31亿元观影人次8.75亿人较2019年同期分别恢复约85%和77%[19] - 8月18日-22日周票房5.87亿元（不含服务费）观影人次1818.0万人平均票价32.2元（不含服务费）[20] - 周票房TOP5：《捕风捉影》（1.78亿元占比30.3%）《浪浪山小妖怪》（1.40亿元占比23.8%）《南京照相馆》（1.17亿元占比19.9%）《坏蛋联盟2》（4155万元占比7.1%）《东极岛》（2809万元占比4.8%）[21] - 待上映重点影片：《7天》（想看人数118,785人）《有朵云像你》（想看人数65,164人）《蛟龙行动（特别版）》（想看人数16,084人）《一只绣花鞋》（想看人数14,190人）[24] 行业重要新闻 - 广电总局印发《进一步丰富电视大屏内容促进广电视听内容供给的若干举措》实施"内容焕新计划" 改进电视剧集数和季播剧播出间隔时长管理政策优化审查机制[26] - 泡泡玛特官宣"迷你版LABUBU"将于8月28日线上开售 8月29日线下开售单价79元整套售价1106元[27] - DeepSeek-V3.1正式发布采用混合推理架构支持思考模式与非思考模式自由切换提升思考效率和Agent能力[28] 重点公司业绩 - 泡泡玛特2025年上半年营收138.8亿元同比增长204.4% 经调整净利润47.1亿元同比增长362.8% THE MONSTERS IP营收48.1亿元同比增长668%[28][29] - 快手2025年Q2平均日活跃用户4.09亿创历史新高总收入350亿元同比增长13.1% 经调整利润净额56亿元经调整净利润率16.0%[30] - 吉比特2025年上半年营业收入25.18亿元同比增加28.49% 归母净利润6.45亿元同比增加24.50%[31] 投资建议 - 游戏：关注中报后边际变化建议关注恺英网络、巨人网络、星辉娱乐、完美世界、顺网科技、神州泰岳等[5] - IP：推荐创源股份、大麦娱乐、泡泡玛特关注阅文集团（IP衍生品上半年GMV接近去年全年水平）[5] - 影视：监管边际改善关注芒果超媒、华智数媒、爱奇艺、阅文集团、华策影视、欢瑞世纪等[5] - AI：关注中文在线（海外短剧平台FlareFlow月用户充值收入增速500%+）、浙数文化（参投14家杭州准独角兽企业）[5] - 分众传媒：主业稳健有碰一碰增量变现+新潮整合潜在向上期权低估值+高分红[5] - 港股：关注腾讯、阿里、快手、美图、阅文、腾讯音乐、哔哩哔哩、网易、美团等[5]

开源大模型

开源大模型

刚刚，字节开源Seed-OSS-36B模型，512k上下文

机器之心· 2025-08-21 09:03

模型发布与开源 - 字节跳动Seed团队正式发布并开源Seed-OSS系列模型包含三个版本：Seed-OSS-36B-Base（含合成数据）、Seed-OSS-36B-Base（不含合成数据）和Seed-OSS-36B-Instruct（指令微调版）[1] - 模型使用Apache-2.0许可证发布允许研究人员和企业开发者自由使用、修改和再分发[2] 模型架构与参数 - 模型采用360亿参数分布在64层网络中支持15.5万词表[5] - 架构结合因果语言建模、分组查询注意力（GQA）、SwiGLU激活函数、RMSNorm和RoPE位置编码[4] - 隐藏层大小为5120 注意力头配置为80/8/8 头大小为128[9] 长上下文处理能力 - 原生支持最大512K tokens上下文长度相当于1600页文本是OpenAI GPT-5系列的两倍[6][7] - 在RULER（128K上下文长度）测试中达到94.6分创开源模型最高分[18][20] 推理预算控制 - 引入推理预算机制允许用户指定模型执行推理的token数量[10] - 推荐预算值为512 tokens的整数倍（如512、1K、2K等） 0表示直接输出答案模式[13][26][27] - 复杂任务（如AIME和LiveCodeBench）性能随预算增加提升简单任务（如IFEval）则出现波动[22][23] 基准测试表现 - Base含合成数据版本在MMLU-Pro得分65.1 MATH得分81.7[15] - Instruct版本在AIME24取得91.7% BeyondAIME得分65 LiveCodeBench v6得分67.4 均创开源SOTA纪录[17][19] - 在TAU1-Retail智能体任务中取得70.4分 SWE-Bench Verified（OpenHands）达56分[20] 训练数据与研究支持 - 使用12万亿tokens进行训练[1] - 同时发布含与不含指令数据的预训练模型为研究社区提供多样化选择[8]

开源大模型

Seed-OSS-36B系列模型

开源大模型

Seed-OSS-36B系列模型

传媒行业周观察（20250811-20250815）：看好游戏、IP、AI、影视等景气度方向

华创证券· 2025-08-18 13:47

行业投资评级 - 传媒行业投资评级为"推荐"，预期未来3-6个月内行业指数涨幅超过基准指数5%以上 [3][44] 核心观点 - 传媒板块明线为AI应用起势，暗线为内容输出带来的文化自信，需锐度和配置并重 [6] - 看好2025年成为中国开源大模型爆发及应用格局重塑之年，分三步推进：公有云价值重塑→平台型企业赋能→C端场景落地 [6] - 港股科技主线对产业催化敏感，建议关注腾讯、阿里、快手、哔哩哔哩等标的 [6] 细分领域分析游戏 - 高频数据向上+中报预期良好，关注暑期结束后DAU及流水持续性 [6] - iOS畅销榜显示腾讯系《和平精英》《王者荣耀》稳居前三，网易《梦幻西游》处中上位置 [15] - 新游《无畏契约：源能行动》《盗墓笔记：启程》即将上线 [17] IP - 长期看好大麦娱乐（2B转授权业务增速+2C渠道扩张）和创源股份（IP文创从0到1落地） [6] 影视 - 剧集政策边际宽松，"新21条"或优化集数、题材等限制，利好芒果超媒、华策影视等 [6] - 2025年电影票房恢复至2019年同期的85%，观影人次恢复76% [20][23] - 上周票房TOP3影片为《浪浪山小妖怪》（2.22亿元）、《南京照相馆》（2.17亿元）、《东极岛》（0.86亿元） [26] AI应用 - 重点关注Deepseek R2上线及财报季表现，推荐快手（25年PE<15x）、阜博集团（AI收入预期差）等 [6] - 华为发布AI推理技术UCM，计划2025年9月开源 [31] - 苹果拟推出机器人、智能安防摄像头等AI产品，预计2027年推出虚拟伴侣机器人 [31] 市场表现 - 上周传媒（申万）指数上涨1.00%，跑输沪深300指数1.37个百分点，位列行业第17位 [7][9] - 个股涨幅前三：吉视传媒（+45.19%）、北纬科技（+41.12%）、游族网络（+19.88%） [10][12] - 港股恒生科技指数上涨1.52%，东方甄选（+39.61%）、阅文集团（+21.57%）领涨 [13][18] 公司动态 - 网易2Q25收入279亿元（同比+9%），Non-GAAP净利润95亿元（同比+22%） [32] - 腾讯2Q25收入1845亿元（同比+15%），经调整净利润631亿元（同比+10%） [33] - 阅文集团25H1调整后净利润5.1亿元（同比-28%），剔除新丽后同比+36% [34]

开源大模型

开源大模型

全球AI大模型迭代提速！中国开源生态爆发

Wind万得· 2025-08-13 06:37

全球AI技术迭代加速 - 8月以来全球AI领域技术迭代显著加快 OpenAI Google DeepMind 百度等中外科技企业相继发布或更新大模型产品推动行业进入创新密集期 [1] - OpenAI推出GPT-5 包含推理增强版多模态版及企业定制版三个版本编程场景性能显著提升代码生成能力突出网页端向个人用户免费开放 API调用价格下调 [3] - 百度计划8月底前推出新一代AI推理大模型旨在强化复杂任务处理能力 Google DeepMind发布"Genie3"模型具备生成动态3D世界及模拟物理现象能力但在可操作性与多智能体交互方面存在局限 [3] 中国开源大模型崛起 - 中国企业在开源大模型赛道表现突出全球市场影响力持续提升产业生态构建与商业化落地展现强劲潜力 [1] - 腾讯开源"混元3D世界模型1.0" 阿里密集发布四款开源模型最新开源模型在国际评测平台位列全球第三京东将"言犀"升级为"JoyAI" 新体系涵盖全尺寸模型支持多模态功能 [3] - HuggingFace榜单显示全球排名前十的开源大模型中中国企业占据九席智谱GLM-4.5位列第一阿里系列模型占五席腾讯月之暗面相关模型上榜 [4] 中美AI发展策略差异 - 中国大模型企业多选择开源路径通过开放技术吸引全球开发者构建应用生态美国科技公司倾向闭源模式如OpenAI从早期开源转向闭源运营以巩固技术领先优势 [6] - 开源模式面临"微调内卷"现象模型更新集中于参数调优底层架构创新不足开发者面临模型版本频繁更迭接口变更等兼容性难题 [6] - 开源模型的"组合效应"可能导致技术壁垒弱化业内呼吁推动统一API接口标准加大原创性基础研究投入 [6] AI商业化与行业影响 - AI应用差异化发展打开增量空间快手聚焦视频与图像生成阿里深耕电商流量运营腾讯探索广告与游戏业务应用显著提升商业化变现效率 [7] - 大模型应用个人用户注册总数超31亿 API调用用户总数超1.59亿下一代大模型临近 Agent及多模态方向有望持续受益推理需求扩容将带动算力需求增长 [7] - AI技术推动互联网行业估值体系重构相关主题ETF或迎来发展机遇 2025年AI大模型行业呈现技术迭代加速开源生态崛起商业化路径多元特征 [7]

Artificial Intelligence

开源大模型

Artificial Intelligence

混元3D世界模型1.0

Artificial Intelligence

开源大模型

Artificial Intelligence

混元3D世界模型1.0

超越OpenAI医疗能力，百川发布开源大模型Baichuan-M2

凤凰网· 2025-08-11 15:32

公司产品发布 - 百川智能正式发布开源医疗增强大模型Baichuan-M2 [1] - 该模型尺寸为32B，属于较小尺寸 [1] 产品性能表现 - Baichuan-M2性能反超OpenAI最新开源模型gpt-oss120b [1] - 模型性能力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型 [1] 产品技术特点与成本优势 - 针对医疗领域用户隐私考虑，支持模型私有化部署需求 [1] - 对模型进行了极致轻量化，量化后精度接近无损 [1] - 量化模型可在RTX4090上实现单卡部署 [1] - 相比DeepSeek-R1 H20的双节点部署方式，成本降低了57倍 [1]

开源大模型

Artificial Intelligence

开源大模型

Artificial Intelligence

反超OpenAI，百川宣布开源医疗大模型发布

新浪科技· 2025-08-11 13:25

模型性能表现 - 百川智能发布的开源医疗增强大模型Baichuan-M2在HealthBench评测中获得60.1分，超越OpenAI最新开源模型gpt-oss120b的57.6分 [1] - 该模型以32B的较小尺寸在评测中超越包括Qwen3-235B、Deepseek R1、Kimi K2在内的其他开源大模型 [1] 部署成本与效率 - 公司对Baichuan-M2进行了极致轻量化，量化后模型精度接近无损，可在RTX4090上实现单卡部署 [4] - 与DeepSeek-R1 H20需要双节点部署的方式相比，Baichuan-M2的部署成本降低了57倍 [4] - 针对急诊、门诊等对交互速度要求高的场景，基于Eagle-3架构优化的MTP版本在单用户场景下实现了74.9%的token速度提升 [4] 硬件适配与市场应用 - 模型针对国产主流芯片进行了专门的开发和适配，使多数医疗机构能够利用现有硬件条件实现快速部署 [4]

开源大模型

开源大模型

现在就等梁文锋了

投资界· 2025-08-10 15:45

硅谷AI圈最新动态 - OpenAI时隔6年首次推出开放权重大语言模型gpt-oss-120b和gpt-oss-20b，采用Transformer架构和MoE设计，参数规模分别为1170亿和210亿[13] - gpt-oss-120b在核心推理基准测试中性能接近OpenAI o4-mini，可在单张80GB GPU上运行；gpt-oss-20b性能接近o3-mini，支持16GB内存端侧运行[13] - 模型采用分组多查询注意力机制(组大小8)和旋转位置编码(RoPE)，原生支持128k上下文[13] - 在RTX5090上运行20B版本，输出速度达160-180tokens/秒[21] - 性能测试显示在远小于DeepSeek R1和Qwen 3的体量下，接近中国开源模型性能[23] 谷歌Genie 3突破 - 谷歌发布文生虚拟世界模型Genie 3，可生成720p清晰度24FPS流畅度的动态交互世界[28] - 模型能实时响应用户指令生成不同内容，要求精准处理物理交互逻辑[29] - 技术突破可能对VR、游戏和文生视频赛道产生深远影响[29] - 目前仍处于官方演示阶段，未开放普通用户试用[29] - 相比前代产品，Genie 3在分辨率、交互时长等方面有显著提升[31] Anthropic专注AI编程 - Anthropic更新顶级大模型Claude Opus 4.1，AI编程能力上限提升2%[34] - 在SWE-bench测试中达到74.5%准确率，领先OpenAI和Gemini同类产品[35] - 终端编程测试(Terminal-Bench)表现达43.3%，显著优于竞品[35] - 公司选择集中资源提升编程能力，保持在大模型商业化赛道的竞争力[38] 华人科技人才贡献 - OpenAI gpt-oss系列核心团队成员包括北大校友任泓宇，曾任职苹果、微软等公司[42] - 上海交大校友Wang Xin参与模型后训练工作[44] - 谷歌Genie 3团队有上海交大本科、哈佛博士Emma Wang参与，优化后实现24fps流畅度和亚秒级延迟[46]

开源大模型

Claude Opus 4.1

开源大模型

Claude Opus 4.1

三位90后，估值700亿

投资界· 2025-08-10 15:45

AI创业潮 - AI神话仍在继续，Mistral AI正在进行新一轮10亿美元融资，估值将达到100亿美元（约合人民币700亿元），成立两年估值翻了近50倍 [2] - 公司由三位90后学霸创立，他们从巴黎顶尖学府毕业投身AI大厂后创业，成立一个月就凭借7页PPT融资1亿美元，刷新欧洲种子轮纪录 [2] - 今年初DeepSeek全球爆红，成为Mistral梦寐以求的理想模样，这一轮由90后们带队的AI大战刚刚拉开帷幕 [2] Mistral AI创始团队 - 三位创始人Arthur Mensch、Guillaume Lample、Timothée Lacroix均为90后，拥有巴黎顶尖高校背景和谷歌DeepMind、Meta AI实验室工作经验 [4] - 2023年三位创始人意识到AI革命机遇，回到巴黎创立Mistral AI，意为"法国吹来的强风" [6] - 创始人表示目标是未来10年处于领先地位，法国总统马克龙多次亲自站台称赞其为"新一代欧洲初创企业与美国科技巨头竞争的典范" [6] Mistral AI发展历程 - 2023年9月发布首个开源大模型Mistral 7B，仅73亿参数规模却在多个基准测试优于Llama 2 [6] - 与封闭的OpenAI和Anthropic不同，公司坚持开源策略 [6] - 2024年发布聊天机器人Le Chat和首款推理模型Magistral，试图正面叫阵DeepSeek [7] - 目前发力商业化，与英伟达等巨头合作，年收入有望首次超过1亿美元且最近一年增长数倍 [8] 融资历程 - 成立一个月完成1.13亿美元种子轮融资，创欧洲纪录，估值2.6亿美元 [10] - 2023年底完成4.15亿美元A轮融资，估值20亿美元 [11] - 2024年2月获微软1630万美元投资，6月完成6.4亿美元B轮融资，估值60亿美元 [12] - 目前正洽谈10亿美元融资，估值或达100亿美元 [12] 投资人阵容 - 早期投资人包括光速创投、Index Ventures、德高集团等知名机构及法国富豪 [10] - A轮由a16z领投，Salesforce、法国巴黎银行等参与 [11] - B轮由General Catalyst领投，英伟达、三星、Salesforce等参投 [12] - 最新潜在投资人MGX由阿布扎比主权基金穆巴达拉和G42组建 [12] 行业竞争格局 - AI开源战场竞争激烈，OpenAI时隔六年首次发布最新开源模型 [7] - 腾讯、智谱AI、阿里巴巴、月之暗面等密集推出新一代开源大模型 [7] - Mistral被质疑测试结果回避与最新版通义千问和DeepSeek直接对比 [7] 90后AI创业者崛起 - AI搜索公司Perplexity估值180亿美元，较去年增长近20倍，由三位90后创立 [15] - Genesis AI完成1.05亿美元种子轮融资，创硅谷具身智能行业纪录 [15] - AnySphere估值90亿美元，由四位麻省理工年轻面孔创立 [15] - 国内90后创业者如宇树科技王兴兴、月之暗面杨植麟等崭露头角 [16] - 这批创业者大多拥有世界顶级大学理工科背景，具有全球视野和技术信仰 [16]

开源大模型

Artificial Intelligence

开源大模型

Artificial Intelligence