开源大模型

搜索文档
中国“霸榜”全球开源大模型:光环下的隐忧与挑战
证券时报· 2025-08-07 02:37
过去两周多的时间里,阿里通义千问陆续开源了六款模型。在这应接不暇的开源狂欢中,某AI公司的 技术研发人员董铭(化名)却感到有些心力交瘁——他默默关掉了一个刚部署几天的测试集群,因为随 着新模型的开源,应用程序接口又变了,而这已经是他近期第四次重写模型调用脚本。 最近,此前有些沉寂的中国大模型又重新热闹起来,无论是互联网大厂还是初创公司,都紧锣密鼓地发 布了新模型,颇有2023年"百模大战"的味道。但不同的是,这一次的大模型浪潮以开源为核心,近期更 新模型的公司都选择了开源的路径。与此同时,据全球知名AI开源社区Hugging Face近日公布的榜单, 排名前十的开源大模型中,中国占据了九席。 中国的开源大模型正以"集群式"的崛起,重塑全球AI版图。但这在加强中国技术影响力、加快AI应用和 普及的同时,也存在着隐忧。一方面,开源模型频繁迭代,但本质依然是基于主流Transformer架构的微 调,能力差距并未拉开,有陷入"微调内卷"与同质化困境的倾向。另一方面,对于开发者来说,开源模 型的爆发虽然提供了各式各样的工具,但也带来了反复调试、兼容成本高等挑战。 "AI的先发者必然倾向于闭源,因为先发者要巩固自己的优 ...
狂揽70亿挑战DeepSeek,AI创企被曝新融资,被英伟达押宝,团队大牛云集
36氪· 2025-08-05 16:12
融资与估值 - 美国Agent创企Reflection AI正洽谈筹集超10亿美元(折合人民币约71.8亿元)资金,用于开发开源大模型,已筹集到大部分金额 [2] - 今年3月公司获得1.3亿美元(折合人民币约9.3亿元)风险投资,红杉资本、CRV、英伟达风险投资部门NVentures等参投 [3] - 公司最新估值为5.45亿美元(折合人民币约39.1亿元),10亿美元融资完成后的估值尚未明确 [3] 创始团队与背景 - 创始团队由前谷歌DeepMind两位研究科学家约安尼斯·安东诺格洛和米沙·拉斯金于2024年创办 [2] - 安东诺格洛在谷歌DeepMind任职12年,曾参与AlphaGo、AlphaZero、MuZero及谷歌Gemini模型开发 [5] - 拉斯金是前谷歌Gemini核心负责人,领导谷歌强化学习和大型语言模型方向 [7] - 团队成员来自谷歌DeepMind、OpenAI和Anthropic,研究领域涵盖大型语言模型、强化学习和Agent [9] 业务布局与产品 - 公司目标构建超智能自主系统,专注自主编程以推动超级智能发展 [4] - 首款编程Agent Asimov已发布,可读取、编写、测试和部署代码,已从企业获得少量收入 [2] - Asimov可分析企业数据生成代码,已集成至金融服务、科技等领域的工作流程 [11] - 红杉资本称Asimov帮助开发者提升10倍工作效率,开发者青睐度高于Cursor Ask、Cloude Code [12] 开源模型战略 - 公司计划拓展开源AI模型开发,瞄准中国企业需求激增的市场机会 [16] - 开源模型成本更低、灵活性更高,可针对特定业务流程微调 [16] - 目前LMArena榜单前30开源模型无美国开发者产品,多为中国模型如阿里通义、DeepSeek、Kimi K2 [16] - 创始人计划将公司打造为美国领先的开源AI模型提供商 [18] 行业动态 - 开源模型热潮催化美国AI公司加快布局,OpenAI计划今夏发布开源模型 [16] - Meta正招聘人才改进模型,可能转向闭源模型开发 [16] - 模型训练成本高昂,OpenAI预计今年投入超70亿美元,2026年达170亿美元 [19]
GPT-5发布前,Anthropic对OpenAI封锁API;特斯拉被曝拖欠账款致两小企破产;人均在职7个月?字节回应|AI周报
AI前线· 2025-08-03 13:33
OpenAI动态 - OpenAI未来几个月将发布大量新东西,包括新模型、新产品和新性能等 [2] - GPT-5即将发布,但外媒报道其未取得技术突破,面临数据瓶颈和技术难题 [3][5] - 疑似GPT-5开源版本gpt-oss-120b(1200亿参数)在社区短暂出现后被删除 [6] - OpenAI被Anthropic切断API访问权限,因违反服务条款使用Claude进行竞争性比较 [7][8][9] - ChatGPT付费企业用户数量从6月的300万增长至超过500万 [37] 行业竞争与人才流动 - Meta以超高薪酬挖角AI人才,向12名TML员工提供最高10亿美元报价但遭拒 [18][19] - 苹果一个月内被Meta挖走4位AI研究员,包括关键研究员和团队负责人 [20] - 微软与OpenAI就未来技术使用权进行深入谈判,确保长期合作 [17] - OpenAI多名核心研究者被Meta挖走,导致内部组织架构混乱 [5] 公司财报与业务 - 微软第四财季收入764亿美元(+18%),净利润272亿美元(+24%),Azure收入同比增长34% [16][17] - Meta计划2025年资本支出660-720亿美元,2026年将继续大幅增加AI基础设施投入 [19] - 海康威视披露海康机器人IPO进程,称其收入和利润在行业中领先 [15] 技术创新与产品发布 - 智谱发布GLM-4.5模型,采用MoE架构,总参数量3550亿,API调用价格低至0.8元/百万tokens [30] - 阶跃星辰开源Step 3模型,总参数量321B,在多项评测中领先 [32] - 字节跳动Seed团队发布扩散语言模型Diffusion Preview,代码推理速度达2146 tokens/s [29] - 小米AI眼镜将推出支付宝扫码支付功能,搭载高通骁龙AR1芯片 [25][27][28] 行业数据与趋势 - 中国大模型应用个人用户注册总数超过31亿,API调用用户总数超过1.59亿 [24] - 开源成为大模型厂商证明能力的方式,近期多个厂商发布开源模型 [32] - 浙江大学发布"悟空"类脑计算机,支持超20亿个脉冲神经元 [33]
影视ETF(516620)涨超2.4%,AI应用与暑期档成行业双主线
每日经济新闻· 2025-07-30 13:27
华创证券指出,传媒行业明线为AI应用起势,暗线为内容输出带来的文化自信,看好今年成为中 国开源大模型的爆发及应用格局重塑之年。影视院线方面,重点单片驱动下景气度向上,受《南京照相 馆》等单片驱动,大盘边际改善明显,看好大盘持续性。此外,AI短剧等进展较快,暑期档总票房已 突破49亿元,连续9天单日票房过亿,市场热度显著回升。游戏板块再次提示关注回调后的布局机会, Q3 AI产业较多催化,有望受益于配置资金。 每日经济新闻 (责任编辑:张晓波 ) 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容 的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱: news_center@staff.hexun.com 影视ETF(516620)跟踪的是中证影视指数(930781),该指数从A股市场中选取涉及影视内容制 作、发行及放映等相关业务的上市公司证券作为指数样本,以反映影视行业相关上市公司证券的整体表 现。中证影视指数覆盖了影视行业的上下游产业链,具有较高的行业代表性和市场影响力,旨在捕捉中 国影视娱乐市场的增长潜力和波动情 ...
我在WAIC看见的十大趋势
量子位· 2025-07-30 10:29
核心观点 - AI行业热度空前,WAIC展会呈现十大核心趋势,展现中国AI产业的快速发展和创新活力 [2][3][5] 十大核心趋势 趋势一:中国AI因DeepSeek而不同 - DeepSeek带来观念改变,AGI在中国被真正相信,中国人可能率先实现AGI [6] - DeepSeek-R1让普通人不再认为AI是"智障",唤醒中国AI创始人直接瞄准AGI [7] - 前谷歌CEO施密特等国际专家认可中国AI实力 [6] 趋势二:基础大模型综合实力比拼 - 基础大模型竞逐重点从SOTA转向推理、多模态和低成本 [8][9] - 阶跃星辰Step-3模型总参数321B,具备多模态推理能力,联合千里科技和吉利汽车落地智能座舱 [12] - 商汤日日新V6.5在多模态推理能力上表现优异,部分指标超过Gemini 2.5 Pro和Claude 4-Sonnet [14][15] - 讯飞深度推理X1升级版在幻觉治理、综合能力等方面有提升 [15] 趋势三:开源大模型进入中国时间 - 开源成为中国大模型领域的标配,通义千问是开源旗手 [17][18][21] - 阿里通义千问系列模型和通义万相2.2全部开源 [18][20] - 中国开源模型方阵蔚为壮观,包括基础大模型和垂直模型 [23][24][26] - 开源共识形成,中国可能成为AI时代的"安卓" [28][31] 趋势四:国产化AI生态闭环 - 国产芯片与国产大模型协同构建生态 [32][33] - 摩尔线程实现100token/s跑满血DeepSeek,推动AI训练向万卡级规模演进 [37] - 后摩智能发布能效比最高的存算一体AI芯片M50,功耗仅10W [39] - 中昊芯英发布中国首枚TPU架构高性能AI芯片"刹那®"和计算集群"泰则®" [41] - 联想、燧原科技等推出国产算力+国产模型的大模型一体机 [44][46] 趋势五:AI基建与垂直行业应用 - 华为展示昇腾384超节点真机,支持万张算力卡的数据中心 [51] - 中国电信展出五大技术体系,包括智传网、算网一体服务等 [53] - PPIO发布国内首个Agentic AI基础设施服务平台 [56] - 国家电网和南方电网展示电力行业大模型"大瓦特",机器人代人率达80% [60] - 蚂蚁数科推出金融大模型Agentar-Fin-R1,在金融基准测试中表现优异 [62] - 百度展示数字人技术NOVA,曾支撑罗永浩数字人直播间创5500万GMV [64] 趋势六:ToC创新与AI Agent - C端产品创新开始,AI Agent成为新风口 [66][67] - WPS发布原生Office办公智能体,通过自然语言完成文档创作等 [76] - 钛动发布全球营销AI Agent,赋能营销全链路 [77] - 深势科技发布通用科学智能体SciMaster,提供专家级科研助手 [79] - Agent被视为AI时代的软件形态产品,将革新各领域应用 [82][83] 趋势七:商业化AI终端 - 汽车、耳机和眼镜成为第一批商业化AI终端 [86][87] - 特斯拉、吉利等车企展示AI能力,座舱领域创新打开新增长空间 [88][90][94] - 讯飞AI耳机iFLYBUDS Pro 3和Air 2主打商务办公场景 [99][100] - AI眼镜备受关注,Rokid预定量达25万台,Halliday中国首秀 [104][105][107] - 夸克发布AI眼镜,集成阿里和支付宝生态 [109][110] 趋势八:具身智能机器人 - 具身智能机器人赛道白热化,今年实现大飞跃 [112][113] - 智元、银河通用、北京人形机器人创新中心等展示能走能动的机器人 [117][119][121] - 宇树科技通过"机器人打拳击"展示灵活运动能力 [129] - 戴盟聚焦触觉感知技术,展示精细化操作能力 [135][137][139] - 行业开始向人形收敛,VLA和世界模型成为共识 [133] 趋势九:非Transformer架构 - 非Transformer架构从学术研究进入产业应用 [144][145] - RockAI展示自研非Transformer架构驱动的机器狗和灵巧手 [146] - RWKV元我智能公开RWKV-7s架构,KV cache仅为MLA的1/9大小 [146] 趋势十:中国与硅谷AI差距 - 中国与硅谷AI差距缩短至6个月,集中在大模型先进技术层面 [154] - 发展目标转向AGI实现,而非追赶硅谷 [155] - 中国拥有发展AI的宝贵资源——人才和用户基础 [157][158]
中国平安再现外脑空降!王晓航任CTO,曾系蚂蚁集团副总裁
南方都市报· 2025-07-29 14:57
人事任命 - 公司聘任王晓航出任集团首席技术官兼平安科技总经理 [1] - 王晓航曾任职于谷歌、彭博、百度、蚂蚁集团等国际知名企业,在百度期间推动打造百度钱包和金融业务,在蚂蚁集团负责数字金融和AI创新,推出AI金融管家等生成式AI产品 [1] 战略方向 - 公司表示王晓航的加入有助于全面提升AI技术研发与应用水平,推动自研大模型与大数据开源平台深度融合发展 [2] - 公司将加快建设数字化经营、数字化运营、数字化管理、数字化营销、数字化服务五大体系 [2] - 公司深化"综合金融+医疗养老"双轮并行、科技驱动战略,加速推进全面数字化转型 [2] 技术布局 - 公司董事长马明哲强调人工智能已在主业各个环节全面铺开,2024年AI坐席服务量约18.4亿次,覆盖80%客服总量 [3] - 公司认为人工智能时代的关键因素包括数据、算法、算力、场景,并拥有深圳和上海两个大机房支持算力需求 [3] - 公司2024年底拥有超2.1万名科技开发人员、超3,000名科学家,累计获得人工智能竞赛冠军45项,专利申请数达55,435项 [3] 财务投入 - 公司一年利润超千亿,可大量投入科技领域 [3]
传媒行业周观察(20250721-20250725):关注暑期档优质内容供给,WAIC展会再掀AI热潮,持续看好AI应用产业机会
华创证券· 2025-07-28 12:45
报告行业投资评级 维持对传媒行业的投资评级为推荐,持续看好AI推荐应用产业机会 [1] 报告的核心观点 - 当下传媒板块明线为AI应用起势,暗线为内容输出带来的文化自信,需锐度和配置并重;看好今年成为中国开源大模型的爆发及应用格局重塑之年,分三步发展 [6] - 港股方面,随着关税博弈节奏或趋缓,叠加港股市场流动性较好,科技主线有望对产业催化更敏感,恒生科技值得配置 [6] - 游戏再次提示关注回调后的布局机会,产业端投流费用抵税问题预计对游戏上市公司实际经营影响有限,Q3 AI产业较多催化,有望受益于配资资金 [6] - 互联网继续看好基本面有支撑、AI叙事有长逻辑的配置型互联网资产 [6] - 电影受重点单片驱动景气度向上,后续仍有大单片待映,看好大盘持续性,此外ai短剧等进展较快 [6] - 教育龙头公司即将进入财报季,行业景气度持续,此外ai教育进展较快 [6] - 分众传媒是优质配置标的,主业稳健+近期互联网加投带来eps提升,6月起大力推广碰一碰,有望带来增量广告投放+潜在新变现方式,此外仍有新潮整合预期,当前低估值+高分红 [6] 各目录总结 上周市场表现回顾:传媒行业上涨2.15% - 上周传媒(申万)指数整体上涨2.15%,同期沪深300指数整体上涨1.69%,板块跑输沪深300指数0.46%,位列所有板块第18位;幸福蓝海、新华传媒等领涨,世纪天鸿、新迅达等领跌 [9][12] - 港股互联网科技板块华虹半导体、东方甄选等领涨,哔哩哔哩-W、理想汽车-W等领跌 [13][15] - 游戏市场腾讯系产品优势地位显著,网易系产品排名位居中上位置,其他厂商产品表现分化 [16] - 电影市场2025年票房大盘已恢复约88%,观影人次已恢复约77%;7月21日-7月25日整体票房5.08亿元;《长安的荔枝》等五部影片为上周票房前五;后续待上映重点影片包括《寒冰白血》等 [19][20][24][26] 行业重要新闻与重点公司公告 - 行业重要新闻包括国泰海通发布新一代全AI智能APP灵犀、OpenAI年底部署百万GPU与马斯克xAI掀算力军备竞赛、可灵AI全球用户超4500万、阿里巴巴首款自研AI眼镜亮相世界人工智能大会、电影暑期档票房突破49亿元等 [28][29] - 公司公告包括万达电影、世纪华通等发布2025年半年度业绩预告,光线传媒发布董事离任公告,荣信文化发布首次回购公司股份公告 [30][32][34][35]
中国信通院:超一半金融企业积极规划内部开源的协作机制
中国青年报· 2025-07-24 18:04
开源技术在金融业的应用 - 金融行业超过58%的企业正在规划内部开源协作机制以促进技术团队间的深度协作与共享并加速智能化和平台化转型 [1] - 中国信通院已推动中国农业银行、中国工商银行、中国建设银行等数十家金融企业完成开源治理评估认证形成可复制的跨领域标准化实践 [1] - 金融开源社区已有50多家金融企业共同搭建技术协同创新与成果转化平台 [1] 开源大模型在金融业的普及 - DeepSeek系列开源大模型在金融企业应用占比达100% [1] - 通义千问系列开源大模型在金融企业应用占比超过70% [1] - 开源大模型成为推动金融行业智能化转型和技术创新的重要动力 [1] 金融行业开源体系建设进展 - 中国平安人寿、中国农业银行、中国信通院、中国建设银行、中国工商银行代表共同发布金融行业开源体系建设路线图研究报告 [2] - 金融开源创新发展能力评估试点同步启动 [2]
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
量子位· 2025-07-22 12:35
开源大模型竞争格局 - 开源大模型竞争进入中国时间,Qwen3新模型发布后迅速获得行业关注[1][24] - Qwen3-235B总参数量为235B,仅为Kimi K2 1T参数规模的25%[2] - 新模型在基准测试性能上超越Kimi K2和DeepSeek-V3等竞争对手[3][13] - 行业竞争格局快速变化,DeepSeek、Kimi和Qwen相继占据领先位置[25] Qwen3-235B-A22B-2507技术升级 - 采用MoE架构,总参数量235B(非嵌入参数234B),推理时激活参数22B[8] - 包含94层网络结构,采用分组查询注意力机制(64个查询头+4个键值头)[8] - 设置128个专家,每次推理激活8个专家[8] - 原生支持262144(256K)长上下文处理能力[9] - 放弃混合思维模式,改为分别训练Instruct和Thinking模型[4] - 当前版本仅支持非思考模式,网页版已上线但通义APP未更新[5] 性能提升表现 - 数学推理能力显著提升:AIME25准确率从24.7%跃升至70.3%[13] - 知识测试表现:MMLU-Pro得分从75.2提升至83.0,MMLU-Redux从89.2升至93.1[11] - 编程能力提升:LiveCodeBench得分从32.9提高到51.8[11] - 多语言能力增强:MultilF得分从70.2提升至77.5[13] - 文本生成质量改善:Creative Writing v3得分从80.4升至87.5[13] 行业动态 - NVIDIA同期发布OpenReasoning-Nemotron系列模型(1.5B/7B/14B/32B)[17][18] - NVIDIA新模型实际基于Qwen-2.5微调,非全新架构[21] - Qwen官方预告将有更大规模升级即将发布[6][23] - Llama转向闭源背景下,中国开源模型正成为行业焦点[24]
游戏ETF(516010)涨超1.1%,版号放量叠加新游表现提振行业信心
每日经济新闻· 2025-07-21 10:17
大模型发展趋势 - 2023年是闭源通用大模型的爆发之年 [1] - 2025年预计成为中国开源大模型爆发及应用格局重塑之年 [1] 游戏板块投资机会 - 游戏板块建议关注回调后的布局机会 [1] - 核心产品高频数据持续向好 [1] - 游戏ETF(516010)跟踪动漫游戏指数(930901),聚焦动画、漫画、游戏等新兴领域 [1] - 动漫游戏指数由中证指数有限公司编制,反映行业相关上市公司整体表现 [1] AI应用商业化进展 - Agent落地范式逐步成熟 [1] - 垂类2B应用加速降本增效,2C应用优化体验 [1] - AI陪伴、AI教育等场景商业化进程加快,符合个性化需求且付费意愿高 [1] IP衍生赛道发展 - IP衍生赛道景气度提升 [1] - 授权业务进展加速 [1] 基金产品信息 - 无股票账户投资者可关注国泰中证动漫游戏ETF联接A(012728)和C(012729) [1]