Workflow
人工智能
icon
搜索文档
开启RL Scaling新纪元,siiRL开源:完全分布式强化学习框架,支持超千卡规模高效训练
机器之心· 2025-07-29 15:44
强化学习扩展性瓶颈与趋势 - 当前顶尖基础模型(DeepSeek-R1、o3-pro、Gemini 2.5-pro、Claude-4)的卓越推理能力依赖大规模强化学习,RL Scaling成为大模型领域"军备竞赛"核心[1] - xAI发布的Grok 4在200,000块GPU集群上运行强化学习,推动后训练规模达到新高度[1] - 解决RL扩展性瓶颈是解锁下一代AI高级推理能力的关键战略[2] siiRL框架创新设计 - 采用多控制器范式和全分布式架构,将数据加载/计算/流转任务均匀分散到工作节点,消除单一控制器瓶颈[3][11] - 核心组件:DAG Planner(逻辑工作流分解)、DAG Worker(GPU绑定执行)、Data Coordinator(数据生命周期管理)[13][14][15] - 支持华为昇腾NPU,实现跨硬件平台兼容[3] 性能优势验证 - 在1024 GPU规模下实现近乎线性扩展,512卡时保持80.5%线性扩展效率[3][21] - PPO/GRPO算法训练中最高实现2.62倍吞吐提升,72B模型训练时基线框架出现OOM而siiRL稳定运行[19] - 数据密集型任务(64k长上下文)中性能优势从1.48倍扩大至2.03倍[26] 技术突破点 - 端到端训练吞吐最高提升7倍(VLM任务)[21][25] - 动态数据缓冲机制自动调整数据分片(数据并行度变化时)[17] - 收敛性验证显示在保持与基线相同精度的前提下大幅减少训练耗时[28] 行业应用前景 - DAG设计为多智能体系统奠定基础,未来将重点拓展MARL算法兼容性和复杂交互机制[29] - 全链路开源框架(代码100%开放)支持国产硬件,目标实现"大模型跑在中国芯"[33] - 产学研团队背景涵盖万卡集群建设者、CUDA开发者、芯片优化专家等[33]
大模型智塑全球产业新秩序论坛在沪举办
中国经济网· 2025-07-29 15:29
大模型技术发展趋势 - 大模型技术在智能体、多模态、开源等领域持续创新,成为全球共同发展方向 [1] - 大模型产业应用进入深水区,正在重塑全球产业格局与生态,需关注真实效果与实际价值 [1] - 7月28日上海举办"大模型智塑全球产业新秩序论坛",聚焦前沿产业突破与垂直领域应用实践 [1] 中国信通院与政府战略部署 - 中国信通院作为国家智库,通过深化研究、完善基础设施、参与国际治理三方面推进大模型产业高质量发展 [1] - 上海徐汇区贯彻"建成全国人工智能高地"战略,已形成产业链创新闭环,未来将加速构建大模型产业生态体系 [1] 行业合作与倡议发布 - 中国信通院联合10家机构发布"大模型开源安全倡议",提出构建安全标准体系、保障开源要素安全等四点倡议 [2] - 上海人工智能实验室等联合发布《终端智能体安全(2025)》,提出全方位安全防护体系,推动智能体应用安全发展 [2] 论坛组织与支持 - 论坛由世界人工智能大会组委会指导,中国信通院主办,多家单位协办和支持,打造大模型行业顶尖盛会 [3]
金工周报-20250729
中邮证券· 2025-07-29 15:29
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称**:OpenReasoning-Nemotron推理模型 **模型构建思路**:基于Qwen2.5架构,通过从6710亿参数的DeepSeek R1 0528模型中蒸馏提炼而成,旨在为数学、科学及代码生成等结构化任务提供高效推理支持[12] **模型具体构建过程**: - 利用NeMo Skills框架生成500万个涵盖数学证明、科学推导和编程解决方案的高质量数据轨迹 - 通过纯监督微调(SFT)而非强化学习进行训练,确保逻辑一致性和符号推理精准度 - 采用GenSelect算法实现"重型推理模式",通过并行启动多个智能体生成候选解并筛选最优答案 - 公式:GenSelect@64技术,在32B模型上将HMMT数学竞赛成绩从73.8提升至96.7[13] **模型评价**:在GPQA、MMLU-PRO和AIME24等基准测试中刷新同参数规模纪录,32B版本在AIME24获得89.2分,超越OpenAI的o3-high模型[15] 2. **模型名称**:Qwen3-Coder **模型构建思路**:以4800亿参数规模、原生支持256K上下文窗口的混合专家架构(MoE)为核心,实现开源编程模型的性能突破[19] **模型具体构建过程**: - 采用稀疏化MoE设计,总参数4800亿但每次推理仅激活350亿参数,包含160个专家网络并动态选择8个参与计算 - 使用7.5万亿token的语料库,其中70%为代码数据,覆盖80余种编程语言及20多种标记语言 - 通过Qwen2.5-Coder对低质量数据清洗改写,生成高质量合成数据 - 引入代码强化学习与长程强化学习,构建分布式系统并行运行2万个独立环境[19] **模型评价**:HumanEval pass@1正确率达93.7%,超越Claude 3.5的92.4%;在SWE-Bench Verified上以31.4%任务成功率首次超过GPT-4的30.9%[20] 3. **模型名称**:AI评审框架 **模型构建思路**:通过赋予AI评审员自主调用外部工具的能力,构建兼具效率与严谨性的混合评审体系[25] **模型具体构建过程**: - 采用三级决策机制:初始领域评估、工具调用环节(事实核查/代码执行/数学核查)、综合评审结论生成 - 工具优先策略,仅在无适用工具时回退至基线模型评审 - 模块化设计实现领域适配,数学核查工具可灵活替换为Wolfram Alpha等专业引擎[26] **模型评价**:将数学问题评审错误率从纯模型评估的28%降至6%,代码评审误判率下降逾40%[29] 模型的回测效果 1. **OpenReasoning-Nemotron模型** - AIME24得分:32B版本89.2分,7B模型78.2分,1.5B模型45.6分[15] - LiveCodeBench得分:从70.2提升至75.3[13] - HMMT数学竞赛成绩:GenSelect@64技术下从73.8提升至96.7[13] 2. **Qwen3-Coder模型** - HumanEval pass@1正确率:93.7%[20] - SWE-Bench Verified任务成功率:31.4%[20] - 上下文处理能力:原生256K扩展至1M token[20] 3. **AI评审框架** - 数学问题评审错误率:从28%降至6%[29] - 代码评审误判率:下降逾40%[29] - MMLU基准测试指标一致性:提升约15%[29] 量化因子与构建方式 (注:研报中未明确提及量化因子的构建内容,故本部分暂缺) 因子的回测效果 (注:研报中未提及量化因子的测试结果,故本部分暂缺) 以上总结严格基于研报中涉及的量化模型相关内容,未包含风险提示、免责声明等非核心信息。模型构建细节引用自原文技术描述部分,测试结果数据均来自基准测试报告[12][13][15][19][20][25][26][29]
最新公布,AI新成果!
中国基金报· 2025-07-29 15:01
头部券商AI技术应用成果 - 中信证券、中信建投、中金公司、华泰证券等头部券商在2025世界人工智能大会上展示"AI+"研究实践成果,涉及投融资主题论坛和科技金融创新论坛 [2] 中信证券AI系统与数字员工 - 发布全市场首套AI算法与市值管理相结合的上市公司企业级服务平台CapitAI-Link,利用大模型技术提供个性化决策支持 [3][4] - 推进AI数字员工体系建设,为每位员工提供"数字分身",实现"以一抵十"的效能跨越,构建人机协同工作生态 [4] 中金公司智能化投研平台 - 展示自主研发的中金点睛数字化投研平台及中金点睛大模型,限时开放用户注册通道 [5][6][7] - 累计保荐科创板上市公司50余家,融资规模超2000亿元,占科创板IPO融资总额约20%;硬科技直投项目逾1100个,累计投资超900亿元 [9] - 发布《科技金融》《具身智能:AI下一站》《人形机器人:商业与经济》等研究报告 [10] 中信建投AI产业发展研究 - 发布《AI新纪元:砥砺开疆・智火燎原》报告,贯穿AI垂直产业链核心环节,实现软硬件研究全链路贯通 [11][12] - AI大模型发展趋势:参数量规模扩大性能提升、强化学习提升推理性能、模态融合丰富、向AGI发展 [12][13] 华泰证券AI智能体应用 - 关注AI智能体应用落地机会,AI服务器有望取代智能手机成为最大科技硬件品类 [14][15] - 2024年全球数据中心应用AI芯片市场规模达1782亿美元(同比+77%),PC和智能手机芯片市场分别为539亿和352亿美元 [15] - 建议关注服务器产业链量价齐升机会,中国是美国外唯一具备完整AI产业链的国家 [16]
Al商业化应用有望加速落地!恒生科技ETF(513130)年内获30.19亿元资金加仓
新浪基金· 2025-07-29 15:01
2025世界人工智能大会 - 2025年7月26日-28日以"智能时代,同球共济"为主题的2025世界人工智能大会在上海举行,为人工智能产业高质量发展注入新动能 [1] - 受大会催化,恒生科技ETF(513130)获资金关注,7月28日单日净申购2.01亿份,份额攀升至374.82亿份,规模达281.49亿元 [1] 恒生科技ETF市场表现 - 截至2025/7/28,年内超187亿元资金净流入跟踪恒生科技指数的ETF,其中恒生科技ETF(513130)获30.19亿元加仓 [1] - 该ETF年内日均成交额达48.87亿元,流动性水平居同类前列 [1] - 恒生科技指数市盈率回落至21.58,处于近五年21.46%分位数水平,估值吸引力提升 [2] 恒生科技指数成分与AI产业 - 恒生科技指数涵盖AI产业链的算力基建、大模型开发、商业应用及终端生态等多环节 [2] - 前五大成份股为腾讯控股、小米集团-W、网易-S、阿里巴巴-W、比亚迪股份,均为AI领域龙头企业 [2] - AI产业正从技术探索向价值深耕转变,新兴技术加速在各场景落地转化为生产力 [2] 华泰柏瑞基金管理能力 - 华泰柏瑞基金是境内首批ETF管理人,保持18年ETF零差错运营纪录 [3] - 旗下标杆产品包括沪深300ETF(510300)、红利ETF(510880)等 [3] - 恒生科技ETF(513130)2021年至2025年上半年收益分别为-30.24%、-21.43%、-8.89%、21.13%、16.37%,与基准表现接近 [3] 产品交易特性 - 恒生科技ETF(513130)支持场内T+0交易,场外投资者可关注其联接基金(A类015310/C类015311) [2]
专访中金公司董事长陈亮:努力做好“科技金融”大文章
国际金融报· 2025-07-29 14:45
科技金融与人工智能发展 - 科技与金融的"双轮驱动"是人工智能跨越式发展的关键引擎,需要匹配科技实力的科技金融体系 [1] - 国家强调以科技创新催生新质生产力,金融活水激发创新动能,形成"科技—产业—金融"良性循环 [2] - 中金公司累计保荐科创板上市公司50余家,融资规模超2000亿元,占科创板IPO融资总额约20% [2] - 中金公司对硬科技直投项目逾1100个,累计投资金额超过900亿元 [2] 中金公司的科技金融服务案例 - 中金公司助力汉朔科技登陆创业板并募集资金11.62亿元,提升终端产线自动化水平 [3] - 中金公司作为唯一中资投行,助力小米集团完成55亿美元港股配售,推动智能电动汽车产能扩建 [3] - 中金公司完成上交所首单"实验室经济"科技创新公司债券发行,募集资金10亿元用于科技创新企业 [3] - 中金公司担任影石创新科创板IPO联席主承销商,募集资金19.38亿元用于智能影像设备生产基地建设 [4] 人工智能产业的市场前景 - 中国AI产业的市场需求到2030年将达到5.6万亿元,2024年至2030年总投资规模将超过10万亿元 [5] - 大模型驱动的新商业模式有望为金融业带来规模达3万亿元的增量商业价值 [7] - 人工智能具备通用技术特征,能在几乎所有经济活动中发挥作用,提高金融服务质量和效率 [5] 人工智能在金融领域的应用 - 大模型技术提升金融从业者展业效率,解决信息不对称问题,降低交易成本 [7] - 大模型技术创新客户交互模式,覆盖更广泛的中长尾客户,提供定制化金融服务 [7] - 大模型技术赋能投资、投研核心场景,提升投资决策的科学性与时效性 [7] 中金公司在AI领域的探索 - 中金公司对大模型进行前瞻性布局,在基础设施搭建、数据治理与运营等方面取得阶段性成果 [8] - 中金财富完成与DeepSeek-R1大模型的深度融合,升级智能投顾助手IC-Copilot [8] - 中金公司构建投顾服务领域"热点发现—资讯处理—策略生成"的三位一体服务生态 [8] 中国AI产业的发展优势 - 中国凭借超大规模市场、完备产业体系与海量应用场景,展现出强大的韧性与潜力 [9] - 中国加速人工智能在产业领域的深度赋能,推动效率革命与模式创新 [9] - 中国提升人工智能核心技术和产业链的自主可控能力 [9]
AI爆款营销的时代,已经来了
首席商业评论· 2025-07-29 14:44
AI时代,品牌的新考验来了。 2025年的消费市场,复苏中透着复杂。能在越来越复杂的市场中搞出声量,AI是一个关键赋能工具。但如何真正用好AI,是摆在所有从业者面前的痛点。 都知道流量为王,初创品牌如何摆脱短视频有量无质?运营人如何用AI一站式管理短视频?如何在AI助力下做到内容为王?有类似困惑的创业者不在少数。 很多人可能没听过筷子科技,它是一家专注于企业级AIGC(人工智能生成内容)创意智能生产和协作增长平台的公司,通过AI技术提升内容生产的效率和质量, 优化内容营销策略,也是当下AI时代助力企业运营的黑马公司代表。 本次分享交流主要围绕AI技术在内容创作、矩阵管理及品牌营销中的应用展开,陆智成在AI工具赋能视频剪辑、内容生成、账号运营、舆情管理等方面进行详细 阐述,满满干货。 01 流量为王时代,AI成了老板们的香饽饽? 对于传统企业营销,内容生产的局限性主要有几点。 第一是效率局限性 ,一个内容营销团队生产力的极限大概是每个月50条。如果企业想要做更大的量,要么平台付费投流,要么再聘请新团队,无论哪种方式,企 业的成本只能有增无减。 第二是创意瓶颈, 过去创意靠编导岗位,更多依赖经验和个人能力来产出相 ...
近30个交易日涨超15%,创业板ETF天弘(159977)续涨1%,机构:科技科创领域有望成为三季度占优方向
21世纪经济报道· 2025-07-29 14:43
A股市场表现 - 7月29日A股三大指数午后持续走强,创业板指涨1.28% [1] - 创业板ETF天弘(159977)当日涨1.18%,成交额超3100万元,近30个交易日累计涨超15% [1] - 成分股中天孚通信涨超12%,中际旭创、泰格医药、新易盛等多股跟涨 [2] 创业板ETF与指数特征 - 创业板ETF天弘(159977)最新流通规模为87.24亿元,紧密跟踪创业板指数(399006.SZ) [3] - 创业板指数由100家创业板上市企业组成,新兴产业和高新技术企业占比高,成长性突出 [3] - 截至7月25日创业板指前十大成分股包括宁德时代、东方财富、汇川技术、中际旭创、迈瑞医疗等 [3] 市场结构与行业趋势 - 市场结构正从"杠铃策略"向"中间资产"转变,创业板指和科创50为代表的科技科创领域迎来周期性拐点 [3] - 宏观层面长期利率下移放缓叠加政策推动产能出清,产业层面AI算力、创新药、半导体、新能源等行业景气拐点显现 [3] - 创业板指一季度利润增速达19%,盈利优势突出,当前市场呈现"价值搭台、成长唱戏"特征 [3] AI产业发展动态 - 2025年世界人工智能大会聚焦AI基础设施、科学智能、智能终端等10大板块,多款重磅AI产品发布推动产业链投资趋势 [4] - 我国AI产业链进入大规模示范应用阶段,智能算力规模高速增长,2026年有望达2024年的两倍,市场规模预计增至337亿美元 [4] - AI应用领域如科研、智驾、金融科技受益普及普惠催化,国产算力产业链受益国内需求提升 [4]
21对话|上海人工智能协会党赞:WAIC今年重在展示应用能力
21世纪经济报道· 2025-07-29 14:42
世界人工智能大会(WAIC)规模与成果 - 2023年WAIC创下多项纪录:7万平方米展区面积、800余家参展商(较去年增加300家)、展出逾3000项前沿展品及百余款首发新品[1][3] - 线下参观人数突破30.5万人次,全网流量达23.6亿(同比增长21.6%),签约32个项目总投资额450亿元,达成意向采购金额162亿元[1] - 展位供不应求,老客户需提前一年预订仍可能无法保证获得展位[1] 人形机器人技术突破与展示亮点 - 今年展出约150台人形机器人,相比去年实现重大突破:从去年仅能简单遥操作挥手,到今年实现具身化突破,下肢可活动且形态多样化(四足狗/人形等)[3] - 特别设置"WAIC里·技能大舞台"展示实际应用能力,区别于北京半程马拉松赛和杭州格斗竞技的展示形式[3][4] - 通过5月发起的国际人形机器人技能大赛筛选出核工业管孔清理等实用场景解决方案,加速了机器人落地应用[4] 上海人工智能产业发展优势 - 上海2018年率先创办WAIC,抓住先机并构建完整产业生态,吸引大批企业集聚[1][7] - 政府强力支持:2022年12月发布《关于人工智能"模塑申城"实施方案》,系统布局基础底座、生产力工具、垂直应用等领域[5] - 前瞻布局核心要素:在算力、算法、数据三大领域重点投入,形成"1+3"基础模型格局(1个开源模型+商汤/MiniMax/阶跃星辰3个模型)[8] 大会与产业互促机制 - 大会通过设置比赛、发布报告、举办论坛等方式持续输出行业前沿动态[6] - 衍生全球开发者先锋大会服务年轻创业者,构建专属创业生态平台[8] - 聚焦全球治理、伦理与安全等议题升级大会规格,助推招商引资和产业扩容[8] 行业发展驱动力 - 人工智能已上升为全球战略,中国2017年将其纳入国家战略,"人工智能+"成为中央重点推进方向[5] - 技术快速迭代与重大突破、应用端需求爆发、资本持续看好共同推动行业加速扩容[5]
大模型一体机性能标准框架研讨会将于8月1日召开
快讯· 2025-07-29 14:39
7月29日,据中国人工智能产业发展联盟消息,为持续推动大模型产业生态建设,中国人工智能产业发 展联盟AI Infra工作组、中国通信标准化协会人工智能技术与标准推进委员会(CCSA TC602)将启动大 模型一体机性能标准的研制工作,标准将体系化地规范大模型一体机的性能指标和技术能力,为行业提 供统一的评测基准和实施指南。工作组计划于8月1日(周五)召开"大模型一体机性能标准框架研讨 会",围绕标准框架和内容展开研讨与交流。 ...