Workflow
模型训练
icon
搜索文档
科创板年内新增最大IPO融资项目拆解:摩尔线程的商业化初探
华尔街见闻· 2025-07-03 21:09
国产GPU行业竞争格局 - "国产GPU四小龙"中摩尔线程和沐曦集成科创板IPO已获受理,壁仞科技、燧原科技、格兰菲智能处于IPO辅导阶段,行业集体迈向资本化[1] - 摩尔线程计划募资80亿元,为2024年上半年科创板最大IPO募资规模,沐曦集成募资额约为其一半[5][6][7] - 行业竞争焦点在于谁能率先成为"国产GPU第一股",市场高度关注[8] 摩尔线程核心竞争力 - 核心团队来自英伟达,MTT S80显卡单精度浮点算力接近RTX 3060,千卡GPU智算集群效率超过国外同代产品[2] - 2024年收入达4.38亿元同比增长超2倍,AI智算产品首次创收3.36亿元占比超7成[3][11] - 研发投入达13.59亿元,净亏损14.92亿元但同比减亏10%[4] 产品与技术进展 - 产品线覆盖AI智算、专业图形加速、桌面级图形加速和智能SoC,形成全功能布局[9][10] - 2023年推出第三代GPU芯片MTT S4000,2024年披露新品MTT S5000,FP32算力达32TFLOPS超越A100但低于H100和MI325X[12][13][15][17] - 基于MTT S5000构建的千卡集群效率超过国外同代产品,计划投资25亿元研发新一代AI训推一体芯片[16] 商业化策略与财务表现 - 消费级产品MTT S80/S70累计收入仅0.72亿元,因国际品牌竞争采取低价策略导致毛利率为负[20] - 转向聚焦B端市场,AI智算和专业图形加速板卡毛利率分别达90.7%和83.13%,显著高于沐曦集成同类产品[21][22] - 在手订单4.4亿元,管理层预计2027年可实现盈利[23][24] 行业技术发展趋势 - FP8低精度浮点格式成为技术突破方向,可在保持低精度同时实现准确性、效率、内存和能耗的平衡[14][15] - 摩尔线程通过支持FP8计算与存储实现训练加速和内存占用降低,与BF16基线相比精度损失控制在0.25%以内[15]
江苏发布创新提升数字贸易政策措施
新华日报· 2025-07-03 05:40
江苏省数字贸易发展规划 - 到2030年全省服务贸易规模目标6000亿元 数字交付服务贸易目标3000亿元 占比50% [1] - 着力推进数字贸易制度型开放 打造数字贸易集聚生态圈 对接高标准经贸规则 [1] - 推进中新数字贸易合作试点 探索数字贸易便利化措施 推动江苏自贸试验区数据出境负面清单 [1] - 积极创建国家服务贸易创新发展示范区 国家数字贸易示范区 完善南京软件谷等载体基础设施 [1] 产业赋能措施 - 发展数字产品贸易 做强南京无锡苏州国家对外文化贸易基地 推动动漫游戏影视产品出口 [2] - 扩大数字技术贸易 推进高端软件发展 实施人工智能+行动计划 升级数字服务贸易 [2] - 探索跨境电商新场景 推动数字订购贸易 联动开放平台 [2] - 激活数据产业潜能 争创国家级可信数据空间试点 发展来数加工离岸数据加工大模型训练新业态 [2] 服务贸易重点领域 - 增强国际运输服务能力 优化国际航线网络 建设智慧港口和智慧航道 [2] - 提升旅游服务国际竞争力 利用入境过境免签政策 优化口岸团体旅游签证 [2] - 加快发展国际教育服务 打造活动品牌 支持境外办学 [2] - 支持人力资源地理信息等专业服务贸易拓展国际合作 [2] - 扩大优质服务进口 吸引国际资源在多领域先行先试 [2]
最高法法官:在大模型训练数据输入端构建合理使用制度
南方都市报· 2025-07-01 17:23
大模型训练数据的法律规制 - 最高人民法院法官亓蕾提出"宽进严出"制度设计思路 即在数据输入端构建合理使用制度 在输出端采取严格规制以平衡技术发展与权利人保护 [1] - AI训练数据属于技术研发环节 单纯模型训练不直接影响权利人 风险主要来自后续应用环节 目前尚未出现规模性风险 [2] - 多数国家和地区对AI训练数据持宽容态度 严格输入端规制将导致高昂授权成本或法律风险 阻碍技术创新 [2] 合理使用制度的立法建议 - 建议通过立法将AI训练数据纳入著作权合理使用特定情形 因其具有底层技术支撑作用和公共利益属性 [3] - AI对作品的使用是"分子料理"式打散重塑 目的为学习语言规律生成新知识 非直接复制存储作品 [3] - 需同步赋予著作权人前端数据合法取得与后端侵权救济手段 如设置技术措施权利和AI服务商注意义务 [3] 美国司法实践案例 - 加州法院在Anthropic案裁决训练AI模型属合理使用 但要求数据采集来源合法 [4] - Meta案显示合理使用判定需考察作品市场价值影响 未经许可训练大模型在多情况下仍属违法 [4] - 中国业界建议个案考察作品市场价值影响 而非抽象判断合理使用 [4] 现行许可模式的局限性 - 传统版权许可模式成本高昂且流程繁杂 可能抑制创新并诱发灰色地带操作 [2] - 法定许可模式仍使大模型公司承担高成本 且版权管理组织需支付高额管理费 [2] - 授权许可与法定许可均面临交易成本过高问题 合理使用更具可行性 [2]
极氪智驾团队夺冠CVPR国际比赛,解决端到端AI模型训练世界级难题
快讯· 2025-06-30 16:08
行业动态 - 国际顶级CVPR 2025自动驾驶研讨会上揭晓Argoverse2 2025场景挖掘挑战赛结果 [1] - 中国极氪智驾团队在挑战赛中拔得头筹 [1] - 极氪智驾团队利用AI技术解决全球自动驾驶领域公认的技术挑战 [1] 技术突破 - 极氪智驾团队从海量、高度冗余的数据中快速定位并提取关键驾驶场景 [1] - 在同数据量情况下,极氪智驾AI模型可获得更优学习成果 [1] - 技术应用提升端到端系统在关键驾驶场景的识别和处理能力 [1] 公司表现 - 极氪智驾团队在自动驾驶领域展示出领先的技术实力 [1] - 公司在AI模型训练和场景识别方面取得显著进展 [1]
微软发布Mu模型:支持Windows智能体,小参数跑出10倍性能;研究称美国30%代码已由AI生成,年创百亿美元价值 | 全球科技早参
每日经济新闻· 2025-06-24 07:50
微软发布Mu模型 - 微软发布创新小参数模型Mu,参数仅3.3亿,性能比肩Phi-3.5-mini但体量为其十分之一 [2] - Mu在离线NPU笔记本设备上可实现每秒超过100 tokens的响应速度,在小参数模型中表现罕见 [2] - Mu支持在Windows中设置智能体,可将自然语言指令实时转化为系统操作 [2] AI编程在美国的应用 - 研究显示2024年美国开发者提交的Python代码中30.1%由AI生成 [3] - AI辅助编程每年为美国创造96亿至144亿美元的经济价值 [3] - 数据基于2018-2024年GitHub上8000万条代码记录的分析 [3] 谷歌使用YouTube视频训练AI - 谷歌正使用200亿条YouTube视频资源库训练新一代AI工具 [4] - 公司强调仅使用部分内容并遵守与创作者及媒体公司的协议 [4] - YouTube表示已投入开发保护机制以保障创作者权益 [4] 关于AI监管的争议 - 微软首席科学家警告特朗普政府禁止州级AI监管的提议将阻碍技术发展 [5] - 该提议计划禁止各州在未来十年内制定任何限制AI的法律或法规 [5] - 专家认为禁止监管与科学进步目标背道而驰 [5] Perplexity推出AI浏览器 - Perplexity计划向Windows用户推出搭载"搜索智能体"的Comet浏览器 [6] - Windows版本已完成并开始小范围测试,Android版本也在快速推进 [6] - 浏览器内置AI助理支持购物折扣检查、邮件提醒和虚拟试衣等功能 [6][7]
华升股份(600156.SH)拟购买易信科技100%股份 6月24日复牌
智通财经网· 2025-06-23 16:57
交易概况 - 华升股份拟通过发行股份及支付现金方式收购易信科技100%股份并募集配套资金 审计评估工作未完成 交易价格未确定 [1] - 公司股票将于2025年6月24日复牌 [1] 标的公司业务 - 标的公司专注于AIDC领域 提供绿色算力基础设施全生命周期服务 包括智算中心规划设计 建设运维 节能系统研发 算力池化调度运营 [1] - 业务覆盖人工智能 大模型训练等场景 以技术创新驱动算力基础设施低碳化 高密度化 智能化升级 [1] 战略布局 - 标的公司已在深圳百旺信 惠州大亚湾 广州南沙 海口运营多个高性能智算中心 湖南郴州在建绿色智算中心 计划拓展河南四川 [1] - 以湖南绿色智算中心为核心 加快中部高密度高能效算力节点布局 形成华南 华中 华北 西南区域化服务能力 [1][2] - 计划构建辐射中部 承东启西的全国智算资源体系 承接低空经济 人工智能 工业互联网 金融科技等高强度算力需求 [2] 战略意义 - 交易符合国家新型信息基础设施建设和新质生产力培育导向 [1] - 标的公司具备中部区域算力资源优先布局优势 将提升我国智能算力基础设施区域协调能力与整体效率 [1][2] - 助力华升股份融入全国算力网络 赋能新质生产力高质量发展 [2]
无损减少80%激活值内存,提升5倍训练序列长度,仅需两行代码
机器之心· 2025-06-23 15:44
本文的第一作者罗琪竣、第二作者李梦琦为香港中文大学(深圳)计算机科学博士生,本文在上海交通大学赵磊老师、香港中文大学(深圳)李肖老师的指 导下完成。 长序列训练对于模型的长序列推理等能力至关重要。随着序列长度增加,训练所需储存的激活值快速增加,占据训练的大部分内存。即便使用梯度检查点 (gradient checkpointing)方法,激活值依然占据大量内存,限制训练所能使用的序列长度。 来自港中文(深圳)和上海交通大学的团队提出 StreamBP 算法。通过对链式法则进行线性分解和分步计算,StreamBP 将大语言模型训练所需的激活值 内存(logits 和 layer activation)降低至梯度检查点(gradient checkpointing)的 20% 左右。 论文标题:StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs 在相同内存限制下,StreamBP 最大序列长度为梯度检查点的 2.8-5.5 倍。在相同序列长度下,StreamBP 的速度和梯度检查点接近甚至更快。 S ...
成立不到五年,这家GPU厂商即将A股上市
搜狐财经· 2025-06-19 18:54
本文由半导体产业纵横(ID:ICVIEWS)综合 国产GPU"四小龙"冲击上市,摩尔线程率先完成上市辅导。 中国证监会官网显示,国产GPU"四小龙"之一的摩尔线程已于6月10日率先完成上市辅导,目前进入"辅 导验收"阶段。 | 全国一体化在线政务服务平台 | | | | | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | | 中国证券监督管理委员会网上办事服务平台(试运行) | | | | | | | | | 公开发行辅导公示 | | 니아있었 | 储导机构 | 餐家时间 国际状态 | | 最出肌肉 | 报告买型 | 擬告标設 | | II 北京 河北 山西 | 川 天津 | 鄉分液程智能科技《北班》 股份有限公司 | 中国证券股份有限公司 | 2024-11-12 辅导治农 | 北京证监局 辅导工作完成报告 关于雕尔成程智能- | | | | 2024年11月,摩尔线程在北京证监局办理辅导备案登记,由中信证券股份有限公司(下称"中信证券") 开展辅导。上市辅导是企业IPO前的必经阶段,由辅导机构协助企业进行全面规范、整改。 ...
当前时点如何看光模块反弹行情
2025-06-06 10:37
纪要涉及的行业和公司 - **行业**:光模块、AI 算力、以太网、光器件 - **公司**:英伟达、天孚通信、Credo、博通、迈凯伦科技、Qualcomm、普利司通、新易盛、菲尼萨、旭创、仕佳光子、博创科技、德科立、联杰科技、太阳光、泰正光、长盈盛 纪要提到的核心观点和论据 英伟达相关亮点 - 季报显示 Blackwell 产品占一季度收入 70%,部署速度达每周 1000 架机架,二季度部署量预计超 6000 - 10000 架[1][4] - GB300 可能二季度末出货,从 GB200 切换到 GB300 无太多障碍,采用有限创新保证稳健交付,核心变化为 HBM 配置提升和标配 CX8 网卡[1][4] - 网卡销售恢复正常,加速 1.6T 订单释放[4] Mellanox 业务表现 - 网络业务超预期,MV link 销售额约 10 亿,ID 和以太坊贡献 10 亿环比增长[1][5] - 收入来自交换机、光模块、网卡及 Armlink 协议授权,这些领域一季度有复苏迹象,利好英伟达供应链,如天孚通信直接受益[1][5] 主权国家对 AI 投资情况 - 投资超预期,沙特大单已促成,英伟达将在欧洲推动更多主权 AI 大单[1][6] - 谷歌 IO 大会提到推理需求显著增加,每月 TOKEN 消耗量达 480 万亿,同比增长 50 倍,支撑推理需求[1][6] 博通相关情况 - Tomahawk 6 提前发布,加速行业迭代,预计 2026 年下半年或 2027 年上半年开始规模交付,推动以太坊 1.6T 增长,支持 2027 年行业增长[1][8] - 目前创新高,核心业务包括 ISC 和以太网,在产业趋势上被普遍看好[11] 其他公司业绩表现 - Qualcomm 近期业绩反馈积极,盘后股价上涨超 20 点,2026 财年增长预期强劲,下游客户需求也强劲[9] - 普利司通上季度 AI 收入 41 亿美元,本季度给出 44 亿美元收入指引,超预期概率较高[10] 光模块市场发展前景 - 明年增长显著,800G 产品预计有超 50%的量增长,价格降幅有限,整体价格降幅仅个位数,结构性降价明年整体可能在 10% - 20%,预计 800G 增速可能达 30%[3][12] - 1.6T 今年预期为 100 万 - 150 万水平,订单加速可能调整数字,明年实现翻倍以上增长较容易[3][12] 光模块市场竞争格局 - 新易盛市场份额持续提升,今年已超过 20%,预计未来在 1.6T 领域参与比例更高[15][16] - 其他二线公司参与力度不大,设备商对供应商导入相对开放,今年 800G 升级快,直采面临瓶颈,可能增加渠道商采购和设备商采购比例,但不影响整体竞争格局[16] 菲尼萨代工链情况 - 整体份额有保障,但产能规划和扩产执行差,转向中国大陆光模块代工厂,400G、800G 高速光模块代工产能缺口比例从不到 30%增长至超 30%,未来可能超 40%[17] - 一些企业进行 PCBA 代工,毛利率可达 20%,净利率超 10 个点,PCBA 代工净利率可达 15 个点,反映行业高景气度[17] 行业未来发展趋势及推荐标的 - 明年紧迫性持续,各公司扩产规划激进,竞争格局未恶化,头部公司利润率持续提升,如旭创因硅光方案提高毛利率[18] - 推荐新易盛、天孚通信与旭创,新易盛业绩增长快、估值低,是反弹最多的标的,天孚通信和旭创距前高还有较大幅度,新易盛接近前高约 20%[18] 天孚通信优势 - 在 1.6T 光引擎市场领先,英伟达和博通季报显示 1.6T 成市场主要需求,随着英伟达相关产品部署和出货,1.6T 预期提升,天孚通信光引擎出货量环比增长显著[19] - 60%业务来自 MetaLus,部分 800G 产能转向 1.6T,直接影响收入业绩,在 1.6T 弹性方面优势明显,增长幅度预计比旭创高十几到二十个百分点,比兴盛高三四十个百分点[20] - 积极导入新大客户,今年有一定量级用于测试的 CPU 交换机,对公司有实际贡献[20] CPU 光引擎市场发展预期 - 今年有几百到上千台用于测试的 CPU 交换机,每台含 72 个 1.6T 光引擎,总计约 7.2 万支,对公司有一定贡献[21] - 明年下半年预计推出以太坊版本,2027 年可能看到基于 3.2T CPU 光引擎的交换机,将提升渗透率,但因 ESTIC 起量,对行业渗透率预期有所调整[21] 二线公司情况 - 仕佳光子、博创科技、德科立、联杰科技和太阳光等二线公司可根据 PE 和增速排序,太阳光可能排在博创之后[22] - 这些公司在光器件领域表现突出,光器件与 AI 产业趋势紧密相关,有较强确定性并享受价值提升,部分核心组件未来将获更高估值,CW 类光源短期增速不慢且盈利能力强[22][23] 无源器件与光模块表现 - 无源器件在毛利率和长期确定性方面优于光模块,部分无源器件公司毛利率高,享受更高估值,光模块在 CPU 架构和 IO 接口新形态下可能受冲击[24] 光器件市场规模及前景 - 2025 年光器件市场规模预计约 1000 亿人民币,无源器件占一两百亿人民币,NPU 规模约 200 - 300 亿人民币[25] - 行业毛利率超 40%,部分品类达六七十,潜在业绩空间远期至少有一两百亿利润,能培养大市值公司[25] AI 技术对行业影响 - AI 推理算力建设规模大,云商有持续投资能力,AI 赋能原有业务反映在利润上,北美 top four 云商 2025 年利润体量可能超 3500 亿美金[26] - AI 军备竞赛未结束,TOKEN 消耗量爆发式增长,推动算力投资持续白热化,在实际高 ARPU 应用 agent 出现前,TOKEN 消耗量会继续增加[26] 多模态模型训练前景 - 是未来 AI 发展新蓝海,图片和视频数据未来训练空间大,能实现 AI 泛用场景,目前 AI 替代部分工作,未来将扩展至更多工种[27] 2026 年硬件行业展望 - 从当前跟踪数据看,行业景气度高,预计 2026 年继续保持良好发展势头,数据为投资者决策提供指引[28] 其他重要但可能被忽略的内容 - 近期 AI 算力市场表现强劲,股价反弹明显,海外市场算力基础设施建设积极信号多,中美关系缓和,产业链反馈积极,但美股反应及时,A股反应滞后[2] - Tom Hank 6 作为以太网标准 1.6T 发布,预计到规模出货需一到两年,2027 年有更多市场反映,竞争格局无特别大变化[15]
Gemini2.5弯道超车背后的灵魂人物
虎嗅· 2025-06-05 11:14
Gemini 2.5 Pro崛起背后的底层逻辑 - 大语言模型训练的核心步骤包括预训练、监督微调和对齐阶段,过去一年行业重点转向对齐阶段,特别是强化学习方向的探索[2] - Google在Gemini系列迭代中积累了坚实的基座模型训练经验,并更加重视强化学习的作用,引入"让AI批判AI"的机制[3] - 编程能力成为各家模型竞争焦点,Anthropic在预训练阶段优先投入高质量代码数据,使其在代码生成质量上领先[4][5] - Google通过整合预训练和强化学习优势,在Gemini 2.5中实现编程和数学等高确定性任务的突破性表现[3][11] - 模型能力差异源于数据配比和训练优先级选择,Anthropic专注编程导致其他能力稍弱,OpenAI侧重人类偏好输出[5][10] Google技术团队与资源整合 - Google DeepMind由Jeff Dean、Oriol Vinyals和Noam Shazee三位专家形成技术铁三角,分别代表预训练、强化学习和自然语言处理能力[15] - Google Brain与DeepMind合并实现强强联合,前者擅长大规模资源调度和预训练,后者专精强化学习[16][17] - Sergey Brin回归带来"Founder Mode",显著提升团队士气和工作强度,推动Gemini快速迭代[19][20] - Google拥有全球最强计算资源、人才储备和近乎无限的资源投入能力,为Gemini快速反超奠定基础[20] Google的API价格优势 - Google十年前开始布局TPU生态,避免依赖NVIDIA GPU并节省"NVIDIA税"[22] - 基础设施能力远超同行,拥有动态调度大规模集群的独家优势,OpenAI等仍需依赖第三方云服务[22][23] - 软硬件一体化优化能力使Google在成本控制上具备天然优势,API定价策略具有显著竞争力[22][23] - 行业数据显示AI服务存在高溢价空间,Google凭借规模效应可承受更低利润率[23][24] 行业竞争格局演变 - OpenAI早期凭借人类偏好输出领先,Anthropic通过代码能力突破建立优势,Google最终以推理能力实现反超[10][11] - 模型能力发展呈现螺旋式上升,各家在不同领域轮流领跑:写作→代码→推理[10][11] - XAI的Grok在数学领域表现突出,反映创始团队背景对模型特化能力的影响[12] - 编程能力商业化成为焦点,Anthropic明确追求生成可直接投入生产的代码而不仅是解题[12]