Workflow
规模定律
icon
搜索文档
AI下半场,大模型要少说话,多做事
虎嗅· 2025-07-01 09:33
本文来自微信公众号:中国企业家杂志 (ID:iceo-com-cn),作者:闫俊文,原文标题:《对话中国 信通院魏凯:AI下半场,大模型要少说话,多做事》,头图来自:AI生成 今年2月DeepSeek爆火,震惊国内外。实际上,在此之前,中国信息通信研究院(下称:中国信通院) 的大模型评测团队就观察到国内模型性能迅速提升的势头,他们当中就包括中国信通院人工智能研究所 所长魏凯。 魏凯说:"2024年一年,国内包括DeepSeek在内的多个大模型团队,一直从多角度努力,不断提升模型 性能,基本上每个月都能看到新的进展。在我们的测试中,DeepSeek在2024年4月的模型性能排名还比 较靠后,8月的版本已经是TOP10里的玩家了,到了10月的版本已经是前几名了,12月发布的DeepSeek- V3成为当时基础能力第一名的模型,而且是开源的,非常了不起。" 2024年底,工业和信息化部成立人工智能标准化技术委员会,魏凯任秘书长,主持日常工作。 6月底,《中国企业家》专访了魏凯,作为资深专家,他对大模型以及当前最火的Agent有独特的看法, 以下是访谈的内容详情(有删减): 一、DeepSeek一直在优化 《中国企业 ...
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 14:49
以下文章来源于GOSIM开源创新汇 ,作者Open AGI Forum 出品 | GOSIM 开源创新汇 近年来,随着大模型技术在全球范围内快速崛起,"出海"成为每家 AI 公司绕不开的话题。在这场激 烈的全球竞逐中,阿里巴巴通义实验室研发的通义千问( Qwen )表现尤为抢眼。 作为全球开源社 区 Hugging Face 上下载量最高的模型之一,Qwen 甚至在欧美用户中收获了超越中文用户的热情 拥趸。 这种国际化成功的背后,是通义实验室在多语言技术上的深度布局与战略眼光。 在法国巴黎举行的 GOSIM AI Paris 大会现场, CSDN&《新程序员》执行总编唐小引 与 阿里巴 巴通义实验室研究科学家杨宝嵩 进行了深入交流。作为 Qwen 多语言能力的负责人,杨宝嵩带领团 队赋予了 Qwen 模型备受称赞的支持全球 119 种语言 的能力。采访中,他透露了 Qwen 一开始就 将国际化视作核心战略 ,优先考虑多语言数据优化,确保全球用户都能公平享受 AI 带来的技术普 惠。 杨宝嵩指出,大模型出海并非简单的语言翻译问题,而是要直面不同语言背后复杂的文化规范和禁忌 内容。在多语言安全性与文化对齐方面,团 ...
研报金选丨别急着找下一个宁德时代,跟着这些“卖水人”能吃肉
第一财经· 2025-06-20 10:38
研报金选 618超级回归福利:年单8折起,直降700元! 还送第一财经智享会员季卡权益。 年内最大优惠来袭,后无来者! 仅本月有效!仅年单有效!错过这次再等一年! 注:年单一人限购一单,同一手机号无法叠加。 研报观点: ①规模定律由参数、算力扩展至并行流,互联带宽亦将受推动...... ②集群低功耗、高速率的需求下,更高的集成度或为更优解...... ③行业头部通信设备厂已有成熟方案,CPO 交换机产业化或在即...... 点此解锁研报全文及推荐详情 第一财经智享会员季卡权益请扫码联系小助手领取 金选导读 1、为什么算力板块这个品种最疯狂?英伟达已降耗70%,分析师惊呼:乐观预计80%渗透+400 亿美元规模+终局结构; 2、未来5年出货CAGR高达123%?2500亿风口倒计时!别急着找下一个宁德时代,跟着这 些"卖水人"能吃肉! 1、为什么算力板块这个品种最疯狂?英伟达已降耗70%,分析师惊呼:乐观预计80%渗透+400 亿美元规模+终局结构; 点此解锁重点公司盈利预测图示 2、未来5年出货CAGR高达123%?2500亿风口倒计时!别急着找下一个宁德时代,跟着这 些"卖水人"能吃肉! 近期,****突破 ...
网络系列报告之CPO概览:光电协同,算力革新
国元证券· 2025-06-17 14:13
报告行业投资评级 - 推荐(首次) [6] 报告的核心观点 - 随着规模定律扩展,并行计算推动集群互联带宽需求,CPO技术因低功耗、高速率优势受重视,长期或成数据中心光电转换模块终局结构,国内供应商多布局产业链上游且全球化产能布局,看好天孚通信、太辰光等公司 [1][2][3] 根据相关目录分别进行总结 1 规模定律下模型参数量高增,并行及功耗需求推高集成 1.1 规模定律下参数量高增,计算并行流增长推集群互联带宽提升 - 模型规模扩展使算力需求增加,推理阶段算力需求指数型增长推动算力集群扩张,并行计算推动集群内互联带宽和通信器件需求提升 [14][17] 1.2 集群大规模、高速率、低功耗需求下,集成式模块或为更优选择 - 集群TCO中电费占比高,降低功耗可优化OPEX;集群规模扩张使通信设备价值量占比上行,CPO技术可提升带宽、功耗和空间效率,降低成本 [20][24][28] 1.3 CPO高性能、低功耗优势推渗透提升,上游器件供应商弹性可观 - CPO技术可形成“技术升级 - 成本下降 - 渗透加速”正向循环,预计到2027年800G和1.6T端口总数中CPO端口将占近30%;介绍了CPO系统组成架构及相关器件 [33][35][42] 1.4 行业头部通信设备厂已有成熟方案,CPO交换机产业化或在即 - 博通推出多款CPO交换机,不断提升交换容量、降低功耗;英伟达发布两款CPO交换机,降低了端口功耗 [52][58][63] 2 行业内重点公司分析 2.1 太辰光:产品成功导入康宁,MPO及光纤柔性板的领先供应商 - 太辰光产品应用广泛,客户包括康宁;营业收入和归母净利润整体增长,光器件产品占比提升;MPO产品领先,shuffle产品和光柔性板产品有优势,FAU产品开展相关工作 [67][70][74] 2.2 光库科技:子公司加华微捷业绩高增,前瞻布局薄膜铌酸锂 - 光库科技产品应用领域广,有多家子公司;营业收入和归母净利润整体增长,光纤激光器和光通讯器件占比近年下降;子公司加华微捷FAU产品布局全面,公司在薄膜铌酸锂材料有积累 [77][80][83] 2.3 天孚通信:英伟达CPO交换机技术合作伙伴,CPO板块多产品布局 - 天孚通信是光器件解决方案和封装制造服务商,产品应用广泛;营业收入和归母净利润高速增长,光有源和无源器件占主导;是英伟达CPO交换机合作伙伴,部分产品小批量生产,泰国产能布局推进 [87][91][95] 2.4 仕佳光子:领先光芯片供应商,间接投资MT插芯供应商福可喜玛 - 仕佳光子聚焦光通信,产品包括多种芯片和连接器;营业收入和归母净利润波动大,光芯片及器件产品占比提升;建立MPO生产基地,间接投资福可喜玛保障MT插芯供给 [98][102][105] 2.5 源杰科技:大功率激光器获千万级订单,推动业绩Q1同比高增 - 源杰科技专注高速半导体芯片,产品应用广泛;营业收入和归母净利润波动大,电信市场类收入占主导;数据中心产品有进展,研发CPO相关产品 [108][111][114] 2.6 光迅科技:前瞻布局CPO光源模块,受益国内云服务商的IDC建设 - 光迅科技是光电器件一站式服务提供商,产品应用广泛;营业收入和归母净利润稳健增长;前瞻布局CPO ELS光源模块 [116][117][120]
GPU集群怎么连?谈谈热门的超节点
半导体行业观察· 2025-05-19 09:27
以下文章来源于魔形智能 Magik Compute ,作者K君 魔形智能 Magik Compute . 为全球客户提供AGI Infra与AIaaS产品和服务 如果您希望可以时常见面,欢迎标星收藏哦~ 人工智能(AI)的浪潮正以前所未有的速度重塑各行各业,其背后离不开海量算力的支撑。当AI模型参数从 亿级跃升至万亿级,传统服务器已难以满足日益增长的算力需求与效率要求。为了打破这个瓶颈,一个全新的 概念应运而生——超节点 (Super Node)。 不止于"大":什么是超节点服务器? 简单来说, 超节点服务器就是大量高速计算芯片的高效统一结构 ,面对AI算力大潮的最优解。它并非计算硬 件的简单堆砌,而是将海量的计算单元(CPU/GPU/TPU等)以前所未有的密度和效率整合在一起,专门为应 对人工智能任务带来的庞大算力需求而生。 传统AI服务器虽然也集成了CPU、GPU等部件,但当AI模型参数动辄千亿、训练数据浩如烟海时,单个GPU 的显存和算力就如同杯水车薪。模型并行(将一个大模型拆分给多个GPU协同处理)成为必然选择。但问题来 了:参与模型并行的服务器之间需要进行海量、高速的数据交换,服务器间的以太网/ I ...
美股跌出了经济衰退的味道,华尔街投行建议增持中国股票
互联网金融· 2025-03-11 17:52
当地时间2025年3月10日,美国纽约,纳斯达克市场中心外的电视屏幕上播放着股市信息。图源:CFP "我要建设一个强大的国家,不能只关注股市。"特朗普说。在上周的国会讲话中,特朗普就给市 场打了"预防针",称为了中长期的结构性转型,可以忍受出现短期的经济不适。 上周五,财政部长斯科特·贝森特也释放出类似论调,他在接受美国消费者新闻与商业频道 (CNBC)采访时表示,随着新政府削减开支,美国经济可能经历一段"排毒期"。 实际上,美股的这波调整始于2月20日, 截至3月10日收盘,标普500指数相较于2月中旬的高点已 下跌8.7%,纳斯达克指数跌近13%。分行业看,美股可选消费、通讯服务、信息技术行业领跌。 "纳指近四周跌超12%,跌出了经济衰退的味道。"民生证券分析师陶川在研报中表示,美股下跌 的核心原因是衰退预期下的流动性紧缩恐慌:一方面,特朗普的"衰退"引导正好碰上了经济数据 的走弱;另一方面,流动性担忧背后,既有美联储缩表末期的不适,更有来自中国和欧洲的"分 流",以及日本央行进一步紧缩的"阴影"。 陶川表示,"预期引导"堪比特朗普的一场"经济豪赌"。特朗普的政策风格是"说得比做得狠",尤 其是今年2月以 ...
DeepSeek开源引领AI普惠化浪潮
Wind万得· 2025-03-03 06:40
DeepSeek开源策略影响 - DeepSeek成立于2023年,由幻方量化孵化,专注于大语言模型开发,已发布DeepSeek Coder、DeepSeek LLM、DeepSeek V3、DeepSeek R1等多款产品 [2] - DeepSeek V3训练成本仅557.6万美元,性能比肩GPT 4o和Claude-3.5-Sonnet,但成本远低于GPT 4o [2] - DeepSeek R1训练成本仅为同类模型的1/30,性能达到OpenAI o1水平,竞技场评分为1362分 [2][3] - 开源周期间发布FlashMLA、DeepEP、DeepGEMM等代码库,优化DualPipe、EPLB并行策略和3FS文件系统,提升算力效率 [5] - FlashMLA在H800 GPU上实现3000GB/s内存带宽和580TFLOPS计算性能,突破硬件极限 [6] 全球AI大模型进展 - DeepSeek R1发布后7天内用户增长1亿,周活跃用户环比增长超750%,远超Kimi的28%增速 [7] - 武汉市出台政策支持AI关键技术突破,单个项目最高资助2000万元 [7] - xAI发布Grok 3,计算能力提升10倍,支持图像分析和多模态处理,并免费开放 [8] - OpenAI发布GPT-4.5,输入/输出价格达75/150美元/百万token,为GPT-4o的30倍,在事实性问答表现优异但学术推理不及Claude 3.7 Sonnet和DeepSeek R1 [9] - GPT-4.5显示单纯扩大模型规模未必提升全面性能,OpenAI计划将GPT-5转向模型架构优化和功能融合 [10] AI大模型投融动态 - OpenAI拟融资400亿美元,头部企业仍主导资本流向 [14] - 低成本高性能模型改变估值逻辑,中小厂商可通过垂直领域创新获得机会 [14] - 投资重心转向AI应用层(金融、医疗、法律等)和Agent开发,2025年国内亿元级融资包括极睿科技(近1亿人民币B+轮)、源络科技(数亿人民币A轮)等 [15][16]
中金:从规模经济看DeepSeek对创新发展的启示
中金点睛· 2025-02-27 09:46
中金研究 DeepSeek的出现有几个没想到,不是大型科技企业和科研院所而是初创企业,不是实体科技公司而是一家金融领域的企业,不是来自处于领先地位的 美国而是在大模型领域相对落后的中国。这一切纯属偶然吗?只有大机构才能研发AI大模型的背后是所谓的规模定律,即要素(数据、算力)投入的 边际产出下降,模型性能提升需要不断增加要素投入,带来规模的门槛要求。DeepSeek的破解在于以算法优化(技术进步)提升算力(要素)的边际 产出,一定程度上替代了算力投入。技术进步从个体来讲似乎有偶然因素,但从宏观来讲是规模经济效应的力量,尤其是外部规模经济,即上下游协 同、共享基础设施和人才池的创新生态,中国在数字基础设施和人才规模优势方面尤其突出。规模经济效应意味着大模型未来的发展或仍将由大国主 导。就中美之间的互动而言,规模定律隐含后发者有优势,所以美国通过限制算力出口减缓中国的追赶。这是因为落后者要素投入的边际产出高于领 先者,市场机制激励要素投入从领先者流向落后者,有利于两者差距的缩小,这有点类似经济学新古典增长模型的逻辑,即规模报酬递减带来发展中 国家和发达国家之间的差距收敛。但这加剧了双方各自的比较优势,美国偏重利用 ...
对话香港大学马毅:“如果相信只靠 Scaling Laws 就能实现 AGI,你该改行了”
晚点LatePost· 2024-06-04 18:05
文丨程曼祺 编辑丨宋玮 黄俊杰 当大部分人都相信一件事或趋势时,不同意的人可以选择沉默,也可以大声说出来。前者是少数派中的多数派,后者少数派中的少数派。 马毅就是一个少数派中的少数派。 自 2000 年从伯克利大学博士毕业以来,马毅先后任职于伊利诺伊大学香槟分校(UIUC)、微软亚研院、上海科技大学、伯克利大学和香港大 学,现担任香港大学计算机系主任和数据科学研究院院长。 他最早将 "压缩感知" 技术应用于计算机视觉领域,在人脸识别、物体分类等任务上产生了巨大影响。 知名 AI 学者李飞飞是马毅在 UIUC 时参与招聘的第一个华人助理教授,ResNet 一作何恺明是马毅在微软亚研院负责视觉组时招的第一个新员 工。 少数派中的少数派。 马毅公开表达时直言不讳。AI 业界惊叹于 GPT 等大模型的威力,担心 AI 可能毁灭人类,如图灵奖得主杰弗里·辛顿(Geoffrey Hinton) 和 OpenAI 发起者之一伊隆·马斯克(Elon Musk)就多次将 AI 类比为原子弹,呼吁监管。 "说现在的 AI 危险的人,要么是无知,要么是别有目的。" 马毅在 twitter 上回应 AI 威胁论。 强烈的观点来自他对 ...