AGI
搜索文档
单张消费级显卡也能参与大模型训练!无问芯穹用「三个盒子」打通十万卡到一张卡AI效能跃升路径
量子位· 2025-07-29 13:05
核心观点 - 智能时代的资源拐点已至,需通过提高智能效率和扩充计算资源两条路径加速抵达AGI临界点 [26][32][33] - 无问芯穹推出"三个盒子"全规模AI效能跃升方案,覆盖从十万卡集群到单张卡的智能基础设施需求 [4][6][7] - AI应用落地价值空间=场景尺度×计算资源×智能效率,效能跃升成为关键突破方向 [34][35] 产品架构 大盒子:无穹AI云 - 面向万卡至十万卡级智算网络,整合全国26省市53个核心数据中心的算力资源,总算力超25000P [10] - 采用"一网三异"调度架构,支持15种主流芯片架构异构算力池,覆盖"东数西算"关键节点 [10] - 实现算力资源高效流转,激活非理想状态算力转化为高稳定性、高吞吐量服务 [12] - 采用"平台+自营"模式,支持企业自建运营平台并接入底层算力网络 [12] 中盒子:无界智算平台 - 面向百卡至千卡级集群,服务高校、科研机构及中小AIDC中心 [15] - 已支持100+大型研发场景,包括3000卡沐曦GPU集群600小时百亿模型训练、2000张昇腾卡千亿模型商用推理 [17] - 推出全球首个跨地域全分布式联合强化学习服务,支持单张消费级GPU参与大模型联合训练 [18][19] 小盒子:无垠终端智能 - 打造"端模型+端引擎+端硬件"一体化解决方案,推出全球首款端侧本征模型Infini-Megrez2.0 [20][21] - 实现云级21B参数智能水平,内存占用控制在7B规模,计算量控制在3B规模 [21] - 支持终端设备休眠状态下持续运行大模型,单设备年增1000+小时有效工作时间 [24][25] 技术突破 - 两年内实现AI性能跨越:从数千卡集群训练的GPT3.5到单手机部署同等性能AI [2] - 通过软硬协同设计突破终端算力限制,使手机承载相当于GPT3.5的AI能力 [2][21] - 效能跃升路径强调"有限资源最优解"而非无限扩张,推动AGI临界点前移 [32][35]
钉钉CTO朱鸿:AI已从上半场切换到下半场,行业AGI会很快到来
新浪科技· 2025-07-29 11:51
行业趋势与展望 - AI已从上半场切换至下半场 企业数据将发挥AI生产力价值的关键时刻 [1] - 垂直领域AGI将很快到来 2025年是行业大模型和企业专属模型落地元年 [1] - 企业专属模型将迎来爆发式增长 自训练模型成为企业拥抱AI的关键路径 [1] 企业AI应用场景 - 语音转文字和IM消息速读摘要总结能力简化人机协作 [2] - 消息翻译 AI表格 智能财务数据洞察通过技术平权降低使用门槛 [2] - 员工关怀 合同审查摘要 会议记录 文档纠错及视频会议AI字幕减少重复性工作 [2] 平台能力与客户成果 - 钉钉作为企业数字化基础平台持续打磨AI能力 推动数据价值与产业智能提升 [2] - 发布《AI实干家》案例手册 涵盖12家知名企业AI实践 覆盖制造零售医疗物流农业金融酒旅互联网等领域 [2] - 永升物业使用钉钉AI使人效提升五倍 年省300万成本 菜鸟80%答疑交由AI实现24小时全球员工服务 [2] 战略方向 - 钉钉将持续深化平台能力 降低AI应用门槛 [3] - 将AI技术转化为企业新质生产力 定义高效智能工作方式 [3] - 在AI落地元年及未来与伙伴共同探索无限可能 [3]
无问芯穹夏立雪:让有计算的地方,就有“无穹”的智能涌现
IPO早知道· 2025-07-29 11:10
无问芯穹全规模AI效能跃升方案发布 - 公司发布全规模AI效能跃升方案,旨在以有限资源实现"无限"需求,包含三大核心产品:针对万卡至十万卡全局算力网络的"无穹AI云"、针对百卡至千卡级大型智算集群的"无界智算平台"、针对单卡至十卡级有限算力终端的"无垠终端智能"解决方案 [2] - 该方案是一套面向未来智能基础设施的软硬协同系统,为跨地域智算网络、智算集群与多形态智能终端等全规模场景提供统一适配多种异构算力,覆盖从模型调度、性能优化到应用部署的全链路支持 [2] - 公司希望通过"打包式"产品服务能力,在单卡至十万卡算力的全规模软硬件场景中,让每份算力释放最大智慧潜能 [3] AI发展面临的资源挑战与解决方案 - 从传统算法到AI2.0阶段,计算资源持续驱动智能边界拓展,但资源有限性成为阻碍AGI发展的终极边界 [4] - 公司提出两条加速抵达AGI临界点的路径:提高智能效率(用更少计算资源获取更强智能)和扩充计算资源(挖掘唤醒更多可用计算资源),两条路径交汇处即为新AGI临界点 [5] - 资源稀缺性约束驱动智能效率持续进化,应用需求牵引顶尖模型从大规模计算下放到中等算力、小算力场景,例如两年前需几千卡集群训练的GPT3.5现在可在一部手机实现同等性能 [5] AI应用落地价值模型 - 公司提出AI应用落地价值空间公式:人工智能应用落地价值空间=场景尺度×计算资源×智能效率 [5] - 公司致力于通过场景尺度、计算资源与智能效率的共振,实现"智无边际、算无虚发"的终极愿景,让有计算的地方就有"无穹"的智能涌现 [5]
智谱新一代旗舰模型再达开源SOTA:持续探索AGI上限,直接叫板OpenAI
IPO早知道· 2025-07-29 11:10
GLM-4.5模型发布 - GLM-4.5是一款面向推理、代码与智能体的开源SOTA模型,首次在单个模型中实现推理、编码和智能体能力的原生融合 [2] - 模型采用混合专家架构,包含两个版本:GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿 [3] - 提供两种工作模式:用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式 [3] 技术性能表现 - 在12个评测基准综合平均分排名全球第三、国产第一、开源第一 [4] - 参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,但多项测试表现更优,显示更高参数效率 [6] - 在SWE-bench Verified榜单上位于性能/参数比帕累托前沿,相同规模下实现最佳性能 [6] 商业化应用 - API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens,远低于主流模型定价 [8] - 在52个编程开发任务测试中,相比其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面突出 [8][10] - 能胜任全栈开发任务,包括编写复杂应用、游戏、交互网页等 [10] 多模态模型突破 - 7月初开源发布GLM-4.1V-Thinking视觉语言模型,刷新10B级别多模态模型性能上限 [11] - 轻量版GLM-4.1V-9B-Thinking在28项评测中23项达10B级最佳,18项持平或超越72B的Qwen-2.5-VL [11] - 该模型成功登顶HuggingFace Trending第一 [13] 国际化布局 - 海外业务已覆盖东南亚、中东和非洲多个国家,为当地政企提供基础设施解决方案 [13] - 被OpenAI列为全球竞争对手,目标是在新兴市场率先落地中国企业AI体系 [13][14]
机器人ETF(159770)实时净申购达1400万份,昨日获资金净流入超6100万元,2025世界人形机器人运动会各赛项进入测试阶段
21世纪经济报道· 2025-07-29 10:18
机器人ETF市场表现 - 机器人ETF(159770)7月29日下跌0.54% 成交额突破4000万元[1] - 该ETF当日获实时净申购1400万份 前日净流入资金超6100万元[1] - 截至7月28日基金份额与规模在深市同标产品中位居第一[1] 成分股及产品结构 - 重仓股包含汇川技术、科大讯飞、石头科技等制造业与信息技术服务业龙头[1] - 行业配置覆盖制造业与信息传输、软件和信息技术服务业[1] - 配备两只场外联接基金(A类014880 C类014881)[1] 人形机器人产业催化事件 - 全球首个人形机器人盛会"2025世界人形机器人运动会"将于8月14-17日在北京国家速滑馆举行[1] - 2025世界人工智能大会接待156个国际采购团 发布300余项采购需求[2] - 大会达成意向采购金额超160亿元 线下参观人次达35万[2] 行业发展趋势 - WAIC2025展示人形机器人从核心技术到具身智能产品的完整产业链[2] - 证券机构认为人形机器人是AGI理想载体 新技术新产品持续涌现[2] - 明星企业产品密集发布叠加重磅会议召开形成板块催化效应[2]
这届WAIC,无问芯穹发布了三个「盒子」
机器之心· 2025-07-28 18:45
核心观点 - 算力是智能时代的核心基础设施,其规模与效率决定数字未来的发展边界 [1] - 公司提出两条加速AGI临界点的路径:提高智能效率与扩充计算资源,通过场景尺度×计算资源×智能效率的共振实现有限资源满足无限需求 [5][8] - 推出全规模AI效能跃升方案三大产品:无穹AI云(万卡级)、无界智算平台(百卡级)、无垠终端智能(单卡级),覆盖从超算到终端的全场景算力优化 [10] 产品技术架构 无穹AI云(大盒子) - 构建覆盖26省市53个数据中心的广域算力网,整合15种芯片架构异构算力池,总算力超25000P,支持跨地域实时算力切换 [14] - 采用"一网三异"调度架构,实现非理想状态算力资源转化为高稳定性AI服务能力,日均Token调用量突破100亿次 [16] - 与华为昇腾合作上线全国首个"算力生态超市",启动百亿生态共建计划,推动国产硬件与平台协同 [18] 无界智算平台(中盒子) - 在3000卡国产GPU集群上实现百亿参数大模型600小时不间断训练,创国产算力记录 [20] - 利用2000张华为昇腾910B卡完成千亿参数模型分布式推理,为云南移动构建商业化服务能力 [23] - 推出全球首个跨地域全分布式联合强化学习服务,最小支持单张消费级显卡接入 [25] 无垠终端智能(小盒子) - 发布全球首款端侧本征模型Infini-Megrez2.0,在7B内存占用下实现21B参数云级智能,突破终端"能效-空间-智能"不可能三角 [31] - 新一代推理引擎Infini-Mizar2.0将AIPC本地模型上限从7B提升至30B,联合Megrez2.0实现推理性能提升超100% [35] - 与新华三推出大模型一体机,单机驱动百亿参数模型,能效翻倍且成本大幅降低 [36] 行业生态布局 - 联合上海创智学院等十余家机构启动人工智能终端软硬适配优化中试平台,解决共性技术难题并建立评价体系 [40][41] - 与三大运营商及20余家AIDC伙伴启动联合运营创新生态计划,整合闲置算力资源 [27] - 合作生态覆盖联想、新华三、异格技术等终端厂商,推动端侧Agentic AI自主进化 [38]
国泰海通|机械:WAIC 2025在沪召开,人形机器人全产业链集中亮剑
国泰海通证券研究· 2025-07-28 18:04
2025世界人工智能大会(WAIC)人形机器人产业观察 核心观点 - 人形机器人成为WAIC2025核心焦点领域之一,产业链从核心技术、关键零部件到整机产品全面展示,产业催化不断且投资机遇显著[1] - 人形机器人是AGI落地的理想载体,具备"硬件载体+场景交互"双重属性,产业协同效应加速落地进程[4] 产品创新 - 本体企业集中展示最新成果:智元机器人展出远征A2/灵犀X2/精灵G1等全系列产品,并联合德马科技完成全球首个端到端具身机器人物流作业直播[2] - 魔法原子MagicBotZ1首秀:配备自研高性能关节模组,24基础自由度(可扩展至50),关节最大扭矩超130N·m,具备高爆发运动能力[2] - 宇树科技打造拳击机器人互动场景,乐聚等企业同步展示场景落地进展[2] 核心零部件 - 产业链覆盖减速器、丝杠、电机、传感器及关节模组等关键组件:禾川科技展出关节执行器与灵巧手,雷赛智能展示灵巧手解决方案,上海机电首次发布一体化关节模组[3] - 制造工艺进步与规模化效应推动成本下降,为量产提供硬件支撑[3] 产业生态 - 特斯拉示范产业协同模式:Optimus共享自动驾驶AI资源(视觉神经网络/Dojo超算/Cortex训练集群),形成"算法-硬件-场景"闭环[4] - 国内生态优势显著:腾讯/京东/商汤/华为展示算力与大模型突破,结合硬件制造与软件算法全产业链,加速商业化落地[4]
AI吸纳全球53%的风险投资!启明创投发布AI十大展望
第一财经· 2025-07-28 13:07
AI行业投资趋势 - 2025年上半年AI初创企业吸纳了全球53%的风险投资资金,占全球风险投资总额的一半以上 [1] - AGI产业处于快速发展阶段,技术性能提升和成本下降推动大规模应用落地 [1] - 投资人持续加码AI基础模型公司,表明大模型领域仍保持高速增长 [1] 技术发展展望 - 未来1-2年200万Token上下文窗口将成为顶级AI模型的标配,上下文工程成为核心驱动力 [3] - 通用视频模型有望在1-2年内出现,推动视频内容生成与交互革新 [3] - AI芯片领域将出现更多国产GPU批量交付,新一代AI云端芯片采用3D DRAM堆叠等技术 [4] - AI推理成本过去两年降低100倍以上,未来Token消耗量将提高1-2个数量级 [4] AI Agent发展 - AI Agent将从"工具辅助"升级为"任务承接",首批"AI员工"将参与企业核心流程 [4] - 多模态Agent将融合视觉、语音等输入,在医疗、金融等行业实现突破 [4] AI应用变革 - AI交互范式将加速转变,自然交互方式推动AI原生超级应用诞生 [5] - 垂直场景AI应用潜力巨大,初创公司采取"垂直深耕"策略与大厂差异化竞争 [6] - AI BPO模式将在金融、客服等行业实现商业化突破,采用"按结果付费"方式 [6] 具身智能发展 - 具身智能机器人将率先在拣选、搬运、组装场景实现规模化部署 [8] - 规模化部署需要上千台机器人落地,形成"模型-本体-场景数据"闭环 [8]
大模型六小龙底牌对决
第一财经· 2025-07-28 11:33
行业格局与竞争态势 - AI领域将存在多个玩家长期共存 不同公司价值观塑造模型差异化特点 开源模型影响力提升且逼近闭源模型性能 [1] - 2024年成为基座模型分水岭 市场玩家数量收缩至个位数 头部大厂与少数创业公司留存 幸存需具备AGI使命感/高人才密度/强融资能力 [2] - 国内大模型技术差异度不足 产品切换成本低导致竞争惨烈 兼容OpenAI API标准加剧同质化 [7] 企业动态与战略分化 - 智谱即将发布GLM-4.5多模态模型 同步推出C端陪伴型AI产品 软硬件均规划付费业务 推进A股+港股双上市 [4][8] - 月之暗面发布K2基座模型后 将推出同规模推理模型 技术重点转向智能体任务调度 港股上市面临仲裁风险 [5][8] - 阶跃星辰展示端到端语音大模型车载应用 成立"模芯生态创新联盟"联合国产芯片厂商 预估年营收10亿人民币 [5][8][15] - MiniMax侧重To C应用而非纯基础模型 同步筹备A+H股上市 百川智能转型医疗 零一万物聚焦B端产业落地 [8][11] 技术演进与AGI路径 - 大模型进入1.0模仿学习→2.0强化学习阶段 技术迭代导致部分公司掉队 [9] - AGI发展存在两大路径争议:单一超级智能系统 vs 多模型多代理架构 MainFunc指出专业模型+Agent组合是关键 [13] - 多模态成为AGI必由之路 智谱采用MoE结构 阶跃星辰发布Step-3多模态模型 强调基础研发与商业化分层融合 [15] 商业化与生态建设 - 创业公司差异化路径包括To C出海/To B服务/产业资源对接/多模态发展 头部企业启动上市筹备 [8] - 行业尚未建立稳固竞争壁垒 技术窗口期需转化为数据闭环护城河 阶跃星辰强调应用落地形成数据飞轮 [16] - 投资热点从基础模型转向具身智能 宇树机器人等硬件厂商关注度超越大模型展台 [5]