无穹AI云

搜索文档
无问芯穹解决方案负责人刘川林:新AI时代下,中国算力产业的落地思考| 36氪2025AI Partner百业大会
36氪· 2025-08-29 19:13
公司发展概况 - 公司成立于2023年5月 依托多元异构和软硬协同技术优势快速成长 联合近百家合作伙伴覆盖大模型 AI芯片和行业客户 持续构建开放共赢的产业生态 [3] AI行业洞察 - 算力是智能时代的核心基础设施 其规模与效率定义数字未来的疆界 行业从1.0 2.0时代逐步迈向AGI阶段 [3] - AGI发展面临核心矛盾:有限算力资源难以满足无限需求 数据与算力瓶颈可能阻碍AGI进程 [4] - 提出"双向奔赴"解决方案:通过高效集约的资源利用加速AGI实现 同时扩大产业算力规模激活有限资源价值 [4][5] 产品体系与落地成果 - 推出"大中小盒子"产品体系:大盒子"无穹AI云"针对万卡至10万卡级算力需求 整合26省份53个数据中心资源 兼容15种主流芯片 累计赋能算力超25000P [6] - 中盒子"无界智算平台"聚焦国产算力激活 支撑大规模训练与推理 已应用于近100个大型研发场景 例如支撑3000卡国产GPU集群运行百亿参数模型训练达600小时 [9][10] - 小盒子为终端算力解决方案 通过软硬件协同优化突破终端算力效率极限 已与联想 新华三等企业合作 [10] - 无穹AI云生态采用"平台+自营"联合运营模式 在北京 上海 杭州落地 支撑日均Token调用量突破100亿 服务10余个智慧场景和100多个AI应用 单应用月活超数千万 [7] 应用场景案例 - AIGC场景覆盖文本 图片 视频生成全流程 提供普惠算力与稳定工作流托管服务 [8] - AI+招聘场景提供一站式微调与自部署服务 通过端到端加速优化响应速度(行业数据显示延迟增加10%会导致用户流失率超50%) [8]
中国算力,如何像水和电一样自然流动?
36氪· 2025-08-27 19:28
行业现状与问题 - 截至2024年9月中国算力规模达246 EFLOPS智能算力同比增长超65%各行业算力应用项目超1.3万个[1] - 智算中心平均机柜利用率仅20%~30%部分企业级中心低至10%[1] - 全国已上线智算中心算力整体利用率仅32%存在供需失衡和资源错配问题[2] - 优质算力供给不足大部分智算中心规模在1000P左右由分散社会资本建设难以匹配需求方[2] - 使用门槛过高创业公司面临找不到或用不起算力问题且缺乏使用裸金属算力的能力[3] - 国产芯片生态割裂多模型多芯片架构导致异构算力无法高效流动部分国产卡难以应用[3] 公司背景与定位 - 无问芯穹于2023年5月由清华大学电子工程系教授汪玉及博士生团队联合创立具备清华科研背景[4] - 公司成立不到两年完成近10亿元融资投资方包括红杉中国百度智谱AI等知名机构[4] - 公司定位为大模型时代"算力运营商"目标解决国产芯片生态割裂和算力使用门槛高问题[5] - 通过"M×N"技术将异构异域异属算力汇聚成云端算力网络实现智能感知和随需获取[5] - 技术路径包括统一中间层屏蔽硬件差异及优化国产芯片在大模型训练推理场景的性能[5] 产品与技术方案 - 公司推出三大核心产品覆盖万卡至十万卡无穹AI云百卡至千卡无界智算平台及单卡至十卡无垠终端智能[6] - 无穹AI云覆盖26省市53个数据中心整合超15种芯片架构异构算力池总算力规模超25000P[7] - 无界智算平台基于3000卡沐曦国产GPU集群支撑百亿参数模型训练600小时不间断利用2000张华为昇腾910B卡实现千亿参数模型推理[8] - 无垠终端智能推出端侧本征模型Infini-Megrez2.0实现21B参数智能水平内存占用控制在7B规模计算量控制在3B规模[9] - 公司通过底层算子通信调度容错技术创新提升算力利用率部分混合芯片算力利用率最高达97.6%[10] 生态合作与验证 - 公司与高校通过产学研协同机制缩短科研成果产业化周期如在研电赛中吸引25支高校团队参与[6] - 无穹AI云覆盖"东数西算"国家战略关键节点通过广域高性能专线实现算力资源实时切换与迁移[7] - 公司服务上海模速空间实现日均Token调用量突破100亿[10]
对话无问芯穹CEO夏立雪:模型和芯片是两条驱动路径,不可能分开发展|独家
钛媒体APP· 2025-07-30 12:42
公司产品发布 - 公司在2025世界人工智能大会期间发布全规模AI效能跃升方案 包括三大核心产品:无穹AI云(针对万卡至十万卡全局算力网络)、无界智算平台(针对百卡至千卡级大型智算集群)和无垠终端智能(针对单卡至十卡级有限算力终端)[2] - 该方案是一套面向未来智能基础设施的软硬协同系统 覆盖跨地域智算网络、智算集群与多形态智能终端等全规模场景 统一适配多种异构算力 提供从模型调度、性能优化到应用部署的全链路支持[2] - 无穹AI云大模型服务平台上线智谱最新开源模型GLM-4.5(3550亿参数)和GLM-4.5-air(1060亿参数)[2] 技术解决方案 - 公司打造产业链上的"世界通用语言" 实现不同芯片之间的无缝通信与协同 使算力资源即插即用且可自由挑选[3] - 通过算法和编译优化 国产芯片性能提升50%-200% 并实现多源异构国产AI芯片的统一调度和混合精度计算 综合性价比全面超越国际主流芯片[5] - 无界智算平台高效利用2000张华为昇腾910B智算加速卡 实现千亿参数模型的分布式部署与大规模推理[6] 商业合作与生态建设 - 公司提供全球首个跨地域全分布式联合强化学习服务 最小支持单张消费级显卡接入 与三大运营商及20余家AIDC机构联合启动"AIDC联合运营创新生态计划"[6] - 与上海创智院共同打造全球首款端侧本征模型无穹天权Infini-Megrez2.0 与联想合作开发智能终端推理加速引擎无穹开阳Infini-Mizar2.0(将AI PC本地模型尺寸上限从70亿提升到300亿参数) 与新华三合作大模型一体机 与苏州异格技术合作推出FPGA大模型推理一体机[7] - 服务的上海模速空间日均Tokens调用量突破100亿 累计服务10余个智慧场景 支撑100多个前沿AI创新应用 单应用月活高达数千万[6] 融资与发展历程 - 公司2024年完成近5亿元A轮融资 创下国内AI基础设施最大单笔融资记录 成立两年累计融资超过10亿元[5] - 成立于2023年5月 专注于为AI 2.0时代提供完整解决方案 致力于成为大模型落地过程中的"M×N"中间层[4] 行业观点与趋势 - 模型和算力芯片是两条驱动路径 需要融合及协同发展 国内算力产业需要多方配合解决资源限制问题[3] - AI应用落地价值空间=场景尺度×计算资源×智能效率 智能效率持续进化推动顶尖模型从大规模计算下放到中等算力和小算力场景[5] - 国产芯片在推理侧具备商业价值 公司帮助用户从国际芯片逐步迁移到国产卡 目前在一些国产卡上运行效率较好[8] - 需要打通算力、数据、模型、应用的全栈能力 教育科研领域应共同思考"最后一公里"问题[8]
腾讯研究院AI速递 20250730
腾讯研究院· 2025-07-30 00:01
Claude新增周流量限制条款 - Anthropic宣布8月底对Claude Pro和Max用户推出每周使用限制,影响将少于5%的订阅用户 [1] - 部分用户24小时不间断运行Claude Code,极端案例中一位用户200美元套餐实际消耗数万美元 [1] - 用户普遍反映缺乏使用量透明度,无法查看已消耗token和剩余配额,许多人开始寻找替代产品 [1] 微软AI Edge浏览器 - Edge浏览器推出"Copilot模式",核心功能是跨标签页情境感知,可同时读取分析所有打开的页面 [2] - 全新界面使用简洁统一输入框,自动理解用户意图,支持语音控制和主题式旅程功能 [2] - 该功能现已在所有Copilot市场限时免费开放,未来可能与Copilot订阅服务捆绑销售,浏览器或不再是免费软件 [2] 无问芯穹发布全规模AI效能跃升方案 - 无问芯穹发布三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [3] - 目前已覆盖26个省市53个核心数据中心,整合超15种主流芯片架构,总算力规模超25000P [3] - 端侧创新包括全球首款端侧本征模型"无穹天权",实现云级21B参数智能水平的同时内存占用控制在7B规模 [3] 阶跃AI推出研究小助手 - 阶跃深研能在十分钟内自主完成复杂研究任务,生成深度专业报告,在xbench-DeepSearch评测中取得70%超高通过率 [4] - 基于强化学习和多智能体架构研发,具备自主思考、推理、动态工具调用能力 [5] - 提供高级搜索功能,包括聚焦搜索、自选信源和知识库,支持导出多种格式 [5] 京东升级大模型品牌为JoyAI - 京东推出JoyAgent智能体平台、JoyInside附身智能和数字人等多场景解决方案 [6] - JoyAgent是首个100%开源的企业级智能体,收获超2000颗GitHub星标 [6] - JoyAI针对不同场景的产品均已实现落地应用,数字人服务超2万品牌,交互型AI潮玩Fuzozo芙崽首发预售售罄 [6] 多模态、多智能体AI记忆系统MIRIX - 加州大学圣迭戈分校和纽约大学研究者推出并开源MIRIX,全球首个多模态、多智能体AI记忆系统 [7] - 系统将记忆分为六个模块:核心、情景、语义、程序、资源和知识金库 [7] - MIRIX在ScreenshotVQA测试中准确率比传统RAG高35%,存储减少99.9%,在LOCOMO长对话任务中达85.4%创新纪录 [7] 空间天气链式AI预报模型 - 国家卫星气象中心与南昌大学、华为联合发布"风宇"模型,全球首个全链式空间天气人工智能预报模型 [8] - 模型首创链式训练结构,包括太阳风"煦风"、地球磁场"天磁"和地球电离层"电穹"三大区域模型 [8] - "风宇"对全球电子密度总含量预测误差控制在10%左右,已申请11项国家发明专利 [8] 上海AI lab开源科学多模态大模型 - 上海人工智能实验室发布并开源"书生"科学多模态大模型Intern-S1,多模态能力全球开源第一 [9] - 模型首创"跨模态科学解析引擎",可精准解读化学分子式、蛋白质结构、地震波信号等复杂科学数据 [9] - 研发团队提出通专融合的科学数据合成方法,创造性地降低了强化学习训练成本 [9] a16z合伙人观点 - AI大模型竞争格局将如云计算大战一样走向寡头垄断,将形成品牌效应新格局 [10] - 应用层已无技术护城河,理性商业决策是"牺牲利润换取分销",价值将在模型基础设施和垂直领域深耕中形成 [10] - AI并非将普通开发者变成超级工程师,而是"让10倍工程师变成2倍",使编程回归本质创造 [10] 腾讯具身智能开放平台 - 腾讯发布具身智能开放平台Tairos"钛螺丝",旨在为机器人本体开发商与应用开发商补齐软件能力 [11] - 平台基于SLAP³技术体系,提供规划大模型、多模态感知大模型和感知-行动联合大模型三大核心能力 [11] - 具身智能未来发展五大趋势(IDEAS):虚实集成世界、技术门槛降低、智能演进、智能体化和感知多模态化 [11]
直击WAIC 2025|无问芯穹CEO夏立雪:算力紧缺根源在“供需错配”,要让国产算力即插即用、像超市商品般可自由挑选
每日经济新闻· 2025-07-29 19:01
行业趋势 - 人工智能算力需求激增,算力资源多元化与国产化成为行业焦点 [1] - 国产算力在整体部署中已接近"半壁江山",尤其在推理和部分训练场景中表现突出 [7] - AI算力正从"技术红利期"向"价值闭环期"过渡,性价比成为关键突破口 [10] 公司技术 - 无问芯穹打造"世界通用语言",实现不同芯片之间的无缝通信与协同,让算力资源即插即用 [1] - 公司专注于在资源受限的终端设备上实现高效AI计算,拥有近20年的软硬件协同优化经验 [7] - 推出中试平台,连接芯片厂商、整机制造商与算法开发者,推动全链条协同创新 [10] 商业模式 - 不同于传统"大集群打包售卖"模式,无问芯穹采用"普惠"基因的商业模式,为中小企业提供弹性灵活的算力服务 [7] - 服务计费方式多样,可按卡、按小时计费,也可按调用量或服务稳定性付费 [8] - 构建"大盒子、中盒子、小盒子"产品矩阵,通过不同形态提升算力的生产价值 [9] 融资与市场地位 - 无问芯穹被视为业内最有可能突破国内算力瓶颈的AI算力运营商之一 [6] - 公司在成立后的16个月时间里累计融资额已接近10亿元 [6] 应用场景 - 端侧AI推理迎来爆发式增长,中国庞大的用户基数与强大的制造能力为端侧AI提供广阔市场 [9] - 笔记本电脑、手机、汽车、机器人等作为人机交互的核心接口,将优先实现AI能力落地 [11] - 国产算力在推理场景中已形成商业化闭环,未来在端侧设备、垂直行业等领域将占据更重要的地位 [10] 生态构建 - 致力于打造从模型、系统到硬件的闭环,推动国内形成"硬件迭代—模型优化—场景落地"的正向循环 [10][11] - 借鉴美国"芯片—模型—应用"的协同经验,构建生态飞轮 [11]
单张消费级显卡也能参与大模型训练!无问芯穹用「三个盒子」打通十万卡到一张卡AI效能跃升路径
量子位· 2025-07-29 13:05
核心观点 - 智能时代的资源拐点已至,需通过提高智能效率和扩充计算资源两条路径加速抵达AGI临界点 [26][32][33] - 无问芯穹推出"三个盒子"全规模AI效能跃升方案,覆盖从十万卡集群到单张卡的智能基础设施需求 [4][6][7] - AI应用落地价值空间=场景尺度×计算资源×智能效率,效能跃升成为关键突破方向 [34][35] 产品架构 大盒子:无穹AI云 - 面向万卡至十万卡级智算网络,整合全国26省市53个核心数据中心的算力资源,总算力超25000P [10] - 采用"一网三异"调度架构,支持15种主流芯片架构异构算力池,覆盖"东数西算"关键节点 [10] - 实现算力资源高效流转,激活非理想状态算力转化为高稳定性、高吞吐量服务 [12] - 采用"平台+自营"模式,支持企业自建运营平台并接入底层算力网络 [12] 中盒子:无界智算平台 - 面向百卡至千卡级集群,服务高校、科研机构及中小AIDC中心 [15] - 已支持100+大型研发场景,包括3000卡沐曦GPU集群600小时百亿模型训练、2000张昇腾卡千亿模型商用推理 [17] - 推出全球首个跨地域全分布式联合强化学习服务,支持单张消费级GPU参与大模型联合训练 [18][19] 小盒子:无垠终端智能 - 打造"端模型+端引擎+端硬件"一体化解决方案,推出全球首款端侧本征模型Infini-Megrez2.0 [20][21] - 实现云级21B参数智能水平,内存占用控制在7B规模,计算量控制在3B规模 [21] - 支持终端设备休眠状态下持续运行大模型,单设备年增1000+小时有效工作时间 [24][25] 技术突破 - 两年内实现AI性能跨越:从数千卡集群训练的GPT3.5到单手机部署同等性能AI [2] - 通过软硬协同设计突破终端算力限制,使手机承载相当于GPT3.5的AI能力 [2][21] - 效能跃升路径强调"有限资源最优解"而非无限扩张,推动AGI临界点前移 [32][35]
无问芯穹夏立雪:让有计算的地方,就有“无穹”的智能涌现
IPO早知道· 2025-07-29 11:10
无问芯穹全规模AI效能跃升方案发布 - 公司发布全规模AI效能跃升方案,旨在以有限资源实现"无限"需求,包含三大核心产品:针对万卡至十万卡全局算力网络的"无穹AI云"、针对百卡至千卡级大型智算集群的"无界智算平台"、针对单卡至十卡级有限算力终端的"无垠终端智能"解决方案 [2] - 该方案是一套面向未来智能基础设施的软硬协同系统,为跨地域智算网络、智算集群与多形态智能终端等全规模场景提供统一适配多种异构算力,覆盖从模型调度、性能优化到应用部署的全链路支持 [2] - 公司希望通过"打包式"产品服务能力,在单卡至十万卡算力的全规模软硬件场景中,让每份算力释放最大智慧潜能 [3] AI发展面临的资源挑战与解决方案 - 从传统算法到AI2.0阶段,计算资源持续驱动智能边界拓展,但资源有限性成为阻碍AGI发展的终极边界 [4] - 公司提出两条加速抵达AGI临界点的路径:提高智能效率(用更少计算资源获取更强智能)和扩充计算资源(挖掘唤醒更多可用计算资源),两条路径交汇处即为新AGI临界点 [5] - 资源稀缺性约束驱动智能效率持续进化,应用需求牵引顶尖模型从大规模计算下放到中等算力、小算力场景,例如两年前需几千卡集群训练的GPT3.5现在可在一部手机实现同等性能 [5] AI应用落地价值模型 - 公司提出AI应用落地价值空间公式:人工智能应用落地价值空间=场景尺度×计算资源×智能效率 [5] - 公司致力于通过场景尺度、计算资源与智能效率的共振,实现"智无边际、算无虚发"的终极愿景,让有计算的地方就有"无穹"的智能涌现 [5]
各国合作培养“不会从人类手中夺权的好AI”
中国青年报· 2025-07-29 06:48
人工智能大会盛况 - 2025世界人工智能大会展览面积首次突破7万平方米,吸引800余家企业参展,3000余项前沿展品亮相,规模创历届之最 [2] - 展品涵盖40余款大模型、50余款AI终端产品、60余款智能机器人以及100余款"全球首发""中国首秀"新品 [2] - 大会全面展现人工智能领域最新进展与未来走向,各项最新AI应用与产品令人目不暇接 [2] 百度数字人技术突破 - 百度发布新一代数字人技术NOVA,宣告超级头部主播能力复刻进入规模化量产时代 [5] - NOVA技术曾支撑罗永浩数字人直播间创下5500万GMV,预计10月向全行业开放 [5] - 新一代NOVA技术实现"双数字人主播"突破,在文心大模型4.5T加持下可做到"懂创作"、"有个性"、"玩梗"等高阶交互 [5] 教育科技产品创新 - 网易有道推出"有道AI答疑笔SpaceOne",深度融合DeepSeek-R1推理模型与自研教育大模型"子曰",提供学科难题深度讲解 [6] - 升级后的"有道子曰翻译大模型"支持109种语言互译,覆盖10余种翻译场景和多种形式翻译 [6] - 合合信息展示AI扫描技术,可将巨幅文物高清扫描并一键"装进"手机,解决文物拍摄难题 [7] 工业AI解决方案 - 黑湖科技展示基于AI Agent的柔性制造解决方案"黑湖小工单",帮助中小工厂提升订单响应速度和履约效率 [11] - 该系统已服务全国超3.2万家工厂,将新品上市周期从3个月压缩至3周,最小起订量从1万件降至100件 [11] - 通过构建多类型AI Agent替代人工决策流程,显著降低管理成本 [11] 具身智能与算力平台 - 商汤科技发布具身智能平台"悟能",为机器人、智能设备提供感知、视觉导航及多模态交互能力 [12] - 无问芯穹发布"无穹AI云""无界智算平台"与"无垠终端智能"解决方案,面向全规模AI应用场景 [12] - 无问芯穹CEO表示AI算力建设需要适应小而广泛的AI应用企业,满足敏捷生产需求 [12] 全球AI发展与合作 - 中国近年涌现众多世界级AI模型,且领先模型多采用开放权重模式,与美国形成显著区别 [17] - 专家认为中美应合作维护世界稳定,确保人类掌控AI [17] - 图灵奖得主姚期智指出需全球携手确保AI技术红利惠及所有国家与群体 [17]
AIPC学会“自己干活”:“小盒子”解锁终端智能新体验
广州日报· 2025-07-29 00:37
AIPC技术突破 - 无问芯穹推出"无垠终端智能"解决方案,通过软硬协同技术解决AIPC依赖云端算力和本地硬件资源有限的痛点 [2] - 全球首款端侧本征模型"无穹天权Infini-Megrez2 0"实现云级21B参数智能水平,内存占用控制在7B规模,实际计算量控制在3B规模 [5] - "无穹开阳Infini-Mizar 2 0"推理引擎将AIPC本地模型尺寸上限从7B提升到30B,智能水平提升18%,推理性能提升超100% [8] 产品创新 - 公司推出三款核心产品:"小盒子"无垠终端智能解决方案、"大盒子"无穹AI云、"中盒子"无界智算平台 [4] - Infini-Megrez2 0模型实现"无感知运行",单台设备年均可释放1000多小时生产力,激活终端设备的休眠时段 [5][7] - 与联想合作推出智能终端推理加速引擎Infini-Mizar 2 0,与新华三联合推出大模型一体机,与苏州异格技术合作FPGA大模型推理一体机 [9] 行业影响 - AIPC从"工具"升级为"智能助手",实现"手停脑停,AI不停"的智能化场景 [7] - 技术突破推动端侧Agentic AI自主进化,解锁更多终端智能应用想象空间 [8] - 公司目标是与上下游伙伴共同打造下一代现象级新终端,让AGI惠及更广泛场景 [11]
这届WAIC,无问芯穹发布了三个「盒子」
机器之心· 2025-07-28 18:45
核心观点 - 算力是智能时代的核心基础设施,其规模与效率决定数字未来的发展边界 [1] - 公司提出两条加速AGI临界点的路径:提高智能效率与扩充计算资源,通过场景尺度×计算资源×智能效率的共振实现有限资源满足无限需求 [5][8] - 推出全规模AI效能跃升方案三大产品:无穹AI云(万卡级)、无界智算平台(百卡级)、无垠终端智能(单卡级),覆盖从超算到终端的全场景算力优化 [10] 产品技术架构 无穹AI云(大盒子) - 构建覆盖26省市53个数据中心的广域算力网,整合15种芯片架构异构算力池,总算力超25000P,支持跨地域实时算力切换 [14] - 采用"一网三异"调度架构,实现非理想状态算力资源转化为高稳定性AI服务能力,日均Token调用量突破100亿次 [16] - 与华为昇腾合作上线全国首个"算力生态超市",启动百亿生态共建计划,推动国产硬件与平台协同 [18] 无界智算平台(中盒子) - 在3000卡国产GPU集群上实现百亿参数大模型600小时不间断训练,创国产算力记录 [20] - 利用2000张华为昇腾910B卡完成千亿参数模型分布式推理,为云南移动构建商业化服务能力 [23] - 推出全球首个跨地域全分布式联合强化学习服务,最小支持单张消费级显卡接入 [25] 无垠终端智能(小盒子) - 发布全球首款端侧本征模型Infini-Megrez2.0,在7B内存占用下实现21B参数云级智能,突破终端"能效-空间-智能"不可能三角 [31] - 新一代推理引擎Infini-Mizar2.0将AIPC本地模型上限从7B提升至30B,联合Megrez2.0实现推理性能提升超100% [35] - 与新华三推出大模型一体机,单机驱动百亿参数模型,能效翻倍且成本大幅降低 [36] 行业生态布局 - 联合上海创智学院等十余家机构启动人工智能终端软硬适配优化中试平台,解决共性技术难题并建立评价体系 [40][41] - 与三大运营商及20余家AIDC伙伴启动联合运营创新生态计划,整合闲置算力资源 [27] - 合作生态覆盖联想、新华三、异格技术等终端厂商,推动端侧Agentic AI自主进化 [38]