Workflow
无垠终端智能
icon
搜索文档
中国算力,如何像水和电一样自然流动?
36氪· 2025-08-27 19:28
行业现状与问题 - 截至2024年9月中国算力规模达246 EFLOPS智能算力同比增长超65%各行业算力应用项目超1.3万个[1] - 智算中心平均机柜利用率仅20%~30%部分企业级中心低至10%[1] - 全国已上线智算中心算力整体利用率仅32%存在供需失衡和资源错配问题[2] - 优质算力供给不足大部分智算中心规模在1000P左右由分散社会资本建设难以匹配需求方[2] - 使用门槛过高创业公司面临找不到或用不起算力问题且缺乏使用裸金属算力的能力[3] - 国产芯片生态割裂多模型多芯片架构导致异构算力无法高效流动部分国产卡难以应用[3] 公司背景与定位 - 无问芯穹于2023年5月由清华大学电子工程系教授汪玉及博士生团队联合创立具备清华科研背景[4] - 公司成立不到两年完成近10亿元融资投资方包括红杉中国百度智谱AI等知名机构[4] - 公司定位为大模型时代"算力运营商"目标解决国产芯片生态割裂和算力使用门槛高问题[5] - 通过"M×N"技术将异构异域异属算力汇聚成云端算力网络实现智能感知和随需获取[5] - 技术路径包括统一中间层屏蔽硬件差异及优化国产芯片在大模型训练推理场景的性能[5] 产品与技术方案 - 公司推出三大核心产品覆盖万卡至十万卡无穹AI云百卡至千卡无界智算平台及单卡至十卡无垠终端智能[6] - 无穹AI云覆盖26省市53个数据中心整合超15种芯片架构异构算力池总算力规模超25000P[7] - 无界智算平台基于3000卡沐曦国产GPU集群支撑百亿参数模型训练600小时不间断利用2000张华为昇腾910B卡实现千亿参数模型推理[8] - 无垠终端智能推出端侧本征模型Infini-Megrez2.0实现21B参数智能水平内存占用控制在7B规模计算量控制在3B规模[9] - 公司通过底层算子通信调度容错技术创新提升算力利用率部分混合芯片算力利用率最高达97.6%[10] 生态合作与验证 - 公司与高校通过产学研协同机制缩短科研成果产业化周期如在研电赛中吸引25支高校团队参与[6] - 无穹AI云覆盖"东数西算"国家战略关键节点通过广域高性能专线实现算力资源实时切换与迁移[7] - 公司服务上海模速空间实现日均Token调用量突破100亿[10]
对话无问芯穹CEO夏立雪:模型和芯片是两条驱动路径,不可能分开发展|独家
钛媒体APP· 2025-07-30 12:42
公司产品发布 - 公司在2025世界人工智能大会期间发布全规模AI效能跃升方案 包括三大核心产品:无穹AI云(针对万卡至十万卡全局算力网络)、无界智算平台(针对百卡至千卡级大型智算集群)和无垠终端智能(针对单卡至十卡级有限算力终端)[2] - 该方案是一套面向未来智能基础设施的软硬协同系统 覆盖跨地域智算网络、智算集群与多形态智能终端等全规模场景 统一适配多种异构算力 提供从模型调度、性能优化到应用部署的全链路支持[2] - 无穹AI云大模型服务平台上线智谱最新开源模型GLM-4.5(3550亿参数)和GLM-4.5-air(1060亿参数)[2] 技术解决方案 - 公司打造产业链上的"世界通用语言" 实现不同芯片之间的无缝通信与协同 使算力资源即插即用且可自由挑选[3] - 通过算法和编译优化 国产芯片性能提升50%-200% 并实现多源异构国产AI芯片的统一调度和混合精度计算 综合性价比全面超越国际主流芯片[5] - 无界智算平台高效利用2000张华为昇腾910B智算加速卡 实现千亿参数模型的分布式部署与大规模推理[6] 商业合作与生态建设 - 公司提供全球首个跨地域全分布式联合强化学习服务 最小支持单张消费级显卡接入 与三大运营商及20余家AIDC机构联合启动"AIDC联合运营创新生态计划"[6] - 与上海创智院共同打造全球首款端侧本征模型无穹天权Infini-Megrez2.0 与联想合作开发智能终端推理加速引擎无穹开阳Infini-Mizar2.0(将AI PC本地模型尺寸上限从70亿提升到300亿参数) 与新华三合作大模型一体机 与苏州异格技术合作推出FPGA大模型推理一体机[7] - 服务的上海模速空间日均Tokens调用量突破100亿 累计服务10余个智慧场景 支撑100多个前沿AI创新应用 单应用月活高达数千万[6] 融资与发展历程 - 公司2024年完成近5亿元A轮融资 创下国内AI基础设施最大单笔融资记录 成立两年累计融资超过10亿元[5] - 成立于2023年5月 专注于为AI 2.0时代提供完整解决方案 致力于成为大模型落地过程中的"M×N"中间层[4] 行业观点与趋势 - 模型和算力芯片是两条驱动路径 需要融合及协同发展 国内算力产业需要多方配合解决资源限制问题[3] - AI应用落地价值空间=场景尺度×计算资源×智能效率 智能效率持续进化推动顶尖模型从大规模计算下放到中等算力和小算力场景[5] - 国产芯片在推理侧具备商业价值 公司帮助用户从国际芯片逐步迁移到国产卡 目前在一些国产卡上运行效率较好[8] - 需要打通算力、数据、模型、应用的全栈能力 教育科研领域应共同思考"最后一公里"问题[8]
腾讯研究院AI速递 20250730
腾讯研究院· 2025-07-30 00:01
Claude新增周流量限制条款 - Anthropic宣布8月底对Claude Pro和Max用户推出每周使用限制,影响将少于5%的订阅用户 [1] - 部分用户24小时不间断运行Claude Code,极端案例中一位用户200美元套餐实际消耗数万美元 [1] - 用户普遍反映缺乏使用量透明度,无法查看已消耗token和剩余配额,许多人开始寻找替代产品 [1] 微软AI Edge浏览器 - Edge浏览器推出"Copilot模式",核心功能是跨标签页情境感知,可同时读取分析所有打开的页面 [2] - 全新界面使用简洁统一输入框,自动理解用户意图,支持语音控制和主题式旅程功能 [2] - 该功能现已在所有Copilot市场限时免费开放,未来可能与Copilot订阅服务捆绑销售,浏览器或不再是免费软件 [2] 无问芯穹发布全规模AI效能跃升方案 - 无问芯穹发布三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [3] - 目前已覆盖26个省市53个核心数据中心,整合超15种主流芯片架构,总算力规模超25000P [3] - 端侧创新包括全球首款端侧本征模型"无穹天权",实现云级21B参数智能水平的同时内存占用控制在7B规模 [3] 阶跃AI推出研究小助手 - 阶跃深研能在十分钟内自主完成复杂研究任务,生成深度专业报告,在xbench-DeepSearch评测中取得70%超高通过率 [4] - 基于强化学习和多智能体架构研发,具备自主思考、推理、动态工具调用能力 [5] - 提供高级搜索功能,包括聚焦搜索、自选信源和知识库,支持导出多种格式 [5] 京东升级大模型品牌为JoyAI - 京东推出JoyAgent智能体平台、JoyInside附身智能和数字人等多场景解决方案 [6] - JoyAgent是首个100%开源的企业级智能体,收获超2000颗GitHub星标 [6] - JoyAI针对不同场景的产品均已实现落地应用,数字人服务超2万品牌,交互型AI潮玩Fuzozo芙崽首发预售售罄 [6] 多模态、多智能体AI记忆系统MIRIX - 加州大学圣迭戈分校和纽约大学研究者推出并开源MIRIX,全球首个多模态、多智能体AI记忆系统 [7] - 系统将记忆分为六个模块:核心、情景、语义、程序、资源和知识金库 [7] - MIRIX在ScreenshotVQA测试中准确率比传统RAG高35%,存储减少99.9%,在LOCOMO长对话任务中达85.4%创新纪录 [7] 空间天气链式AI预报模型 - 国家卫星气象中心与南昌大学、华为联合发布"风宇"模型,全球首个全链式空间天气人工智能预报模型 [8] - 模型首创链式训练结构,包括太阳风"煦风"、地球磁场"天磁"和地球电离层"电穹"三大区域模型 [8] - "风宇"对全球电子密度总含量预测误差控制在10%左右,已申请11项国家发明专利 [8] 上海AI lab开源科学多模态大模型 - 上海人工智能实验室发布并开源"书生"科学多模态大模型Intern-S1,多模态能力全球开源第一 [9] - 模型首创"跨模态科学解析引擎",可精准解读化学分子式、蛋白质结构、地震波信号等复杂科学数据 [9] - 研发团队提出通专融合的科学数据合成方法,创造性地降低了强化学习训练成本 [9] a16z合伙人观点 - AI大模型竞争格局将如云计算大战一样走向寡头垄断,将形成品牌效应新格局 [10] - 应用层已无技术护城河,理性商业决策是"牺牲利润换取分销",价值将在模型基础设施和垂直领域深耕中形成 [10] - AI并非将普通开发者变成超级工程师,而是"让10倍工程师变成2倍",使编程回归本质创造 [10] 腾讯具身智能开放平台 - 腾讯发布具身智能开放平台Tairos"钛螺丝",旨在为机器人本体开发商与应用开发商补齐软件能力 [11] - 平台基于SLAP³技术体系,提供规划大模型、多模态感知大模型和感知-行动联合大模型三大核心能力 [11] - 具身智能未来发展五大趋势(IDEAS):虚实集成世界、技术门槛降低、智能演进、智能体化和感知多模态化 [11]
单张消费级显卡也能参与大模型训练!无问芯穹用「三个盒子」打通十万卡到一张卡AI效能跃升路径
量子位· 2025-07-29 13:05
核心观点 - 智能时代的资源拐点已至,需通过提高智能效率和扩充计算资源两条路径加速抵达AGI临界点 [26][32][33] - 无问芯穹推出"三个盒子"全规模AI效能跃升方案,覆盖从十万卡集群到单张卡的智能基础设施需求 [4][6][7] - AI应用落地价值空间=场景尺度×计算资源×智能效率,效能跃升成为关键突破方向 [34][35] 产品架构 大盒子:无穹AI云 - 面向万卡至十万卡级智算网络,整合全国26省市53个核心数据中心的算力资源,总算力超25000P [10] - 采用"一网三异"调度架构,支持15种主流芯片架构异构算力池,覆盖"东数西算"关键节点 [10] - 实现算力资源高效流转,激活非理想状态算力转化为高稳定性、高吞吐量服务 [12] - 采用"平台+自营"模式,支持企业自建运营平台并接入底层算力网络 [12] 中盒子:无界智算平台 - 面向百卡至千卡级集群,服务高校、科研机构及中小AIDC中心 [15] - 已支持100+大型研发场景,包括3000卡沐曦GPU集群600小时百亿模型训练、2000张昇腾卡千亿模型商用推理 [17] - 推出全球首个跨地域全分布式联合强化学习服务,支持单张消费级GPU参与大模型联合训练 [18][19] 小盒子:无垠终端智能 - 打造"端模型+端引擎+端硬件"一体化解决方案,推出全球首款端侧本征模型Infini-Megrez2.0 [20][21] - 实现云级21B参数智能水平,内存占用控制在7B规模,计算量控制在3B规模 [21] - 支持终端设备休眠状态下持续运行大模型,单设备年增1000+小时有效工作时间 [24][25] 技术突破 - 两年内实现AI性能跨越:从数千卡集群训练的GPT3.5到单手机部署同等性能AI [2] - 通过软硬协同设计突破终端算力限制,使手机承载相当于GPT3.5的AI能力 [2][21] - 效能跃升路径强调"有限资源最优解"而非无限扩张,推动AGI临界点前移 [32][35]
各国合作培养“不会从人类手中夺权的好AI”
中国青年报· 2025-07-29 06:48
人工智能大会盛况 - 2025世界人工智能大会展览面积首次突破7万平方米,吸引800余家企业参展,3000余项前沿展品亮相,规模创历届之最 [2] - 展品涵盖40余款大模型、50余款AI终端产品、60余款智能机器人以及100余款"全球首发""中国首秀"新品 [2] - 大会全面展现人工智能领域最新进展与未来走向,各项最新AI应用与产品令人目不暇接 [2] 百度数字人技术突破 - 百度发布新一代数字人技术NOVA,宣告超级头部主播能力复刻进入规模化量产时代 [5] - NOVA技术曾支撑罗永浩数字人直播间创下5500万GMV,预计10月向全行业开放 [5] - 新一代NOVA技术实现"双数字人主播"突破,在文心大模型4.5T加持下可做到"懂创作"、"有个性"、"玩梗"等高阶交互 [5] 教育科技产品创新 - 网易有道推出"有道AI答疑笔SpaceOne",深度融合DeepSeek-R1推理模型与自研教育大模型"子曰",提供学科难题深度讲解 [6] - 升级后的"有道子曰翻译大模型"支持109种语言互译,覆盖10余种翻译场景和多种形式翻译 [6] - 合合信息展示AI扫描技术,可将巨幅文物高清扫描并一键"装进"手机,解决文物拍摄难题 [7] 工业AI解决方案 - 黑湖科技展示基于AI Agent的柔性制造解决方案"黑湖小工单",帮助中小工厂提升订单响应速度和履约效率 [11] - 该系统已服务全国超3.2万家工厂,将新品上市周期从3个月压缩至3周,最小起订量从1万件降至100件 [11] - 通过构建多类型AI Agent替代人工决策流程,显著降低管理成本 [11] 具身智能与算力平台 - 商汤科技发布具身智能平台"悟能",为机器人、智能设备提供感知、视觉导航及多模态交互能力 [12] - 无问芯穹发布"无穹AI云""无界智算平台"与"无垠终端智能"解决方案,面向全规模AI应用场景 [12] - 无问芯穹CEO表示AI算力建设需要适应小而广泛的AI应用企业,满足敏捷生产需求 [12] 全球AI发展与合作 - 中国近年涌现众多世界级AI模型,且领先模型多采用开放权重模式,与美国形成显著区别 [17] - 专家认为中美应合作维护世界稳定,确保人类掌控AI [17] - 图灵奖得主姚期智指出需全球携手确保AI技术红利惠及所有国家与群体 [17]
这届WAIC,无问芯穹发布了三个「盒子」
机器之心· 2025-07-28 18:45
核心观点 - 算力是智能时代的核心基础设施,其规模与效率决定数字未来的发展边界 [1] - 公司提出两条加速AGI临界点的路径:提高智能效率与扩充计算资源,通过场景尺度×计算资源×智能效率的共振实现有限资源满足无限需求 [5][8] - 推出全规模AI效能跃升方案三大产品:无穹AI云(万卡级)、无界智算平台(百卡级)、无垠终端智能(单卡级),覆盖从超算到终端的全场景算力优化 [10] 产品技术架构 无穹AI云(大盒子) - 构建覆盖26省市53个数据中心的广域算力网,整合15种芯片架构异构算力池,总算力超25000P,支持跨地域实时算力切换 [14] - 采用"一网三异"调度架构,实现非理想状态算力资源转化为高稳定性AI服务能力,日均Token调用量突破100亿次 [16] - 与华为昇腾合作上线全国首个"算力生态超市",启动百亿生态共建计划,推动国产硬件与平台协同 [18] 无界智算平台(中盒子) - 在3000卡国产GPU集群上实现百亿参数大模型600小时不间断训练,创国产算力记录 [20] - 利用2000张华为昇腾910B卡完成千亿参数模型分布式推理,为云南移动构建商业化服务能力 [23] - 推出全球首个跨地域全分布式联合强化学习服务,最小支持单张消费级显卡接入 [25] 无垠终端智能(小盒子) - 发布全球首款端侧本征模型Infini-Megrez2.0,在7B内存占用下实现21B参数云级智能,突破终端"能效-空间-智能"不可能三角 [31] - 新一代推理引擎Infini-Mizar2.0将AIPC本地模型上限从7B提升至30B,联合Megrez2.0实现推理性能提升超100% [35] - 与新华三推出大模型一体机,单机驱动百亿参数模型,能效翻倍且成本大幅降低 [36] 行业生态布局 - 联合上海创智学院等十余家机构启动人工智能终端软硬适配优化中试平台,解决共性技术难题并建立评价体系 [40][41] - 与三大运营商及20余家AIDC伙伴启动联合运营创新生态计划,整合闲置算力资源 [27] - 合作生态覆盖联想、新华三、异格技术等终端厂商,推动端侧Agentic AI自主进化 [38]
这届世界人工智能大会,无问芯穹发布了“三个盒子”
证券时报网· 2025-07-28 14:55
公司产品发布 - 无问芯穹在世界人工智能大会上发布全规模AI效能跃升方案,包含三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [1] - 三大产品被比喻为"三个盒子",旨在通过软硬协同系统覆盖从单卡至十万卡算力的全规模场景,提升算力利用效率 [1] - 无穹AI云为超大规模算力集群提供系统性解决方案,整合异构算力形成云端算力网络 [2] 技术架构与性能 - 无穹AI云底层构建全国广域算力网,覆盖26省市53个核心数据中心,整合超15种芯片架构,总算力规模超25000P [3] - 无界智算平台已在100多个大型研发场景中保障模型训练与推理,基于3000卡国产GPU集群实现百亿参数模型600小时不间断训练 [3] - 无垠终端智能解决方案通过"端模型+端引擎+端硬件"三位一体协同优化,突破终端设备资源限制 [4] 终端创新成果 - 推出全球首款端侧本征模型Infini-Megrez2.0,在21B参数智能水平下将内存占用压缩至7B规模,计算量控制在3B规模 [5] - Infini-Megrez2.0演示显示可离线执行AI任务,单台设备年均可释放1000多小时生产力 [5] - 新一代推理引擎Infini-Mizar 2.0与Megrez2.0结合实现智能水平提升18%、推理性能提升超100% [6] 行业合作与商业化 - 与华为昇腾合作上线全国首个"算力生态超市"模速空间算力生态平台2.0,日均Token调用量突破100亿 [3] - 与联想合作发布智能终端推理加速引擎,与新华三合作推出大模型一体机,与苏州异格技术推出FPGA大模型推理一体机 [6] - 上海模速空间已支撑100多个前沿AI创新应用,单应用月活达数千万 [3] 战略愿景 - 公司提出通过提高智能效率与扩充计算资源两条路径加速抵达AGI临界点 [2] - 提出AI应用落地价值空间公式:场景尺度×计算资源×智能效率,强调三要素共振实现有限资源支撑无限需求 [2]
无问芯穹发布全规模AI效能跃升方案
快讯· 2025-07-28 14:29
无问芯穹全规模AI效能跃升方案发布 - 公司在2025年世界人工智能大会上发布全规模AI效能跃升方案 [1] - 方案面向未来智能基础设施的软硬协同系统 [1] - 方案覆盖跨地域智算网络、智算集群与多形态智能终端等全规模场景 [1] 三大核心产品推出 - 无穹AI云:提供云端AI服务能力 [1] - 无界智算平台:支持异构算力统一适配 [1] - 无垠终端智能:赋能多形态智能终端 [1] 技术能力与市场表现 - 方案提供从模型调度、性能优化到应用部署的全链路支持 [1] - 公司服务的上海模速空间日均Token调用量突破100亿大关 [1] - 上海模速空间是全球最大人工智能孵化器 [1]
实探|今日看点,上海这场会AI含量拉满、机器人成分爆表!
证券时报· 2025-07-26 23:42
2025世界人工智能大会展示亮点 - 网易有道推出全球首个虚拟人口语私教,具备实时互动和个性化答疑功能,可生成专属回答案例 [1] - 网易有道发布AI答疑笔SpaceOne,采用多模态视觉技术突破题库限制,能解析图形题和实验现象等复杂内容 [1] - 无问芯穹发布全规模AI效能跃升方案,包括三大操作系统级产品:无穹AI云、无界智算平台和无垠终端智能解决方案 [2] - 无问芯穹联合创始人提出AI算力建设需要适应小而广泛的应用企业,满足敏捷生产需求 [2] - 中昊芯英展示自研"刹那"TPU芯片和"泰则"服务器,芯片能耗仅为传统GPU的70%,单位算力成本为海外领先GPU的50% [2] AI技术发展趋势 - 浪潮集团强调AI发展进入"经济可行性"周期,提出企业需要复合AI能力(判别式+生成式AI) [3] - 数据治理成为AI落地关键,高质量数据决定应用上限,行业竞争进入数据战阶段 [3] - AI与企业应用间存在工具链断层,需构建数智底座支撑 [3] - 企业软件优化迎来智能体时刻,安全可信是AI落地基础 [3] 行业应用场景 - 展会展示机器人广泛应用于零售、制造、维修等劳动场景 [1] - 无问芯穹生态企业展示AI视频创意、语音建模、角色互动、人像美化等多样化应用 [2] - 人工智能正快速融入具身智能、多模态、智能体、APP和科研等领域 [3]
实探|今日看点,上海这场会AI含量拉满、机器人成分爆表!
证券时报· 2025-07-26 23:33
2025世界人工智能大会 - 大会主题为"智能时代 同球共济",展示机器人成为社会劳动主角的场景,包括便利店销售、智造车间作业、修理铺服务等[1] - 展区设置复古红砖小巷与机器人形成科技感与古早背景的强烈反差[1] 网易有道 - 推出"全球首个虚拟人口语私教",支持英语互动并生成个性化回答案例[3] - 发布AI答疑笔SpaceOne,具备多模态视觉突破技术,可解析图形题、物理实验现象等复杂内容[5] 无问芯穹 - 首次发布全规模AI效能跃升方案,包括"无穹AI云"、"无界智算平台"和"无垠终端智能"三大操作系统级产品[5] - 方案覆盖跨地域智算网络、智算集群与多形态智能终端场景,支持模型调度到应用部署全链路[5] - CEO夏立雪提出算力建设需适应小而广泛的AI应用企业,满足敏捷生产需求[6] 中昊芯英 - 展示自研TPU AI芯片"刹那"和服务器"泰则",单个计算单元搭载8片芯片[8] - "刹那"芯片能耗为传统GPU的70%,单位算力成本为海外领先GPU的50%[8] 浪潮集团 - 海岳大模型受关注,副总裁魏代森提出AI落地的五个关键支撑[10] - 关键支撑包括复合AI能力、数据治理、数智底座构建、企业软件重构和安全可信基础[10]