无垠终端智能
搜索文档
无问芯穹完成近5亿元A+轮融资 持续发力智能体时代的AI新基建
证券日报网· 2025-11-27 18:50
融资信息 - 公司完成近5亿元人民币A+轮融资,由珠海科技集团、孚腾资本领投,多家新老投资方参与[1] - 融资阵容汇聚国家产业资本与头部市场化基金,体现对公司在国家战略响应和技术创新方面的认可[1] 资金用途与战略方向 - 募集资金将主要投入三大方向:扩大软硬协同技术优势、推动AI云与终端方案规模化拓展、加大智能体基础设施研发投入[3] - 公司战略核心为构建新一代可学习、可进化的Agentic Infra,实现生产、协同、服务智能体[5] 产品与技术架构 - 公司构建了完整的“智能体基础设施 × (AI云 + 终端智能)”技术与产品架构[3] - 云端产品“无穹AI云”提供智能体服务平台和人工智能服务平台,已完成超25000P算力纳管,覆盖26座城市的53个核心数据中心,服务百余家AI企业[4] - 终端解决方案“无垠终端智能”包括端模型、端软件和端IP,其中端模型以3B计算成本实现21B级智能水平,推理加速引擎实现3倍时延降低和40%能耗节省[4] 市场地位与客户基础 - 公司成立两年半,已服务百川智能、Kimi、联想集团、理想汽车等头部企业客户及多家人工智能科学研究机构[5] - 公司定位为面向人工智能最前沿技术与应用落地的高性能AI基础设施提供商[5] 行业趋势与公司观点 - 人工智能正从“对话工具”向“行动伙伴”演进,智能体有望成为未来社会的新型生产力单元[3] - 基础设施是服务智能体开发与迭代的生产线,也是支撑其规模化应用的基石[3]
5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建
量子位· 2025-11-27 15:30
融资情况 - 公司完成近5亿元A+轮融资[3] 累计融资金额近15亿元[1][7] - 本轮融资由珠海科技集团和孚腾资本领投 惠远资本 尚颀资本 弘晖基金跟投 洪泰基金 达晨财智 尚势资本&海棠基金 联想创投 君联资本 申万宏源 徐汇科创投 元智未来等老股东继续加码[5] - 融资阵容实现国资与市场化基金双重背书 既肯定公司技术创新 也代表资本市场对其智能体基础设施路线的肯定[7] 资金用途与战略方向 - 融资资金将用于持续扩大软硬协同 多元异构的技术领先优势 推动AI云产品与AI终端方案在产业中的规模化拓展 加大智能体基础设施研发投入[9] - 公司提出生产智能体 协同智能体 服务智能体的体系化战略 完成面向智能体场景的原生基础设施转型[10] - 公司计划继续推进Agentic Infra战略布局 加速智能体在数字世界与物理世界的融合[27] 技术能力与产品布局 - 公司在全国完成25,000P+算力纳管 覆盖26座城市 53个核心数据中心 服务百余家头部客户和多家科研机构[12] - 云端无穹AI云实现多元异构算力统一纳管 高性能训练&推理优化 智能体服务平台标准化和完整工具链[15] - 终端无垠终端智能解决方案包括无穹天权端侧大模型 以3B计算成本与7B内存需求对标21B级智能水平 无穹开阳终端推理加速引擎在主流硬件上实现3倍时延降低 40%能耗节省和40%内存占用 无穹天璇自研端侧LPU IP实现能效翻倍[16] - 公司还发布Infra Agents云端基础设施智能体蜂群 Kernel Mind终端推理加速与优化平台 RLinf强化学习框架和Cache to Cache无损通信框架[16] 市场地位与客户基础 - 公司成为AI基础设施领域最受资本追捧的黑马企业之一[1] - 服务客户包括Kimi 百川智能 Lovart 理想汽车 联想集团 生数科技 Soul VAST 中国移动 新华三 中兴终端等头部企业 支撑智源 浦江实验室 之江实验室 上海算法创新院 中关村学院等科研机构[12] - 投资方认为公司已在云+端全栈体系中构建成熟产品矩阵与多行业落地案例 为下一代Agentic Infra深化布局奠定坚实基础[19] 创始团队背景 - 公司由清华电子工程系长聘教授 系主任汪玉和其弟子夏立雪牵头创办[22][23] - 汪玉深耕智能芯片领域二十余年 曾成功孵化AI芯片企业深鉴科技 夏立雪本科到博士均毕业于清华大学电子工程系 连续五年入选斯坦福全球学科Top2%科学家榜单 连续两年入选AI2000人工智能全球最具影响力学者榜单[23]
5亿元A+轮融资,无问芯穹加速构建Agentic Infra | 巴伦精选
钛媒体APP· 2025-11-27 11:28
融资信息 - 公司完成近5亿元A+轮融资 [2] - 融资由珠海科技集团、孚腾资本领投,惠远资本、尚颀资本和弘晖基金跟投 [2] - 老股东洪泰基金、达晨财智、尚势资本&海棠资金、联想创投、君联资本、申万宏源、徐汇科创投、元智未来持续追投 [2] 资金用途 - 资金将用于扩大软硬协同、多元异构的技术领先优势 [2] - 推动AI云产品与AI终端方案在产业中的规模化拓展 [2] - 加大智能体基础设施研发投入,构建智能体服务平台及配套云、端基础设施 [2] 公司战略与愿景 - 公司已完成向智能体原生基础设施的转型 [2] - 战略核心是构建可学习、可进化的Agentic Infra [3] - 目标是实现智能体在数字世界与物理世界中的规模化普惠应用 [2] 产品与技术架构 - 公司搭建了“智能体基础设施 ×(AI 云 + 终端智能)”架构 [4] - 云端“无穹AI云”提供智能体服务平台和人工智能服务平台 [5] - 终端“无垠终端智能”提供端模型、端软件、端IP一体化解决方案 [5] 云端业务进展 - 无穹AI云已纳管超25,000P算力,覆盖26座城市的53个核心数据中心 [5] - 服务百余家AI企业,为其AI应用开发与部署全流程降本增效 [5] 终端产品性能 - 端模型无穹天权以3B计算成本、7B内存需求实现21B级智能水平 [5] - 终端推理加速引擎无穹开阳在主流硬件上实现3倍时延降低、40%能耗节省和40%内存占用 [5] - 自研终端推理LPU IP无穹天璇实现能效翻倍,大幅降低大模型推理成本 [5] 客户与合作伙伴 - 云端客户包括百川智能、Kimi、联想集团、理想汽车、智谱、中国移动等头部企业 [6] - 科研机构合作伙伴包括上海人工智能实验室、之江实验室、智源研究院等 [6] 新产品发布 - 发布云端基础设施智能体蜂群Agents Infra与终端通用推理加速优化平台Kernel Mind [7] - 配套技术包括强化学习框架RLinf和通信框架Cache to Cache [7] 行业定位与问题解决 - 智能体正成为人机协同与机器自主决策的核心载体 [3] - 传统基础设施依赖大量“胶水代码”,导致计算资源闲置、任务中断、运维成本高昂 [3] - 公司解决方案旨在突破人工智能产业应用的算力瓶颈 [6] 投资人观点 - 投资人认可公司在AI基础设施领域的技术前瞻性和系统化能力 [8] - 公司布局与我国构建自主国产人工智能产业生态的战略方向高度契合 [8]
中国算力,如何像水和电一样自然流动?
36氪· 2025-08-27 19:28
行业现状与问题 - 截至2024年9月中国算力规模达246 EFLOPS智能算力同比增长超65%各行业算力应用项目超1.3万个[1] - 智算中心平均机柜利用率仅20%~30%部分企业级中心低至10%[1] - 全国已上线智算中心算力整体利用率仅32%存在供需失衡和资源错配问题[2] - 优质算力供给不足大部分智算中心规模在1000P左右由分散社会资本建设难以匹配需求方[2] - 使用门槛过高创业公司面临找不到或用不起算力问题且缺乏使用裸金属算力的能力[3] - 国产芯片生态割裂多模型多芯片架构导致异构算力无法高效流动部分国产卡难以应用[3] 公司背景与定位 - 无问芯穹于2023年5月由清华大学电子工程系教授汪玉及博士生团队联合创立具备清华科研背景[4] - 公司成立不到两年完成近10亿元融资投资方包括红杉中国百度智谱AI等知名机构[4] - 公司定位为大模型时代"算力运营商"目标解决国产芯片生态割裂和算力使用门槛高问题[5] - 通过"M×N"技术将异构异域异属算力汇聚成云端算力网络实现智能感知和随需获取[5] - 技术路径包括统一中间层屏蔽硬件差异及优化国产芯片在大模型训练推理场景的性能[5] 产品与技术方案 - 公司推出三大核心产品覆盖万卡至十万卡无穹AI云百卡至千卡无界智算平台及单卡至十卡无垠终端智能[6] - 无穹AI云覆盖26省市53个数据中心整合超15种芯片架构异构算力池总算力规模超25000P[7] - 无界智算平台基于3000卡沐曦国产GPU集群支撑百亿参数模型训练600小时不间断利用2000张华为昇腾910B卡实现千亿参数模型推理[8] - 无垠终端智能推出端侧本征模型Infini-Megrez2.0实现21B参数智能水平内存占用控制在7B规模计算量控制在3B规模[9] - 公司通过底层算子通信调度容错技术创新提升算力利用率部分混合芯片算力利用率最高达97.6%[10] 生态合作与验证 - 公司与高校通过产学研协同机制缩短科研成果产业化周期如在研电赛中吸引25支高校团队参与[6] - 无穹AI云覆盖"东数西算"国家战略关键节点通过广域高性能专线实现算力资源实时切换与迁移[7] - 公司服务上海模速空间实现日均Token调用量突破100亿[10]
对话无问芯穹CEO夏立雪:模型和芯片是两条驱动路径,不可能分开发展|独家
钛媒体APP· 2025-07-30 12:42
公司产品发布 - 公司在2025世界人工智能大会期间发布全规模AI效能跃升方案 包括三大核心产品:无穹AI云(针对万卡至十万卡全局算力网络)、无界智算平台(针对百卡至千卡级大型智算集群)和无垠终端智能(针对单卡至十卡级有限算力终端)[2] - 该方案是一套面向未来智能基础设施的软硬协同系统 覆盖跨地域智算网络、智算集群与多形态智能终端等全规模场景 统一适配多种异构算力 提供从模型调度、性能优化到应用部署的全链路支持[2] - 无穹AI云大模型服务平台上线智谱最新开源模型GLM-4.5(3550亿参数)和GLM-4.5-air(1060亿参数)[2] 技术解决方案 - 公司打造产业链上的"世界通用语言" 实现不同芯片之间的无缝通信与协同 使算力资源即插即用且可自由挑选[3] - 通过算法和编译优化 国产芯片性能提升50%-200% 并实现多源异构国产AI芯片的统一调度和混合精度计算 综合性价比全面超越国际主流芯片[5] - 无界智算平台高效利用2000张华为昇腾910B智算加速卡 实现千亿参数模型的分布式部署与大规模推理[6] 商业合作与生态建设 - 公司提供全球首个跨地域全分布式联合强化学习服务 最小支持单张消费级显卡接入 与三大运营商及20余家AIDC机构联合启动"AIDC联合运营创新生态计划"[6] - 与上海创智院共同打造全球首款端侧本征模型无穹天权Infini-Megrez2.0 与联想合作开发智能终端推理加速引擎无穹开阳Infini-Mizar2.0(将AI PC本地模型尺寸上限从70亿提升到300亿参数) 与新华三合作大模型一体机 与苏州异格技术合作推出FPGA大模型推理一体机[7] - 服务的上海模速空间日均Tokens调用量突破100亿 累计服务10余个智慧场景 支撑100多个前沿AI创新应用 单应用月活高达数千万[6] 融资与发展历程 - 公司2024年完成近5亿元A轮融资 创下国内AI基础设施最大单笔融资记录 成立两年累计融资超过10亿元[5] - 成立于2023年5月 专注于为AI 2.0时代提供完整解决方案 致力于成为大模型落地过程中的"M×N"中间层[4] 行业观点与趋势 - 模型和算力芯片是两条驱动路径 需要融合及协同发展 国内算力产业需要多方配合解决资源限制问题[3] - AI应用落地价值空间=场景尺度×计算资源×智能效率 智能效率持续进化推动顶尖模型从大规模计算下放到中等算力和小算力场景[5] - 国产芯片在推理侧具备商业价值 公司帮助用户从国际芯片逐步迁移到国产卡 目前在一些国产卡上运行效率较好[8] - 需要打通算力、数据、模型、应用的全栈能力 教育科研领域应共同思考"最后一公里"问题[8]
腾讯研究院AI速递 20250730
腾讯研究院· 2025-07-30 00:01
Claude新增周流量限制条款 - Anthropic宣布8月底对Claude Pro和Max用户推出每周使用限制,影响将少于5%的订阅用户 [1] - 部分用户24小时不间断运行Claude Code,极端案例中一位用户200美元套餐实际消耗数万美元 [1] - 用户普遍反映缺乏使用量透明度,无法查看已消耗token和剩余配额,许多人开始寻找替代产品 [1] 微软AI Edge浏览器 - Edge浏览器推出"Copilot模式",核心功能是跨标签页情境感知,可同时读取分析所有打开的页面 [2] - 全新界面使用简洁统一输入框,自动理解用户意图,支持语音控制和主题式旅程功能 [2] - 该功能现已在所有Copilot市场限时免费开放,未来可能与Copilot订阅服务捆绑销售,浏览器或不再是免费软件 [2] 无问芯穹发布全规模AI效能跃升方案 - 无问芯穹发布三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [3] - 目前已覆盖26个省市53个核心数据中心,整合超15种主流芯片架构,总算力规模超25000P [3] - 端侧创新包括全球首款端侧本征模型"无穹天权",实现云级21B参数智能水平的同时内存占用控制在7B规模 [3] 阶跃AI推出研究小助手 - 阶跃深研能在十分钟内自主完成复杂研究任务,生成深度专业报告,在xbench-DeepSearch评测中取得70%超高通过率 [4] - 基于强化学习和多智能体架构研发,具备自主思考、推理、动态工具调用能力 [5] - 提供高级搜索功能,包括聚焦搜索、自选信源和知识库,支持导出多种格式 [5] 京东升级大模型品牌为JoyAI - 京东推出JoyAgent智能体平台、JoyInside附身智能和数字人等多场景解决方案 [6] - JoyAgent是首个100%开源的企业级智能体,收获超2000颗GitHub星标 [6] - JoyAI针对不同场景的产品均已实现落地应用,数字人服务超2万品牌,交互型AI潮玩Fuzozo芙崽首发预售售罄 [6] 多模态、多智能体AI记忆系统MIRIX - 加州大学圣迭戈分校和纽约大学研究者推出并开源MIRIX,全球首个多模态、多智能体AI记忆系统 [7] - 系统将记忆分为六个模块:核心、情景、语义、程序、资源和知识金库 [7] - MIRIX在ScreenshotVQA测试中准确率比传统RAG高35%,存储减少99.9%,在LOCOMO长对话任务中达85.4%创新纪录 [7] 空间天气链式AI预报模型 - 国家卫星气象中心与南昌大学、华为联合发布"风宇"模型,全球首个全链式空间天气人工智能预报模型 [8] - 模型首创链式训练结构,包括太阳风"煦风"、地球磁场"天磁"和地球电离层"电穹"三大区域模型 [8] - "风宇"对全球电子密度总含量预测误差控制在10%左右,已申请11项国家发明专利 [8] 上海AI lab开源科学多模态大模型 - 上海人工智能实验室发布并开源"书生"科学多模态大模型Intern-S1,多模态能力全球开源第一 [9] - 模型首创"跨模态科学解析引擎",可精准解读化学分子式、蛋白质结构、地震波信号等复杂科学数据 [9] - 研发团队提出通专融合的科学数据合成方法,创造性地降低了强化学习训练成本 [9] a16z合伙人观点 - AI大模型竞争格局将如云计算大战一样走向寡头垄断,将形成品牌效应新格局 [10] - 应用层已无技术护城河,理性商业决策是"牺牲利润换取分销",价值将在模型基础设施和垂直领域深耕中形成 [10] - AI并非将普通开发者变成超级工程师,而是"让10倍工程师变成2倍",使编程回归本质创造 [10] 腾讯具身智能开放平台 - 腾讯发布具身智能开放平台Tairos"钛螺丝",旨在为机器人本体开发商与应用开发商补齐软件能力 [11] - 平台基于SLAP³技术体系,提供规划大模型、多模态感知大模型和感知-行动联合大模型三大核心能力 [11] - 具身智能未来发展五大趋势(IDEAS):虚实集成世界、技术门槛降低、智能演进、智能体化和感知多模态化 [11]
单张消费级显卡也能参与大模型训练!无问芯穹用「三个盒子」打通十万卡到一张卡AI效能跃升路径
量子位· 2025-07-29 13:05
核心观点 - 智能时代的资源拐点已至,需通过提高智能效率和扩充计算资源两条路径加速抵达AGI临界点 [26][32][33] - 无问芯穹推出"三个盒子"全规模AI效能跃升方案,覆盖从十万卡集群到单张卡的智能基础设施需求 [4][6][7] - AI应用落地价值空间=场景尺度×计算资源×智能效率,效能跃升成为关键突破方向 [34][35] 产品架构 大盒子:无穹AI云 - 面向万卡至十万卡级智算网络,整合全国26省市53个核心数据中心的算力资源,总算力超25000P [10] - 采用"一网三异"调度架构,支持15种主流芯片架构异构算力池,覆盖"东数西算"关键节点 [10] - 实现算力资源高效流转,激活非理想状态算力转化为高稳定性、高吞吐量服务 [12] - 采用"平台+自营"模式,支持企业自建运营平台并接入底层算力网络 [12] 中盒子:无界智算平台 - 面向百卡至千卡级集群,服务高校、科研机构及中小AIDC中心 [15] - 已支持100+大型研发场景,包括3000卡沐曦GPU集群600小时百亿模型训练、2000张昇腾卡千亿模型商用推理 [17] - 推出全球首个跨地域全分布式联合强化学习服务,支持单张消费级GPU参与大模型联合训练 [18][19] 小盒子:无垠终端智能 - 打造"端模型+端引擎+端硬件"一体化解决方案,推出全球首款端侧本征模型Infini-Megrez2.0 [20][21] - 实现云级21B参数智能水平,内存占用控制在7B规模,计算量控制在3B规模 [21] - 支持终端设备休眠状态下持续运行大模型,单设备年增1000+小时有效工作时间 [24][25] 技术突破 - 两年内实现AI性能跨越:从数千卡集群训练的GPT3.5到单手机部署同等性能AI [2] - 通过软硬协同设计突破终端算力限制,使手机承载相当于GPT3.5的AI能力 [2][21] - 效能跃升路径强调"有限资源最优解"而非无限扩张,推动AGI临界点前移 [32][35]
各国合作培养“不会从人类手中夺权的好AI”
中国青年报· 2025-07-29 06:48
人工智能大会盛况 - 2025世界人工智能大会展览面积首次突破7万平方米,吸引800余家企业参展,3000余项前沿展品亮相,规模创历届之最 [2] - 展品涵盖40余款大模型、50余款AI终端产品、60余款智能机器人以及100余款"全球首发""中国首秀"新品 [2] - 大会全面展现人工智能领域最新进展与未来走向,各项最新AI应用与产品令人目不暇接 [2] 百度数字人技术突破 - 百度发布新一代数字人技术NOVA,宣告超级头部主播能力复刻进入规模化量产时代 [5] - NOVA技术曾支撑罗永浩数字人直播间创下5500万GMV,预计10月向全行业开放 [5] - 新一代NOVA技术实现"双数字人主播"突破,在文心大模型4.5T加持下可做到"懂创作"、"有个性"、"玩梗"等高阶交互 [5] 教育科技产品创新 - 网易有道推出"有道AI答疑笔SpaceOne",深度融合DeepSeek-R1推理模型与自研教育大模型"子曰",提供学科难题深度讲解 [6] - 升级后的"有道子曰翻译大模型"支持109种语言互译,覆盖10余种翻译场景和多种形式翻译 [6] - 合合信息展示AI扫描技术,可将巨幅文物高清扫描并一键"装进"手机,解决文物拍摄难题 [7] 工业AI解决方案 - 黑湖科技展示基于AI Agent的柔性制造解决方案"黑湖小工单",帮助中小工厂提升订单响应速度和履约效率 [11] - 该系统已服务全国超3.2万家工厂,将新品上市周期从3个月压缩至3周,最小起订量从1万件降至100件 [11] - 通过构建多类型AI Agent替代人工决策流程,显著降低管理成本 [11] 具身智能与算力平台 - 商汤科技发布具身智能平台"悟能",为机器人、智能设备提供感知、视觉导航及多模态交互能力 [12] - 无问芯穹发布"无穹AI云""无界智算平台"与"无垠终端智能"解决方案,面向全规模AI应用场景 [12] - 无问芯穹CEO表示AI算力建设需要适应小而广泛的AI应用企业,满足敏捷生产需求 [12] 全球AI发展与合作 - 中国近年涌现众多世界级AI模型,且领先模型多采用开放权重模式,与美国形成显著区别 [17] - 专家认为中美应合作维护世界稳定,确保人类掌控AI [17] - 图灵奖得主姚期智指出需全球携手确保AI技术红利惠及所有国家与群体 [17]
这届WAIC,无问芯穹发布了三个「盒子」
机器之心· 2025-07-28 18:45
核心观点 - 算力是智能时代的核心基础设施,其规模与效率决定数字未来的发展边界 [1] - 公司提出两条加速AGI临界点的路径:提高智能效率与扩充计算资源,通过场景尺度×计算资源×智能效率的共振实现有限资源满足无限需求 [5][8] - 推出全规模AI效能跃升方案三大产品:无穹AI云(万卡级)、无界智算平台(百卡级)、无垠终端智能(单卡级),覆盖从超算到终端的全场景算力优化 [10] 产品技术架构 无穹AI云(大盒子) - 构建覆盖26省市53个数据中心的广域算力网,整合15种芯片架构异构算力池,总算力超25000P,支持跨地域实时算力切换 [14] - 采用"一网三异"调度架构,实现非理想状态算力资源转化为高稳定性AI服务能力,日均Token调用量突破100亿次 [16] - 与华为昇腾合作上线全国首个"算力生态超市",启动百亿生态共建计划,推动国产硬件与平台协同 [18] 无界智算平台(中盒子) - 在3000卡国产GPU集群上实现百亿参数大模型600小时不间断训练,创国产算力记录 [20] - 利用2000张华为昇腾910B卡完成千亿参数模型分布式推理,为云南移动构建商业化服务能力 [23] - 推出全球首个跨地域全分布式联合强化学习服务,最小支持单张消费级显卡接入 [25] 无垠终端智能(小盒子) - 发布全球首款端侧本征模型Infini-Megrez2.0,在7B内存占用下实现21B参数云级智能,突破终端"能效-空间-智能"不可能三角 [31] - 新一代推理引擎Infini-Mizar2.0将AIPC本地模型上限从7B提升至30B,联合Megrez2.0实现推理性能提升超100% [35] - 与新华三推出大模型一体机,单机驱动百亿参数模型,能效翻倍且成本大幅降低 [36] 行业生态布局 - 联合上海创智学院等十余家机构启动人工智能终端软硬适配优化中试平台,解决共性技术难题并建立评价体系 [40][41] - 与三大运营商及20余家AIDC伙伴启动联合运营创新生态计划,整合闲置算力资源 [27] - 合作生态覆盖联想、新华三、异格技术等终端厂商,推动端侧Agentic AI自主进化 [38]
这届世界人工智能大会,无问芯穹发布了“三个盒子”
证券时报网· 2025-07-28 14:55
公司产品发布 - 无问芯穹在世界人工智能大会上发布全规模AI效能跃升方案,包含三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [1] - 三大产品被比喻为"三个盒子",旨在通过软硬协同系统覆盖从单卡至十万卡算力的全规模场景,提升算力利用效率 [1] - 无穹AI云为超大规模算力集群提供系统性解决方案,整合异构算力形成云端算力网络 [2] 技术架构与性能 - 无穹AI云底层构建全国广域算力网,覆盖26省市53个核心数据中心,整合超15种芯片架构,总算力规模超25000P [3] - 无界智算平台已在100多个大型研发场景中保障模型训练与推理,基于3000卡国产GPU集群实现百亿参数模型600小时不间断训练 [3] - 无垠终端智能解决方案通过"端模型+端引擎+端硬件"三位一体协同优化,突破终端设备资源限制 [4] 终端创新成果 - 推出全球首款端侧本征模型Infini-Megrez2.0,在21B参数智能水平下将内存占用压缩至7B规模,计算量控制在3B规模 [5] - Infini-Megrez2.0演示显示可离线执行AI任务,单台设备年均可释放1000多小时生产力 [5] - 新一代推理引擎Infini-Mizar 2.0与Megrez2.0结合实现智能水平提升18%、推理性能提升超100% [6] 行业合作与商业化 - 与华为昇腾合作上线全国首个"算力生态超市"模速空间算力生态平台2.0,日均Token调用量突破100亿 [3] - 与联想合作发布智能终端推理加速引擎,与新华三合作推出大模型一体机,与苏州异格技术推出FPGA大模型推理一体机 [6] - 上海模速空间已支撑100多个前沿AI创新应用,单应用月活达数千万 [3] 战略愿景 - 公司提出通过提高智能效率与扩充计算资源两条路径加速抵达AGI临界点 [2] - 提出AI应用落地价值空间公式:场景尺度×计算资源×智能效率,强调三要素共振实现有限资源支撑无限需求 [2]