Workflow
量子位
icon
搜索文档
AI算力大战打到太空!英伟达前脚H100入轨,谷歌TPU后脚上天,中国玩家笑而不语
量子位· 2025-11-05 10:08
太空算力竞赛格局 - 英伟达与谷歌正积极布局太空算力基础设施,计划在太空建立吉瓦级数据中心[2] - 中国公司在太空算力领域处于领先地位,已实现常态化商业运行[5][34] - 行业正从技术验证阶段向规模化商用阶段过渡[35] 英伟达太空算力部署 - 通过Inception计划孵化的Starcloud公司执行太空算力部署,本月已发射搭载H100芯片的Starcloud-1卫星[6][7] - 卫星重60公斤,尺寸相当于小型冰箱,选择H100因其在训练、微调和推理方面的最佳性能[7][8] - 卫星将处理合成孔径雷达卫星群数据并实时传回地球,计划2025年启动商业服务[9][11] - 远期目标建设功率达5吉瓦、跨度4公里的轨道数据中心,预言10年内新建数据中心将全部建在太空[11][12] 谷歌太空算力计划 - 太阳捕手计划预计2027年初发射两颗原型卫星,测试TPU在太空运行情况[14][18] - 卫星采用太阳能供能和自由空间光通信技术,验证分布式机器学习任务可行性[17][18] - 谷歌目标同样是在太空建成吉瓦级数据中心,已发表专门论文论证可行性[19][20] 太空算力经济性与技术优势 - 太空能源成本仅为陆基方案的1/10,发射成本持续下降推动经济可行性[21][22] - 太阳能电池板效率较地球提升8倍,深空真空环境提供无限散热能力[24] - 在轨处理卫星数据可减轻通信压力,Starcloud已实现对SAR数据的在轨处理[25][26] - 光通信链路实验实现800Gbps单向传输,TPU辐射耐受性达预期任务剂量三倍[27][30] 中国太空算力进展 - 之江实验室三体计算星座首批12颗卫星已于2024年5月发射,计算能力从T级提升至P级[32] - 星座在轨计算能力达5POPS,卫星间激光通信速度最高达100Gbps[32][33] - 该星座于2024年9月实现常态化商业运行,标志着太空算力进入实用阶段[34]
全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成
量子位· 2025-11-04 16:22
比赛概况 - Alpha Arena是由美国第三方机构Nof1发起的AI实盘投资比赛,历时17天,从10月18日进行至11月4日[8] - 参赛模型包括中美两队的六位选手:阿里千问Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4[8] - 每个大模型获得1万美元初始资金,在Hyperliquid交易所使用相同的提示词和输入数据进行真实市场交易[8][9] - 比赛目标是最大化风险调整后的收益,模型需独立完成识别Alpha机会、决定仓位、判断买卖点和实时风险管理等任务[12][13] 比赛结果 - 阿里千问Qwen以22.32%的收益率获得冠军,账户价值达到12,232美元,总盈利2,232美元[1][24] - DeepSeek位列第二,收益率4.89%,账户价值10,489美元,盈利489.08美元,成为全场唯二盈利的模型[2][24] - 美系四大模型全线亏损:Claude亏损30.81%,Grok亏损45.3%,Gemini亏损56.71%,GPT-5亏损62.66%垫底[3][22][24] - 从交易频率看,Gemini交易最频繁达238次,Grok为47次,Qwen和DeepSeek分别为43次和41次[24] 比赛过程分析 - 初期六大模型均表现克制,互相观望谨慎试水[13] - Qwen和DeepSeek组成"赚钱组",轮番登顶并始终占据第一梯队[14] - Claude和Grok采取"震荡派"策略,进出频繁但总体亏损[15] - GPT-5和Gemini呈现持续下滑趋势,越挣扎亏损越大[16] - 10月23日Qwen以14,657.43美元账户价值超越DeepSeek的12,220.14美元登顶[20] - Qwen在关键时刻通过紧急避险实现最终反超,以超过20%的收益率问鼎冠军[21] 行业意义 - 在无提示词、无人类兜底、无试错空间的真实交易环境中,中国模型包揽冠亚军显示其复杂任务理解力和执行稳定性[2][26] - 模型应用能力与真金白银的市场表现存在显著差异,实盘交易验证更具参考价值[27] - 这是首次通过真金白银验证的AI交易能力比拼,阿里通义千问成为首家在此类实盘比赛中问鼎的模型[28]
清华AI数学家系统攻克均匀化理论难题!人机协同完成17页严谨证明
量子位· 2025-11-04 16:22
核心观点 - AI在数学研究中的角色实现从“解题工具”到“科研协作伙伴”的升级,清华大学团队通过人机协同模式成功解决均匀化理论难题,形成约17页数学证明 [1][2][3] - 该研究验证了“人类分析+AI推导”协同范式的可行性,为攻克复杂数学问题提供了新路径,使AI踏入“原创科研”核心地带 [2][3][5] 研究背景与目标 - 当前主流AI系统在数学研究中存在局限,如FunSearch、AlphaEvolve依赖程序化表述,AlphaGeometry系列聚焦几何推理,难以覆盖广泛数学分支,且完整证明构建仍需依赖人类 [4] - 研究核心目标是打破AI在数学研究中的困境,通过人机协同实现能力互补,共同攻克单一主体难以突破的复杂数学难题 [5] 具体研究问题与成果 - 研究聚焦均匀化理论问题,具体为推导周期性分布的流体夹杂尺度趋近于零时耦合Stokes-Lamé系统的极限均匀化方程,并严格证明原解与极限解的误差估计 [6][7] - 团队通过人机协同不仅得出极限方程,更精确证明了误差阶数α=1/2,形成约17页数学证明,AIM系统在最困难的子问题证明中作出非平凡贡献 [8][12] 人机交互五大模式 - 直接提示:通过定理提示、概念引导、细节优化,引导AIM聚焦核心推理路径,减少无效探索 [13][14] - 理论协同应用:将完整数学理论体系打包为“知识包”提供给AIM,使其在预设框架内开展多步骤连贯推导 [16][17] - 交互式迭代优化:遵循“AI输出→人类诊断→反馈修正→AI再推理”循环,逐步完善证明链条 [18][19] - 明确运用边界:针对AIM当前难以胜任的任务由人类主导完成,避免资源浪费 [20][21] - 辅助优化策略:通过多轮尝试筛选最优证明、提供目标结论约束推理方向、根据任务选择适配模型,提升AI输出可靠性与效率 [22] 研究价值与突破 - 验证人机协同数学研究范式,将AI推理能力与人类知识经验系统性融合,拓宽数学工作者能力边界 [27][28] - 攻克均匀化理论难题,证明内容很大程度上由AI生成,体现了人机协同在解决研究级数学问题方面的潜力 [29] - 系统梳理交互模式,提炼具有实证价值的见解,为未来AI辅助数学研究框架设计提供参考,加速AI与数学科研融合落地 [30] 未来研究方向 - 深化并系统化人机交互模式,研究现有模式能否迁移到其他数学领域,并针对特定需求设计更丰富高效的交互模式 [32][33] - 基于交互反馈优化AIM系统,以实现数学定理证明自动化为长期目标,依据实验积累的见解提升模型推理能力 [34][35][36]
我MiniMax,用实习生处理数据,照样屠榜开源大模型
量子位· 2025-11-04 13:06
注意力机制选择 - 公司从Linear Attention回归到Full Attention,原因是经过测试发现Efficient Attention机制在长上下文任务中性能大幅下降,而Full Attention在稳定性和可靠性方面表现更优[11][12][13] - 团队测试了多种Efficient Attention变体包括GDN和Mamba2,但实际表现均不及Full Attention[14][15] - 当前评测系统不完善,常用榜单无法有效区分Efficient Attention与Full Attention的性能差异,但在多跳推理或长链逻辑等复杂任务中Efficient Attention劣势明显[21][22] 数据处理策略 - 公司通过雇佣实习生处理数据来证明其数据处理流程的成熟度,即使缺乏经验的人员也能达到预期效果[24][27] - 数据质量衡量标准聚焦于思维链和Response两个维度,其中思维链要求逻辑完整且表述简洁,Response部分则刻意引入格式多样性以避免对特定榜单格式的过拟合[31][32][34][35] - 公司构建了基于规则和大模型判断的数据清洗流程,专门针对典型bad case进行清理,以消除模型幻觉和指令未遵循等问题[37][38] 模型思考模式创新 - 公司提出"交错式思维链"策略,使思考过程在显式推理与工具调用之间交替进行,形成"计划→行动→反思"循环,显著提升长链任务容错率和环境扰动适应能力[45][46][47][48] - 为解决模型工具调用能力泛化不足的问题,公司设计覆盖全轨迹扰动的数据链路,模拟工具变化、系统提示语调整、环境参数异常等多种真实场景,增强模型在不确定性中的任务完成能力[50][51][52] 技术发展路径 - 公司技术决策以工程理性为导向,优先考虑模型在真实任务中的稳定性与可用性,而非盲目追求算力节省,这一思路在MoE架构探索阶段已得到验证[53][54][55] - 模型定位强调实用性,旨在为开发者提供落地工具,注重解释逻辑和系统性迭代,而非参数堆叠的"炫技模型"[56][57]
量子位2025年度榜单冲刺申报中!企业/产品/人物榜正在征集
量子位· 2025-11-04 13:06
评选活动概述 - 正式启动2025人工智能年度榜单评选报名 旨在感受智能浪潮跃迁并给予同行掌声与鼓舞 [1] - 评选从企业、产品、人物三大维度设立五类奖项 包括领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物 [3][4] - 评选结果将于MEET2026智能未来大会上正式公布 报名截止日期为2025年11月17日 [19] 企业类奖项评选标准 - 领航企业参选需注册地在中国或主营业务面向中国市场 主营业务属人工智能及相关产业并居行业领先地位 [5] - 领航企业评选标准包括业务能力、技术能力、资本能力及其他综合能力 具体考察市场占有率、营收规模、科研实力、融资情况等 [10] - 潜力创业公司参选需未上市 拥有人工智能产品落地及可行商业模式 近一年在技术研发或行业应用取得显著成果 [11] - 潜力创业公司评选标准包括业务潜力、技术创新、资本能力及其他综合能力 具体考察商业模式、目标市场规模、融资情况等 [11] 产品类奖项评选标准 - 杰出产品参选需以人工智能技术为核心 已投入市场并获得用户反馈 近一年完成重要技术创新或迭代升级 [14] - 杰出产品评选标准包括产品力与技术力、落地情况及其他综合能力 具体考察功能完整性、性能表现、市场占有率等 [14] - 杰出解决方案参选需以自主创新人工智能技术为核心 已在实际场景中落地实施 近一年在技术融合或应用创新有显著突破 [15] - 杰出解决方案评选标准包括创新性、落地情况及其他综合能力 具体考察技术融合能力、应用模式创新、市场占有率等 [15] 人物类奖项及大会信息 - 焦点人物参选需国籍为中国或所属公司主体在中国 为创始团队成员或核心高管 近一年带领团队在AI技术或商业化取得显著突破 [21] - 焦点人物评选标准包括企业情况、个人能力及其他综合能力 具体考察企业行业地位、个人技术能力、商业能力等 [21] - MEET2026智能未来大会以共生无界 智启未来为主题 将邀请科技、产业与学术领域领军人物探讨人工智能+、AI Infra等前沿话题 [23][24] - 大会每年吸引上千名科技从业者参与 百万观众线上围观 近百家合作媒体联合曝光 已成为智能科技行业年度风向标 [24]
聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?
量子位· 2025-11-04 13:06
行业趋势与竞争格局 - 移动智能技术迭代推动手机端AI"超级入口"成为行业竞争新焦点,GUI Agent技术具备重塑流量分发格局的潜力,催生千亿级市场机遇[1] - 苹果、华为、字节跳动、美团、智谱AI等多家企业已积极布局该赛道,行业进入快速发展阶段[1] - 美团于2025年9月14日率先推出首个AI Agent,支持平台内"一句话点餐",标志着技术从研发走向实用化[1] 中兴通讯技术表现与商业化进展 - 在2025年10月17日SuperCLUE发布的AgentCLUE-mobile手机GUI Agent(离线)基准测评中,中兴通讯Nebula-GUI模型以7B参数量获得总榜银牌,总分84.38分,UI元素定位得分93.17分[1][2] - 该模型在自动点餐、订票等复杂任务中,准确率与操作速度远超业界其他模型,具备手机端侧部署落地能力[1] - Nebula-GUI的"一句话订票"、"一句话拍照"功能已在中兴终端努比亚Z70 Ultra、Z80 Ultra及红魔新品手机商用[3] - 截至当前,该模型已覆盖30余款主流APP,常用场景平均准确率超90%,未来计划进一步覆盖手机绝大多数APP与使用场景,并新增购物比价、旅游出行等场景级服务[3] 核心技术优势:数据制备系统 - 中兴开发了一套完整的端到端数据制备系统,包括数据标注工具、自动化数据PIPELINE、自动化轨迹数据生成系统,显著提升数据标注效率与质量[8] - 基于该系统生成的数据占训练数据的90%,整体覆盖出行、社交、生活服务等多元场景下的主流APP[8] - 通过引入GUI数据标注工具,数据标注效率实现了3倍提升,解决了中文GUI数据稀缺(公开英文数据集达百万级,中文数据仅数千组)、标注粒度粗、跨APP操作复杂任务轨迹数据不足等行业难题[9][12] 模型训练与优化方法论 - 公司通过构建VLA(屏幕截图+操作指令+执行动作)数据对,对模型进行系统性监督微调,使通用多模态模型进化为具备"感知-理解-执行-规划-纠错"能力的GUI操作智能体[22] - 自主构建了百万级规模的中文GUI数据集,覆盖数十款主流中文APP及数百种高频交互场景,同时整合了数百万条以英文为主的GUI样本,显著提升模型基础感知与语义理解能力[25][26] - 通过大量指令数据和精确思维链引导,模型单步操作平均准确率超过95%,部分简单指令操作达到99%准确率[31] - 引入双层强化学习范式,通过离线步骤级连续奖励与在线任务级强化的协同训练,设计了基于目标控件边界框的自适应空间感知连续奖励函数、基于概率模型的推理质量评估奖励及逻辑一致性奖励,提升模型决策效率与泛化能力[43][46][48]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-11-04 11:32
技术发展趋势 - 人工智能正重塑一切,成为新时代的基础设施[1][7] - 智能技术已从工具发展为深度理解人类需求的智能伙伴,渗透软件、硬件、机器人等形态[2] - 技术发展跨越产业、学科和场景边界,催生新生态和新机遇[3] - 多模态、AR/VR、空间计算等技术使数字世界与物理世界的界限模糊并融合[4] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力[5] 行业盛会与影响力 - MEET2026智能未来大会以“共生无界,智启未来”为主题,聚焦智能科技产业聚变[7][13] - 大会是第七届年度影响力科技商业峰会,每年吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光[9][12] - 过往嘉宾包括李开复博士、张亚勤教授等产业领袖,倪光南院士等多位学术领路人,以及百度、阿里、腾讯、华为等科技行业领军企业代表[9] 前沿议题与榜单发布 - 大会将探讨人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿话题[13] - 大会将重磅发布2025人工智能年度榜单,从公司、产品、人物三大维度评选五类奖项,包括领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物[16][17][18][19] - 量子位智库将照例在大会上发布《2025年度AI十大趋势报告》,提名具有巨大潜力的十大AI趋势并进行深入分析[23][24]
Qwen拿半成品刷下AIME'25满分,给别人留点面子吧……
量子位· 2025-11-04 11:32
数学推理能力 - Qwen3-Max-Thinking在AIME 25和HMMT25数学竞赛中达到100%准确率 [3] - 该模型在AIME 25测试中成绩为91%,超越GPT-5 Codex的98.7%和GPT-5的94.3% [6] - 模型成功解答IMO竞赛题,求所有实数α使得整数序列为n的倍数 [16] 编程与代码生成能力 - 模型一次成功编写Python程序实现小球在旋转六边形内弹跳的物理效果 [12][13][15] - 能够使用Three.js构建3D太阳系,但初始版本存在功能不完整问题,经提醒后优化了前端效果 [20][22][23] 产品状态与可用性 - Qwen3-Max-Thinking为早期预览版,目前仍在训练中 [3][9] - 该版本已在Qwen Chat提供免费试用,API同步上线阿里云 [9][31] - 模型在Thinking模式下思考时间较长,可能出现中英文混合思考情况 [25] 技术特点与行业影响 - 模型被描述为"半成品模型"但已展现强大数学推理能力 [1] - 有观点认为该模型完成度令人难以置信,在OpenAI内部动荡之际实现技术突破 [8]
微软机房大量英伟达GPU开始吃灰……
量子位· 2025-11-04 11:32
文章核心观点 - 微软面临大量英伟达AI芯片闲置问题,主要瓶颈并非算力过剩或芯片供应,而是电力基础设施和数据中心空间不足[1][2][3][4] - AI行业整体面临电力供应和基础设施建设速度远落后于算力需求的挑战,能源匹配问题成为制约发展的关键因素[10][11][36] - 行业策略正在调整,从追求峰值算力转向重视能源效率,同时向能源充足地区转移基础设施布局[30][38][39][43] 微软GPU闲置现状分析 - 微软CEO纳德拉确认公司拥有大量英伟达GPU因缺电和缺数据中心空间而闲置在库房[1][3] - 闲置主要原因包括缺乏电力供应以及缺少已建好并具备供电冷却能力的"warm shells"数据中心[5][6] - 纳德拉明确表示微软受到的是电力限制而非芯片供应限制[8] 行业电力基础设施瓶颈 - 美国整体电力需求因AI和云计算数据中心建设而超预期增长,公用事业公司发电规划滞后于实际需求[15][16] - 传统电厂从立项到并网需要数年周期,而AI产业扩张以季度计算,导致供需严重不匹配[17][21] - 光伏太阳能建设周期最短也需数月甚至一年,无法匹配AI需求快速变化节奏[19][20] - 数据中心开发商采用"计量表后"供电方式直接接入电力,试图绕过公共电网弥补供能缺口[17] 行业领袖观点与战略调整 - OpenAI CEO奥特曼认为AI用电需求将持续增长,高效算力将激发更多应用场景[24][26] - 奥特曼呼吁美国政府每年增加100吉瓦发电能力,将其视为"AI战略资产"[28] - 微软调整策略不再囤积单一GPU,因芯片若无法及时使用将在6年折旧周期内提前贬值[30][31][32] - 行业关注点从算力峰值性能转向能源效率,低能耗芯片需求凸显[38][39] 基础设施布局新趋势 - 微软获得批准向阿联酋运送英伟达芯片建设AI数据中心,未来四年将在海湾国家投资80亿美元[41][42] - AI基础设施呈现从硅谷向能源充足新兴市场迁移的趋势,中东地区因资金和能源优势成为新选择[43]
全新创作平台SkyReels来了!一张画布+一个对话框包办AI视频创作全流程
量子位· 2025-11-04 09:56
产品核心定位与优势 - 产品是昆仑万维旗下的全新AI视频创作工具SkyReels,旨在通过一体化画布简化多模态内容创作流程[1] - 核心优势在于将图像生成、音频配乐、视频剪辑等多个独立功能整合进一张可无限延展的画布,用户无需在不同工具和网站间切换,避免了频繁导入导出文件的操作[3][4][5] - 该设计让创作者能更专注于内容创意本身,而非技术实现流程,提升了创作效率[44][45][46] 多模态模型集成与功能 - 平台内置了众多海内外主流大模型,包括近期热门的Sora2、Veo3.1、NanoBanana等,用户可根据需求灵活选用[7] - 支持图生视频功能,用户只需将图片拖入视频功能区并输入提示词,即可让静态图片动态化,例如将黏土风拍立得照片转化为动态视频[9][11][13] - 具备音乐生视频能力,可先让AI生成一段特定风格的音乐,再根据音乐氛围自动生成匹配剧情的视频,展示了其理解情绪和自导自演的能力[15][16][17] - 支持风格迁移功能,能够用一张图的风格去影响另一张图,例如将肯德基老爷爷与上海外滩场景结合生成新图片[17][19] 智能代理系统 - 平台设有一个Super Agent作为总协作者,可随时响应用户需求,进行聊天、补全脚本、生成分镜等操作[21][22] - 提供28个Expert Agent专家代理,覆盖广告大片、故事书绘本、高质量海报等专业领域,能为特定需求提供深度且可直接使用的解决方案[24][26] - 专家代理能生成具有商业大片质感的内容,例如耳机产品广告图、毛毡风动画片段、咖啡店品牌视觉设计等[26][28][29] 模板化创作与数字人技术 - 平台内置近10个大类、150多种创作模板,涵盖AI数字人口播、产品功能演示、高阶创意广告等场景,用户选择模板即可快速生成内容[31][32] - 数字人技术是业内首个支持单镜头多人多轮对话的模型,能实现最长4分钟的连续嘴型同步,并支持32种运镜与Prompt控制,使多角色互动自然流畅[36] - 数字人示例展示了其精准的嘴型同步和细节处理能力,如双人对话场景和角色语速节奏控制[36] 视频后期处理能力 - 支持视频延长功能,可将短视频延长并智能补充新镜头,例如将2秒的猫咪打哈欠视频延长至6秒并添加俯视远景镜头,画面过渡顺滑[36][38] - 具备视频风格化处理功能,可对长达30秒的视频进行风格转换,在保留原动作的基础上套用剪纸、辛普森、像素风、梵高画风等多种视觉风格[40][42]