Workflow
量子位
icon
搜索文档
“智元机器人收购A股上市公司是创新需要…现金流能撑三年”
量子位· 2025-08-22 17:03
公司战略与融资 - 公司已完成对A股科创板公司上纬新材63.62%的控股[1] - 融资能力强劲 可随时启动融资 计划年底启动C轮融资并引入国际产业方[8] - 当前无营收 但现金流可支撑三年运营[8] - 未来三年计划投入数十亿资金孵化50个早期项目 已投15个早期项目 年化收益达8倍[8] - 启动"智元A计划" 目标三年内打造千亿级产业生态[8] 产品与商业化 - 2024年计划出货几千台机器人 2025年出货数万台 未来目标每年出货几十万台[8] - 商业化路径优先ToB场景 后续拓展ToC市场[8] - 落地场景从简单环境+简单任务逐步过渡到复杂环境[8] - 当前销售以直销为主 但计划2024年渠道占比提升至30% 2026年达到70%以上[8] - 重点布局展厅讲解接待和文娱表演场景 已与马来西亚i-city等国际伙伴签约[56][57] 技术研发与突破 - 团队规模超1000人 平均年龄31岁 其中75%为研发人员[8] - 研发投入中2/3聚焦AI算法 1/3专注机器人本体技术[8] - 实现24小时连续自主行走 突破极端环境适应性(地表温度61℃)[20][21] - 实验室测试已达连续行走3000小时 批量测试完成360小时无异常 正进行720小时测试[22] - 开发视觉SLAM与激光雷达融合方案 强化感知精度与安全性[36][38][39] - 发布动作驱动世界模型开源平台Genie Envisioner 采用3000多小时真实机器人数据训练[25][26] 数据战略与行业合作 - 行业处于数据早期阶段 公司通过杭州湾具身智能创新中心推动数据标准化与产业化[28][29] - 计划1-2年内积累大规模真实数据 目标达到大语言模型数据规模[29] - 采用"数据金字塔"策略 结合互联网数据与真机数据优化模型性能[35] - 与上市公司深度合作 借助其行业资源与资金加速落地[49] - 平台化开发生态 包括开源AMRT框架和AimIO嵌入式系统[45] 国际化进展 - 出海双路径并行:科研教育(北美合作)与商业化(东南亚、日韩、中东)[55][56] - 与英伟达、Skill AI达成数据驱动领域合作[55] - 东南亚市场进展最快 已落地马来西亚主题乐园机器人项目[56] 成本与效率优化 - 工业场景ROI回收周期因地区而异:绵阳约3年 上海约2年 海外可缩短至1年[59] - 通过客户协同优化作业效率 例如料箱转运时间从160秒压缩至40秒[60] - 与富临精工合作降低关节成本 推动整机成本下降[61]
只有5%AI项目在挣钱!MIT最新报告印证奥特曼警告
量子位· 2025-08-22 17:03
AI投资现状与市场热度 - 全球生成式AI投入在2025年上半年达到300-400亿美元,已超过2024年全年总和[5] - 高盛分析估计AI总投资额将飙升至2000亿美元[5] - 科技巨头投资活跃,亚马逊向Anthropic投资27.5亿美元,微软向OpenAI投资130亿美元,并有5000亿美元计划用于AI基础设施"星际之门"[3] AI项目投资回报率分析 - MIT与英伟达联合报告显示,仅5%的AI项目能创造百万美元价值,其余95%项目回报为零或仍处于亏损状态[1][4][8] - 企业完全自研AI工具的成功率仅为33%,而采购外部工具的AI项目部署成功率可达66%[12] - AI投资显著偏向成果更可见的前端职能(如营销邮件生成、智能评分),而采购、财务、法律等高ROI后端AI项目资金受阻[12] AI项目失败原因与挑战 - AI工具失败主因并非模型质量,而是与实际使用场景间存在学习差距,如在特殊情况失效、难以适应特定审批节点或数据格式[9] - AI工具需每次重新提供上下文背景信息导致效率低下,且多次出现同一错误难以纠正[9] - 多数用户仅愿使用AI处理邮件撰写、数据分析等简单任务,复杂任务仍更信赖人类同事[10] 行业应用与未来展望 - 科技与媒体行业已出现明显的AI结构性变革,而能源与材料、高端制造、金融服务、消费与零售、医疗与制药、专业服务等七大行业仍停留在试点阶段,呈现高关注低转化[12][16] - AI技术尤其是生成式AI已进入落地期,具备实际解决问题的能力,市场高估与低估并存,但AI是未来技术所向[14][15] - 微软、谷歌、Meta和亚马逊等硅谷巨头核心业务每年产生数千亿美元利润,即使AI开发连年亏损也不会立即面临资金危机,将持续加码AI投资[18]
阿里全新AI IDE现在免费用:超强上下文理解,覆盖整个代码库
量子位· 2025-08-22 13:51
产品定位与核心功能 - 专为真实软件开发设计的代理式编码平台 通过智能代理无缝融合增强的上下文工程技术 系统化解决软件开发任务 [3] - 能够深度分析用户代码库 自动生成清晰易懂的文档 类似项目维基百科 使团队成员快速理解项目全貌 [7][8] - 支持同时理解和修改多个互相关联文件 在修改前清晰展示所有更改 支持用户实时审查 [13][14] 技术能力与创新 - 集成全球顶尖编程模型 具备最强上下文工程能力 可一次检索10万个代码文件 [1][27] - 通过规则/记忆/代码图谱/索引四大技术支柱实现深度代码库解析 使AI达到真正"理解"而非仅"看到"代码 [24][26] - 集成长短期记忆系统 基于会话历史总结项目经验和个人偏好 存储为"笔记"实现自我学习和进化 [29] - 智能自动选择最合适LLM 在任务难度与响应速度/成本间自动取得最佳平衡 无需手动切换模型 [31][33] 用户体验与差异化 - 支持自然语言指令分解为可执行开发步骤 像人类搭档一样协同工作 [11] - 学习记忆用户编码风格/架构模式/技术栈偏好 保持舒适编程手感 [16][17] - Quest任务模式支持自然语言功能规格描述 自动理解规划并生成详细报告 实现高度自动化功能交付 [19][21][22] 市场推广与用户反馈 - 当前处于预览阶段 完全免费使用 支持英语和简体中文 [4] - 发布后获得广泛关注 用户试用评价较高 [34][35] - 提供论坛支持用户交流和错误报告 已有部分问题反馈 [39]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 13:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
量子位· 2025-08-22 13:51
核心观点 - 谷歌通过硬核数据反驳大模型高能耗舆论,强调Gemini单次查询能耗极低,仅0.24wh,碳排放0.03g CO₂e,耗水量约5滴,显著低于公众预期 [2][3][4] - 谷歌通过全栈优化(硬件、模型架构、服务系统)实现能效提升,一年内Gemini能耗降至1/33,碳排放降至1/44 [5][6][20] - 公司提出全面能源计算框架,涵盖实际芯片利用率、空闲资源、基础设施等要素,纠正理论计算偏差 [8][13][19] 能耗计算框架 - 现有理论计算方法仅考虑芯片运行能耗(如TPU/GPU耗电0.10wh),忽略实际部署中的关键因素 [8][9][10] - 谷歌提出综合计算指标,包括: - 实际芯片利用率(生产系统利用率低于理论最大值) [9][14] - 空闲计算机(为高可用性预留的容量消耗能源) [15] - 主机CPU和内存功耗(服务必需组件) [16] - 数据中心基础设施开销(冷却、配电等,PUE指标衡量) [17] - 用水量(冷却系统耗水,随能效提升减少) [18] - 综合计算后单次查询能耗为0.24wh(中位数) [19] 能效优化策略 - 模型架构:Transformer框架效率比传统语言模型高10-100倍,采用MoE、混合推理减少计算量 [22] - 训练优化:通过精准量化训练(AQT)降低能耗且保持质量 [23] - 推理服务:推测解码技术(小模型预测+大模型验证)、蒸馏技术(大模型生成轻量服务模型)提升响应效率 [25][26] - 定制硬件:自研TPU芯片(如Ironwood能效比首代高30倍),软硬件协同设计最大化每瓦性能 [27][28] - 资源调度:动态分配TPU资源减少空闲时间,高级编译系统(XML、Pallas、Pathways)提升运行效率 [31][32] - 数据中心:平均PUE达1.09(业界领先),增加清洁能源使用,优化冷却系统与水资源管理 [33] 环境指标对比 - Gemini单次查询全面能耗数据: - 能耗0.24wh(相当于微波炉运行1秒) [3] - 碳排放0.03g CO₂e(低于人类一次排放) [3] - 耗水量约5滴(若仅算TPU/GPU则为0.12ml) [3][9] - 能效提升成果:一年内能耗降为原1/33,碳排放降为1/44 [6]
首个故事可视化综合评估框架来了!80个故事单元53种类别,20种技术方案全面对比
量子位· 2025-08-22 13:51
故事可视化技术发展现状 - AIGC技术进步推动连环画与故事绘本生成成为电影生成叙事性的基础[1] - 故事可视化技术旨在用文字或照片生成连续图片序列[2] - 技术核心挑战在于确保角色形象一致性和构建复杂叙事场景[4] ViStoryBench评估框架设计 - 框架由阶跃星辰携手上科大、西湖大学联合提出[3] - 解决现有评估体系指标单一、维度局限的问题[4] - 特别关注题材多样性和视觉风格谱系等缺失维度[5] - 重视艺术表达与叙事逻辑的有机统一[8] 数据集构建特征 - 包含80个故事单元和53种故事类别[14] - 涵盖344个独立角色和509张参考图像[14][19] - 同时包含中文和英文内容[13] - 每个故事涉及2至10个角色[14] - 采用人工筛选与AI辅助相结合的内容采集方式[16] 评估指标体系 - 包含角色相似性、风格相似性、提示对齐度等多维度指标[22] - 角色相似性从跨相似性和自相似性两个维度评估[25] - 风格相似性基于CSD风格特征解耦能力[29] - 采用登场角色数量匹配度(OCCM)统计角色数量准确性[31] - 使用Aesthetic Predictor V2.5和Inception V3双模型评估美学质量[33] 实验设计与方法覆盖 - 评测超过20种技术方案包含18种主要方法及其变体[33] - 覆盖开源方法、商业产品和多模态大语言模型三大类别[33] - 测试GPT-4o和Gemini-2.0等先进多模态模型[38] - 评估白日梦、豆包、讯飞绘影等商业软件平台[42] - 所有商业产品测试在2025年5月1日至7日期间完成[44] 自动化测试结果分析 - Copy-Paste Baseline在IS分数和美学评分上表现优异但提示一致性显著偏低[55] - 商业模型展现差异化特征:Doubao和GPT-4o在提示一致性和角色数量匹配指标突出[59] - 豆包在角色一致性上获得3.63分(满分4分)的高分[59] - GPT-4o在主观美学上以3.28分夺冠[59] - 自动化指标与人工评价呈现高度相关性相关系数最高达0.7956[60] 技术局限性与发展方向 - 当前专注于多图像的帧间一致性而非同步音视频电影生成[62] - 现有开源方法不支持背景参考图像[62] - 部分方法使用非标准次生参考图像可能影响评估准确性[62] - 评估策略需要权衡专家模型和视觉语言模型的各自局限[62] - 数据集存在版权风险和数据偏好问题[62]
波士顿动力机器人终于有脑子了!人类故意使绊子也不怕
量子位· 2025-08-22 10:30
技术升级 - Atlas机器人升级为Atlas MTS版本,具备自然语言理解、自主动作规划和意外处理能力[1][8][21] - 采用4.5亿参数扩散Transformer模型,结合流匹配目标,处理30Hz图像、人体感觉和语言指令输入[17] - 通过模型预测控制器与VR界面结合,覆盖从精细操作到全身移动的全任务范围[19] 性能演示 - 成功处理箱盖意外关闭、箱子位置移动和遗漏装置等突发情况[2][4][6] - 学习能力覆盖系绳子、折叠椅子和翻轮胎等人类可演示动作[23] - 官方演示视频在YouTube获得超过10万观看量和1万点赞[9] 技术架构 - 端到端语言条件策略实现四步构建:数据收集、处理标注、网络训练和任务评估[14][15] - 电驱系统替代液压系统,提升响应精度、降低能耗并更好适配AI框架[29][30] - 具备3D空间感知和实时物体追踪能力,支持复杂工业任务自主执行[36] 行业对比 - 宇树科技电驱产品线包含H1(65万元)、G1(9.9万元)和R1(3.99万元)三款人形机器人[41] - H1型号实现3.3m/s移动速度,峰值负载21kg,支持模仿学习和强化学习[41] - 电驱技术趋势推动机器人向轻量化(25kg)、低成本化和AI集成化发展[40][44]
OpenAI头号叛徒,竟然是自学的AI???
量子位· 2025-08-22 10:30
公司发展历程 - Anthropic由前OpenAI核心团队成员创立 专注于AI安全和规模化计算[45] - 公司最初仅有7位联合创始人和100多名员工 资金实力远不如OpenAI[45] - 通过Claude 3.5 Sonnet实现技术突破 市场份额从追赶者跃升至32%[17] 技术突破与产品特性 - Claude 3.5 Sonnet在多项基准测试中超越竞品:GPQA钻石级推理59.4%(0-shot CoT)[15]、MMLU 88.3%(0-shot CoT)[15]、代码HumanEval 92.0%(0-shot)[15] - 采用"快乐教育"开发理念 注重内部基准测试和dogfooding实践[7] - 将模型视为用户而非工具 鼓励开发者参与训练过程[10] - 上下文窗口扩展至100万tokens 超越行业标准[25] 市场竞争格局 - OpenAI市场份额从50%下降25% 而Anthropic占据32%市场份额[17] - 在编程细分领域 Anthropic市场份额超过OpenAI两倍以上[17] - 获得Cursor等关键客户支持 其编程默认模型从GPT切换至Claude[20] - 主动切断Windsurf等竞争对手的API访问权限[21] 人才发展路径 - 核心技术人员通过6个月自学完成AI领域转型[2][36] - 学习路径包括Coursera机器学习课程、Kaggle项目和实践项目开发[38] - 关键突破来自规模化计算和Scaling Laws的应用[41] - 主导GPT-3开发 将模型参数从15亿扩展至1700亿[41] 行业技术演进 - Transformer架构持续优化 引入局部稀疏注意力和预正则化技术[41] - 模型展现卓越的少样本学习能力 实现多任务自然语言处理[41] - 计算资源分配和GPU管理成为模型训练的关键要素[46] - 模型在代理式编程和复杂任务执行方面出现意外突破[14]
清北浙领跑两院新院士候选!最年轻被提名人39岁
量子位· 2025-08-22 10:30
院士增选总体情况 - 中国科学院公布2025年院士增选有效候选人639人,中国工程院公布660人[2][3] - 两院新增院士各不超过100名,预计11月公布结果[4] - 中国科学院候选人数量较2023年增长约9.6%,中国工程院增长约0.8%[7][8] 学科分布情况 - 中国科学院院士增选学科人数分布:数学物理学部98人、化学部105人、生命科学和医学学部125人、地学部96人、信息技术科学部61人、技术科学部104人、特别领域50人[8] - 中国工程院院士增选学科人数分布:机械与运载工程学部68人、信息与电子工程学部68人、化工冶金与材料工程学部71人、能源与矿业工程学部72人、土木水利与建筑工程学部91人、环境与轻纺工程学部73人、农业学部83人、医药卫生学部91人、特别通道43人[10] 院校候选人分布 - 清华大学以58名候选人位居榜首,北京大学55名位列第二,浙江大学39名排名第三[10] - 候选人数量前七院校:上海交通大学31人、复旦大学25人、南京大学25人、中国科学技术大学22人[10] - 最年轻候选人来自苏州大学,年仅39岁[12] 人工智能领域地位提升 - 人工智能在中国科学院增选指南中首次成为独立学科,单独分配1个名额[15] - 中国工程院将机器人技术新增为优先支持学科,与人工智能、自动化系统技术并列[19] - 信息三组(含人工智能、机器人技术)获得4个增选名额,体现政策倾斜[19] 人工智能领域候选人 - 信息与电子工程学部候选人包含多位人工智能领域学者,如北京航空航天大学曹先彬(1969年出生)、华中科技大学冯丹(1970年出生)[23] - 知名人工智能学者入选名单:科大讯飞胡国平(1977年出生)、清华大学唐杰(1977年出生)、北京大学朱松纯(1969年出生)[23][24] - 上海交通大学在信息与电子工程学部有4位候选人,清华大学、中国科学技术大学、北京大学各有3位[22] 推荐人情况 - 中国工程院院士王坚推荐清华大学史元春教授[27] - 郑南宁院士推荐北京通用人工智能研究院朱松纯教授[27] - 吕建院士推荐南京大学周志华教授[27]
小扎“亿元俱乐部”车门焊死!被曝冻结招聘,禁止内部人员流动
量子位· 2025-08-22 08:59
公司战略调整 - Meta超级智能实验室冻结招聘并禁止跨团队调动 公司发言人证实此为基本组织规划 旨在为超级智能工作创建坚实结构[1] - 公司首席AI官Alexandr Wang澄清称对超级智能实验室的投资将持续增加 否认冻结招聘的负面报道[1] - 招聘冻结政策要求任何例外需经首席AI官Alexandr Wang批准[6] 人才招聘动态 - 截至8月中旬 Meta从OpenAI招聘20多名研究人员和工程师 其中13名来自谷歌 3名来自苹果 3名来自xAI 2名来自Anthropic 总计50多名新员工[4] - 新招聘高管团队包括Nat Friedman(前GitHub CEO)任超级智能实验室副总裁 Daniel Gross任产品副总裁 Yann Le Cun继续担任首席AI科学家[5] - 新聘研究人员主要来自DeepMind、OpenAI和谷歌等机构 涵盖视觉变换器、扩散模型、多模态对齐等前沿领域[5] 内部管理挑战 - 新老员工因薪酬待遇悬殊产生摩擦 部分研究人员威胁辞职[7] - 高薪新员工与现有员工的文化冲突削弱工作动力和忠诚度[8] - 公司面临整合新旧团队与化解内部矛盾的运营挑战[9] 组织架构重组 - AI部门在六个月内进行第四次重组 新成立"Meta超级智能实验室"拆分为四个独立小组[10][11] - TBD实验室由Alexandr Wang负责 专注高风险创新技术及Llama大语言模型开发[12][15] - 产品与应用研究组由Nat Friedman领导 推动技术产品化落地[12][15] - 基础设施组由Aparna Ramani负责 支持AI研发所需的硬件和平台[12][15] - 基础人工智能研究组由Robert Fergus领导 专注长期基础科学研究[12][15] - 此前为推进Llama模型成立的"AGI Foundations"团队被解散 成员分配至新团队[12] 行业环境与财务表现 - MIT报告显示95%的公司在AI投资上零回报[14] - OpenAI CEO Sam Altman将当前AI热潮比作互联网泡沫[17] - Meta2025年第二季度营收达475.2亿美元 同比增长22% 净利润183.4亿美元 同比增长36%[19][20] - AI驱动的广告推荐系统使Instagram广告转化率提升5% Facebook提升3% 用户停留时间分别增加6%和5%[18] - 2025年资本支出预测为660亿-720亿美元 2026年费用增长率将超过2025年[20] - 摩根士丹利警告薪酬激增可能在没有明确创新收益的情况下稀释股东价值[20] 战略展望 - 招聘冻结未给出明确时间表[21] - 公司在AI竞赛中需调整节奏并评估战略 为下一阶段冲刺做准备[22]