Workflow
空间智能
icon
搜索文档
两张图就能重构3D空间?清华&NTU利用生成模型解锁空间智能新范式
量子位· 2025-07-09 09:18
3D语言场景生成技术突破 - 提出LangScene-X生成式框架,仅需2张图像即可构建3D语言嵌入场景,相比传统NeRF方法所需的20个视角大幅降低输入要求 [2][4] - 攻克传统方法依赖密集视图的痛点,实现多模态信息统一建模,为空间智能领域开辟新路径 [3][5] - 模型能模拟人类认知方式,通过稀疏视觉输入建立融合语言理解的3D空间系统 [4] 传统3D语言场景生成痛点 - 密集视图依赖:传统方法如NeRF在仅2-3张输入时物体边界模糊率超40%,而真实场景获取密集视图成本高昂 [5] - 跨模态割裂:现有方法处理外观/几何/语义时模块独立,导致ScanNet测试中法线与RGB一致性误差达27.3° [6] - 语言特征压缩瓶颈:CLIP的512维特征直接嵌入导致内存占用高,场景切换时文本查询准确率下降58% [7] LangScene-X核心技术方案 - TriMap视频扩散模型:四阶段训练实现RGB/法线/语义协同生成,仅2张输入时法线-RGB误差降至8.1°,语义边界准确率提升63% [8] - 语言量化压缩器(LQC):通过向量量化将CLIP特征压缩为3维索引,重建误差仅0.0001,跨场景迁移无需微调 [10][11] - 语言嵌入表面场:渐进法线正则化使3D表面重建误差显著降低,"冰箱"查询中表面重合度达91.7% [12] 模型架构创新价值 - 单模型统合多模态生成,消除传统模块化流程低效问题,确保3D空间一致性 [14] - 语言量化压缩器实现高维特征跨场景泛化,内存占用减少90% [10][14] - 语言嵌入表面场技术实现文本与3D场景精准对齐,如"stuffed bear"可精确定位关联区域 [15] 实证性能表现 - LERF-OVS数据集上mAcc达80.85%(+31.18%),mIoU达50.52%(+10.58%) [16] - ScanNet数据集mIoU达66.54%,超越现有方法14.92%,分割掩码边界锐利度超越人工标注 [16] 应用前景 - 技术可应用于VR场景构建、人机交互、自动驾驶及具身智能等领域 [18] - 提供底层技术范式,具备成为空间智能核心驱动力的潜力 [18]
空间智能率先落地国民APP!实测:时空决策很顺滑,直达千人N面出行体验
量子位· 2025-07-07 14:13
空间智能技术落地 - 空间智能技术已具备实际应用条件,可围绕时间和空间进行预测推理,应用于世界模型、XR设备、自动驾驶及具身智能机器人等领域 [1] - 导航地图APP是空间智能最直接的落地场景,因其天然具备时空预测需求 [2] - 高德地图率先推出AI内测版,通过智能体"小高老师"实现时空动态决策,标志空间智能进入国民级应用阶段 [3][60][67] 小高老师智能体功能 - 实时响应复杂需求:根据用户时空状态提供出行/生活服务方案,整合多APP功能,如推荐避暑独处地点并直接调用导航 [3][5][6] - 多模态交互:支持语音/文字输入,输出包含路线规划、红绿灯数量、堵车预警等细节,并一键跳转导航 [15][47] - 场景化服务:覆盖旅游规划(如北京三天游)、特种兵行程(7天跨城)、本地探索(南锣鼓巷相邻景点推荐)及日常购物(童装/运动风店铺推荐) [9][27][31][33][40] - 深度细节支持:提供出片地点的最佳天气、穿搭色系、隐藏机位等专业建议,如青岛日落前2小时拍摄提示 [23][24] AI导航技术升级 - 超视距感知能力:通过视觉语言模型预测多路口红绿灯状态,计算最优车速实现连续绿灯通行,并预判事故/施工占道 [55] - 车道级动态优化:高速场景下实时感知车流变化、事故占道,推荐全局最优车道,提供变道决策支持 [57] - 安全预警系统:夜间或弯道等场景预判行车风险,如急刹车、大货车超车预警,通过语音/画面提醒 [57][59] 高德AI化底层逻辑 - 从工具型应用到时空决策智能体:基于实时位置、动态路况及用户意图输出唯一性方案,如安静看书到热闹商场的动态切换 [61][62] - 技术挑战突破:解决高维噪声数据实时处理(毫秒级决策)、多目标优化(权衡冲突目标)等难题 [63] - 生态优势:8亿月活用户提供海量交互数据,端侧场景天然适配实时空间决策需求 [65][66] 行业意义 - 空间智能价值验证:高德通过出行场景证明技术可落地性,推动数字与物理世界融合 [68][72] - 行业独特性:交通数据生态与AI技术结合形成壁垒,其他厂商难以复刻 [70] - 未来方向:从"怎么去"升级为"适合去哪里",实现千人千面甚至"一人N面"的个性化服务 [59][69][71]
前瞻全球产业早报:特朗普称各国将于8月1日开始支付新关税
前瞻网· 2025-07-07 13:19
极氪电驱技术 - 极氪将在7月9日推出全球首个基于纯电架构的豪华超级电混架构浩瀚-S(SEA-S)[2] - 浩瀚-S是全球首个全栈900伏高压混动架构[2] 淘宝补贴计划 - 淘宝启动500亿元补贴计划 为期12个月直补消费者及商家[3] - 补贴上线后餐饮连锁品牌和中小商家生意环比增长170%和140%[3] 人工智能与手机市场 - 李飞飞提出空间智能是AI下一个前沿领域[4] - 2025年5月国内市场手机出货量2371.6万部 同比下降21.8% 其中5G手机占比89.3%[4] 特斯拉香港调价 - 特斯拉下调香港Model 3售价 部分车型税后折扣最高达18%[5] - Model 3入门版配合"一换一"计划后售价低至24.9万港元[5] 腾讯产品升级 - 腾讯元宝搜索能力升级 支持呈现图片与视频号内容[6][7] - 微信优化聊天记录备份功能 支持自动备份至外部存储设备[9] 消费电子动态 - 苹果第二季度在华iPhone销量同比增长8% 为2023年以来首次增长[8] - 小鹏G7正式上市 三个版本售价19.58万-22.58万元[10] - 比亚迪汉家族全球交付累计超100万辆[11] 国际企业与政策 - 波音获得28亿美元美国卫星合同 涉及两颗卫星[14] - 特朗普称各国将于8月1日开始支付新关税 税率可能10%-70%[11] - 日本"春斗"工资整体涨幅5.25% 平均每月增加16356日元[12] 人工智能与芯片 - 微软推迟第三代AI专用芯片至2028年后 Maia 200芯片推迟至2026年[16] - CoreWeave成为首家部署英伟达Blackwell Ultra AI芯片的云服务商[18] - 马克·库班预测AI将造就全球首位万亿美元富豪[15][16] 融资与IPO动态 - 东链炬达完成500万元天使轮融资[18] - 山东华启教育完成1500万天使轮融资[19] - 江阴华新精密获证监会同意沪市主板IPO注册[20] - 深圳承泰科技向港交所提交上市申请[21] 企业运营调整 - UPS首次向美国全职司机提供自愿买断方案[17] - 英国试验显示四天工作制对企业盈利有利 17家机构保留该制度[13]
飞渡科技发布“峥嵘大模型”:开启空间智能新时代,让世界学会思考
金投网· 2025-07-07 12:26
公司技术 - 飞渡科技推出"峥嵘大模型"重新定义空间智能,赋予空间意义、结构与逻辑,使空间具备思考能力 [1] - 峥嵘大模型包含三大核心模块:峥嵘-C(空间理解引擎)、峥嵘-M(智能建模中枢)、峥嵘-G(生成仿真引擎) [2][3] - 峥嵘-C融合卫星遥感、LiDAR、街景等多源数据,解析数十亿级图像并破译文本空间语境 [2] - 峥嵘-M运用神经渲染、点云拼接等技术,实现毫米级精度建模与语义推理 [2] - 峥嵘-G基于真实物理规则实现高保真数字孪生与结构重建,支持复杂场景仿真 [3] 技术性能 - 峥嵘大模型在City3D、OpenScene等任务中刷新行业纪录,三维建模精度与语义识别准确率位列全球前列 [3] - 技术实现从数据到智能的全链路覆盖,展现行业领先的统治力 [3] 应用场景 - 峥嵘大模型将物理空间转化为机器可理解的语义结构,使空间从"可看见"进化为"可认知" [6] - 通过物理仿真与智能推演,模拟灾害演进、工业流程、城市运行等场景,提升决策精准度 [6] - 以三维建模复活文化遗产、复原历史场景,实现文明的数字传承 [6] 生态布局 - 公司计划逐步开放峥嵘大模型核心能力,包括Demo实时交互体验与API接口开源 [5] - 鼓励开发者基于真实场景进行二次开发,共建空间智能生态 [5]
DeepSeek给王一博道歉被当真,年度AI幻觉/马斯克Grok 4跑分曝光/华为盘古团队回应模型争议|Hunt Good周报
搜狐财经· 2025-07-06 11:35
Grok-4模型性能曝光 - Grok-4在HLE评估中基础得分35%,开启推理功能后提升至45%,显著领先OpenAI o3和Google Gemini系列[1] - 在GPQA测试中得分达87%-88%,代码能力评测SWE Bench得分72%-75%[2] - 新版本支持多模态输入、130k token上下文、结构化输出、数学推理和函数调用等功能[3] - Grok 4 Code将深度集成在Cursor编辑器,具备智能补全、调试和执行功能[3] 华为盘古模型开源争议 - 华为开源盘古7B稠密模型及72B混合专家模型,被质疑与阿里云通义千问Qwen-2.5 14B高度相似[4] - 华为声明盘古Pro MoE模型基于昇腾硬件平台独立开发,采用创新MoGE架构解决分布式训练负载均衡难题[5] - 承认部分基础组件代码参考业界开源实践,但严格遵循开源许可证要求[5] Cluely公司ARR快速增长 - AI面试辅助工具Cluely企业版推出后ARR一周内翻番至700万美元[7] - 产品实时分析用户在线对话生成隐蔽提示,应用于销售、客服和远程教学等场景[7] - 面临免费开源竞品Glass的挑战,增长持续性存疑[9] 特斯拉Optimus项目调整 - 暂停人形机器人零部件采购进行设计调整,预计耗时2个月[10] - 硬件存在关节电机过热、灵巧手负载低等问题,软件计划增加合成数据训练[12] - 原计划年产5000台目标恐难达成,目前仅完成约1000台[13] 百度搜索重大升级 - 搜索框升级为"智能框",支持超1000字文本输入和多模态交互[16] - 集成文心大模型和视频生成技术,可快速生成电影级短视频[17] AI基础设施投资热潮 - Amazon新建1200英亩数据中心与Anthropic合作,目标训练全球最大AI系统[21] - Oracle通过去中心化策略建立高效AI云基础设施[21] - 行业预计新建数据中心总投资超3200亿美元,年耗电量相当于百万家庭需求[23] Meta成立超级智能实验室 - 整合FAIR、大语言模型开发和AI产品团队,由Scale AI前CEO Alexandr Wang领导[24] - 吸引多位来自OpenAI、DeepMind和Anthropic的核心人才加入[26] - 计划未来几年投入数千亿美元发展AI基础设施和模型研发[26] 开源模型进展 - 百度文心4.5系列开源10款模型,包含47B和3B MoE模型及0.3B稠密模型[30] - 苹果开源DiffuCoder-7B-cpGRPO代码生成模型,EvalPlus基准性能提升4.4%[36] - B站开源AniSora V3动画视频生成模型,支持多种风格一键生成[34]
第二届中国空间智能AI设计大会:共启“AI共生力”新纪元
36氪· 2025-07-03 15:17
行业趋势 - AI技术快速发展并向各领域渗透,成为重塑行业形态的重要力量,从智能家居到医疗诊断、物流配送等场景无处不在[2] - 空间智能技术从单设备智能化升级为万物互联的"空间智能体",实现柔性化、交互化和自进化,重新定义生活空间设计逻辑[1] - 具身智能实现关键突破,Google DeepMind发布首个可本地部署的视觉-语言-动作模型,推动AI从云端依赖转向自主运行[4] 技术突破 - 预训练模型(BERT/GPT/deepseek)显著提升语言理解与生成能力,可处理复杂任务并输出高质量文本[4] - 计算机视觉取得突破性进展,AI系统能实现目标检测、语义分割、图像生成和视频分析等功能[4] - 智能体(Agent)技术成熟使AI从工具升级为执行者,Google开源A2A协议实现多智能体协同完成复杂任务[11] 行业活动 - 第二届空间智能AI设计大会以"AI共生力"为主题,推动AI与家居产业从技术革新转向生态协同[11][12] - 首届大会吸引现场超10,000人次参与,200+位行业领袖出席,直播观看量超5000万,媒体曝光超2亿[9] - 第二届大会聚焦人机共生、产业智变和生态孵化三级体系,构建开放共享的AI+生态体系[12][13][14] 应用场景 - AI在家居领域实现全流程智能化,覆盖设计、生产、营销、服务等环节[12] - Lovart AI可一键生成设计方案并完成从任务安排到落地交付的全流程[11] - Collov AI desk通过海量SKU探索和空间改造可视化提升顾客互动与转化率[22] 生态建设 - 大会构建"底层算力-技术平台-场景应用-终端服务"全链条生态体系[16] - 展示智能驾驶座驾、宇树机器人交互、全屋智控系统等跨界科技应用[22] - 开展研学实训与公开课体系,培育AI设计人才并提供商业化路径参考[22] 未来方向 - 推动AI贯穿需求洞察到场景落地的全链条,实现数据驱动的高效协同[12] - 探索设计师与AI智能体在创意生成、方案优化等方面的协作新范式[12] - 加速家居企业AI能力升级,构建可持续进化的AI+生态系统[25]
李飞飞最新YC现场访谈:从ImageNet到空间智能,追逐AI的北极星
创业邦· 2025-07-02 17:49
ImageNet与深度学习革命 - ImageNet通过提供大规模高质量标记数据集(80000+次引用)为神经网络成功奠定基础 开创数据驱动范式转变[8][9] - 项目历时18年孵化 初期算法错误率达30% 直到2012年AlexNet结合GPU算力实现突破性进展[11][14][16] - 采用开源策略和挑战赛形式推动社区共建 加速计算机视觉从物体识别向场景描述演进[12][17][19] 空间智能与World Labs布局 - 三维世界理解被定义为AI下一前沿 进化史长达5.4亿年 远超语言进化维度[24][25] - World Labs聚焦构建3D世界模型 团队集结NERF作者等顶尖人才 解决组合复杂度更高的空间智能问题[25][27][28] - 应用场景覆盖元宇宙内容生成 机器人学习 工业设计等 需突破硬件与内容创作双重瓶颈[30][32] 人工智能发展路径 - 视觉智能发展轨迹清晰:物体识别→场景叙事→空间智能 每阶段需5-10年技术积累[17][19][22] - 语言模型与视觉模型存在本质差异 前者依赖序列数据 后者需处理不适定的3D→2D投影问题[27][28] - AGI定义存在争议 但空间智能被视为实现通用智能不可或缺的组成部分[23][44] 创新方法论 - "智识上的无畏"被反复强调为突破性创新的核心特质 贯穿从学术研究到创业全过程[6][37][42] - 数据质量优先于数据规模 需采用混合方法获取高质量3D空间数据[47][48] - 跨学科研究与小数据理论被视为学术界可突破的潜在方向[41][42] 行业生态观察 - 开源策略应根据商业模型差异化选择 Meta等平台型企业更倾向全面开源[46] - 学术机构在计算资源劣势下 需聚焦工业界尚未关注的底层理论问题[41][42] - 硬件迭代与生成模型结合将推动元宇宙等场景落地[30][32]
科技制造领跑 银河通用完成新一轮融资|21私募投融资周报
21世纪经济报道· 2025-06-30 22:15
一级市场投融资概况 - 报告期内国内一级市场发生融资事件46起,其中40笔披露金额,总规模约90.32亿元人民币 [1] - 融资币种以人民币为主,共36起,美元融资3起 [2] - 科技与制造行业融资热度最高,先进制造、机器人、新材料分别完成8笔、5笔、5笔融资,披露金额分别为9.0亿、18.96亿、8.8亿元人民币 [3][4] 地域分布 - 融资地域集中度显著,北京市(10笔)、上海市(9笔)、广东省(8笔)合计占比超58% [5][6] 重点赛道融资动态 自动驾驶 - 哈啰Robotaxi完成超30亿元天使轮融资,创本周单笔最高纪录,投资方包括蚂蚁集团、宁德时代 [26] 机器人 - 银河通用完成11亿元融资,专注具身多模态大模型,宁德时代领投 [22] - 非夕科技完成约亿美元C轮融资,聚焦自适应机器人技术 [28] 半导体/芯片 - 蓝芯算力获数亿元Pre-A轮融资,研发RISC-V架构服务器芯片 [21] - 智汇芯联完成战略融资,推进5G-A无源物联网芯片研发 [32] 活跃投资机构 - 深创投本周出手3次,宁德时代通过2笔投资加码自动驾驶及机器人赛道 [8][9] - 溥泉资本联合宁德时代领投易控智驾超4亿元D轮融资,布局矿山无人驾驶 [42][43] 细分领域代表案例 消费服务 - 安心鲜生获2800万元A轮融资,拓展社区零售"超市+驿站"模式 [11] 医疗健康 - 承葛生物完成过亿元天使轮融资,专注微生态医疗 [19] - 霆升科技获近亿元B+轮融资,研发心腔内超声技术 [15] 新能源/材料 - 速方新能源研发富锂锰基正极材料,获千万元天使+轮融资 [40] - 朴烯晶完成近5亿元B+轮融资,突破超高纯聚合物材料 [63] 航空航天 - 穿越者载人航天获数千万元融资,推进亚轨道飞船研制 [50] 技术突破方向 - 中科祥龙聚焦金属3D打印,获亿元级A轮融资加速航空航天应用 [61] - 容锐科技基于合成生物技术完成近亿元Pre-A轮融资,切入保健食品原料市场 [54]
特斯联IPO再加速:复合增长58%冲击港交所
和讯· 2025-06-27 17:57
港股上市进展 - 特斯联更新招股书 港股上市进程更进一步 [1] - 港股市场估值优势明显 恒生指数预测市盈率企稳于9倍以上 南向资金持续流入 外资对中国资产兴趣抬升 [1] 财务表现 - 2024年营业收入达18.43亿元 同比增长83.2% 2022-2024年复合增长率达58.0% [2] - 2024年销售支出占收入比例由13.2%降至8.5% 三费总费用率由76.9%下降至45.0% [2] - 2024年12月31日后收到D++轮投资结余款项6.5亿元 新股东包含青岛汇铸等多家机构 [2] 业务发展 - AI产业数智化业务收入从2023年6.24亿元增至2024年16.4亿元 同比增长162.9% [3] - 截至2024年末在手订单金额达23亿元 客户数量提升至342个 [3] - 国际化战略加速推进 与阿联酋Ethara公司达成战略合作 为阿布扎比国家体育运动中心提供AIoT解决方案 [3] 技术布局 - 形成AIoT领域模型、AIoT基础设施及AIoT智能体三大核心板块 [4] - AIoT基础设施全线产品已完成对DeepSeek系列模型及其他开源模型的优化 [5] - 绿色智算体已完成国产芯片适配 支持华为昇腾等信创芯片 适配DeepSeek-R1/V3等前沿大模型 [5] - AIoT智能体以机器人与智能穿戴设备为核心载体 实现类人思考等多功能 [5] 研发实力 - 研发人员占员工总数46.9% [6] - 特斯联智联网实验室发布LoCKey新型方案 提高通信领域秘钥生成效率与安全性 研究成果被IEEE ICC 2024收录 [6] - IPO募资将主要用于增强研发能力 投资TacOS、绿色智算体及领域大模型研发 [6]
特斯联成为预在港上市的最大AI企业,强劲业绩吸引资本加持
搜狐财经· 2025-06-26 17:34
香港资本市场科技企业上市热潮 - 2025年1月至4月已有19家企业登陆港股 较去年同期增加4家 募集资金总额达213亿港元 接近去年同期的三倍 [1] - 截至5月20日共有24家公司在香港主板上市 合计募集资金突破600亿港元 [1] - 目前排队等待上市的企业数量攀升至约150家 特斯联是2025年预在港上市的最大AI企业 [1] 港股政策环境优化 - 港交所通过《上市规则》增设18A(生物科技)和18C(特专科技)章节 为未盈利创新企业开辟专属通道 [3] - 2025年5月港交所推出"科企专线"新政 允许特专科技及生物科技公司以保密形式提交申请 提升上市流程确定性 [3] - 赴港上市为AI 5G 智能汽车等领域企业提供国际资本池 助力海外拓展与品牌影响力提升 [3] 特斯联业绩表现 - 2024年实现营收18 43亿元 较2023年大幅增长83 2% [3] - 2022年至2024年营收年复合增长率达58 0% 位居行业增速前列 [3] - 2024年销售 管理及研发三项费用率总和由2023年的76 9%显著下降至45 0% [4] - 应收账款周转天数从2022年的238天缩短至2024年的104天 资金运转效率大幅提升 [4] 特斯联业务与融资进展 - 2025年初完成D++轮融资 引入青岛汇铸 青岛得厚等国有资本及诺哲瑞英 上海瑞力等产业基金 [4] - 围绕"空间智能"核心确立AIoT领域模型 AIoT基础设施及AIoT智能体三大战略方向 [4] - 截至2024年末在手订单金额达23亿元 AI产业数智化业务收入同比飙升162 9%至16 4亿元 占总收入比重89% [4]