Workflow
Artificial Intelligence
icon
搜索文档
分割一切并不够,还要3D重建一切,SAM 3D来了
机器之心· 2025-11-20 10:07
文章核心观点 - Meta公司深夜发布其Segment Anything Model (SAM)系列的重大更新,包括SAM 3D和SAM 3 [1] - SAM 3D包含两个模型:专注于物体与场景重建的SAM 3D Objects和专注于人体形状与姿态估计的SAM 3D Body [2][5] - 公司同步开放了模型权重与推理代码,并推出全新平台Segment Anything Playground供用户体验 [7][8] SAM 3D Objects技术特点与性能 - 该模型提出全新技术路径,用于在单张自然图像中实现稳健、真实感强的3D重建与物体姿态估计,能从日常照片中重建物体的细致3D形状、纹理和场景布局 [11] - 核心创新在于通过强大的数据标注引擎突破真实世界3D数据难以大规模获取的瓶颈,并结合全新的多阶段3D训练流程 [15][22] - 借助数据引擎,公司在真实世界图像上总计标注近100万张图像,生成约314万个3D网格 [17] - 性能表现卓越:在3D形状指标F1 (0.01)上达到0.2339,显著高于对比模型(如Trellis + MegaPose的0.1436);在3D IoU指标上达到0.4254,优于Hunyuan3D1 + Foundation Pose的0.2937 [27] SAM 3D Body技术特点与性能 - 该模型旨在解决从单张图像中获得准确人体三维姿态与形体重建的长期挑战,即使图像中存在不寻常姿势、遮挡、多人同时出现等复杂情况也能保持高质量表现 [28] - 基于公司全新的开源3D网格格式Meta Momentum Human Rig (MHR),该格式通过将骨骼结构与软组织形体分离建模提供更强可解释性 [30] - 训练数据集包含约800万张图像,使其能够应对遮挡、罕见姿态和各种服装 [31] - 在多个3D基准测试中超越以往模型,例如在EMDB数据集上的MPJPE指标为61.7,优于4DHumans的98.0和NLF的68.4 [32] SAM 3技术特点与性能 - SAM 3引入可提示概念分割,模型能够根据文本提示或示例图像提示找到并分割某个概念的所有实例,克服了现有模型在面对细致、具体请求时的困难 [34][35] - 模型架构建立在公司以往AI进展之上,文本和图像编码器来自4月开源的Meta Perception Encoder,检测模块基于DETR [37] - 在概念分割性能上取得跨越式提升,将cgF1分数提升了两倍,优于基础模型和专业模型 [39] - 推理效率高:在H200 GPU上对单张包含超过100个检测目标的图像仅需30毫秒即可完成推理,在视频中约五个并发目标的情况下仍可保持近实时表现 [39]
刚刚,Yann LeCun官宣离职创业,瞄准高级机器智能AMI
机器之心· 2025-11-20 10:07
机器之心报道 机器之心编辑部 就在刚刚, 即将离职 Meta 的图灵奖得主 Yann LeCun 在 Threads、领英等社交平台上宣布已经开启事业的下一阶段: 创业 。 这家新公司的研发核心将是所谓的 Advanced Machine Intelligence ,即高级机器智能(AMI)。他写到:「新公司的目标是推动下一场 AI 的重大革命:让系统能 够理解物理世界,拥有持久记忆,具备推理能力,并能规划复杂的行动序列。」也就是说,这家新公司将继续他一直以来坚持的「世界模型」研究。 有趣的是,作为配图,他还发了一张与扎克伯格的合影。 图源: https://www.linkedin.com/feed/update/urn:li:activity:7397020300451749888/ 以下为 Yann LeCun 离职声明全文: 我非常感谢马克・扎克伯格、Andrew Bosworth(CTO)、Chris Cox(CPO)以及 Mike Schroepfer(First Senior Fellow)对 FAIR 的支持,以及他们过去几年对 AMI 计划的支持。由于他们持续的兴趣与支持, Meta 将成为 ...
通往通用人工智能的关键一步?DeepMind放大招,3D世界最强AI智能体SIMA 2
机器之心· 2025-11-20 10:07
机器之心报道 机器之心编辑部 您的 AI 伙伴「游戏陪玩」版已上线。 今天,Google DeepMind 发布了 SIMA 2 ,一个在虚拟 3D 世界中能自主游戏、推理并持续学习的通用 AI 智能体。 DeepMind 创始人哈萨比斯将其定义为 通往通用人工智能的关键一步 。 去年,谷歌 DeepMind 推出了 SIMA (Scalable Instructable Multiworld Agent,可扩展、可指导的多世界智能体),这是一个能够跨越多种虚拟环境、遵循基本指令 的通才 AI,标志着 AI 在 3D 世界中将语言转化为行动的初步探索。 SIMA 2 则代表了这一研究的重大飞跃,是创建通用和有益 AI 智能体研究的下一个里程碑。通过 集成 Gemini 模型 的先进能力,SIMA 正在从一个被动的、模仿 人类操作的指令遵循者进化为一个 交互式的游戏伴侣 。 SIMA 2 不仅能遵循人类指令,还能在未见过的复杂环境中(如各种开放世界游戏)进行自主规划、解释行动步骤、与用户实时对话(支持文本、语音或图像输 入),并通过试错与 Gemini 反馈的闭环机制自我迭代,提升技能。 这对机器人技术和人工智 ...
八年磨一剑,硅基智能冲击 “数字人第一股”:B 端红利难掩盈利薄弱与竞争压力
36氪· 2025-11-20 09:58
公司上市与市场地位 - 硅基智能于2025年10月底向港交所递交招股书,冲击“港股数字人第一股” [1] - 按收入计算,2024年公司在中国数字人智能体赛道排名第一,市场份额为32.2% [5] - 公司已完成8轮融资,融资总额超过10亿元人民币,投后估值达31.5亿元 [5] 业务发展与技术演进 - 公司核心理念为“硅基文明”,致力于通过AI技术打造“硅基劳动力”推动企业数字化转型 [1] - 技术发展经历三轮跃迁:2017年从语音赛道切入,2019年推出AIGC数字人,2024年推出多模态大模型DUIXONE [2][3] - 商业模式从“卖工具”转向“卖结果”,提供完整的API调用平台 [3] - 截至2025年10月底,已向多个行业客户提供超过8万个“硅基劳动力” [10] 财务表现与客户策略 - 2025年公司扭亏为盈,经调整净利润约为529万元人民币 [1] - 营收从2022年的2.23亿元增长至2024年的6.55亿元,但增速从138.12%放缓至23.40% [6] - 公司采取“小而美”战略聚焦B端大客户,平均客户价值从2022年的38万元提升至2025年上半年的113万元 [6][11] - 对大客户依赖度显著增加,五大客户贡献营收占比从2022年的56.4%升至2025年上半年的87.5% [10] 运营成本与盈利能力 - 2025年上半年实现经调整净利润528.9万元,但报告期内累计亏损超3亿元人民币 [11] - 销售成本逐年增长,从2022年的1.37亿元增至2025年上半年的2.23亿元 [12] - 毛利率波动下滑,从2023年的45.8%降至2025年上半年的31.6% [14] - 平均获客成本大幅提升,2025年上半年为15.8万元,是2022年的2倍 [11][12] 现金流与负债状况 - 2024年末现金及现金等价物为1.82亿元,同比增长7.69% [14] - 2025年完成D轮融资后,2025年6月末现金及现金等价物增至3.04亿元,缓解现金流压力 [14] - 2024年贸易应付账款高达1.16亿元,同比增长20.83% [14] 行业竞争与市场挑战 - 2024年中国数字人智能体市场规模为20亿元,全球为41亿元,预计2030年中国市场达155亿元 [11] - 百度、腾讯、华为等大厂凭借大模型技术和生态优势强势布局行业,同质化竞争加剧 [15] - 公司为抢占市场份额采取“竞争性定价”策略,挤压利润空间 [14][15] - 2025年上半年研发投入为6653.9万元,较2024年同期下滑18.95% [13]
谷歌Gemini 3模型获市场认可,Alphabet股价一度大涨超6%创新高
硬AI· 2025-11-20 09:53
Gemini 3 AI模型发布 - 谷歌正式发布最新AI模型Gemini 3,并在发布首日立即于谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用 [3] - Gemini 3是谷歌在约八个月前发布Gemini 2.5后推出的升级版本,能够为更复杂的问题提供更优质的答案,且无需过多提示即可判断用户请求背后的上下文和意图 [3] 模型性能与竞争力 - D.A. Davidson分析师称Gemini 3是真正强大的AI模型,在初步测试和AI基准评分中表现出色,足以与OpenAI和Anthropic发布的竞品展开竞争 [2][3] - 基于初步测试和基准评分,该模型实质性地推动了前沿技术的发展,在某些领域的能力远超通常对这一代前沿模型的预期 [4] - 美国银行证券分析师指出,Gemini 3代表谷歌在缩小与AI竞争对手之间"感知中的大语言模型性能差距"方面迈出的又一积极步伐 [2][7] 市场反应与股价表现 - Alphabet股价周三飙升5%,一度涨超6.6%创新高,随后涨幅收窄,截至发稿股价回落至293.76美元,涨幅逾3% [3][5] - 今年以来,Alphabet股价累计涨幅已超过55%,市场对其AI产品线的持续优化和竞争力提升反应积极 [10] 业务影响与采用情况 - AI Overviews和Gemini的健康采用指标表明,尽管竞争加剧,谷歌仍成功将用户引导至其AI界面,这有助于缓解对搜索业务可能受到冲击的担忧 [9] - 自OpenAI于2022年推出ChatGPT并引发生成式AI热潮以来,谷歌一直面临追赶压力 [8]
杨立昆官宣离职,感谢一圈Meta领导,只字不提亚历山大·王
36氪· 2025-11-20 09:52
杨立昆离职与创业计划 - 65岁的图灵奖得主、Meta AI首席科学家杨立昆宣布将于年底从Meta离职,计划创办一家专注于先进机器智能研究项目的初创公司[1] - 新公司目标是构建能理解物理世界、具备持久记忆、推理并能规划复杂动作序列的系统,将分析网络数据之外的信息以更好地呈现物理世界及其属性[1] - Meta将成为其新创业公司的合作伙伴[1] 杨立昆在Meta的职业生涯 - 杨立昆于2013年加入Meta并领导基础人工智能研究实验室,在Meta工作12年,其中5年担任FAIR创始董事,7年担任Meta首席AI科学家[3][4] - 他是2018年ACM图灵奖获得者之一,与Yoshua Bengio、Geoffrey Hinton合称"深度学习之父"[5] - FAIR的创建是其最自豪的非技术成就,他感谢了马克·扎克伯格等高管对FAIR及AMI项目的支持[4] 先进机器智能的技术理念 - AMI是Meta对AGI的内部代号,蓝图聚焦于理解物理世界、具备常识、持久记忆、能够推理和规划且可控安全的系统[3] - 杨立昆认为现有大模型对世界理解有限,需新计算架构开发在特定领域表现出色的系统,而非追求全能AI[9] - 今年6月他提出通过视频预测模型V-JEPA V2实现AMI,该系统通过预测视频内容抽象表示来学习物理世界行为[9] Meta的AI战略调整 - Meta在发布Llama 4后确定落后于竞争对手,决定放弃FAIR的长期研究,转向更快推出模型和AI产品[12] - 今年夏天扎克伯格斥资143亿美元聘请28岁的Scale AI创始人汪滔领导新"超级智能"团队,并收购Scale AI 49%股份[12] - 今年10月Meta在AI部门裁员600余人,包括曾协助启动FAIR的成员,新团队更倾向于封闭方式而非开源策略[14] 行业人才流动与技术路线分歧 - 今年11月Meta已损失两位顶尖大佬,此前PyTorch之父Soumith Chintala也宣布离职[3] - 杨立昆离职重要原因是Meta对FAIR的裁员和削减投入,以及新AI团队的加入[3] - 杨立昆创业并与Meta合作,被视为平衡自研基础模型与理解物理世界的世界模型两条技术路线的解法[18]
BigBear.ai's Sales Drop but Earnings Improve in Q3. What's Going On With the Stock?
The Motley Fool· 2025-11-20 09:30
财务业绩 - 第三季度营收3310万美元 同比下降20% 主要因陆军项目需求下降[3] - 净利润为250万美元 相比去年同期净亏损1510万美元有显著改善[4] - 盈利改善主要源于衍生工具公允价值减少2610万美元 此项为非经营性项目[4] - 上一季度因衍生工具公允价值增加1358亿美元 导致净亏损2286亿美元 远超903亿美元的经营亏损[4] 经营状况 - 公司专注于人工智能和数据分析领域 被部分投资者视为下一个Palantir Technologies[2] - 第三季度日常经营活动现金净流出960万美元[6] - 毛利率为2728%[6] - 公司持续出现经营亏损并消耗现金[6] 市场表现与估值 - 当前股价约为584美元 今年迄今上涨约36%[9] - 过去52周股价波动巨大 最低197美元 最高1036美元[2][6] - 市值约为28亿至30亿美元[6][9] - 日交易量9000万股 低于11100万股的平均成交量[6] 业务前景与风险 - 业务增长路径不一致 缺乏强劲的销售增长来证明进展[7] - 业务高度依赖政府支出 而当前政府支出前景并不强劲[10] - 作为高风险科技公司 需要强劲增长来说服成长型投资者[7]
李彦宏人民日报撰文
搜狐财经· 2025-11-20 09:25
文章核心观点 - “十五五”时期经济社会发展的主题是推动高质量发展,核心是加快高水平科技自立自强,积极发展新质生产力,人工智能对此作用关键 [1] - 推动人工智能更好赋能高质量发展的重要方面是让千行百业内化AI能力、构建AI原生能力,使之成为企业发展的原生推动力 [1] - 加强战略规划,让“AI赋能”成为发展共识,探索人机协同的新型组织和管理模式 [2] - 公司作为中国人工智能领域投入最早、布局最全的企业之一,有责任、有能力也有信心走在变革前列,将持续加大投入以助力行业智能化转型 [3] 人工智能产业发展现状与优势 - 过去几年,中国在人工智能算力基础设施和大模型等关键领域取得显著突破,算力规模跃居全球第二 [1] - 已涌现出DeepSeek推理大模型、文心原生全模态大模型等广受好评的基础大模型 [1] - 公司建成了国内首个自研的P800三万卡集群 [1] 人工智能与实体经济深度融合 - 中国是世界上唯一拥有全部工业门类的国家,推进人工智能与实体经济深度融合空间广阔、潜力巨大 [2] - 利用人工智能技术赋能矿业、化工、轻工、船舶等重点产业,有助于进一步夯实实体经济根基 [2] - 在交通、能源、物流、港口等复杂系统中,“伐谋”算法智能体专注于寻找全局最优解,已实现显著提效 [2] 人工智能赋能企业的具体路径与价值 - 瞄准重复劳动多、劳动力紧缺、岗位高危、流程瓶颈多、决策复杂度高等场景应用AI [1] - 用好AI在低成本内容生成、无人化、智能编码、智能算法优化等方面的优势,能帮助企业降成本、提利润、优决策、发现新增长点 [1] - 从决策到执行,从客户到供应链,让AI能力渗透到生产、经营、服务的每一个环节,是企业必须做好的课题 [3] - 千行百业立足自身优势内化AI能力,可激发通用模型与行业有机融合产生的化学反应,实现社会整体生产效率和创新能力的跃升 [2] 公司的战略定位与未来规划 - 公司将持续加大投入,构建领先的智能基础设施,研发更前沿的大模型技术,打造更开放的产业生态体系 [3] - 公司致力于助力千行百业内化AI能力、构建AI原生能力、加速智能化转型,为中国经济高质量发展作出新贡献 [3]
OpenAI宣布与零售业巨头Target达成合作伙伴关系
证券时报网· 2025-11-20 08:47
OpenAI宣布与零售业巨头Target达成合作伙伴关系。从下周开始,顾客可以在ChatGPT中浏览Target的 商品。例如,顾客可以向ChatGPT提问:"帮我计划一下假期电影之夜。"之后,顾客便可在ChatGPT上 浏览Target的商品,并根据ChatGPT的推荐将相应商品添加到购物车。当顾客准备购买购物车中的商品 时,系统会将他们引导至Target应用。 ...
Meta首席营收官与商业AI部门高管离职;爱诗科技拍我AI上线V5 Fast模式,视频生成速度提升30%丨AIGC日报
创业邦· 2025-11-20 08:08
更多AIGC资讯…… 1.【Anthropic CEO警告:AI将"消灭"半数白领初阶职务,失业率恐飙至20%】AI初创公司 Anthropic首席执行官Dario Amodei再次警告,生成式AI的快速进展可能在未来五年内"消灭"一半的 白领初阶职务,使失业率飙升至10%-20%。他点名三大高风险职业:初阶顾问、实习律师、新进金 融分析师。AI系统已经能接手这些新进通常负责的核心工作,包括撰写文件与进行分析。Amodei谈 到,他的担忧源自于观察到Claude已具备处理复杂的端到端工作能力,包含进阶客服、撰写技术内 容、分析医学论文,甚至撰写Anthropic内部近90%的源代码。( 钛媒体 ) 2.【Meta领导层大洗牌,首席营收官与商业AI部门高管离职】据报道,Meta首席营收官John Hegeman将离开这家社交网络巨头,这是该公司领导层进行的一系列变动之一,此前该公司面临着 投资者要求证明其代价高昂的AI战略合理性的压力。他的关键职责将由另一位Meta资深高管Andrew Bocking接管。去年11月才加入Meta领导公司商业AI部门的Clara Shih也将离职。(新浪财经) 3.【谷歌Dee ...