Workflow
通用人工智能
icon
搜索文档
豪掷148亿美金、七位数薪资挖人、发布世界模型V-JEPA 2……扎克伯格终于坐不住了!
搜狐财经· 2025-06-12 17:14
Meta的AI战略布局 - Meta拟以148亿美元收购Scale AI约49%股份 若交易完成将成为公司史上最大外部投资 交易结构采用现金直接购买现有股东股份以避免反垄断审查 [2] - Scale AI估值将达300亿美元 2024年营收8.7亿美元 预计2025年超20亿美元 客户包括OpenAI、微软、通用汽车等 [3] - Scale AI创始人Alexandr Wang将卸任CEO并加入Meta超级智能实验室 该实验室由扎克伯格亲自组建 计划2025年投入650亿美元 [4][5] 人才与研发动态 - Meta向OpenAI和谷歌研究人员提供七至九位数薪酬方案 已成功挖角谷歌DeepMind顶级研究员Jack Rae等人才 [5] - 公司推出12亿参数世界模型V-JEPA 2 基于自监督学习训练 使用超100万小时视频和100万张图像数据 具备物理世界推理能力 [10][11] - V-JEPA 2采用两阶段训练 第一阶段学习基础物理规律 第二阶段引入62小时机器人控制数据 已开源并部署实验室机器人 [11][12] 行业竞争与合作伙伴 - Meta通过投资Scale AI获取高质量数据库 并探索国防军事应用 其Defense Llama模型已获五角大楼委托测试 [6][7] - 公司打破单干策略 首次大规模投资外部AI企业 此前曾参与Scale AI的10亿美元F轮融资 [6] - 行业呈现Transformer学派与世界模型学派之争 Meta通过V-JEPA 2推动后者发展 目标实现通用人工智能 [10][12] 技术突破与商业化 - V-JEPA 2实现"现实抽象数字双胞胎"概念 可应用于自动驾驶、仓储机器人等领域 显著降低训练数据需求 [10][11] - Meta同步发布IntPhys 2等三大基准测试 用于评估模型物理世界理解能力 强化行业标准制定话语权 [12] - Defense Llama基于Llama 3开发 专门支持美国国家安全任务 包括军事行动规划和对手弱点分析 [6]
蔡崇信:DeepSeek取得突破后,阿里巴巴工程师春节无休全力追赶AI浪潮
硬AI· 2025-06-12 15:04
阿里巴巴AI战略与竞争态势 - 公司在DeepSeek发布R1模型后意识到AI领域落后,工程团队取消春节假期加速开发,几周内推出Qwen系列模型[1][2][3] - Qwen系列模型成为全球最受欢迎的开源大型语言模型之一,公司全面转向聚焦通用人工智能(AGI)[3] - 未来三年将投入超过3800亿元人民币(约530亿美元)建设AI基础设施,包括数据中心[3] 开源策略与云计算协同 - 选择开源Qwen系列模型以推动AI应用普及,带动训练和推理需求增长,从而促进云计算业务发展[3][4] - 开源策略已与苹果公司建立合作,为iPhone提供AI技术支持[4] 公司经营现状与挑战 - 2024年第一季度销售额仅同比增长7%,AI领域大规模投资的回报仍不确定[4] - 2023年公司经历"巨大考验时期",存在扩张过快、方向迷失等问题[4] - 尽管面临挑战,管理层对未来发展保持乐观态度,认为公司"正走在一条非常好的路上"[4] 中国AI行业竞争特点 - 中国消费互联网环境充满活力,工程师群体存在激烈竞争文化,持续推动AI领域创新[2][3] - 行业竞争表现为快速响应机制,如阿里巴巴在竞品发布后迅速调整资源推出对标产品[1][2][3]
刚刚,LeCun亲自出镜,Meta推出新世界模型!
机器之心· 2025-06-12 08:53
Meta的AI战略布局 - 公司组建"超级智能团队"以实现通用人工智能 并提供9位数薪酬吸引人才[3] - 推出基于视频训练的世界模型V-JEPA 2 旨在开发能像人类一样认知世界的AI系统[4][5] - 首席AI科学家Yann LeCun强调世界模型是物理世界的数字孪生 可帮助AI理解物理规律并进行任务规划[6] V-JEPA 2技术特性 - 模型架构包含12亿参数 基于联合嵌入预测架构(JEPA)构建[8] - 包含编码器和预测器两大组件 通过自监督学习无需人工标注[16][18][19] - 训练分两阶段:使用超100万小时视频和100万张图像进行预训练 再用62小时机器人数据微调[20][21][25] 模型性能表现 - 在抓取任务(Grasp)成功率从8%提升至45% 放置任务(Pick-and-place)从13%提升至73%[12] - 动作预测任务(Epic-Kitchens-100)准确率达39.7% 超越前最佳27.6%[12] - 在Hugging Face物理推理榜单排名第一 超越GPT-4o等模型[34] 应用场景拓展 - 适用于辅助技术、混合现实指导、个性化教育等场景[6] - 在机器人领域实现零样本规划 新环境物体操作成功率65%-80%[26] - 对自动驾驶和家庭服务机器人具有重大意义[7] 新发布的基准测试 - IntPhys 2测试物理合理性判断 人类准确率85%-95%而当前模型接近随机水平[28] - MVPBench通过最小变化对减少模型作弊 评估真实物理理解能力[29] - CausalVQA专注视频因果关系理解 揭示模型在反事实推理方面的不足[32][33] 未来研究方向 - 开发跨多时间尺度的分层JEPA模型 应对复杂任务分解需求[36] - 探索多模态JEPA模型 整合视觉、听觉和触觉等感官信息[36] - 持续优化在物理推理和因果理解方面与人类表现的差距[28][33]
工信部两度部署“人工智能+”行动,产业进度条加快
21世纪经济报道· 2025-06-11 20:11
政府政策与行业支持 - 政府工作报告提出持续推进"人工智能+"行动,并将数字技术与制造优势、市场优势结合,支持大模型广泛应用,发展智能终端及智能制造装备 [4] - 轻工业、医药、食品等行业数字化转型政策密集出台,均提及人工智能赋能行业部署 [4] - 工信部专题会议部署"人工智能+"行动,强调推动大模型在制造业落地,加快全流程智能化升级,培育人工智能赋能应用服务商 [6] - 国家数据局等部门印发《"数据要素×"三年行动计划》,旨在解决数据供给质量不高、流通机制不畅等问题 [11] 人工智能产业发展与市场规模 - 2025至2029年中国AI产业预计保持32.1%的年均复合增长率,2029年市场规模突破1万亿 [5] - 2024年开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4% [10] - 利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14% [10] 具身智能与人形机器人 - 具身智能成为人工智能与机器人技术融合的核心赛道,人形机器人企业如宇树科技获得关注和融资,但实用价值遭质疑 [2] - 赛迪研究院报告显示,用户对人形机器人的使用体验和安全性存在疑虑 [3] - 智源研究院理事长黄铁军表示,5-10年内具身智能有望代替人类从事不愿干、危险的劳动 [3] 行业应用与企业实践 - 北京大学教授翁翕认为,行业应用将呈现爆发式增长,通过智能体、垂类大模型等形式加速渗透 [5] - 中国石油数智研究院建设昆仑大模型,为能源化工行业首个通过国家备案的行业大模型 [7] - 中国移动布局人工智能领域,形成超2000人的AI人才队伍,加快"九天"模型特色能力突破 [7] 技术挑战与解决方案 - 高质量数据集面临数据存量小产量低、质量良莠不齐、缺乏高价值数据引领等问题 [10] - 人形机器人产品构建面临感知系统和控制算法深度开发不足、实际场景数据积累不足等瓶颈 [10] - AI幻觉问题突出,图灵奖得主Yoshua Bengio提出研发非代理性人工智能系统和全球协同治理方案 [12] - 国家互联网信息办公室等发布《人工智能生成合成内容标识办法》,推动生成内容全流程安全管理 [13] 数据生态与算力发展 - 数据安全和流通问题限制数据生态发展,部分企业探索合规使用模式 [11] - 工信部印发《算力互联互通行动计划》,提出到2028年基本实现全国公共算力标准化互联 [12]
训推大模型,为何应该先彩排?
虎嗅APP· 2025-06-11 18:39
通用人工智能(AGI)发展路径 - 单点技术演进边际效应递减,系统性能天花板转向系统工程上限,需通过系统工程创新实现整体效能最优[1] - 华为推出《华为技术披露集》系列,首次全面详述技术细节,旨在构建开放协作生态系统助力昇腾生态发展[1][2] 大模型训推系统核心挑战 - 超过60%算力浪费在硬件资源错配与系统耦合上,传统优化方法难以解决算力-带宽-容量失衡的"三角矛盾"[3] - 大规模训练集群存在利用率黑洞,MoE模型需精准平衡计算与内存配比,通信占比压缩不当会导致效率骤降[5] - 动态实时推理系统需同时满足高吞吐与低延迟,万卡集群需实现毫秒级资源再平衡与故障容错保障长稳运行[6] 破局方案:"数字化风洞"技术 - 采用虚拟环境预演技术,小时级预演万卡集群方案,通过性能加速与高可用设计实现大模型"又快又稳"运行[7][8] - Sim2Train训练仿真系统实现并行配置、内存管理等自动寻优,支撑MFU达41%,算力潜能释放显著[8][9] - 动静态融合建模仿真方法通过有向无环图精准刻画计算/内存/通信需求,结合硬件刻画能力实现效率优化[9][10] 推理系统性能优化 - Sim2Infer推理仿真系统实现动态智能优化,端到端推理性能提升30%+,支持低延迟高吞吐部署[12][13] - 多层级建模仿真系统集成负载特征建模、离散事件驱动仿真等五大模块,实现软硬件协同加速创新[12][13] 高可用集群保障技术 - Sim2Avaliablity高可用仿真实现万卡集群分钟级快恢,可用度达98%,硬件可靠性瓶颈定位精准[15][16] - 马尔科夫链构建系统状态监控模型,结合蒙特卡洛分析实现故障随机模拟与集群硬件可控[16] 未来技术演进方向 - 新型应用如细粒度MoE、Agentic AI等驱动系统架构创新,需建模仿真支撑算力基础设施持续演进[18][20] - 华为将持续深化负载自动图化建模、多维架构耦合仿真等关键技术,推动国产算力基础设施建设[20]
IPO研究 | 预计2028年中国数据智能应用软件市场规模将达713亿元
搜狐财经· 2025-06-11 17:01
公司概况 - 明略科技已向港交所递交上市申请 中金公司为独家保荐人 [1] - 公司成立于2006年 是中国领先的数据智能应用软件公司 主要服务消费品 食品饮料 汽车 3C等行业及线下零售和餐饮连锁企业 [1] - 按2023年总收入计 公司是中国最大的数据智能应用软件供应商 [1] - 拥有2177项专利及926项专利申请 获得超过450项国内外奖项 在数据智能 企业知识图谱和数据隐私等领域拥有1167项发明专利 [1] 行业分析 - 中国数据智能应用软件市场规模从2019年的人民币144亿元增至2023年的人民币303亿元 2019-2023年复合年增长率为20 4% [2] - 预计2028年市场规模将达到人民币713亿元 2023-2028年复合年增长率为18 7% [2] - 数据智能应用软件主要分为营销智能 营运智能及其他类别 [2] 技术发展 - 通用人工智能背景下 数据 生成式AI模型及行业知识是企业获得竞争优势的关键因素 [1] - 企业可利用数据智能应用软件将运营数据价值转化为资本 结合生成式AI能力和行业知识生成数据驱动的工作流程 [1] - 该方法可优化垂直应用场景中的运营效率 提升客户体验 [1]
比亚迪长安等车企承诺账期不超60天,蔚小理尚未跟进;YU7外形被质疑抄袭,专家放话不侵权;喜马拉雅12.6亿美元卖身腾讯音乐
雷峰网· 2025-06-11 08:53
汽车行业动态 - 比亚迪、长安等传统车企统一承诺支付账期不超过60天,蔚小理等新势力暂未跟进[4][5] - 比亚迪股东会透露公司已投入1000亿元用于AI驾驶辅助领域,校招薪资水平超过华为[10][11] - 小鹏G7全球首发图灵AI芯片,支持30B参数大模型,将于6月11日亮相[25][26] - 华为与上汽合作的首款车型"尚界"伪装车曝光,预计2025年秋季上市,定位15-25万元市场[30] - 外媒报道比亚迪免费"天眼"系统冲击特斯拉FSD在华战略,中国车企在自动驾驶领域快速崛起[14][15] 科技与AI进展 - 智元研究院四足机器人完成导盲测试,成功引导视障人士抵达8楼目标位置[17] - Meta组建新AI实验室开发"超级智能",重金挖角OpenAI和谷歌人才[38] - 英伟达下一代AI芯片"Vera""Rubin"开发顺利,本月流片,2026年初量产[39][40] - 亚马逊宣布200亿美元投资宾州AI数据中心,创造1250个高技能岗位[43] - 百度网盘推出"AI相机",整合拍摄、修图、翻译等全模态功能[24] 消费电子与互联网 - 华为Pura 80系列6月11日发布,搭载国产1英寸主摄CMOS,起售价约5000元[32] - iOS 26设计语言引发争议,被指界面元素过大且缺乏创新功能[28] - 腾讯音乐12.6亿美元收购喜马拉雅,布局在线音频赛道[19] - TikTok宣布在英国新增500岗位并投资1.4亿英镑,扩大欧洲业务[39] - 谷歌修复漏洞:此前可通过暴力破解15秒获取账号关联手机号[44][45] 企业战略与人事 - 理想汽车成立空间机器人和穿戴机器人事业部,加码AI布局[34] - 格力电器称工业制品等板块具备分拆上市条件,芯片自研应用占比30%[34][35][36] - 商汤绝影世界模型研发负责人武伟离职,或选择创业[19][20][21] - 阿里影业更名为"大麦娱乐控股",业务方向调整[21] - 台积电调整海外建厂策略:美国项目加速,日欧项目因需求疲软放缓[13][14] 知识产权争议 - 小米回应YU7设计抄袭质疑,专家称外观专利判定标准为"可区分性"而非相似度[7][8] - 抖音副总裁回应618期间"水军"攻击,称虚假信息传播危害行业生态[22]
氪星晚报 |扎克伯格为Meta新 “超级智能”AI团队招聘人员;马斯克:SpaceX今年的收入将达到155亿美元;由微软支持的人工智能实验室Mistra...
36氪· 2025-06-10 19:00
劲仔食品 - 公司部分创新升级产品已进入胖东来系统 目前销售情况良好 [1] Meta - 扎克伯格正在组建专家团队以实现通用人工智能(AGI) 计划向Scale AI投资超100亿美元 [2] Uber与Wayve - 宣布计划在伦敦进行无人驾驶汽车测试 [2] 天康生物 - 5月销售生猪22.97万头 环比下降6.13% 同比下降9.67% [2] - 5月销售收入3.45亿元 环比下降9.21% 同比下降19.95% [2] - 5月商品猪销售均价14.02元/公斤 环比下降2.09% [2] - 1-5月累计销售生猪128.51万头 同比增长12.49% [2] - 1-5月累计销售收入19.02亿元 同比增长4.22% [2] 天合光能 - 目前超过1/3业务来自解决方案 未来两三年该比例将增至50%以上 [3] 平安好医生 - 品牌焕新为"平安好医生" 发布年度医健服务名片 [3] - 已建立覆盖29个科室约5万名医生团队 [3] - 链接10.5万家健康服务商 23.5万家药店 4000家医院 [3] SpaceX - 预计今年收入将达到155亿美元 [4] VinFast - 一季度交付36330辆电动汽车 同比增长296% [4] - 一季度总营收约6.57亿美元 同比增长149.9% [4] - 一季度净亏损约7.12亿美元 [4] 泡泡玛特 - 已注册数十枚labubu系列商标 [4] - 今年1月登记《LABUBU 与朋友们》动画剧集第一季剧本著作权 [4] 投融资 - 杭州氧宜居环保科技完成A轮5000万融资 用于车载负氧离子仪项目 [6] - 啵特叮咚完成2000万元天使轮融资 用于AI智能路由算法研发等 [7] - 龙兴航电完成亿元A++轮融资 杭州科创集团等参投 [8] - 光子跃迁获亿元天使轮融资 用于AI影像算法研发 [9] 新产品 - Mistral将推出其首个推理模型 [9] - 美团发布首款AI编程智能体产品NoCode [9] - 趣丸千音MCP Server上线 提供文本转语音等六大能力 [10] 行业监管 - 市场监管总局就《直播电商监督管理办法》公开征求意见 [10]
敢说永不掉线、秒级恢复,华为的底气是什么?
虎嗅APP· 2025-06-10 18:18
通用人工智能(AGI)与系统工程创新 - 单点技术演进边际效应递减,系统性能天花板转向系统工程上限,需通过系统工程创新实现系统效能最优[1] - 以整体视角重构路径,通过复杂系统的极致把控与再组织寻找技术突破可能,有望独立引领前沿技术发展[1] 高可用性核心基础 - 华为构建全栈可观测能力,包括集群运行视图、告警视图、网络链路监控等,提升故障感知能力[5] - 建立AI集群全系统可靠性分析模型,实现CloudMatrix超节点万卡集群MTBF大于24小时的硬件高可靠能力[6] - 提出超节点光链路软件容错方案,光模块闪断故障率容忍度>99%,新增10倍+光模块后闪断率低至电链路水平[6] 高可用性业务支撑 - 训练Pangu Ultra 135B稠密模型时,4K卡集群相比256卡基线线性度达96%;Pangu Ultra MoE 718B稀疏模型8K卡集群线性度95.05%[11] - 万卡集群训练恢复时间优化至10min以内,进程级重调度恢复缩短至3min,进程级在线恢复进一步压缩至30s[14] - 大EP推理架构采用三级容错方案,实例内重启恢复时间压缩至5min内,TOKEN级重试技术使故障影响减少60倍[16] 创新方案与未来方向 - 六大创新方案包括故障感知诊断、故障管理、光链路容错三大基础能力,以及集群线性度、训练快恢、推理快恢三大业务支撑能力[18] - 未来将在场景多元化、异构融合与资源池化、极致可观可测与智能自治免维三个方向持续探索[18]
一个md文件收获超400 star,这份综述分四大范式全面解析了3D场景生成
机器之心· 2025-06-10 16:41
3D场景生成技术综述 核心观点 - 南洋理工大学S-Lab系统梳理300+篇论文,将3D场景生成方法划分为四大技术范式:程序化生成、基于神经网络的3D表示生成、图像驱动生成、视频驱动生成 [2] - 领域自2021年起进入爆发期,主要驱动力为扩散模型、NeRF、3D Gaussians等新技术涌现 [4] - 当前技术面临生成能力不均衡、3D表征缺陷、数据瓶颈、评估标准缺失四大挑战 [16] - 未来发展方向聚焦高保真生成、物理约束引入、交互式场景、感知-生成一体化四大方向 [12][18] 技术路线分类 程序化生成 - 通过预定义规则/LLM先验自动构建复杂环境(如城市、地形),具备空间一致性优势 [8] - 细分方法包括基于规则生成(地形)、约束优化生成(室内)、LLM辅助生成(布局控制) [8] 神经网络3D表示生成 - 直接生成场景图/参数或3D表征(点云/NeRF/3D高斯),具备强三维理解能力 [8] 图像驱动生成 - 基于2D图像生成模型重建3D结构,包括整体生成(全景图)和迭代生成(图像序列) [9][14] 视频驱动生成 - 融合时空一致性,分为一阶段(端到端)和两阶段(时空分离控制)方法 [9][15] 性能评估维度 - 七大关键指标:真实感、多样性、视角一致性、语义一致性、效率、可控性、物理真实性 [7] - 不同方法在可控性/真实性/效率/一致性之间存在显著权衡关系 [7] 下游应用领域 - 覆盖3D场景编辑、人-场景交互、具身智能、机器人、自动驾驶等关键场景 [2] 未来技术突破方向 - 高保真生成需协调几何/纹理/光照/多视角一致性,提升材质建模与细节捕捉能力 [12] - 物理约束引入需结合可微分物理模拟器,保障物体移动/摆放符合真实规律 [18] - 交互式场景需实现动态响应能力,理解物体可用性/因果关系/多智能体逻辑 [18] - 感知-生成一体化需构建统一架构,双向增强场景理解与生成准确性 [18]