Workflow
全模态模型
icon
搜索文档
「CV 铁三角」落定Meta,视觉 AI 如何向多模态演进?
机器之心· 2025-07-19 13:49
Meta挖角「CV铁三角」与多模态AI演进 - Meta近期高薪挖走OpenAI苏黎世办公室的「CV铁三角」(Lucas Beyer、Alexander Kolesnikov、Xiaohua Zhai),三人曾在GoogleBrain/DeepMind共事并主导多项视觉AI里程碑研究 [4][5] - 「CV铁三角」的五项核心成果构成多模态AI基础框架: - **S4L(2019年5月)**:通过自监督+半监督学习减少图像分类对人工标注的依赖 [5] - **BiT(2019年12月)**:验证视觉领域大规模预训练→微调范式的可行性,被CLIP/SAM等沿用 [6] - **ViT(2020年10月)**:首次将纯Transformer应用于视觉任务,打破CNN垄断并实现跨模态特征关联 [6][7] - **MLP-Mixer(2021年5月)**:用双层MLP替代卷积/自注意力机制,简化架构同时保持性能 [7] - **PaLI系列(2022年9月起)**:谷歌多模态统一尝试,将图像+语言任务转化为文本生成 [7] - 研究轨迹覆盖从图像分类到多语言对话,为Omni-LLM全模态模型奠定技术路径 [5][7] Multi-Agent协作与RAG技术争议 - 检索增强生成(RAG)被质疑为过渡方案,需与持续状态memory机制互补以支持动态上下文迁移 [2] - 多智能体环境需解决多层级memory架构设计挑战,包括语义漂移、上下文污染及优先级管理 [2] Perplexity挑战谷歌搜索霸权 - Perplexity通过AI原生浏览器突破流量限制型AI瓶颈,创始人Aravind Srinivas构建资源效率型产品护城河 [3] - 谷歌因现有搜索业务模型限制,难以推出非流量受限的AI产品 [3] 行业动态统计 - 本期通讯覆盖30项AI&Robotics要闻,含技术进展10项、国内动态8项、国外动态12项 [3]
整理:每日科技要闻速递(5月27日)
快讯· 2025-05-27 07:36
新能源汽车 - 碳酸锂期货价格跌破六万大关,反映原材料价格下行趋势 [1] - 比亚迪引发行业价格战担忧,业内认为"隐性降价"策略可能长期存在 [1] 科技与AI - 腾讯将发布全球首个全模态模型"混元-O",展示AI领域技术突破 [2] - 微软开源浏览器Agent工具,支持实时跟踪与控制智能体 [2] - 苹果计划对全平台操作系统进行设计革新,可能涉及用户体验升级 [2] - OpenAI计划设立首尔办事处,扩大亚洲市场布局 [2] - 美团透露其新代码约52%由AI生成,体现技术应用深度 [2] 半导体与硬件 - 三星HBM3E内存通过英伟达单芯片认证,成品认证或延迟至下半年 [2] - 小米否认玄戒O1芯片为Arm定制产品的传闻,澄清市场传言 [2] 医药与生物科技 - 优时比在中国上市重症肌无力创新药优迪革,拓展治疗领域 [2] 互联网与消费 - 美团一季度一线城市高频骑手月均收入达10010元,反映劳动力成本 [2] - 美团王兴回应京东外卖竞争,强调将不惜代价保持市场地位 [2] 消费电子 - 苹果可能调整iPhone发布策略,改为一年两次新品发布 [2]
王健林再卖48座万达广场,腾讯等“熟人团”接盘;两辆车在充电站起火燃烧,蔚来回应;董明珠孟羽童合体带货500万元丨邦早报
创业邦· 2025-05-26 08:03
万达商业资产出售 - 太盟投资集团联合腾讯控股、阳光人寿等机构共同设立合营企业,收购大连万达商业管理集团持有的48家万达广场项目公司100%股权,涉及北京、广州、成都等多个一二线城市[3] - 交易已获国家市场监管总局无条件批准,但具体金额未披露[3] 新能源汽车行业动态 - 比亚迪推出限时促销活动,涉及王朝网、海洋网共22款智驾版车型,最高补贴优惠5.3万元,其中海豹07DM-i智驾版价格从15万多元降至10.28万元[12] - 蔚来2025款ET5/ET5T车型上市,起售价29.8万元,新增两款车色并升级智能座舱配置[13] - 比亚迪4月欧洲电动汽车销量达7231辆,同比增长169%,首次超越特斯拉成为当地销量十大品牌之一[19] 人工智能与科技行业 - 英伟达将为中国市场推出基于Blackwell架构的AI芯片,售价6500-8000美元,低于H20芯片,预计6月量产[9][10] - 腾讯计划6月发布首个端到端语音通话模型Hunyuan-Voice,并规划推出全球首个"全模态模型"混元-O[12] - 苹果智能家居中枢产品因AI技术推进未达预期推迟至年底发布,配备7英寸显示屏并支持HomeKit控制[10] 消费电子与硬件 - 大疆Mini 5 Pro、Avata 3和Neo 2无人机正在开发中,Mini 5 Pro预计9月发布,Avata 3将配备更大相机传感器[17] - 微软可能砍掉Xbox游戏机硬件,目前在开发的下一代主机或为最后一代产品[12] 机器人技术 - 全球首个人形机器人格斗赛在杭州举行,宇树G1机器人展示出较强的稳定性与敏捷性,能完成侧踢、组合拳等动作并在8秒内起身[7] 区域产业政策 - 广州将出台游戏电竞产业扶持政策,设立专项经费支持研发、赛事、场馆建设等全产业链环节[19]