Workflow
Google Gemini 2.5
icon
搜索文档
Google Gemini、MiniMax更新大模型,全球首个智能眼镜支付上线丨新鲜早科技
21世纪经济报道· 2025-06-18 10:16
巨头动向 - Google Gemini 2.5模型家族更新,包含Gemini 2.5 Flash-Lite支持多模态输入和工具接入,Gemini 2.5 Flash统一Token定价标准为每百万Token 0.3美元,Gemini 2.5 Pro在多个基准测试超越竞品 [2] - MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1,支持100万上下文输入和8万Token输出,RL成本下降至53万美元 [3] - 月之暗面开源代码大模型Kimi-Dev-72B,在SWE-bench Verified测试中以72B参数量取得60.4%高分,超越671B参数的DeepSeek-R1 [4] 智能终端与出行 - 鸿蒙智行周交付达11600台连续4周破万,问界M8单周交付突破5000台,上市45天累计交付超20000台 [5] - 京东外卖日订单突破2500万单,入驻餐饮门店超150万家,全职骑手超12万人预计本季度末达15万人,北上广深骑手平均月收入1.3万元 [7] - 理想汽车回应美团CEO王兴减持573.7万股套现超6亿港元,持股比例从20.94%降至20.61% [9] 人工智能应用 - 微信测试聊天记录备份至外部存储设备功能,支持U盘/移动硬盘多份备份管理 [6] - 豆包AI上线播客功能,可基于PDF/网页生成双人对话节目 [8] - Rokid联合支付宝推出智能眼镜支付方案"看一下支付",支持语音指令完成付款 [9] - 夸克发布AI学习产品"夸克老师",具备讲题、批作业、出题等家教功能 [13] 半导体与硬件 - 芯聚能半导体车规级SiC芯片实现全链条自主可控并批量上车,主驱模块进入大规模交付阶段 [14] - DDR4内存条价格大幅上调但成交乏力,部分DDR4颗粒现货价已超DDR5 [15] - 兆芯集成科创板IPO申请获受理拟募资41.69亿元,投向服务器/桌面处理器等项目 [16] - 思特威公告国家集成电路基金二期持股比例由7.35%降至6.99% [21] 资本运作 - 曹操出行港股招股拟募资18.53亿港元,估值228.23亿港元引入6名基石投资者 [17] - 京东方A拟48.49亿元收购咸阳彩虹光电30%股权 [18] - 吴通控股拟8400万元收购智能电子20%股权 [19] - 蓝星光域完成数千万元B轮融资用于激光通信技术商业化 [20] 企业合作 - 国芯科技抗量子密码卡CCUPHPQ01测试成功并向多家客户送样 [10] - 德马科技与智元新创达成战略合作探索具身智能机器人在物流场景应用 [11] - 传音控股与印尼电信运营商IOH合作推动5G终端渗透和移动互联解决方案 [12]
中金 | AI智道(9):多模态推理技术突破,向车端场景延伸
中金点睛· 2025-06-03 07:45
多模态推理技术进展 - 2025年3月Google发布Gemini 2.5模型,原生支持文本、图像、音频、视频、代码库等多模态输入,并在LMArena排行榜超越GPT-4.5和Claude 3.7 [1][2] - 2025年4月阶跃星辰发布多模态推理模型Step-R1-V-Mini,商汤发布SenseNova V6模型,后者实现10分钟长视频理解能力 [2] - 2025年5月MiniMax开源视觉RL统一框架V-Triune,使VLM掌握视觉推理和感知的统一能力 [2] 技术架构创新 - MiniMax V-Triune框架采用三层组件架构:多模态样本数据格式化、异步客户端-服务器架构的验证器奖励计算、数据源级指标监控 [3] - 通过动态IoU奖励机制和冻结ViT参数等优化,Orsta 32B模型在MEGA-Bench Core基准测试性能提升14.1% [3][6] - 商汤SenseNova V6采用多模态长思维链构建、多模态强化学习和多模态全局记忆技术创新 [2] 智能驾驶应用 - 蔚来NVM世界模型具备全量理解、想象重构和推理能力,在ETC车道通行和停车场寻路等场景性能显著提升 [3][7] - 理想自研VLA大模型通过多模态推理模拟人类驾驶员思维运作方式 [3] - 多模态推理技术可增强道路交通标志识别判断能力,提升复杂场景泛化性 [3] 性能对比 - Orsta 7B模型在MEGA-Bench Core测试中相比骨干模型提升3.2个百分点 [6] - Orsta 32B模型在知识、数学、感知等多项指标上实现5.9-20.2个百分点的提升 [6] - 在32B+模型对比中,Orsta 32B-0326版本相比骨干模型在核心指标提升2.1个百分点 [6]