Workflow
Art
icon
搜索文档
看遍奥斯卡后,VLM达到电影摄影理解新SOTA|上海AI Lab开源
量子位· 2025-07-16 09:49
ShotBench团队 投稿 量子位 | 公众号 QbitAI 当前最强大的视觉语言模型(VLMs)虽然能"看图识物",但在理解电影方面还不够"聪明"。 上海人工智能实验室联合新加坡南洋理工大学 S-Lab、同济大学和香港中文大学,正式推出 ShotBench ,配套模型 ShotVL 及训练集 ShotQA ,为VLM的"电影感"打开评测与训练的双重缺口。 ShotBench是一个专门为电影语言理解设计的综合基准。 它包含超过3.5k个由专家标注的图像和视频片段问答对,来自超过200部备受赞誉 (主要是 奥斯卡 提名)的电影,涵盖 八个关键电影摄影维度 ——景别、取景构图、摄像机角度、镜头焦距、照明类型、照明条件、构图和 摄像机运动。团队按照严格的标注流程,结合经过训练的标注员和专家监督,确保构建基于专业电影知识的、高质量的评估数据集。 ShotQA ,是一个包含约7万个电影问答对的大规模多模态数据集。 借助ShotQA,团队通过 监督微调(SFT) 和 群体相对策略优化 (GRPO) 开发了ShotVL。 ShotVL 在ShotBench上显著优于所有现有的开源和专有模型,确立了新的顶尖性能。 团队在S ...
7个月翻一番!AI agent能力飙升,METR报告揭示指数级进化规律
量子位· 2025-07-16 09:49
henry 发自 凹非寺 量子位 | 公众号 QbitAI 报告指出:在软件开发、数学竞赛、科学问答等任务中,agent已能完成 相当于人类花费50–200分钟才能完成的任务 ,并且这种能力还在快 速提升——大约每 2–6个月 就能 翻一番 。 在计算机操作任务中,虽然任务时长较短,但增长率与软件开发等任务一致。 Agent在自动驾驶任务的性能增长速度则较慢,约20个月翻一番。 Agent能力每7个月翻一番! 根据非营利研究机构METR最新发布的报告,这一规律已在9项基准测试中得到了验证。 这些任务涉及编程、数学、计算机使用、自动驾驶等领域,表明大模型正在不断向着高度自动化迈进。 在视频理解任务中,模型能够在 时长1小时 的视频上取得 50% 的成功率。 作为一家致力于研究前沿人工智能系统能力及其风险的研究团队,METR此次的报告又进一步拉近了AI自主化的时间线,快来和我们看看报告 有哪些内容吧。 Agent的摩尔定律 在此前的测试中,METR将评估范围聚焦于软件开发和研究类任务,并发现AI agent的能力呈现出一种"摩尔定律"式的增长趋势—— 平均每七 个月,其可完成任务的time horizon就会翻一 ...
摩根士丹利:小米集团-2025 年第二季度全球智能手机出货量有望超过 4200 万台1
摩根· 2025-07-16 08:55
报告行业投资评级 - 小米公司股票评级为“Overweight”(增持),行业观点为“In-Line”(与基准市场表现一致) [4] 报告的核心观点 - 2025年第二季度小米全球智能手机出货量可能超第一季度 [1] - IDC初步数据显示2025年第二季度全球智能手机出货量同比微增1.0%,达2.952亿部;Canalys数据则显示同比下降1% [1][3] - 按公司划分,三星2025年第二季度出货量达5800万部,同比增长7.9%,全球排名第一,市场份额19.7%(Canalys数据为19%);苹果出货4640万部,排名第二,份额15.7%(Canalys数据为16%);小米出货量同比微增0.6%,达4250万部,排名第三,全球市场份额14.4%(Canalys数据为15%) [2][3] 根据相关目录分别进行总结 公司财务数据 - 小米公司2025年7月14日收盘价为57.30港元,目标价62.00港元,较目标价有8%的上涨空间;52周股价范围为15.36 - 61.45港元;当前流通股2.5501亿股,市值1861.46亿美元,日均交易额9.21亿美元 [4] - 预计2024 - 2027财年每股收益分别为1.07元、1.52元、2.10元、2.56元;净收入分别为3659亿元、4730亿元、6072亿元、6871亿元;EBITDA分别为259亿元、438亿元、624亿元、770亿元;ModelWare净利润分别为237亿元、362亿元、483亿元、595亿元;市盈率分别为34.9、37.6、28.2、22.9 [4] 估值方法 - 采用分部加总估值法,对智能手机、IoT和互联网服务三个业务单元使用剩余收益(RI)模型,分别应用11%、11%和11.4%的股权成本,终端增长率分别为3%、3%和6% [9] - 电动汽车业务采用DCF估值,加权考虑30%的乐观情景、60%的基准情景和10%的悲观情景,以反映2025年上半年第二款电动汽车可能的成功情况,加权平均资本成本(WACC)为12.2%,终端增长率为5%,并加上投资价值 [9] 行业覆盖公司评级 - 报告对Greater China Technology Hardware行业多家公司给出评级,如AAC Technologies Holdings(2018.HK)评级为“O”(增持),Accelink Technologies Co. Ltd.(002281.SZ)评级为“U”(减持)等 [64]
Anthropic推出专业金融AI服务
快讯· 2025-07-16 08:22
当地时间7月15日,AI初创公司Anthropic宣布,推出面向金融行业的AI分析解决方案。Anthropic表示, Claude金融分析解决方案可以帮助金融专业人士构建经得起合规审查的审计和尽职调查、财务分析建 模、识别投资机会并监控投资组合持仓情况。公告也显示,作为金融服务最重要的数据来源, Anthropic已经与多家数据提供商达成实时数据供应协议,能够为银行、保险、资产管理和金融科技机 构提供多元化的服务。(科创板日报) ...
梁文锋等来及时雨
虎嗅APP· 2025-07-16 08:05
行业竞争格局 - 国内大模型行业竞争加剧,"AI六小龙"中的阶跃星辰、智谱AI计划7月底发布新一代基础大模型,科大讯飞也将推出全新模型 [1] - Kimi K2模型发布后成为国内首个总参数量达1万亿的MoE架构开源模型,在代码和数学推理任务上反超DeepSeek [7] - 阿里、字节、百度等科技大厂通过推出更低价的API模型,正在夺走DeepSeek的性价比标签 [7] DeepSeek市场表现 - DeepSeek月活跃用户规模从1月爆发式增长后,4月开始下滑,5月MAU为1.69亿,环比下降5.1% [1] - 官网访问量下降29%,用户使用率从年初7.5%峰值回落至5月底的3% [2] - 苹果App Store免费应用下载榜排名从榜首跌至30名开外 [2] 技术发展动态 - DeepSeek近期仅进行小版本升级,如DeepSeek-R1-0528仍基于2024年12月的V3 Base模型微调,未推出新一代V4模型 [6] - Kimi K2支持128K上下文窗口,MiniMax-M1支持100万上下文输入,远超DeepSeek R1的64K窗口 [10] - DeepSeek是主流AI助手中唯一暂不支持多模态功能的产品,缺乏语音、图片生成等能力 [13] 算力与供应链 - 英伟达H20芯片因美国出口管制被禁售,导致DeepSeek算力储备紧缺,影响R2模型上线 [3] - 7月15日英伟达公告正在申请重新销售H20芯片,美国政府已承诺授予许可证 [4] - MiniMax-M1模型训练仅用512块H800三周时间,租赁成本53.47万美元,远低于DeepSeek V3模型的557万美元 [8] 商业模式与策略 - DeepSeek选择开源路线但忽视C端应用,专注AGI研发,导致产品体验落后竞争对手 [10] - OpenAI通过高频更新保持热度,GPT-4.1系列发布后份额迅速增至10%,而DeepSeek R1使用率从7%峰值降至3% [12] - 第三方平台托管的DeepSeek R1与V3模型使用量自发布以来增长近20倍,显示开发者生态活跃 [9]
OpenAI前CTO公司获英伟达、AMD投资,估值达120亿美元
凤凰网· 2025-07-16 08:03
凤凰网科技讯 北京时间7月16日,据科技网站TechCrunch报道,AI创业公司Thinking Machines Lab发言 人表示,该公司在周一正式完成了由安德森·霍洛维茨基金领投的20亿美元种子轮融资。Thinking Machines Lab 由OpenAI前首席技术官米拉·穆拉蒂(Mira Murati)创办。 Thinking Machines Lab发言人称,这轮融资对公司的估值为120亿美元。英伟达、AMD、Accel、 ServiceNow、思科以及简街资本也参与了投资。 今年6月,多家媒体报道称,Thinking Machines Lab即将以100亿美元估值完成这笔20亿美元融资。但是 显然,该公司估值在过去一个月已经大幅上涨。 这笔融资是硅谷历史上规模最大的种子轮融资之一,体现了投资者对于蕴含潜力的新AI实验室的巨大 投资热情。Thinking Machines Lab成立不到一年,目前尚未披露其研发项目。 "很快,我们也会分享我们最好的科研成果,帮助研究界更好地理解前沿AI系统。"穆拉蒂表示。 目前尚不清楚穆拉蒂这一表态是否意味着Thinking Machines Lab会发布一个 ...
2025中国(深圳)独角兽企业大会明日开幕
深圳商报· 2025-07-16 07:24
大会概况 - 2025中国(深圳)独角兽企业大会将于7月17日至18日在深圳举行,主题为"新质驱动·未来领航",聚焦"硬科技底色" [1] - 大会由深圳市工信局、中小企业服务局指导,长城战略咨询、交通银行、深创投、国信证券等联合主办,北京与仁科技、深圳私募基金业协会等承办 [1] - 将发布《GEI中国独角兽企业研究报告2025》和《深圳市独角兽企业及瞪羚企业研究报告2025》,通过量化分析揭示独角兽成长规律与产业趋势 [1] 参会企业与机构 - 图灵量子、云舟生物、易府if医疗、舜铭存储等全国百余家独角兽企业参会,覆盖人工智能、机器人、集成电路、商业航天、生物医药等20余个前沿领域 [1] - 深创投、达晨财智、东方富海、基石资本等深圳本土头部投资机构将出席 [1] - 大会设置"合作洽谈会"活动,促进创新企业与深圳产业链资源及政策红利对接,实现"落地即加速" [1] 深圳独角兽企业特点 - 深圳是全国"硬科技"独角兽最活跃的城市之一,独角兽集中在前沿科技领域 [2] - 集成电路、机器人、3D打印、清洁能源是深圳独角兽的突出赛道 [2] - 深圳独角兽呈现"从跟跑到领跑"的创新路径,近年涌现优必选(机器人)、云天励飞(AI)、奈雪的茶(新消费)等上市企业代表 [2]