Workflow
特斯拉AI代理
icon
搜索文档
OpenAI推出医疗开源测试基准HealthBench;苹果发布可在iPhone上运行的极速视觉语言模型FastVLM | 全球科技早参
每日经济新闻· 2025-05-13 07:53
OpenAI推出医疗开源测试基准HealthBench - OpenAI推出HealthBench开源基准测试,旨在衡量AI系统在医疗健康领域的能力 [2] - HealthBench由262位来自60个国家/地区的医生合作打造,包含5000段真实健康对话 [2] - 采用48562个独特的医生编写的评分标准进行开放式评估,涵盖紧急情况、全球健康等多个健康背景和行为维度 [2] - 该基准测试有望为AI在医疗健康领域的能力评估提供更全面、准确且具实践意义的参考标准 [2] 苹果发布极速视觉语言模型FastVLM - 苹果发布专为高分辨率图像处理优化的视觉语言模型FastVLM,可在iPhone等移动设备上高效运行 [3] - FastVLM通过创新的FastViTHD视觉编码器,实现高达85倍的编码速度提升 [3] - 该模型为实时多模态AI应用铺平道路,展现苹果在AI技术领域的创新实力 [3] FDA宣布使用AI技术加速药品审批流程 - FDA宣布在所有中心引入AI技术,以缩短药品审批时间 [4] - 该决定基于一项针对科学审查员的生成性AI试点,AI工具可帮助科学家减少重复性工作 [4] - 使用AI后,科学审查任务时间从三天缩短至几分钟,显著提升审核效率 [4] 特斯拉推出AI代理提升客户服务 - 特斯拉推出专门用于处理客户沟通服务的AI代理,可检测沟通延迟和监测对话情绪 [5] - AI代理能自动将重要诉求上报管理层,已在十个试点地点推出 [5] - 客户在手机应用输入"Escalate"后,系统将在两周延迟后自动上报问题 [5] Gemini 2.5 Pro实现6小时视频理解 - 谷歌Gemini 2.5 Pro支持长达6小时的视频分析,拥有200万Token的超大上下文窗口 [6] - 该模型首次实现通过API直接解析YouTube链接,在VideoMME基准测试中准确率达84.7% [6] - Gemini 2.5 Pro现已通过Google AI Studio向开发者开放体验,标志着AI向视频驱动的多模态产品转型 [6][7]