Alibaba Cloud Launches Compact, Multimodal AI Model
文章核心观点 阿里巴巴云推出多模态人工智能模型Qwen2.5 - Omni - 7B,该模型性能出色且具多用途,公司持续投入AI研发以拓展智能边界创造机会 [1][3][5] 新模型介绍 - 新模型Qwen2.5 - Omni - 7B可处理文本、图像、音频和视频输入,以文本和自然语音实时响应 [1] - 模型紧凑且多模态,能支持“敏捷、经济高效的AI代理” [1] - 可部署在手机和笔记本电脑上 [1] - 可用于帮助视障用户导航、提供烹饪指导、驱动智能客服对话等 [2] - 在Hugging Face和GitHub上开源,可通过Qwen Chat和阿里云开源社区ModelScope访问 [2] - 在所有模态性能表现出色,在实时语音交互等方面树立“新基准” [3] 公司过往动态 - 约两个月前阿里巴巴发布Qwen2.5 - Max,称其在关键基准测试中优于顶级AI模型 [3] - Qwen2.5 - Max在MMLU - Pro等多项基准测试中表现与DeepSeek V3等模型相当 [4] 公司未来规划 - 公司在2月财报电话会议表示未来三年在AI上的投入将超过过去十年 [4] - 公司CEO称目标是继续开发拓展智能边界的模型以创造更多机会 [5]