传媒行业快报:通义千问2.5发布,中文大模型纵深突破
华金证券·2024-05-10 18:32
报告的核心观点 - 通义千问2.5大模型在多个基准测评中超越GPT-4Turbo,成为目前最强中文大模型[1][2] - 通义千问开源模型Qwen1.5-110B在开源领域实现强势赶超,在多个基准测评中超越Meta的Llama-3-70B[2] - 国内大模型持续迭代突破,对标海外顶尖技术,有望深度赋能国内AI生态,加速商业化落地[1][2] 报告内容总结 行业动态 - 通义千问2.5在理解能力、逻辑推理、指令遵循等方面较上一版本均有9%-19%的提升,在代码能力领域也实现10%的提升[2] - 通义千问2.5在OpenCompass基准测评中得分追平GPT-4Turbo,成为该基准首次录得国产大模型取得此等佳绩[2] - 通义千问开源模型Qwen1.5-110B在多个基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜上进入榜首[2] - 通义已推出参数规模横跨5亿到1100亿的8款大语言模型,满足不同场景用户需求[2] 应用落地 - 小米旗下AI助手"小爱同学"与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI生成能力[2] - 微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将其应用于社交媒体、保险、游戏等领域[2] - 大模型赋能AI加速落地,有望进一步推动通用模型在垂类应用中的发展[2] 投资建议 - 建议关注昆仑万维、天娱数科、因赛集团、蓝色光标、天下秀等大模型应用落地企业[2] 风险提示 - 政策不确定性、AI应用落地不及预期、版权授权潜在争议风险等[2][7]