报告行业投资评级 - 计算机行业投资评级为优于大市(维持) [1] 报告的核心观点 - 海外大模型龙头在性能和多模态交互上竞争激烈,宝座多次更迭,技术争夺聚焦端到端原生多模态和统一神经网络,比较维度向叠加终端升级 [3][5] - 国内大模型聚焦长文本,在文科能力尤其是长文本处理上有赶超之势,通过降价和迭代提升竞争力 [3][59] - 建议关注国产大模型厂商和接入头部大模型的应用标的 [3] 各部分总结 海外龙头轮番抢占第一宝座,比拼整体性能和多模态交互 高速迭代,海外龙头轮番占领大模型之巅 - OpenAI、Google、Anthropic三大厂商在1年左右时间内轮换大模型第一宝座,2024年迭代速度加快 [6] - 初代GPT - 4o在文本、推理、编码、多语言、音频、视觉等方面性能提升,多模态能力拓展,API性价比提高 [8][10] - 二代谷歌Gemini有进阶版1.5 Pro和轻量化1.5 Flash,前者上下文窗口和性能提升,后者效率高、延迟低、成本效益好 [12][14] - 翘楚Claude 3.5 Sonnet聚焦视觉和交互体验,上下文、速度、价格有优势,写作自然,视觉能力强 [18][21] 大模型高地争夺:多模态的理解和响应,原生多模态技术比拼 - 最终判断依据是多模态的理解、生成和响应,GPT - 4o在视觉和音频理解、响应时间上表现出色 [26] - 技术争夺集中在端到端原生多模态技术和统一神经网络,传统多模态技术架构有局限,GPT - 4o和Chameleon采用新架构 [28][31][37] 比较维度升级:从模型到叠加终端,跨设备的使用效果体验 - 谷歌Astra模型具备多模态能力,与GPT - 4o有不同侧重点,能通过智能手机观察世界并响应 [55][57] 国内大模型逆袭之路:聚焦长文本,降价迭代提升竞争力 先文后理:聚焦长文本,国产大模型已有赶超GPT之势 - 理科能力上国内大模型与GPT - 4有差距,但文科能力差异缩小,通义千问2.1和Kimi在部分能力上表现突出 [61] - 国内大模型长文本能力部分赶超GPT - 4,通义千问、360智脑、文心一言等开放长文本能力 [63][64] 长文本的三大难题和解决之道 - 长文本存在注意力机制计算复杂度、上下文记忆、最长文本约束难题 [71] - 突破长文本限制的方法包括优化注意力机制、长期记忆力机制、位置编码外展、上下文处理等 [74][77] 商业上降价,加速迭代卷出未来 - 国内大模型厂商降价抢占API调用量,轻量级模型降幅大,降价后调用量大幅增长 [80][87] - 降价背后是训练和推理成本下降,训练成本通过MoE架构和提高训练效率降低,推理成本通过压缩KV缓存降低 [91][98] 投资建议 - 建议关注国产大模型厂商如科大讯飞、商汤等,以及接入头部大模型的应用标的如金山办公、万兴科技等,同时关注Kimi相关标的 [3]
从技术路径,纵观国产大模型逆袭之路
德邦证券·2024-07-05 09:07