从技术路径，纵观国产大模型逆袭之路

报告行业投资评级 - 计算机行业投资评级为优于大市（维持） [1] 报告的核心观点 - 海外大模型龙头在性能和多模态交互上竞争激烈，宝座多次更迭，技术争夺聚焦端到端原生多模态和统一神经网络，比较维度向叠加终端升级 [3][5] - 国内大模型聚焦长文本，在文科能力尤其是长文本处理上有赶超之势，通过降价和迭代提升竞争力 [3][59] - 建议关注国产大模型厂商和接入头部大模型的应用标的 [3] 各部分总结海外龙头轮番抢占第一宝座，比拼整体性能和多模态交互高速迭代，海外龙头轮番占领大模型之巅 - OpenAI、Google、Anthropic三大厂商在1年左右时间内轮换大模型第一宝座，2024年迭代速度加快 [6] - 初代GPT - 4o在文本、推理、编码、多语言、音频、视觉等方面性能提升，多模态能力拓展，API性价比提高 [8][10] - 二代谷歌Gemini有进阶版1.5 Pro和轻量化1.5 Flash，前者上下文窗口和性能提升，后者效率高、延迟低、成本效益好 [12][14] - 翘楚Claude 3.5 Sonnet聚焦视觉和交互体验，上下文、速度、价格有优势，写作自然，视觉能力强 [18][21] 大模型高地争夺：多模态的理解和响应，原生多模态技术比拼 - 最终判断依据是多模态的理解、生成和响应，GPT - 4o在视觉和音频理解、响应时间上表现出色 [26] - 技术争夺集中在端到端原生多模态技术和统一神经网络，传统多模态技术架构有局限，GPT - 4o和Chameleon采用新架构 [28][31][37] 比较维度升级：从模型到叠加终端，跨设备的使用效果体验 - 谷歌Astra模型具备多模态能力，与GPT - 4o有不同侧重点，能通过智能手机观察世界并响应 [55][57] 国内大模型逆袭之路：聚焦长文本，降价迭代提升竞争力先文后理：聚焦长文本，国产大模型已有赶超GPT之势 - 理科能力上国内大模型与GPT - 4有差距，但文科能力差异缩小，通义千问2.1和Kimi在部分能力上表现突出 [61] - 国内大模型长文本能力部分赶超GPT - 4，通义千问、360智脑、文心一言等开放长文本能力 [63][64] 长文本的三大难题和解决之道 - 长文本存在注意力机制计算复杂度、上下文记忆、最长文本约束难题 [71] - 突破长文本限制的方法包括优化注意力机制、长期记忆力机制、位置编码外展、上下文处理等 [74][77] 商业上降价，加速迭代卷出未来 - 国内大模型厂商降价抢占API调用量，轻量级模型降幅大，降价后调用量大幅增长 [80][87] - 降价背后是训练和推理成本下降，训练成本通过MoE架构和提高训练效率降低，推理成本通过压缩KV缓存降低 [91][98] 投资建议 - 建议关注国产大模型厂商如科大讯飞、商汤等，以及接入头部大模型的应用标的如金山办公、万兴科技等，同时关注Kimi相关标的 [3]