计算机行业深度：从技术路径，纵观国产大模型逆袭之路

行业投资评级 - 报告维持"优于大市"的行业投资评级 [2] 报告的核心观点海外大模型竞争格局 - 海外大模型龙头厂商OpenAI、Google、Anthropic轮番占领大模型第一宝座 [15][16][17] - GPT-4o自我革命,持续刷新综合性能 [18][19][20][21][22] - 谷歌Gemini 1.5 Pro和Gemini 1.5 Flash提升了上下文理解和推理能力 [23][24][27][28][29][30][31] - Anthropic的Claude 3.5 Sonnet在视觉和交互体验方面表现优异 [33][34][35][36] 国内大模型发展 - 国内大模型聚焦长文本能力,部分已经赶超GPT-4 [73][74][75][76][77] - 国内头部企业如通义千问、Kimi等在长文本能力方面表现突出 [78][79] 大模型技术发展 - 大模型在长文本处理中面临注意力机制计算复杂度、上下文记忆和最长文本约束等难题 [82][83][84] - 优化注意力机制、引入长期记忆力机制、位置编码外展等方法可以突破长文本限制 [86][87][88] 商业模式发展 - 国内大模型厂商纷纷降价,以吸引更多开发者参与,撬动大模型"飞轮迭代" [91][92][96][97][98][99] - 降价背后是训练和推理成本的下降,包括采用MoE架构、优化训练效率和压缩KV缓存等 [101][102][103][104][105][114][115][116][117][118][123][124] 投资建议 - 建议关注国产大模型厂商和接入头部大模型的应用标的 [126] 风险提示 - 海外大模型技术封闭可能导致国内大模型与海外差距扩大 - 国内大模型整体性能尚未达到商业化应用的水平 - 国内缺乏算力支持可能导致大模型迭代速度放缓 - 国内大模型技术路线分歧可能影响未来发展方向 [127]