Workflow
CoD强化大模型不可能三角,加速端侧应用落地
首创证券·2025-03-25 21:35

报告行业投资评级 - 看好 [1] 报告的核心观点 - 思维链CoT拆解复杂问题形成详细中间推理步骤,草稿链CoD简化中间推理步骤,CoD在准确性上与CoT相当甚至超越,仅使用7.6%的token,降低推理任务成本和延迟 [5] - 大模型存在成本、效果、性能的不可能三角,发展大模型不止一条路径,如DeepSeek - R1牺牲精度以低成本提升速度,GPT - 4高成本低速度实现高精度 [5] - 高端算力芯片受限,端侧推理应用也能发展,可调整速度、成本、精度权重匹配不同场景 [5] - 投资建议为关注高端算力芯片和端侧芯片,以及搭载算力芯片和加载AI大模型的推理智能终端 [5] 根据相关目录分别进行总结 思维链CoT - 大模型通过思维链提示机制解决复杂推理任务性能较好,强调详细逐步推理过程,用于算术、常识和符号推理 [6] - 2022年1月论文提出思维链概念,手工在prompt里加入含思维过程问答示例可提升LLM推理准确度 [6] 草稿链CoD - 2025年3月论文提出草稿链,鼓励LLM生成简洁信息密集输出,减少延迟和计算成本 [8] - CoD在数学、常识和符号推理任务中准确率接近或超越CoT,token消耗量降至CoT的7.6% [9] - 基准测试涵盖多领域,效率验证实验包括token消耗评估和推理延迟测试 [19] 大模型的不可能三角 - DeepSeek - R1采用GRPO优化,训练效率高、计算资源消耗少,在数学和逻辑推理任务表现好 [24] - ChatGPT和DeepSeek - R1架构和训练方法不同,适用于不同场景,各有优劣 [25] - 发展大模型不止一条路径,可调整速度、成本、精度权重匹配不同应用场景 [27] 投资建议 - 从芯片角度关注高端算力芯片和端侧芯片,从应用角度关注搭载算力芯片和加载AI大模型的推理智能终端 [30]