Workflow
Codebuddy
icon
搜索文档
代码里插广告,腾讯 Codebuddy 们 “背锅”?DeepSeek “极你太美”事件,其他模型也逃不掉?
AI前线· 2025-08-27 13:42
DeepSeek V3.1模型异常输出事件 - 腾讯Codebuddy和字节Trae国内版在代码生成过程中出现异常输出,包括插入"极速电竞APP"广告文本和随机生成"极"字[2] - 问题根源指向DeepSeek最新的V3.1模型,腾讯已上报问题并承诺修复[4] 异常输出表现形式 - 在本地ik_llama.cpp测试中,预期输出"time.Second"变为"time.Se 极"或"time.Se extreme"[5] - 在Fireworks平台测试中,预期输出"V1"变为"V 极"[6] - 异常token包括ID:15075("extreme")、ID:2577(简体"极")和ID:16411(繁体"極")[5] 问题复现情况 - 官方API复现概率较低但存在,第三方平台复现率较高[7] - 修改异常字符后官方API问题概率下降,但VolcEngine等平台问题概率仍保持高位[7] - 该问题被网友称为"极你太美"事件,DeepSeek尚未作出正式回应[8] 历史问题追溯 - 早期DeepSeek R1模型就存在类似问题,会输出"极速赛车开奖直播"字符串[10] - R1 0528版本曾在代码中多次插入"极客园"[10] - 4月份就有开发者在GitHub提交该bug,怀疑是模型权重或分词器问题[10] 同类问题扩展 - Gemini模型存在更严重的代码混合问题,常在响应中生成中文单词[14] - Grok模型也出现过类似问题[14] - Qwen3 235B A22B Instruct 2507和Qwen3 Coder 30B A3B Instruct表现出同样问题[14] - Qwen3 Coder 480B A35B Instruct在严重量化后出现相同问题[14] - GLM 4.5模型未受影响[14] 问题原因分析 数据污染假说 - 预训练数据可能包含"极客"和"极速"等高频率词汇组合[15] - 模型输出"极"后可能接"客"+"园"形成"极客园",或"速"+"赛"形成"极速赛车"[15] - 问题可能源于R1-Zero模型,通过合成数据训练传播到DeepSeek-R1和V3 0324版本[17] 蒸馏传染理论 - 大模型在编程题中会出现枚举数列的恶性pattern[18] - R1-0528会在枚举后输出"极长的列表"或"极大的数字"[18] - 训练数据可能包含"极长的数组"等未洗净内容,模型将"极"当作终止符使用[19] 技术机制分析 - 排除Token连续性假说,量化不会改变向量形状导致token混淆[15][17] - 排除MTP(Multi Token Prediction)问题[17] - 模型将"极"作为边界token使用,反映其学习数据统计规律而非真正理解语言[19] 行业影响与建议 - 自蒸馏链条延长会导致数据瑕疵多次放大[20] - 需要在数据合成→预训练→SFT→RLHF全链条建立严格监控和清洗机制[20] - 该现象为研究模型内部符号学提供了有价值案例[20] - 开源模式有利于问题发现和集体修复[20]
国产AI Agent产业链正逐步成熟,科创AIETF(588790)最新单日“吸金”2.60亿元,最新规模、份额均创成立以来新高
新浪财经· 2025-07-28 13:19
指数表现 - 上证科创板人工智能指数(950180)下跌0 07% 成分股中芯原股份(688521)领涨3 69% 石头科技(688169)上涨3 45% 萤石网络(688475)上涨1 26% 星环科技(688031)领跌3 80% 威胜信息(688100)下跌3 38% 优刻得(688158)下跌2 73% [3] - 科创AIETF(588790)下跌0 64% 最新报价0 62元 近1周累计上涨5 23% 涨幅排名可比基金3/7 [3] - 科创AIETF近6月净值上涨11 38% 居可比基金第一 自成立以来最高单月回报为15 59% 最长连涨月数为2个月 最长连涨涨幅为26 17% 上涨月份平均收益率为9 71% 历史持有6个月盈利概率为100 00% [5] 流动性及资金流向 - 科创AIETF盘中换手8 92% 成交4 70亿元 近1周日均成交3 34亿元 排名可比基金第一 [3] - 科创AIETF最新资金净流入2 60亿元 近5个交易日内有3日资金净流入 合计3 08亿元 日均净流入6165 69万元 [4] - 科创AIETF本月以来融资净买额达1614 58万元 最新融资余额达4 89亿元 [4] 规模及份额 - 科创AIETF最新规模达52 64亿元 创成立以来新高 位居可比基金1/7 [4] - 科创AIETF最新份额达84 79亿份 创成立以来新高 位居可比基金1/7 [4] 行业动态 - 国产AI Agent加速崛起 推动AI编程平台发展 国产Coding模型如Kimi K2和Qwen Coder已具备较强能力 AI IDE通过AI能力降低开发门槛 提升效率 适配AI行为逻辑 [4] - 字节 腾讯 阿里等企业推出的AI编程平台各具特色 Trae2 0注重全栈开发能力 Codebuddy聚焦产品开发部署 Qwen Code专为Qwen3-Coder设计 [4] - 上海国投先导公司管理的三只私募投资基金拟投资第三批子基金 包括新发起设立的子基金和以增资入伙方式参股已设立的基金 [3] 指数构成 - 上证科创板人工智能指数从科创板市场选取30只市值较大的为人工智能提供基础资源 技术以及应用支持的上市公司证券作为指数样本 [5] - 前十大权重股分别为寒武纪(688256) 澜起科技(688008) 金山办公(688111) 芯原股份(688521) 石头科技(688169) 恒玄科技(688608) 晶晨股份(688099) 复旦微电(688385) 中科星图(688568) 道通科技(688208) 前十大权重股合计占比68 03% [6] 基金特性 - 科创AIETF近3个月超越基准年化收益为2 43% 排名可比基金1/6 [5] - 科创AIETF成立以来相对基准回撤0 40% [5] - 科创AIETF管理费率为0 50% 托管费率为0 10% 费率在可比基金中处于较低水平 [5] - 科创AIETF近1月跟踪误差为0 012% 在可比基金中跟踪精度最高 [5]
国产AIAgent的崛起
华福证券· 2025-07-28 11:46
报告行业投资评级 - 强于大市(维持评级) [1] 报告的核心观点 - AI Agent框架是Coding模型与AI编程平台协调配合,AI IDE通过AI能力降低开发门槛、提升效率,让底层逻辑适配AI行为 [3] - Claude Code推动Agent进入新阶段,Anthropic借助Claude大模型成Coding模型标杆,借Claude Code切入AI编程平台 [3] - 国产Coding模型中Kimi K2、Qwen3 - 2507、Qwen3 - Coder表现突出 [3] - 国产AI编程平台中字节、腾讯、阿里是突出代表,字节升级Trae 2.0,腾讯推出Codebuddy,阿里Qwen Code适配Qwen3 - Coder [3] - 建议关注国产AI Agent相关产业链 [3] 根据相关目录分别总结 AI Agent框架:Coding模型+AI编程平台 - Agent应用落地需优秀Coding模型和AI编程平台配合,Coding模型用于更高自动化,工具调用依赖其代码能力;AI编程平台整合开发流程,AI IDE引入AI能力提升效率,降低编程门槛 [6][7] - 传统IDE是工具集成平台,整合基础工具提供标准化开发环境;AI IDE以AI模型为核心,是开发者智能协作伙伴,降低开发门槛、提升效率 [10][12] - Cursor崛起原因包括与Claude深度绑定、具备强大代码索引上下文理解能力、有代码审查能力、工程化集成能力强 [14][15] - Claude模型适合Agent,Claude 3.7 Sonnet在TAU工作台性能先进,能处理全栈开发任务 [16][17] Claude Code:推动Agent进入新阶段 - Anthropic借Claude大模型成Coding模型标杆,借Claude Code切入AI编程平台,截至2025年7月6日,Claude Code吸引11.5万名开发人员,一周内处理1.95亿行代码 [23][25] - Claude Code优势在于需求理解与计划制定模块、全局代码库感知系统、自动化调试与修复引擎、工作流自动化系统 [29] 国产Coding模型:Kimi K2和Qwen Coder崛起 - Kimi K2是具备更强代码能力、更擅长通用Agent任务的基础模型,在部分能力维度表现超一些模型,略逊于Claude 4 Opus等;其爆发原因是开源万亿参数大模型、具有优秀Agent能力的非推理模型 [33][34] - Qwen3 - 2507是Qwen3 - 235B - A22B在非思考模式下的升级迭代,是纯非推理模型,在五项测试中多数指标拿下非推理模型最高分 [35][37] - Qwen3 - Coder是阿里发布的垂类代码模型,采用混合专家MoE架构,总参数480B,激活35B参数,训练数据7.5万亿tokens且70%是代码,引入强化学习,原生支持256K token上下文并可扩展至1M长度,在部分方面取得开源模型SOTA效果,可与Claude Sonnet4媲美 [40][41] 国产AI编程平台:字节、腾讯和阿里 - 字节注重全栈开发能力,升级Trae 2.0,TRAE与AI深度集成,有智能问答等能力,Solo模式以AI主导全流程开发 [43][44] - 腾讯重视产品开发部署,2025年7月22日发布CodeBuddy,定位“产设研一体”的AI全栈工程师平台,产品、设计、研发阶段有不同功能 [45][47] - 阿里Qwen Code针对Qwen3 - Coder模型优化,有增强的解析器支持和工具支持,可查询和编辑大型代码库、自动执行管理任务 [48][49] 投资建议 - 建议关注国产AI Agent相关产业链 [52]