LLM(大语言模型)
搜索文档
AI 编程正在终结框架时代
AI前线· 2026-03-22 13:33
文章核心观点 - 自2025年12月以来,AI驱动的自动化编程技术取得显著进步,使得行业能够摆脱对复杂框架和中间层工具的依赖,回归真正的软件工程,即专注于解决实际问题的架构和设计,而非重复的体力劳动[2][10] - 自动化编程工具(如编码代理)的成熟,使得开发者能够快速构建定制化工具,从而专注于产品中真正重要的复杂性,而非被框架强加的、不必要的复杂性[4][10] - 行业长期以来过度依赖由大型科技公司(如谷歌、Meta、Vercel)主导的框架,本质上是将劳动力成本外部化,并导致工程师沦为可替换的操作员,而非解决问题的工程师[9] - 呼吁开发者利用现有的成熟工具(如Bash、编码代理)和模型,开始构建真正属于自己的、量身定制的解决方案,而不是继续装饰由他人设计的“老房子”[13][14][15] 自动化编程的实质与影响 - 自动化编程并非肤浅的“氛围编码”,而是类似于历史上印刷机、织布机带来的工作革命,其核心是自动化繁重的、逐行敲击代码的体力劳动[4] - 自动化编程允许经验丰富的开发者扮演“建筑师”角色,基于其深厚的经验(如二十年的亲手实践)进行高层设计,而将具体的“砌砖”工作交给工具,同时保留深入底层进行调整的能力[4][5] - 自动化编程使得开发者能够快速构建所需的小型工具,从而将时间投入到真正重要的艺术创作中,而非重复的“锻造间汗水”[5] 对现有框架生态的批判 - 行业盲目接受了大量框架、库和工具,这些抽象层用无意义的抽象解决本不存在的问题,每解决一个问题却创造了十个新问题,污染了软件工程[6] - 框架主要解决了三个问题:1)“简化”,实则是工程师因害怕自行设计而接受他人蓝图的一种“投机取巧”[8];2)“自动化”样板代码,这是唯一可被理解的部分[8];3)未声明的“劳动力成本”,即企业通过采用标准化框架来降低对高技能、需培训的软件工程师的依赖,将其转变为易于替换的“齿轮”[9] - 继续依赖框架将导致企业持续支付高昂的隐性成本,包括运营成本(如漏洞修复)和设计选择成本,并错失软件工程领域数十年来最大的机遇[13] 新范式下的工具与机遇 - 自2025年12月以来,自动化编程的革命性进步已显而易见,为行业提供了摆脱无用复杂性、专注于产品核心复杂性的机会[10] - 自动化样板代码的成本已变得极低,开发者可以“有目的地构建”工具,对于99%的用例,一个简单的Makefile就足够,仅在真正复杂时才考虑更复杂的方案[10] - 编码代理等工具已非常成熟,它们能极好地处理Bash等基本工具,最古老的工具(如1989年诞生的Bash)反而展现出最强的未来适应性,编码代理转向以Bash为交互方式即是明证[11] - 行业应利用现有的工具和模型,停止用“丝绸包裹断腿”(指用框架掩盖根本问题),开始构建属于自己的东西[15] 相关评论与不同观点 - 有评论完全赞同文章观点,认为这是一个创造的时代,应相信个人品味进行自主探索和实验,而非依赖组织或复杂库[16] - 有评论提出不同看法:1)当前LLM对于中低级工程师而言并非像框架那样能解决“简化”问题,缺乏足够的提示技巧培训和生态系统文档支持,可能导致技术鸿沟扩大[17];2)质疑模型自我改进的能力,担心会被困在训练时的架构中,无法像框架那样持续演进以应对未来的问题[17]
中金:大模型赋能,行业景气构建新思路
中金点睛· 2025-11-28 08:07
文章核心观点 - 行业盈利增长率是股票价值增长的核心驱动力,且比市盈率变化更具可预测性,预测盈利增速有助于增强行业组合收益表现[3] - 行业景气模型通过需求、供给等中观指标反映行业基本面状态,从而预测未来盈利表现,为股价收益预测提供支撑[3][9] - 大语言模型(LLM)可显著提高行业景气模型的构建效率,通过定性筛选和定量检验中观指标,实现模型在全行业范围的快速推广[4][5][17] - 基于LLM构建的行业景气指数对未来盈利增速有预测能力,其秩相关系数的均值和中位数均在0.25左右,并可应用于行业轮动策略以获取超额收益[5][26][40] 行业盈利预测的重要性 - 股票长期收益率可拆解为股息率、盈利增长率和市盈率变化,其中盈利增长率是核心驱动力[3][9] - 假设能提前一个季度预知未来行业盈利增速,并构建市值中性化的高增速行业组合,该组合收益表现整体优于行业等权组合和低增速组合[3][9] LLM赋能行业景气模型构建 - 在传统行业景气模型构建中,基本面逻辑定性分析与指标筛选环节耗时巨大,LLM可在此环节提高效率,快速识别核心指标[4][13] - 设计了一套构建流程:利用LLM对中观指标进行定性筛选,再经过定量检验(如格兰杰因果检验、相关性检验),最终合成行业景气指数[5][17][20] - 使用火山引擎DeepSeek-R1接口,对每个行业重复训练三次以降低随机性影响,每次选取近20个指标,并计算指标间相关性以保留高相关指标[18] - 对LLM初筛指标进行数据标准化和变形(计算同比、环比、五年分位数),并剔除极端值影响[20] - 通过LLM精筛和相关性测试双重判断指标对净利润的影响极性,最终每个行业筛选出近5个指标合成景气指数[23][25] 行业景气模型预测效果 - 构建了28个中信一级行业及对应的104个二级行业、271个三级行业的景气指数[5][46] - 不同级别行业的景气指数与未来盈利增速的秩相关系数均值和中位数均在0.25附近,显示出一定的预测能力[5][26] - 按景气得分将时间区间等分为五组,统计发现约80%的行业其分组未来盈利增速的单调性得分不低于0.5,表明景气指数分组预测效果显著[5][30] - 以有色金属行业为例,其景气指数与净利润环比和同比增速的秩相关性系数分别为0.50和0.63,走势近似[36] 行业景气指数应用与轮动策略 - 行业景气指数应用场景广泛,包括行业择时、行业轮动、行业景气选股和风险预警等[6][38] - 构建高景气行业组合(选择排名前20%的行业)回测显示,其在中信一、二、三级行业的年化超额收益率分别为2.4%、2.9%、2.8%[6][40] - 选择排名前10%的高景气行业组合,其年化超额收益率在中信一、二、三级行业分别可达1.2%、8.1%和3.1%[6] - 敏感性测试表明,二级和三级行业景气轮动的收益表现整体优于一级行业,可能源于更广的投资宽度[44][46] - 高景气行业组合相较于等权行业组合,长期收益表现较为稳定[50][53][55]
大佬开炮:智能体都在装样子,强化学习很糟糕,AGI 十年也出不来
自动驾驶之心· 2025-10-22 08:03
文章核心观点 - AI行业存在过度夸大和脱离实际的现状,AGI的实现仍需约十年时间,其发展将带来每年约2%的GDP增量,但并非以当前主流预期的方式实现[2][3][5][6][10][12][13] AGI发展时间与瓶颈 - AGI的实现预计需要十年时间,当前AI智能体存在认知缺陷,包括不够聪明、缺乏多模态能力、无法进行计算机操作、缺乏持续学习能力等[12][13] - 行业曾过早尝试完整解决方案,如雅达利深度强化学习和OpenAI的Universe项目,但因缺乏足够的表征能力而失败[16][17][18] - 预测未来算法将与当前有所不同,但核心仍将是通过梯度下降训练的大型神经网络,需在架构、优化器、损失函数等方面全面改进[33][34][35] LLM认知缺陷与学习机制 - 大语言模型存在认知缺陷,不擅长编写独特或智力密集型代码,容易误解代码风格并增加不必要的复杂性[40][41][42][43] - 模型记忆能力过强,但缺乏类似人类的反思、知识提炼和合成数据生成过程,导致其输出多样性不足且容易发生模型崩溃[60][61][62][63][67] - 人类学习通过内置硬件和进化编码的算法进行,而LLM通过模仿互联网文档训练,是两种不同的智能路径[19][20][22][23] 强化学习局限性 - 强化学习存在显著缺陷,其通过最终结果奖励整个过程的机制噪音过大,无法有效分配部分信用[50][51][52] - 基于过程的监督虽为替代方案,但自动化分配信用困难,且易受对抗性示例影响,导致模型找到漏洞欺骗评判系统[54][55][56][58] - 人类不使用强化学习进行智能任务,而是通过更复杂的回顾和思考过程,当前LLM缺乏相应机制[21][50][52] 自动驾驶与教育应用挑战 - 自动驾驶实现需要较长时间,因涉及复杂物理世界交互,其难度远高于纯数字知识工作[6][10] - 教育的未来可能涉及AI辅助,但需解决模型当前认知缺陷,如持续学习、知识提炼和长上下文处理等[6][10][31][32] 智能进化与经济影响 - 智能进化类似计算趋势的延伸,超级智能将是社会自动化的进步,逐步承担数字和体力工作[94][95] - AGI对经济的影响主要体现在自动化知识工作,预计可覆盖10%到20%的经济份额,但需考虑社会任务重构和工作界面变化[83][84][85] - AI当前最成熟的应用在编程领域,因代码高度结构化且具备相应基础设施,其他文本处理任务如内容重写等仍面临挑战[88][89][90][92]
一场对抗OpenAI的“危险游戏”,值不值得投资
虎嗅· 2025-07-23 08:17
行业趋势 - ChatGPT周活用户突破10亿大关,超过60%消费者绕过谷歌、百度直接向AI助手查询商品信息[1] - 全球AI搜索引擎市场规模预计2025年达4363亿美元,2032年增长至10888亿美元,CAGR为14%[8] - 网络搜索板块占2025年AI搜索引擎市场61.7%份额,生成式AI技术占比54.2%[8] - 美国商业网站流量2024年7月至2025年2月增长1200%,39%消费者使用过AI搜索引擎[7] 商业模式创新 - GEO(生成式引擎优化)成为新风口,类比谷歌AdWords和Facebook定向广告的迭代[2] - Profound采用企业级SaaS订阅模式,提供AI搜索优化分析服务,月费499美元起[11][15] - Daydream采用B2C电商平台模式,通过自然语言和图像识别优化购物搜索[9][11] - Goodie AI采用分层订阅定价,专注AI搜索可见性监控和内容优化[10][11] 公司动态 - Profound成立11个月获2000万美元A轮融资,Kleiner Perkins和英伟达风投领投[1][7] - 服务覆盖18国,月处理超1亿次AI搜索查询,客户包括Indeed、MongoDB等[20] - Ramp案例显示AI可见性从32%提升至222%,行业排名从第19升至第8[20][21] - 产品包含Answer Engine Insights、Agent Analytics等五大功能模块[14] 竞争格局 - 主要竞争者包括Goodie AI、Daydream及SEO转型企业Ahrefs[10][11] - Profound优势在于先发性和产品丰富度,Ahrefs依托SEO时代客户基础[12] - Daydream团队来自微软、谷歌、Pinterest,侧重C端购物体验[9] - Goodie AI团队有字节跳动背景,提供AI内容生成和情绪监控[10] 技术挑战 - GEO公司需持续破解大模型黑箱,算法迭代可能导致优化策略失效[2][21] - 效果归因模糊,品牌难以区分自然权重调整与GEO工具作用[23] - 商业模式与大模型平台存在对抗性,需频繁调整优化策略[21][22] - 长期需转型为垂直行业服务商,拓展工具链而非单一GEO功能[24]