ClaudeCode
搜索文档
宋雪涛:叙事回归理性的序幕已拉开
雪涛宏观笔记· 2026-02-26 10:09
市场整体观点 - 当前市场波动主要源于流动性与风险偏好变化,而非AI产业方向发生根本逆转 [6] - 市场已进入波动率彻底释放的新阶段,从非理性繁荣转向情绪化博弈,年初黄金、有色、加密货币等高波动Beta资产出现联动去杠杆,引发跨市场连锁反应 [6][40] - 未来美股对业绩兑现要求将更严苛,对资本开支的容忍度持续下降,波动大概率加剧,但科技股是否已经走到右侧仍需观察 [2][40] 一、AI产业与投资表现的分离 - AI产业持续进步,但投资端可能存在过度定价和对长期回报的过度乐观,产业进步对投资并不总是好事 [8] - 投资泡沫过大能为产业留下大量廉价基础设施,往往在泡沫破裂时产业技术才迎来真正进步,建议将产业发展与投资决策分开看待 [8] - 市场近期剧烈反应更多是投资情绪、流动性与叙事节奏的更迭,而非软件、硬件本身变动所致 [8] - 在产业层面,Claude等大模型应用在垂直领域已能替代初级办公人员,对软件SaaS等行业构成直接冲击,软件板块跑输硬件已持续两年 [9] - 软件近期下跌更多是市场借产业逻辑为借口,释放积压的高波动情绪 [9] 二、美股财报季:资本支出容忍度下降与流动性约束 - 美股四季报披露期,市场对业绩关注度显著提高,对资本开支的容忍度快速下降,这是过去两三年持续“烧钱”的结果 [12] - 市场“投资过度”的惩罚机制已经明显强化,是否出现足够大的商业模式以覆盖持续扩大的资本开支成为焦点 [12] - Amazon四季度财报显示全年CAPEX计划高达2000亿美元,超过Google和Meta,导致其股价单日下跌约13% [14] - Oracle连续三个季度自由现金流为负,宣布年内融资450-500亿美元债券,其CDS价格是关键的观察指标 [14] - Amazon、Google、Microsoft和Meta四家公司2026年CAPEX总额预计约6600亿美元,较2025年激增60%,是2024年支出的两倍多,但四家公司合计收入在2025年增速仅约18%,支出与收入剪刀差巨大 [17] - 市场担忧在回报尚未显现的情况下,投入已提前透支,基本面担忧不断累积 [17] - 流动性环境的核心约束是通胀粘性,尽管已累计降息175个基点,但长端利率持续高位运行,1月下旬10年期美债利率一度触及4.3% [21] - 政策利率处于3.5%–3.75%区间,未来可降息空间最多也只有两到三次,在边际宽松不明朗的情况下,大型科技公司的巨额资本开支显得格外刺眼 [21] 三、就业与经济K型分化加速科技股内部分化 - 宏观就业数据疲弱,1月ADP新增就业仅2.2万人,远低于预期的4.5万人,若排除教育和医疗服务行业激增的7.4万个岗位,整体新增就业将为负数 [27] - 教育和医疗作为刚需行业的就业扩张,凸显了其他领域的就业萎缩,专业商业服务、互联网及制造业就业全面下行,呈现出“无就业增长”状态 [27][28] - 美国经济呈现K型分化,AI产业扩张对其他行业造成明显的“挤出效应”,抢占了融资、电力和存储资源 [11] - 市场反应极端:业绩没有明显超预期则反应平淡,稍有不及预期则惩罚极为严厉 [29] - 微软财报公布后约一周内股价下跌约18%,因其云业务收入增速仅26%低于预期,而资本开支增速高达66%超预期 [29] - Meta四季度收入超预期展示了AI提升广告效率的能力,但高企的资本开支计划引发市场担忧,其收入增长仍依赖实体经济 [29] - 美国经济被挤出的部分是滋养科技巨头现金流的根基,一旦实体经济持续被挤压,将直接影响Meta、Google和Amazon的自由现金流 [30] - 苹果资本开支持续下降,全年仅约120亿美元,在一众CAPEX动辄上千亿美元的科技巨头中显得克制,成为资金暂时的情绪安全垫 [32] - 英伟达作为“卖铲人”,商业模式是出售算力设备,其他公司削减或扩张资本开支对其短期业绩影响有限,成为本轮趋势中少数真正赚钱的巨头 [32] 四、铁索连环的融资叙事松动 - “铁索连环”故事是科技股调整的催化剂,巨头们围绕Sam Altman展开互相承诺投资,形成循环融资与快联交易 [33] - 自去年10月底以来,在谷歌冲击下,整个OpenAI链条表现不佳,核心松动后订单兑现存在不确定性 [33] - 若OpenAI被超越,微软将面临投资缩水、竞争冲击及订单风险(未来订单中接近45%来自于OpenAI)等多重风险 [33] - OpenAI当前技术领先并不意味着商业闭环,还未真正赚取经营性收入,模型竞争格局发生变化,Claude、Google Gemini等表现良好,OpenAI已非唯一领先者 [35] - 投资科技的难点在于好公司未必是好投资,最终可能只剩下一两个赢家,广泛投资并通过最终生存下来的少数个体获取高额回报是一种方式 [36] 五、叙事松动催生更大波动与未来展望 - 年初是企业集中披露业绩与资本开支预期的时间窗口,流动性易出现边际变化,市场会进行预期再修正 [37] - 2026年流动性环境变量众多(联储人事更替、通胀、中期选举等),可能导致流动性边际收紧 [38] - 资本市场将越来越多地要求科技企业给出明确的盈利回报,尤其是AI相关商业模式是否真正能够兑现 [39] - 从产业长期看,从大模型到Agent、具身智能的路径仍是长期愿景,核心产业逻辑并未根本改变,当前波动更多来自流动性与风险偏好的扰动 [39] - “铁索连环”叙事正在松动,如果这一环解体,除非有新的叙事和流动性预期补位,否则链条上的公司必然受到影响 [39] - 2026年美股的业绩环境并不轻松,市场耐心接近极限,估值对业绩的要求将更加严苛,情绪催化下的波动加大几乎是确定的 [40]
关于这波软件股崩塌我的看法
佩妮Penny的世界· 2026-02-25 19:14
美股软件行业近期动荡的核心诱因 - 近期美股软件股出现大规模抛售,近万亿美元市值蒸发,被称为“软件行业的DeepSeek时刻”[1] - 市场核心担忧在于AI技术正在改变软件行业的商业模式,从“卖铲子”(销售软件账号/年费)转变为“直接卖结果”,导致传统软件公司收入可能面临暴跌[7] - 以卖账号年费为主的软件公司受到冲击,因为AI可能使客户所需的工作人数大幅减少,例如从100人减少到10人,从而影响其软件订阅收入[7] AI对传统软件公司护城河的冲击分析 - AI技术正在削弱或摧毁传统软件公司的部分护城河,但部分护城河依然稳固甚至得到加强[8] - **被削弱或摧毁的护城河包括:** - **习得性界面与工作流嵌入**:用户习惯的交互界面和工作流程因AI带来的更简单的自然语言交互而被重塑,降低了用户转换成本[9][10] - **业务逻辑**:AI可能改变或替代原有的软件业务逻辑[9] - **公开数据访问**:AI降低了获取和分析公开数据的门槛[9] - **人才稀缺性**:AI降低了开发软件对复合型高级工程师的依赖,理论上使专业知识工作者能更直接地创建工具[9][13] - **产品捆绑**:AI可能解构传统的软件产品捆绑销售模式[9] - **保持完整或增强的护城河包括:** - **专有数据**:垂直行业积累的非公开专有数据(如金融研报、结构化财务数据)其交易、归属和定价仍是难点,构成持续壁垒[9][12] - **监管锁定**:金融、医疗等受强监管行业的合规与牌照要求构成高壁垒[9][16][18] - **网络效应**:现有软件生态形成的网络效应难以被快速取代[9] - **交易嵌入**:深度嵌入企业核心业务流程(如ERP、支付)的软件,因其业务不可中断性和高替换成本而相对安全[9][11] - **系统记录**:作为企业核心数据记录系统的地位难以动摇[9] 市场表现分化与受影响公司类型 - 在此轮抛售中,不同类型软件公司表现出现显著分化[7] - “卖铲子”类型的公司跌幅最大,例如Adobe、ServiceNow、Workday[7] - 与云、AI、数据基础设施相关的公司表现相对抗跌,例如Snowflake、Cloudflare[7] 新一代AI原生软件的竞争威胁 - 以大模型为基础的新一代AI Native软件正在抢夺传统软件公司的客户[7] - 许多大模型公司自身发布了Agent协作功能,并且有公司开始使用如ClaudeCode、Cursor等AI编程工具快速开发内部业务系统,降低了对外部传统软件的依赖[7] 传统软件公司的剩余优势 - 传统软件大厂在**销售渠道、客户关系与生态网络**方面仍具优势,其长期建立的大客户销售团队、代理商和开发者生态难以被快速颠覆[15][16] - **企业级软件的采购惯性**与**合同绑定**为现有厂商提供了缓冲时间,客户更可能要求降价而非立即更换供应商[15] - **责任归属问题**是AI小公司的挑战,当前大模型作为生成系统无法为输出结果担责,而人员与资本规模较小的AI初创公司难以承担企业级应用的责任风险[18][19] 行业格局演变与投资视角 - 此次市值崩塌将加速软件行业格局洗牌,并可能促使传统公司加快数据提取与分析等功能的用户界面友好化进程[12] - 传统软件行业的核心优势,如高毛利率、持续的订阅收入模式依然存在,而新兴AI软件普遍采用的订阅模式面临Token成本过高的挑战,导致其毛利率可能不及传统软件[21] - 从投资角度看,行业指数具备“不死”特性,新的AI软件公司成长后,很大概率会被现有大型软件公司通过并购等方式整合,最终仍会被纳入主要行业指数(如IGV)[21] - 当软件股估值折价到一定程度,具备长期投资价值[21] 中国软件股与美股动荡的关联性 - 中国软件股与此次美股软件股动荡**基本没有直接关系**[1][22] - 中国软件行业目前既未显著享受到AI红利,又受到整体经济环境压力,普遍处于“降本增效”状态[22] - 除非与AI有特别直接关联的应用公司,目前未见大量显著受益于AI发展的中国软件公司[22]
千亿资金需求下 OpenAI本周在ChatGPT上线广告
新浪财经· 2026-02-13 08:34
公司战略与商业模式转变 - 公司创始人山姆·奥特曼两年前曾表示,在ChatGPT中投放广告是商业模式的最后手段,认为这会使用户对产品失去信任 [2] - 但公司本周已开始在ChatGPT中展示广告,这是其为寻找新创收方式以实现收支平衡的众多增收计划之一 [3] - 公司正面临迫在眉睫的财务压力,去年实现收入约130亿美元,但未来四年预计还需再投入约1000亿美元 [3] - 公司希望今年收入实现三倍增长,这意味着必须开展许多几乎毫无经验的业务 [3] 收入结构与增长计划 - 去年年底,公司约60%的收入来自消费产品,40%来自企业技术 [5] - 消费收入大部分来自订阅:在使用ChatGPT的8亿用户中,约6%每月至少支付20美元使用更高级版本 [5] - 进军广告业务的目的,是从免费版ChatGPT中创造额外收入 [5] - 公司希望在今年年底前,将企业产品(面向企业、政府机构等大型组织的技术)的收入占比提升至50% [6] 广告业务拓展与挑战 - 许多在线广告行业资深人士认为,ChatGPT这类AI聊天机器人最终每年可创造数十亿美元广告收入,但这可能需要多年的试验 [13] - 公司已开始组建广告销售团队,但这项工作仍处于早期阶段,缺乏真正意义上的销售团队和相应的基础设施与技术体系 [14] - 为发展广告业务,公司于今年5月聘请了长期在Facebook任职的菲姬·西莫担任应用业务首席执行官,并从X和Meta挖来了数百名曾负责广告产品的员工 [14] - 在拓展广告业务的同时,公司将面临来自谷歌等老牌广告公司的竞争 [13] 企业市场拓展与竞争 - 公司计划通过向企业出售技术赚取更多收入,但目前面临一长串竞争对手 [3] - 在企业市场,公司面临谷歌、微软等老牌服务商以及Anthropic等初创公司的竞争,Anthropic在AI编程领域不断攻城略地 [4] - 目前,企业向公司支付费用使用Codex以及ChatGPT Enterprise等办公工具,部分用户每月支付高达200美元 [6] - 但普通企业可能不愿为办公软件支付如此高昂的费用,且公司面临来自Anthropic及其代码生成工具ClaudeCode的日益激烈的竞争 [6] 其他创收模式探索 - 公司正在探索名为“价值共享”的新盈利思路,例如若其技术助力发现新药,公司可能会分享一部分利润 [7] - 公司推出了面向科学家的产品Prism,其“价值共享”的言论引发了研究人员对公司是否打算从其科学发现中抽成的质疑 [7] - 为应对舆论,公司高管澄清不会从使用Prism的个体科学家的成果中抽成,但未排除与大型药企合作并从中分润的可能 [8] 融资与上市前景 - 尽管在融资方面取得了巨大成功,但全球范围内愿意且有能力继续拿出数十亿美元支撑其算力成本的投资方屈指可数 [3] - 登陆华尔街上市是一个选择,但公司高管私下承认,上市前必须先止住亏损 [3] - 有报道称公司计划最快12月上市,但部分高管对此感到意外,主要担忧原因是认为公司尚未准备好 [5] 行业竞争态势 - 竞争对手Anthropic主要专注于企业工具,并投放超级碗广告调侃公司引入广告的做法 [7] - 公司创始人山姆·奥特曼在X上回击,称Anthropic把昂贵的产品卖给有钱人,而公司同样致力于把AI带给数十亿无法负担订阅的人 [7] - 行业观察人士指出,公司同时试图赢下消费者、追赶竞争对手的编程工具、建设数据中心并继续融资,面临多重挑战 [4]
OpenAI首席执行官:ChatGPT的月增长率恢复到10%以上
新浪财经· 2026-02-09 22:53
OpenAI运营与增长 - ChatGPT月增长率已恢复到10%以上 [2][5] - 公司每周活跃用户超过8亿 [2][5] - 计划在本周推出“更新的聊天模式” [2][5] - 将开始向部分美国用户展示ChatGPT中的广告,以创收资助技术开发 [2][5] OpenAI产品与技术动态 - 编码产品Codex的增长率比一周前增长了约50% [2][5] - Codex与Anthropic的计算机编程工具ClaudeCode直接竞争 [2][5] - 上周推出了名为GPT-5.3-Codex的新编码模型 [2][5] 人工智能行业竞争格局 - 包括OpenAI和Anthropic在内的AI初创公司正加紧竞争,以获得新客户和市场份额 [2][5] - 截至12月底,谷歌Gemini应用的月活跃用户已超过7.5亿 [2][5] - Anthropic被视为软件行业颠覆者,因其AI编码技术已被软件开发者接受 [2][5] - Anthropic正通过ClaudeCowork等产品推动商业交易,为白领执行计算机任务 [2][5]
为什么 ClawdBot 能带火 Mac mini?叶天奇聊 Agent 电脑丨100 个 AI 创业者
晚点LatePost· 2026-02-05 22:35
文章核心观点 - 文章介绍了一家名为Pamir AI的初创公司,其核心产品是一款售价250美元、计算器大小的专用硬件设备,旨在为AI Agent提供独立的物理计算终端,以解决与云端或共享电脑运行Agent相关的成本、隐私和功能限制问题,并最终可能定义下一代计算设备形态 [5][7][10][13] 公司概况与创始人背景 - 公司名称Pamir AI,创始人叶天奇,1997年出生,毕业于美国普渡大学机械工程与控制理论专业,曾任职于高通,具备从机械到神经网络的全栈能力 [6] - 公司核心团队仅4人(包括创始人),目前估值2500万美元,累计获得260万美元投资 [7][15] - 创始人经历多种AI项目尝试后,回归自身硬件禀赋,认为“创业者与点子匹配度”至关重要 [6] 产品定位与核心功能 - 产品是一款微型硬件盒子,本质是一台微型Linux电脑,95%的任务可在本地设备执行,能7x24小时持续在线 [7][10] - 核心定位是为AI Agent提供独立的“电脑”,实现物理隔离、隐私保护(通过硬件加密和版本回滚)并提供硬件接口 [10][14] - 与云端方案(如Manus)相比,本地运行无需持续费用,类似“买房”与“租房”的区别;与运行在Mac mini等通用电脑的方案相比,具备直接连接并控制外部物理设备的能力 [11] 技术路径与战略选择 - 公司战略放弃竞争激烈的“Agent层”软件(如ClawdBot),认为这是躺在大厂的“火车轨道”上,属于短期的技术投机,长期会被大厂超越 [5][17][18] - 选择为Agent提供“Runtime”和物理设备,专注于打造“Agent电脑”这一硬件基础设施,认为其Agent层应是可“热拔插”的,以适配未来百花齐放的Agent生态 [5][17] - 在记忆处理等具体技术上,摒弃了ClawdBot高度工程化、高token消耗的方案,追求更接近人类记笔记方式的零散化、碎片化记忆模式 [19] 市场验证与用户场景 - 产品目前处于手工制作阶段,月销量约200台,通过黑客松口碑和Instagram广告获客,转化率高,“打广告15分钟就开始有人下单” [15] - 当前用户主要包括三类:开发者(用于后台自动化写代码)、电子发烧友与创作者(用于为硬件编写程序)、知识工作者(作为本地“智能硬盘”处理文件) [12] - 产品通过物理接口(如USB)连接并“Hack”外部硬件的能力是早期吸引投资人的亮点,例如重写打印机驱动使其打印复杂图形,或控制LED灯带 [11] 商业模式与发展规划 - 商业模式以硬件销售为主,未来通过深圳供应链量产,目标达到50%的毛利率 [15] - 计划于2026年6月量产下一代产品,并计划对产品功能进行收敛,砍掉部分为“Hack”服务的接口,更聚焦于“电脑”的核心属性 [13][15] - 公司认为Agent生态是高速增长领域,即使自身短期无进展,公司价值也会随生态成长而增长,这是其追求的“复利价值” [20][21] 行业洞察与未来愿景 - 行业现象:ClawdBot等Agent软件的流行,带动了用户将其运行在旧电脑或Mac mini上的需求,验证了Agent需要独立计算设备的市场 [10] - 公司终极愿景是定义下一代计算设备形态,成为一个“无情的工作机器”,取代现有笔记本电脑,与手机、iPad或AR眼镜等前端显示设备配合,后台专注执行任务 [13][23] - 投资人(五源资本孟醒)认为,“Agent电脑”是一个合理且高频的赛道,而硬件Hack是更长尾的场景,最终产品需要覆盖全场景,从极客市场走向大众市场 [13][15]
AI的瓶颈不是算力,而是…
36氪· 2026-01-17 16:18
文章核心观点 - AI技术能力提升迅速,但组织适配速度缓慢,真正的瓶颈在于组织是否敢于让AI执行任务,而非技术本身 [1] - AI转型的核心是组织范式的重构,而非IT部门的专项任务,组织需要围绕AI原生工作流进行重新设计 [6][12] AI应用现状与组织决策边界 - 公司技术团队报告有**30%**的代码由AI完成,但这数字在技术条件允许接近**100%**的背景下,暴露了组织的决策边界和克制 [2] - 一个最小化团队在**两到三周内**用AI构建出完整产品的第一个可用版本,证明几乎全部代码都可由AI完成,关键在于组织取消了“必须由人完成”的人为边界 [2] 传统组织架构与AI原生工作流的冲突 - 传统组织分工逻辑源自工业时代,角色清晰、边界明确,但协作成本随规模迅速上升 [3][4] - AI原生工作流类似三维打印,可整体生成,自然稀释传统角色边界,组织主轴演变为理解问题/定义价值的能力与固化经验为系统能力之间的互动 [4] AI对工作质量与人才要求的影响 - 在代码生成场景,团队对AI的评价在一年内从**50分**提升到**85分**,这反映了组织命题的转变 [5] - AI将交付下限抬高至**85分**,但定义“什么是**100分**”并为之负责的能力变得稀缺,人的价值在**85分**之后才真正开始 [5] 组织推动AI转型的具体实践 - 公司将经营管理会转变为每两周一次的“AI推动会”,讨论重点从看数字批评转向如何用AI为客户创造价值和新品研发,新品节奏从一/两季度一次加快至几乎每月多个 [6] - 公司推出名为“ABC+”的内部培训认证,教授非技术背景员工使用**Cursor、Lovable、Dify、ClaudeCode**等工具,以此识别并筛选出组织内愿意改变的潜在下一代领导者 [7][8] - 公司为非技术员工举办黑客松,获胜项目由销售与市场组队,用**Cursor**和**Dify**搭建工作流,将每年**300–600份**产品需求文档转化为客户易懂的一页纸,直接用于获客,减少了业务与研发间的翻译层 [9] AI对组织结构和运营模式的根本性改变 - AI嵌入工作流后,最小可交付单元变小,从需数十人、数月协作的项目,缩小为少数人即可完成完整闭环,追求高内聚、低耦合 [10] - 当工作闭环足够短,协调不再是主要工作,导致协调型中层角色变得尴尬,而真正的领导力变得更加重要 [11] - AI的“剩余价值”应用于减少组织的耦合度,即减少对齐、拉通和会议 [10] - AI成为CEO推动组织变革的共识工具,为长期难以推动的变革提供了被普遍接受的起点 [11] AI时代的最终瓶颈 - AI的最终瓶颈不是算力、模型规模或技术路线,而是人是否准备好改变以及组织是否敢于被重新设计 [12] - 如果组织仍围绕工业时代的分工与协调逻辑构建,再强的AI也只能被使用到**30%** [12] - 真正困难的是是否愿意让AI工具反过来重塑组织自身 [13]
【大涨解读】AI应用:科技巨头新模型再度点燃AI应用上涨潮,GEO+AI编程成重点,AI重塑流量入口有望打开千亿市场
选股宝· 2026-01-12 11:19
AI应用概念股市场表现 - 2025年1月12日,AI应用概念股集体大涨,多只股票涨停或涨超10% [1] - 利欧股份、博瑞传播、引力传媒、浙文互联、省广集团、易点天下、天龙集团、天下秀等股票集体录得2连板 [1] - 蓝色光标、昆仑万维、壹网壹创、因赛集团、福石控股等股票涨幅均超过10% [1] 领涨个股详情 - **引力传媒 (603598.SS)**:录得6天5板,最新价28.52元,涨幅+9.99%,流通市值76.79亿元,公司与今日头条、抖音、微信等平台有合作关系,旗下拥有“核力星推”、“核力智选”两大产品 [2] - **利欧股份 (002131.SZ)**:录得7天4板,最新价8.21元,涨幅+10.05%,流通市值480.26亿元,公司为整合数字营销服务机构,推出营销产品为广告客户提供研、创、投、销服务 [2] - **博瑞传播 (600880.SS)**:录得6天3板,最新价7.12元,涨幅+10.05%,流通市值77.82亿元,公司旗下每经科技与阿里云共建智能化产品,并接入通义千问大模型 [2] - **税友股份 (603171.SS)**:录得6天3板,最新价78.17元,涨幅+10.01%,流通市值317.28亿元,公司与阿里云在AI智能体应用方面保持合作,基础设施使用阿里云,应用通义千问大模型于SaaS场景 [2] - **天下秀 (600556.SS)**:录得6天3板,最新价8.60元,涨幅+9.97%,流通市值155.47亿元,公司旗下AI产品“灵感岛”依托红人营销系统,推出六大AI Agent针对不同创作环节 [2] - **恒为科技 (603496.SS)**:录得2天2板,最新价35.49元,涨幅+10.01%,流通市值113.64亿元,公司正在筹划收购标的公司75%股权,标的公司主营业务为企业客户提供解决方案 [2] - **浙文互联 (600986.SS)**:录得2天2板,最新价10.74元,涨幅+10.04%,流通市值159.74亿元,公司发布「HochiGEO」智能体,用于监测与内容分发策略,覆盖汽车、快消等行业 [2] - **省广集团 (002400.SZ)**:录得2天2板,最新价11.41元,涨幅+10.03%,流通市值196.96亿元,公司自主研发“灵犀 AI”,整合多方AI服务,具备自然语言处理能力,辅助行业报告撰写、创意设计等全营销流程,并成立“AIGC 智能传播研究院” [2] - **易点天下 (301171.SZ)**:录得2天2板,最新价63.23元,涨幅+20.00%,流通市值241.64亿元,公司作为跨境营销龙头,其自研GEO产品旨在提升品牌在生成式结果中的可见性 [2] 行业驱动事件 - 当地时间1月10日,马斯克宣布将在一周内开源X平台最新内容推荐算法,市场普遍解读为“马斯克也要涉足GEO” [3] - 据媒体报道,DeepSeek计划在2025年2月中旬发布下一代V4模型,重点强化编程能力,其初步基准测试显示编程表现已超越主流模型 [3] - 2025年1月8日,马斯克预告xAI下月升级Grok Code,将支持一次性完成很多复杂的编程任务 [3] 机构核心观点:AI编程的战略地位 - 编程能力是AI模型重点提升方向,AI编程已成为核心应用场景 [4] - 2025年以来,国内外领先模型公司(如Anthropic、OpenAI及国内的通义千问、智谱GLM-4.7、月之暗面Kimi-K2)均致力于提升代码能力,并不断刷新代码模型性能极限 [4] - AI编程是当前B端应用落地最成熟和最主流的赛道:Anthropic的AI编程工具ClaudeCode在发布仅6个月后年度化收入就达到了10亿美元 [5] - 根据OpenRouter数据,AI Coding占据全球token总消耗的50% [5] - Coding能力是数字世界的通行证和钥匙,长期来看战略意义重大 [5] 机构核心观点:GEO(生成式引擎优化)的发展 - GEO是生成式AI时代的流量营销新范式,是SEO的进化形态,通过自然语言语义优化等技术,使内容成为AI“首选信源”,在对话式搜索等场景抢占流量入口 [5] - 截至2025年9月,海外AI应用月活用户超12亿,中国达4.9亿,同比分别增长76.7%和172.3% [5] - 用户对AI信任度提升推动消费决策链变革,超过70%的消费者愿意使用AI助手进行购物决策 [5] - GEO仍处于发展初期,根据秒针测算,2025年全球GEO市场预计达到112亿美元,2030年有望达到千亿美元级别 [6] - 广告代理商或通过新增GEO服务等方式,从广告代理服务向营销技术服务转型,未来或向订阅制或按效果付费方式转型,盈利能力有望进一步提升 [6] 产业链与市场前景 - GEO的受益方包括技术提供方和高权重内容平台 [6] - AI应用覆盖编程、营销、短剧等多个场景,上游涉及算力支持,下游涵盖多行业应用落地 [6]
Karpathy 2025年AI终极觉醒:我们还没发挥出LLM潜力的10%
36氪· 2025-12-22 08:29
文章核心观点 - 2025年是人工智能发展历程中的“觉醒”之年,标志着大语言模型从模仿人类向追求真理的范式转移,其核心驱动力包括RLVR的崛起、Vibe Coding的流行以及关于AI本质的哲学思考[1][3] RLVR革命 - 传统的LLM训练流程包含预训练、监督微调和RLHF三个阶段,但RLHF存在“阿谀奉承”问题,导致模型倾向于生成看似正确但实际错误的答案[4][6] - 2025年兴起的RLVR范式引入第四阶段,其核心是使用可验证的客观结果作为奖励信号,例如用编译器验证代码、用答案验证数学题,从而训练模型进行真正的推理[7][11][12] - RLVR使模型能够通过自我博弈涌现出推理能力,它尝试生成成千上万条不同的推理路径,并由自动验证器进行筛选和强化[15][16][17][18] - 该范式引入了“测试时算力”这一新的扩展定律,模型能力不再在训练结束时定格,推理阶段通过增加“思考时间”可以显著提升表现[19][20][21][22] - 行业案例显示,仅靠纯粹的RLVR训练,模型也能从零开始衍生出强大的推理和自我反思能力,这意味着算力的价值从训练端向推理端转移[23] 哲学分野:动物与幽灵 - AI先驱Rich Sutton的“苦涩教训”认为,长期来看,能利用无限算力的通用方法终将胜出,他心目中的AGI是像动物一样具身、通过试错学习的连续智能体[27][28][29][31] - 然而,当前的大语言模型被描述为“幽灵”,它们无状态、没有持续的意识流,其智能是基于人类互联网文本的统计学蒸馏,是在扮演而非真正理解[32][33] - 目前的科研方向被认为是在召唤更强大的“幽灵”,这是一种位于“心智空间”不同坐标系的、全新的智能形态[35] - 这种智能是“参差”的,它在某些领域表现卓越,但在另一些简单任务上可能严重失误,这种特性源于训练数据分布不均和分词方式的先天缺陷[37][52] Vibe Coding - Vibe Coding代表编程范式的转变,开发者从编写代码细节转变为用自然语言描述意图,将逻辑和实现交由AI完成,人类主要负责审美和验收[40][44] - 行业实践案例显示,一个完整的Web应用项目可以在开发者不手写一行代码的情况下,通过自然语言指令与AI协作完成[41][44] - 2025年AI编程工具形成两大流派:以Cursor/Windsurf为代表的IDE增强派,将AI无缝集成到开发环境中辅助编码;以Claude Code为代表的终端Agent派,能够接受高级指令并自主执行复杂的开发任务[45] - 尽管Claude Code展现了Agent的雏形,但真正的“全自动工程师”尚未到来,当前的Agent在复杂架构任务上仍需人类把控方向[46] - 行业观点认为,Claude Code通过聚焦本地化开发体验,抓住了开发者的核心痛点[46] 范式转移 - 谷歌Gemini Nano Banana模型因其名称和特性引发了病毒式传播,它代表了文本生成、图像生成与世界知识在模型权重中交织的综合能力[47][49] - 一个深刻的行业观点是:文本是计算机偏好的格式,而非人类喜欢的格式,人类更倾向于通过视觉和空间维度接收信息[47][49] - 未来的LLM交互界面应超越文本,以图像、信息图、幻灯片、视频等人类偏好的格式进行输出,这被认为是继图形用户界面后的下一个重大计算范式[47][49] - 大语言模型正作为一种新型智能形态崭露头角,其能力分布不均,既在某些方面远超预期,又在另一些方面显得笨拙,但整体上极其有用[54] - 行业认为,即使以当前模型的能力,其应用潜力也远未被发掘出10%,该领域从概念上看仍感觉广阔无垠[55][56]
一图看懂|如何用 AI 重构企业产品增长新曲线
AI前线· 2025-06-19 16:10
AI技术前沿与产业落地 - AICon北京站聚焦AI技术前沿突破与产业落地 围绕AI Agent构建 多模态应用 大模型推理性能优化等热门议题深入探讨 [1] 行业人才竞争动态 - 扎克伯格挖角OpenAI 签约跳槽发放7亿奖金 [1] - 阶跃星辰高管离职跳槽京东 [1] - 百度大规模抢夺顶尖AI人才 岗位数量增长超60% [1] - 阿里自曝因DeepSeek竞争压力加速人才布局 [1] 大模型技术进展 - DeepSeek R1编程得分超越Claude Opus 4 但月暗称其新模型表现更优 [1] - ClaudeCode被员工高频使用 日均成本达1000美元 创始人承认定价偏高主要面向大公司 [1] 行业热点事件 - 特朗普AI治国计划代码在GitHub泄露引发争议 [1]
推理、训练、数据全链条的工程挑战,谁在构建中国 AI 的底层能力?|AICon 北京
AI前线· 2025-06-16 15:37
大模型系统性问题与国产AI挑战 - 大模型发展面临推理慢、训练不稳、数据迁移难等系统性挑战 这些因素决定技术规模化落地能力 [1] - 国产AI需解决算力适配、系统容错、数据合规等现实问题 特别是摆脱对进口芯片的依赖 [1] - AICon大会将聚焦国产芯片推理适配、开源部署、训练容错机制等七大关键议题 覆盖基础设施建设全貌 [1] 国产算力与推理优化技术 - 清程极智开源赤兔推理引擎 实现在非英伟达Hopper架构及国产芯片上原生运行FP8精度模型 解决硬件成本高企问题 [4] - 华为昇腾推出DeepSeek大模型推理架构 提供性能优化方案与专家并行调度技术 加速国产算力平台部署 [5][6] - 京东零售分享LLM推理优化实践 通过请求调度与流水线执行技术 平衡高吞吐与低延迟的零售级需求 [7][8] 训练系统与开源生态 - 蚂蚁集团开源DLRover框架 解决万卡规模训练的稳定性问题 包含分布式容错与国产卡适配经验 [11] - SGLang推理引擎整合专家并行、推测解码等前沿技术 实现DeepSeek V3等开源模型低成本部署 [9][10] - 阿里巴巴探讨强化学习系统发展 涵盖RLHF架构、自对齐算法及开源生态建设方向 [8][9] 数据基础设施演进 - Zilliz推出向量数据库云原生方案 解决GenAI场景下的数据迁移、BYOC部署和Schema演进问题 [12] - 行业面临传统数据库架构不适应AI需求的问题 需构建企业级向量数据管理平台 [12] 行业动态与人才流动 - 百度大幅扩招AI人才 岗位数量增长超60% 反映行业对顶尖技术人才的激烈争夺 [12] - 阶跃星辰高管转投京东 显示头部企业间核心人才竞争白热化 [12] - ClaudeCode获企业青睐 日均使用成本达1000美元/员工 凸显高性能AI工具的商业价值 [12]