Workflow
Coding
icon
搜索文档
合合信息推出AI Agent云资源智能管理终端,可实现“一句话管理千台服务器”
环球网· 2025-06-20 17:02
产品发布 - 合合信息在2025亚马逊云科技中国峰会上发布业内首个AI Agent跨平台云资源智能管理终端Chaterm [1] - 该解决方案通过构建"对话式终端管理工具"为云计算从业人士提供云资源智能化和规模化管理新路径 [1] - 核心代码已全面开源 [1] 技术特点 - Chaterm将AI Agent能力引入云资源管理终端,使管理人员能在对话交互中精准调度云资源 [3] - 产品具备"辅助驾驶"和"自动驾驶"两种工作模式,可大幅提升云资源开发和管理效率 [5] - 在构建GPU集群开发环境场景下,原本需数小时的工作现在可在十几分钟内完成 [5] - 搭载批量管理远程服务器能力,自动"记忆"用户操作习惯,实现"一次配置,多端通用" [5] - 具有跨平台兼容性,支持MAC、WINDOWS、LINUX等操作系统 [5] 行业影响 - 传统终端管理方式存在操作繁琐、效率低下等瓶颈 [3] - Vibe Coding(氛围编程)的出现让"对话式开发体验"成为可能 [3] - 公司表示将继续探索AI技术与产业场景的融合边界,推动行业智能化转型 [6] 数据安全 - 全面开源核心代码,开发者可观察算法底层运行逻辑并进行定制化修改 [6] - 实现云资源管理领域"透明可控,安全可信" [6]
2025必看!大神Karpathy封神演讲:AI创业不造钢铁侠,而是造钢铁侠的战衣
量子位· 2025-06-20 13:53
软件3.0时代 - 软件在过去70年基本没变 但最近几年连续经历两次根本性变革 从传统编程到神经网络再到自然语言编程大模型 [2][5] - 大模型是可编程的 提示词就是程序 用自然语言编写 标志着软件3.0时代的到来 [4][5][6] - 软件1.0是传统代码编程 软件2.0是神经网络权重参数调整 软件3.0是自然语言编程大模型 [11][31] 大模型三重属性 - 工具属性:类似电力网络 前期高资本投入建设基础设施 后期按API使用量收费 需求特征为低延迟、高稳定性、质量一致 [8] - 工厂属性:训练需巨额资本 技术路线复杂 研发集中在少数公司 软件可复制性使护城河不如硬件牢固 [9] - 操作系统属性:形成复杂软件生态系统 闭源巨头与开源社区并存 当前类似计算的1960年代 模型集中在云端 [12][13] 大模型能力与局限 - 拥有百科全书般记忆 能记住Git提交哈希值等人类难以记忆的内容 [15] - 存在认知缺陷 产生幻觉、缺乏自我认知、犯低级错误如9.11大于9.9 数错字母数量 [16] - 患顺行性失忆症 上下文窗口即工作记忆 每天被清空 无法持续学习巩固知识 [16] AI应用机遇 - 最大机遇在构建半自主化产品 提供自主性滑块 控制权始终在人类手上 如Cursor的代码重构层级选择 Perplexity的搜索深度选择 [17][21][22] - Vibe coding兴起 大模型理解自然语言使人人可编程 但部署环节仍依赖传统人工操作 [24][25] - 需为AI agent重建基础设施 当前软件为人类设计 需转向大模型友好格式 如Markdown文档替代点击指令 [25][26] 行业发展趋势 - 需重写海量代码 专业程序员与vibe coder共同参与 未来十年自主性滑块将逐步右移 [28] - 中期大模型渗透企业级工作流 代码、文档、数据分析全面智能化 [29] - 长期普及类贾维斯智能助手 但人类始终是闭环决策者 [30] - 从业者需同时掌握Software 1.0代码、2.0模型训练、3.0提示词工程 [31]
Andrej Karpathy最新演讲爆火!人类已进入「说话就能编程」的软件3.0时代
机器之心· 2025-06-20 08:58
软件演进阶段 - 软件发展划分为三个阶段:人工编写指令的「软件1.0」、以神经网络权重为核心的「软件2.0」、由LLM开启的「软件3.0」[8] - 软件1.0是直接为计算机编写的代码,软件2.0是神经网络的权重,软件3.0则是用自然语言编程LLM[24][25] - 软件2.0领域已出现类似Github的平台如Hugging Face和Model Atlas[21] LLM本质与特性 - LLM可被视为一种「新型操作系统」,其核心设置类似CPU,上下文窗口类似内存[52] - LLM是「有缺陷的超人」:知识渊博但会产生幻觉、犯低级错误且没有长期记忆[14] - LLM具有基础设施属性,类似电网建设,通过API按量计费提供智能服务[38] - LLM生态系统类似操作系统市场,有闭源提供商和开源替代品如Llama[49] 行业应用与机遇 - 当前最大机遇是开发「部分自主性」产品,而非完全自主AI[14] - Cursor和Perplexity是早期LLM应用典范,具备上下文管理、多次调用编排和自主性滑块等特性[101][103][107] - 未来软件将普遍具备「自主性滑块」,允许用户调整自主程度[104] - 需要重构数字基础设施使其对AI友好,如将文档转为Markdown格式[170][176] 开发范式转变 - 自然语言成为新编程接口,提示词就是编程LLM的程序[27] - 出现「氛围编程」现象,非专业人士也能通过自然语言描述构建软件[141][144] - 开发者需掌握三种编程范式(1.0/2.0/3.0)并根据场景灵活选择[34] - 开发流程中「生成-验证」循环的快速运转是关键,GUI可极大提升验证效率[117] 未来发展趋势 - 当前处于类似1960年代的计算纪元,LLM算力仍集中在云端[59][64] - 需要为AI重新设计数字基础设施,使其机器可读、可操作[14][187] - 未来十年将见证技术从增强工具向自主智能体的渐进式演进[189] - 钢铁侠战衣式增强工具比完全自主智能体更适合当前技术阶段[134]
AI大神卡帕西最新演讲:AGI从幻想到落地,先要直面三个现实
36氪· 2025-06-19 20:09
软件3.0生态重构 - 软件3.0以"提示词即程序"范式颠覆传统编程,将提示词与系统设计、模型调优融合为新生产力,而非简单叠加手工代码与机器学习[2] - 软件发展分为三个阶段:手工敲代码的软件1.0、机器学习训练模型的软件2.0、提示词驱动的软件3.0,后者正以不可逆转趋势挤压前两代生存空间[6] - 大语言模型具备"多面手"属性,可切换数字水电工、代码生产工厂、应用开发者、在线管家等角色,彻底重构技术研发到商业化的逻辑[7] LLM心理学与认知缺陷 - 当前大模型存在"锯齿状智能"现象:能解决高难度任务但可能在常识判断上出错,如能解偏微分方程却分不清9.11和9.9大小[10][12] - "顺行性遗忘"指大模型对话记忆局限,每次对话都是全新开始,缺乏持续学习能力,需通过系统提示学习划定能力边界[14][16] 人机协作框架 - "部分自主性"框架需平衡AI自主决策与人类信任,通过自主性调节器动态控制AI自主度,如Cursor从Tab键补全到智能体全包模式[17][18] - 人机协同需快节奏验证(10秒内批改AI方案)与严格边界划定(强制代码包含指定函数),防止生成无法运行的玄学代码[21] - 技术落地需跨越Demo到产品的鸿沟,Waymo案例显示完全自主性不现实,部分自主性才是实用解决方案[23] 智能体开发生态 - Vibe Coding概念催生数千家初创公司,但实际应用中AI光速编程效果易失效,暴露理想与现实的差距[24] - 开发工具链呈现新旧割裂:老工具文档复杂难懂,新工具文档简洁清晰,需DeepWiki类知识整理工具自动关联API等资源[27] - 智能体作为"双语翻译官"连接人类与计算机程序,推动开发范式从人适应机器转向机器适应人[30] 行业变革方向 - 务实创新应聚焦半自主系统开发、软件3.0范式转型、大模型基础设施化三大方向,而非空谈AGI目标[31] - 未来胜出者将是最懂人机协作的团队,这场变革本质是生产关系的重构,类似工业革命对生产方式的改变[31]
Wix Further Expands into Vibe Coding with Acquisition of Base44, a Hyper-Growth Startup that Simplifies Web and App Creation with AI
Globenewswire· 2025-06-18 21:00
文章核心观点 Wix.com宣布收购AI平台Base44,此收购将增强其AI产品组合,推动在线创作变革,使数字世界更具可及性和创造性 [1][2][4] 收购情况 - Wix以约8000万美元的初始对价收购Base44,并根据特定绩效指标在2029年前支付额外的或有付款 [5] - 预计该交易对2025年预订量和收入贡献不大,2025年将向Base44员工支付约2500万美元的留任奖金,此费用将不计入非GAAP和自由现金流结果 [6] 公司情况 Wix.com - 全球领先的SaaS网站建设平台,成立于2006年,为各类用户提供行业领先的性能、安全、AI功能和可靠基础设施,以及多种商务和业务解决方案、先进的SEO和营销工具 [8] - 专注于持续创新,不断推出新功能和产品,助力用户打造强大高端的数字形象 [8] Base44 - 创新的AI平台,使用自然语言构建自定义软件应用,无需传统编码,结合前沿AI技术,助力不同用户快速设计、部署和扩展定制数字解决方案 [10] - 拥有不断增长的用户群,注重无缝、直观体验,推动无代码开发的未来发展,在市场上有一定影响力,与eToro和SimilarWeb等有B2B合作 [3][10] 行业趋势 科技领域正经历重大变革,“氛围编码”兴起,推动创作从手动开发向意图驱动的软件开发转变,对通过对话和直觉将想法转化为现实的工具需求不断增长 [2] 各方观点 - Wix CEO表示此次收购是公司在线创作变革承诺的重要里程碑,Base44团队带来的技术、市场渗透和领导力与公司使命契合,将推动AI驱动创作的边界拓展 [4] - Base44 CEO认为Wix是帮助Base44实现规模和分销的最佳选择,双方理念相符,Wix的规模将推动Base44发展,Base44将继续作为独立产品和业务运营 [4]
速递|Anysphere半年估值翻4倍或至200亿美元,继6月初完成融资,又拟接洽新的一轮
Z Potentials· 2025-06-18 11:49
公司融资动态 - 人工智能代码编辑器Cursor的开发商Anysphere正与投资者洽谈新一轮融资 潜在估值达180亿至200亿美元[1] - 公司2023年成立后年化收入已突破5亿美元大关 被投资者称为有史以来增长最快的初创企业[1] - 本月初公司刚完成由Thrive Capital领投的9亿美元融资 投后估值达99亿美元 参投方包括安德森·霍洛维茨基金、Accel和DST Global[2] 业务发展现状 - Cursor产品能分析程序员操作并推荐代码行 客户包括OpenAI、Spotify、美国职棒大联盟和Instacart等知名企业[2] - 超过半数财富500强企业正在使用Cursor 日活跃用户超过100万人[2] - 产品降低了非技术人员编程门槛(氛围编程) 同时提升专业开发者效率[2] 行业竞争格局 - 公司面临来自GitHub Copilot和Amazon CodeWhisperer的激烈竞争[3] - 主要竞争对手Windsurf已同意以30亿美元出售给OpenAI 但交易尚未完成[3] 公司战略方向 - 当前重心聚焦技术研发、产品打造和团队建设 而非主动寻求融资[1] - 虽资金充足 但仍可能利用有利融资条件充实资产负债表[2]
对话言创万物创始人:AI Coding 是在「垒砖」,我们想用 AI「盖房子」
深思SenseAI· 2025-06-18 09:56
AI Coding与AI SWE行业分析 核心观点 - AI Coding是当前最火热的AI赛道之一 但仅占软件工程(SWE)全流程的30%左右 真正的机会在于AI SWE即用AI重构软件研发全链路[1][3][9] - 严肃场景的软件开发复杂度远超Vibe Coding的范畴 需要解决架构设计、测试部署等系统性难题[2][11][21] - 未来AI Agent将成为软件研发的Controller和Planner 渗透到需求沟通、代码生成、测试运维等各个环节[16][17][39] 行业现状与机会 AI Coding局限性 - 当前AI主要聚焦单个模块代码生成 仅占工程师工作时间的30-35% 无法覆盖SWE全流程[9][11] - Vibe Coding适合demo开发 但严肃场景需要解决多模块协同、负载均衡等复杂问题[2][11] - GitHub Copilot等工具仍依附传统IDE形态 未来可能被多Agent协同的工作台取代[17][29] AI SWE市场潜力 - 软件工程是价值极高的存量市场 2025年云厂商、数据库等SWE相关企业市值已达千亿级[12] - 大厂在AI SWE领域进展缓慢 GitHub Copilot体验落后于Cursor等创业公司产品[13][14] - 技术快速迭代打破现有优势 创业公司有机会在细分领域超越资源更丰富的大厂[14][15] 技术演进路径 发展阶段划分 - L0-L2:从代码补全到局部任务自动化 当前行业处于L2阶段[35] - L3-L4:实现模块级和系统级自动化 具备初级架构设计能力[35][38] - L5:SWE AGI实现Result-as-a-Service 人类仅需需求输入和结果验收[35][39] 关键技术突破 - 需构建Agent专用基础设施 如Superbase后端服务、MCP通信协议等[17] - 端到端Agent Learning将用户反馈数据融入模型训练 提升任务完成率[48] - 沙盒隔离、服务发现等Infra支持Agent安全自主运行[31][48] 公司战略与差异化 产品定位 - 聚焦大粒度任务自主完成 而非代码补全等单点功能[29][31] - 从目标而非代码出发 对齐工程师与产品经理的任务目标[22][31] - MVP版本已开发10万行代码 复杂度远超普通AI应用[49][51] 竞争优势 - 无存量用户包袱 产品架构围绕Agent自主运行设计[30][31] - 团队效率达大厂2-5倍 全员使用多款AI工具实现原生提效[31][32] - 30人精干团队专注技术突破 避免大厂常见的组织效率折损[47][53] 未来工作模式 人机协作演进 - 短期:工程师带领5-10个Agent协同工作 聚焦创造性任务[42] - 长期:优秀工程师可管理100个Agent 通过高效调度提升生产力[42] - 初级工程师可能被替代 高阶工程师成为需求澄清和结果验收的关键节点[41][42] 组织形态变革 - AI原生组织会议减少50% 工程师日均会议不超过2场[53] - 软件设计原则将重构 现有面向人类的工程方法可能不再适用[33] - 团队规模控制在40人以内 通过技术深度而非人力规模取胜[47][54]
海外AI编程独角兽吸金240亿,中国版“Cursor”何时杀出重围?
第一财经· 2025-06-18 09:46
投资人判断"很难有胜算",入局者相信"弯道超车"。 "面试时让我打开IDE写代码,我打开Cursor,刚把函数名写完,实现全出来了,"在关于AI编程的讨论帖下,一位海外的网友表示,"太糗了,只能假装认为 AI不全对,尽量挑毛病,最后发现AI写的就是全对。" AI编程工具正在重塑工作流,而以Cursor为代表的编程产品,将编程体验拉到了新的高度。凭借此产品,Anysphere从默默无闻到估值近百亿美元,仅用了 三年,其代表的"氛围编程"(Vibe Coding)正席卷全球开发者。 第一财经整理发现,海外AI编程战场硝烟弥漫,估值超过10亿美元的AI编程独角兽至少有7家,总融资已超240亿人民币,战火从产品烧到模型层, OpenAI、Anthropic纷纷卷入,"百编大战"已经打响。 反观国内,虽然大厂和初创纷纷入局,产品发布密集,但跟进较慢,还在迭代初期,国内开发者的首选仍是Cursor。此外,与海外初创企业领跑不同,国内 AI编程领域却是字节、阿里等大厂声量更大。这种海内外生态差异的原因是什么?国内有机会跑出自己的"Cursor"吗? 投资人的判断很现实,称"很难看到胜算"。但入局者则认为,技术发展未到终局, ...
对话言创万物创始人:AI Coding 是在「垒砖」,我们想用 AI「盖房子」
Founder Park· 2025-06-17 17:49
AI Coding 或者 Coding Agent,或许是当下最火热的 AI 赛道。这是模型能力的主线,更强的代码能力, 意味着模型能够解锁更多应用场景。 在全行业都在体验 AI Coding 的时候,氛围编程 Vibe Coding 成为了最热门的关键词。 Vibe Coding 引入了大量非专业代码人群,因此饱受关注。但陈志杰意识到,严肃场景的软件生产比想 象中复杂的多。 编辑 | Nico、万户 言创万物投资人,早期基金 Creek Stone 的合伙人李一豪也参与了本次采访,感谢他提出了很多有价值 的问题。 超 6000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 软件开发是一个数十年的产业,软件开发构建了今天我们熟悉的整个「数字世界」。 而写代码,仅仅是软件工程的一个子环节。这意味着,刚刚能够做到基础 Coding 的大模型,也许之后 有机会解决更大更难的问题。 一个有机会被 AI 颠覆的价值极高的存量市场。 2025 年初,前 TikTok 算法负责人陈志杰选择创业,与老搭档刘晓春一起,创办言创万物,聚焦 AI Coding 方向, ...
关于 Multi-Agent 到底该不该做,Claude 和 Devin 吵起来了
Founder Park· 2025-06-16 22:16
多智能体系统核心观点 - Anthropic与Cognition两篇文章共同揭示了多智能体系统的适用场景与局限性:Anthropic强调多智能体在低依赖、可并行任务中的高效性(如研究任务),而Cognition指出高依赖、紧耦合任务(如AI Coding)目前不适合多智能体架构 [2][12][39] - 多智能体系统性能提升显著但成本高昂:Anthropic的测试显示多智能体系统比单智能体性能提升90.2%,但token消耗达普通聊天的15倍 [9][10] - 当前技术限制下,多智能体系统需满足三大条件:任务价值足够高、需要大量并行处理、信息量超出单个上下文窗口 [12][16] 多智能体架构设计 - 编排器-工作器模式为核心架构:主智能体负责协调,子智能体并行执行任务,通过动态搜索替代传统RAG的静态检索 [13][16][19] - 并行工具调用实现效率飞跃:引入两层并行化(主智能体同时启动3-5个子智能体,子智能体并行使用3+工具)使复杂查询研究时间缩短90% [25][26] - 上下文管理策略关键:采用外部内存存储关键信息、智能压缩机制防止溢出,子智能体输出直接写入文件系统减少token开销 [35][36] 多智能体适用场景 - 最佳应用领域:开放式研究任务(如跨领域软件开发、商业策略制定、学术研究),可覆盖信息量超出单智能体能力的广度型查询 [9][38] - 当前不适用场景:需要共享同一上下文的高依赖任务(如实时编码协调),LLM智能体尚无法有效处理任务分配与实时协调 [12][57] - 典型成功案例:Anthropic多智能体系统完成标普500公司董事会成员搜索等复杂研究任务,而单智能体系统失败 [9] 多智能体工程挑战 - 提示工程决定系统行为:需开发智能体心理模型,明确任务分配规则(简单查询1个智能体3-10次调用,复杂研究10+子智能体) [21][23] - 调试复杂度指数级增长:微小提示改动引发连锁反应,需建立模拟环境观察失败模式(如子智能体重复搜索、工具选择错误) [21][31] - 部署策略特殊:采用彩虹部署逐步迁移流量,避免中断运行中的智能体状态 [33] 多智能体评估方法 - 传统评估方法失效:需采用最终状态评估而非路径验证,LLM评判者规模化评估事实准确性、引用质量等维度 [27][28][29] - 人工测试不可替代:发现自动化评估遗漏的边缘情况(如SEO内容偏好),修正信息源选择偏差 [29] - 涌现行为需监控:智能体交互产生非预期行为,需追踪决策模式与交互结构 [30] AI Coding领域实践 - Cognition实践表明:2025年技术条件下,编程任务采用多智能体会导致系统脆弱,因决策分散且上下文共享不足 [57] - 单线程线性agent更可靠:Claude Code子agent仅回答明确定义问题,避免并行工作导致的矛盾输出 [55] - 上下文工程是核心:需压缩历史对话关键细节,微调专用模型管理长上下文 [53]