Agent
搜索文档
大模型公司不搞浏览器搞Agent,实测找到原因了
量子位· 2025-10-31 14:27
产品核心功能 - 产品形态为桌面悬浮球Agent,可直接与本地操作系统交互[3][44] - 具备联网搜索、浏览器操作、Excel表格处理和终端控制能力[6] - 支持通过自然语言驱动计算机系统,实现"为所欲为"的本地操作[2][45] 技术操作能力 - 自动完成编程环境搭建,如下载conda、创建虚拟环境、安装指定包(Python 3.11.13、torch 2.8.0、torchvision 0.23.0等)[9][11][14][19] - 执行过程中自动纠错并修改方法,最终在本地打开Jupyter[15] - 自动升级代码项目,如用Pygame替换tkinter界面、增加分数排行榜功能、修复内存泄漏并生成exe文件[21][24][25] 任务管理特性 - 支持"妙计"功能实现操作步骤复用,如通过"/图片按时间分类"指令快速执行复杂操作[30] - 具备定时任务能力,可设置到点自动执行任务[8][32] - 支持并行处理任务,后台运行不干扰当前工作,任务结束时浮出提醒[8][34] 行业发展趋势 - Agent正打破人机交互边界,过去手动衔接的操作环节被语言指令串联[47] - 多家公司布局桌面Agent领域,如智谱推出主打推理和PPT生成的Agent,MiniMax推出能输出分析报告和代码的"超级员工"[41][42] - 技术趋势从浏览器Agent转向本地操作系统交互,未来人机互动可能像对话一样轻松[40][47] 产品当前局限 - 任务执行速度较慢,环境搭建需以分钟为单位计时[36][37] - 调试代码时对多个错误修改不完全,需多次检查[38] - 目前仅支持Mac系统,Windows版本尚未发布[39]
2025长沙1024程序员日:为开发者职业发展插上腾飞之翼
搜狐财经· 2025-10-26 18:53
AI对就业市场的影响 - AI技术自2022年底渗透经济领域后,对就业市场影响严峻,开发者和客服是AI暴露度较高的岗位[1] - 2022年底至2025年7月期间,22-25岁年轻开发者就业率下降6%,而更年长就业群体反而增长6%-9%[1] - AI不一定会引发就业下降,但已开始对入门级岗位造成影响,当AI作为辅助工具时,这些岗位需求不降反增[1] 全球开源生态与开发者规模 - 全球开发者总量突破1.5亿,中国开发者总量超1200万,活跃开发者约400万,规模稳居全球第二[6] - 大模型开发生态贡献度Top10国家中,美国贡献占比37.41%,中国为18.72%[6] - 在AI Agent领域差距大幅缩小,美国贡献占比24.6%,中国为21.5%,说明中国开发者在Agent层面投入更多[6] AI技术发展趋势 - 软件领域正从AI辅助研发向AI原生研发演进,奇点智能研究院发布《AI原生软件研发成熟度模型AISMM》[9] - AISMM将AI原生软件研发划分为五个阶段:L1辅助提效、L2领域集成、L3代理协同、L4自主代理、L5软件工厂[9] - AI编程已从“辅助工具”进化为“自主伙伴”,未来80%需求将由AI自主完成,异步委派取代实时协作成为主流[13] 企业AI工具与平台进展 - 华为AI全流程工具链ModelEngine数据工程DataMate开源,在瑞金医疗场景实践中将病理数据处理周期缩短80%[10] - 华为启动2025年鸿蒙应用开发者激励计划和“天工计划”,计划投入超10亿支持鸿蒙应用开发和AI Agent创新[11] - 腾讯云智能体开发平台通过三大引擎构建基础设施,在复杂场景下相比传统RAG性能提升20%,准确率达95%以上[13] 操作系统与开源生态建设 - 搭载HarmonyOS 5的终端设备数突破2300万,已有80+鸿蒙应用智能体正式上线小艺智能体广场[11] - 普华基础软件开源全球首个智能驾驶操作系统龘微内核EasyAda和安全车控操作系统开源小满EasyXMen[15] - OpenHarmony已迁移到GitCode,公司将和社区开发者一起打造开源开放、免费、AI原生的操作系统[14] 开发者工具与协作模式演进 - AI编程工具正经历从静态Copilot到动态Agent的范式跃迁,从被动辅助执行向主动思考转变[17] - 华为云在开发者空间提供Agent工具赋能泛开发者,通过拖拉拽就能开发智能体应用[19] - Qoder构建三层核心能力:Repo Wiki将隐性知识显性化,Quest模式使复杂任务效率提升10倍以上[13] 行业应用与实践活动 - 活动举办九场“1024 AI构建者大会”实战工作坊,覆盖微软、亚马逊云科技、华为云、腾讯云等企业技术[20][24] - 微软专场体验智能GitHub Copilot与MCP技术深度集成,亚马逊云科技专场以Kiro工具完成从0到1的AI应用落地[24] - 腾讯云黑客松冠军工坊指导开发者实操CodeBuddy、腾讯云智能体开发平台、混元3D模型等工具[24]
能够攻克这个难关,这家公司几乎做到世界第一!
混沌学园· 2025-10-23 20:08
公司技术与产品 - 公司凭借全球顶尖的柔性仿真引擎技术打造3D仿真建模软件Style3D Studio,并自研基于GPU的3D仿真、光追渲染等全球领先的核心技术[4][15] - 公司核心产品Studio发布9.0版本预告,新版本通过AI大模型学习行业知识,自动生成3D服装,实现从设计到3D模型的快速转化[10] - 公司近期正在攻坚全球首创的AIGP技术(AI生成版片),AI首先生成2D的结构化数据,再通过自动化建模得到3D模型,支持实时修改和优化,大幅缩短从设计到生产的周期[19][20][21] AI与行业应用 - 公司在AIGC时代实现AI生成设计灵感、AI生成3D数字样衣和营销内容,并在央视《赢在AI+》节目斩获AIGC+设计赛道冠军,从700多家企业中脱颖而出荣获"2025中国AI创业十骏"[4] - 公司自研全球首个服装时尚领域Agent DeepModa,采取多智能体架构,构建五大核心组件,覆盖设计、营销、生产完整链路的端到端模型框架[22][23][32] - DeepModa在设计阶段支持实时流行趋势分析、智能化款式生成和花型设计,在生产阶段进行款式解析并生成版型和3D样衣,在销售阶段自动生成文案、电商图和营销短视频[23][24][25] 客户案例与市场表现 - 全球已有超2000家客户使用公司核心软件,包括李宁、安踏、波司登等知名品牌,海外客户收入占公司营收一半,第二届伙伴大会集结超600位海内外头部时尚企业嘉宾[4] - 太平鸟与公司合作后,经3D建模的款式最终复样比率约为10%,未采用3D建模的款式复样比率接近50%,并将AI技术深度融入产品推广场景优化模特表情[12] - 以Shein、Halara为代表的出海快时尚品牌基于公司技术实现以小时计的产品设计周期,实现更快测款、更快获得反馈和更多订单的增长飞轮[38] 行业趋势与战略定位 - 公司认为垂直领域的Agent需要专业化、本地化部署,其核心竞争力源于对客户需求的深度理解、独家工具API调用能力、行业认知和数字资产积累[34] - 工业软件是链接行业客户业务场景和AI新技术的抓手,AI需与工业软件结合才能完成具体业务需求,未来所有CAD软件都会AI化实现全新升级[35][37] - 服装时尚企业对全球供应链布局需求迫切,公司跟随全球化客户脚步进行海外布局,有望迎来客户数大幅增长拐点并发展成为产业的基础操作系统[37][38]
IDC:中国AI基础设施市场爆发式增长,阿里云第一
财经网· 2025-10-22 16:20
市场整体表现 - 2025年上半年中国AI基础设施服务市场同比增长122.4%,达到198.7亿元人民币 [1] - 生成式AI基础设施在AI IaaS市场中占比扩大至八成以上,其市场规模同比增长219.3% [1] - AI基础设施服务市场整体预计到2029年将接近1500亿元人民币 [2] 市场竞争格局 - 阿里云以24.7%的市场份额在中国AI基础设施服务市场稳居第一 [1] - 在生成式AI基础设施细分市场,阿里云市场份额为24.9%,位列第一 [1] - 在经典AI基础设施细分市场,阿里云以23.6%的市场份额位列第一 [1] 公司业务与战略 - 阿里云通过持续加大AI基础设施资本支出和算力储备来支持业务增长 [1] - 公司提供灵骏AI集群和GPU弹性算力等多元化AI IaaS服务以满足客户需求 [1] - 阿里云全栈AI服务已覆盖中国主流车企,包括中国一汽、比亚迪、吉利、蔚来、小鹏等企业 [2] 行业需求驱动 - 市场需求全面拥抱AI,互联网、汽车、手机制造、金融、泛政府等多个行业AI需求旺盛 [2] - 车企及智驾供应商竞争加剧,持续加码算力投入以抢占智驾方案领先地位 [2] - 未来Agent普及和具身智能落地将带动算力需求指数级增长,推理基础设施重要性将大幅提高 [2]
当前Agent赛道:热度之下隐现落地难题,如何破局?
雷峰网· 2025-10-22 08:51
Agent市场概况与竞争格局 - Agent成为AI应用最具爆发性方向之一,资本大力押注、玩家竞相入局,企业争先恐后落地[2] - 中国企业级Agent应用市场规模在2028年保守估计将达到270亿美元[3] - 头部玩家呈现分化,主要走向“全栈人工智能服务商”、“强强联合”以及垂直领域“专业者”等不同路径[4][5][6] 主要玩家类型与策略 - AI巨头(如OpenAI)依托底层大模型能力具备先发优势,推出ChatGPT Agent并进军Agent开发平台[8] - 云大厂(如Google、AWS、阿里云)凭借云与AI基建设施、庞大客户群和平台生态成为主力玩家,布局Agent具有重要战略意义,因其是未来资源消耗大户,能给云业务带来巨大增长潜力[8] - 明星初创企业多聚焦垂直场景,以行业know-how形成竞争壁垒,例如Cursor专注于编程Agent,Harvey推出法律领域垂直Agent[10] 全栈AI服务商布局案例 - 阿里云以“全栈AI服务商”定位展开全面布局:模型层通过通义大模型家族提供“大脑”;开发层打造百炼平台和无影AgentBay;应用层推出企业级平台AgentOne,结合电商领域know-how提供开箱即用Agent[9] - 全能型选手具备覆盖芯片算力基础设施、云计算平台、模型算法等至少三层能力,例如阿里云、谷歌云[11] 生态合作模式 - 具备特长的玩家选择与其他头部厂商生态联盟实现强强联手,例如以模型算法见长的OpenAI与微软Azure合作,将模型托管在Azure AI Foundry上,并与Databricks数据平台原生集成GPT模型[12] Agent企业应用场景 - Agent在企业应用主要有三类场景:技术维度处理多模态复杂内容、对话机器人等交互类场景、智能巡检和风控等调用规模大的场景[15] - 率先完成Agent落地的是用户交互高频的消费电子行业,但畜牧等传统行业也在逐步推进[15] - 业内共识是Agent带来的颠覆式行业变革仍在酝酿之中[15] Agent落地面临的技术挑战 - Agent能力受限于大语言模型、记忆系统、任务规划及工具使用,在模型幻觉、多模态整合、记忆管理、迁移泛化等方面存在技术难点[16] - 企业落地面临系统融合难、多Agent协同难等挑战,多Agent模式决策链路过长,可能导致等待半小时以上,且存在跨厂商通信、鉴权和身份认证难题[17] - 企业原有系统(如ERP、CRM)的定制化能力受限,影响Agent融合深度[17] 企业侧非技术卡点 - 企业面临场景不收敛、模型如何选用、业务场景选择、应用架构落地等困境[18] - 不同类型企业需求各异:中小企业关心部署、AI原生企业希望解决复杂运维、科技驱动大企业关注具体技术挑战如数据清洗和API封装[19] - 从数据到语料的转化是重要难题,在指导客户项目时,50%-70%时间用于处理数据到语料的关系[19] 破局落地的关键路径 - 技术革新方面需持续提升底层大模型能力及背后系统性工程能力[22] - 开发范式正从预定义编排式、单次决策智能式向具备更强自主规划、多轮反思与循环执行能力演进[23] - 业界广泛应用MCP协议破除Agent与业务系统融合壁垒,并采用A2A协议打破不同厂商、场景Agent的通信协作壁垒,例如阿里云百炼平台依托A2A实现跨Agent调用[23] - 阿里生态内部高德、淘宝、钉钉、闲鱼等业务正转化为Agent形态,通过百炼实现跨场景智能协作,构建Agent Store生态[24] - 行业know-how至关重要,企业需思考业务与多Agent技术形态的融合方式,并结合成本和效果综合考量Agent组合关系[25] - 处理复杂边缘案例是开发难点,期待开发者分享经验,阿里云推行百炼创客计划和AI实训营以分享业务经验[26]
OpenAI元老Karpathy 泼了盆冷水:智能体离“能干活”,还差十年
36氪· 2025-10-21 20:42
智能体发展时间框架 - 智能体距离真正成熟还需要十年时间,而非明年爆发 [2] - 当前智能体如Claude、Codex尚不成熟,缺乏多模态能力、持续学习能力和完整认知结构,无法胜任实际工作 [2] - 智能体发展的核心瓶颈在于认知组件不完整,需要系统性工程突破而非单纯计算力提升 [2] AI训练范式与架构革新 - 强化学习存在根本缺陷,其试错学习机制与人类学习方式背道而驰 [11] - 未来AI的关键方向是去知识化,保留核心算法让模型具备自我成长能力 [4] - 需要重建认知结构,当前Transformer仅相当于大脑皮层,缺乏情绪、空间记忆等关键组件 [4] - 真正的智能体需要突破上下文窗口限制,构建长期记忆系统 [4] - 未来认知核心可能仅需十亿参数,关键在于从低质量数据中提取高质量认知结构 [34][35][36] 代码生成能力现状 - 大语言模型在代码生成上存在显著认知缺陷,远未达到自动化AI工程程度 [6] - 模型在结构化、精细化工程设计上表现无力,容易产生幻觉 [7] - LLM训练于常规代码,倾向于防御性编程,无法理解用户架构意图 [7] - 模型有效应用场景包括语言翻译、非关键任务编程和自动补全加速 [9] - 当前LLM编程工具是连续演化的结果,而非突破性革命 [10] AGI落地路径与经济影响 - AGI定义为能完成任何经济价值任务且不逊于人类的系统,但首先应用于数字知识型工作 [38] - AGI将渐进式嵌入经济,不会瞬间颠覆世界,预计占GDP的2% [39][50] - 未来工作模式将是80%由Agent执行加20%人类监督的滑动式自主性 [40] - 代码是LLM最理想的落地沙盒,因其高度结构化、基础设施完备且经济回报明确 [42][43][44] - 部署路径从最结构化任务开始,逐步向上下游迁移,最终重构工作定义 [48][49] 人类学习机制与AI启示 - 人类学习通过思考、发问和讨论构建结构性理解,而非简单预测下一个token [22] - 模型存在悄无声息的崩溃现象,缺乏认知多样性,丧失探索能力 [26] - 做梦可能是进化出的反过拟合机制,通过随机游走维持认知灵活性 [28][29] - 人类记忆差是学习能力的前提,迫使抽象和模式提取,而模型记忆过多缺乏抽象 [32] - 未来AI需要构建梦境机制维持高熵状态,避免陷入死亡回路 [30][31] 自动驾驶技术挑战 - 自动驾驶是不能出错的AI任务,需要将错误概率压到接近零,而非功能完善80%就能上线 [59] - 当前最大障碍是常识推理,涉及社会理解而不仅是计算机视觉任务 [60] - 大语言模型是概率引擎而非保障引擎,不能承诺永远不出错 [61] - 自动驾驶需要全社会协同系统,包括监管、基础设施和伦理判断 [61] - 落地过程将是缓慢、渐进、区域化的系统替代,从高速公路物流开始扩展 [62][63] 智能演化与文化传承 - 人类智能是极端罕见的生物现象,智能不是演化必然终点 [51][52] - 人类独特性在于通过语言、模仿和教育跨代复制知识,绕开基因瓶颈 [53][54][56] - AI训练是为了让其成为文化的下一个节点,扩展文明操作系统 [57][58] - 文化复制可在一天内完成更新,相比基因演化的百万年是一大捷径 [55]
中国最新Agent产品趋势:多体协同,垂直赛道,行业核心业务 | 量子位智库AI 100
量子位· 2025-10-19 12:10
以下文章来源于量子位智库 ,作者AI 100组委会 量子位智库 . 连接AI创新,提供产业研究 分析师 刘萌媛 奕然 量子位智库 | 公众号 AI123All Agent元年已经过半,Agent产品也进入垂直场景深度应用的下半场。 量子位智库最新发布的2025Q3 AI100榜单中的Agent产品,在智能体技术优化、应用落地等方面蓬勃发力,越来越像人类的"AI伙伴"。 智能体技术演进日趋成熟,从 单点智能化工作 向 系统化智能协作 发展,追求更加高效、强大、稳定的任务处理能力,如扩展上下文长度并 融合多模态信息深度理解复杂场景任务,云端服务与本地操作系统深度集成,无缝接入用户工作流提供个性化服务。 应用落地呈现 从通用工具向行业"智能伙伴"深化 的鲜明趋势,嵌入千行百业的业务流程解决特定痛点。例如,科研领域Agent助力实现实验 流程自动化,投资领域Agent为用户提供长周期个性化投资策略组合建议。 量子位智库9月最新观察的数据显示,Agent类产品分走相当一部分流量。 在本次旗舰100榜单中共有7款Agent产品入围,其中 扣子空间、蚂蚁百宝箱 都是首次发布即入榜。 △2025Q3 AI 100榜单 此外, ...
阿里发布Qoder CLI助推AI开发效率,人工智能AIETF(515070)持仓股盘中震荡
每日经济新闻· 2025-10-17 10:44
市场行情表现 - A股三大指数跌幅扩大,创业板指和深证成指盘中均跌超2% [1] - 电网设备和CPO板块跌幅居前 [1] - 人工智能AIETF(515070)盘中跌超2%,其持仓股德赛西威盘中跌超8.5%,寒武纪跌幅收窄 [1] 公司产品发布 - 阿里巴巴发布全新AI编程工具Qoder CLI,具备强大的代码生成与理解能力 [1] - Qoder CLI在空闲状态下内存占用比同类工具低约70%,响应时间控制在200毫秒以内 [1] - 该工具的智能CodeReview功能可将代码审查耗时减少50% [1] - 此次发布标志着公司在"IDE+CLI"双引擎开发模式上迈出关键一步 [1] 行业发展趋势 - Agent的快速发展正推动人机协同进入全新范式,为人工智能技术的实际应用开辟更广阔路径 [1] - 未来,面向不同垂直领域的Agent将成为连接AI模型与终端用户的关键枢纽 [1] - Agent类应用的市场空间和商业价值将不断扩展,展现出巨大发展潜力和行业影响力 [1] 相关金融产品 - 人工智能AIETF(515070)跟踪CS人工智能主题指数(930713) [2] - 该ETF成分股选取为人工智能提供技术、基础资源以及应用端的个股,聚集产业链上中游 [2] - 前十大权重股包括中际旭创、新易盛、寒武纪-U、中科曙光、科大讯飞等国内科技龙头 [2]
超级智能时代,人是不是不用工作了?
36氪· 2025-10-15 20:27
文章核心观点 - 科幻与科技加速重叠,AI的终极目标是超级人工智能(ASI),这将引发对商业软件公司未来、人类工作形态以及人类存在意义的根本性思考 [1][5] 商业软件公司的未来演变 - 传统商业软件的核心逻辑“功能封装”将因大模型而变得多余,用户可通过自然语言指令直接完成全流程,软件形态将从“产品”转变为“服务流”或“意图代理” [6] - 软件公司角色将发生根本转变,从产品提供商转变为“Agent运营商”,其护城河不再是代码,而是领域知识、数据资产与伦理治理能力 [7][8] - 行业案例显示,SAP等公司已采取“AI优先,套件优先”战略,通过AI打破数据孤岛,实现业务流程端到端丝滑流转,为Agent开箱即用奠定基础 [7] 人类工作形态的转变 - AI发展速度迅猛,ChatGPT出现不到三年已能完成编程、设计、法律文书等曾被视为“高技能”的工作,预计5年后AI替代部分人类工作将成为显而易见的事实 [9][10] - “不用工作”不等于“没有任务”,人类仍需设定目标、评估结果、处理模糊性与价值冲突,对AI工作进行判断和决策将成为新的工作形态 [12] - 未来人类需要持续学习以具备决策力,可能涌现“Agent伦理审计师”、“意图澄清师”等新职业,审美等能力将变得至关重要 [12][13] 技术发展趋势与预测 - 阿里巴巴CEO吴泳铭提出AI的终极目标是ASI,届时每个人将有上百个Agent服务,大模型将吞噬软件,不再需要工程师专业开发的商业软件 [1] - 凯恩斯曾预测到2030年人均工作时长将减至每周15小时,但现实是人均GDP已增长7倍以上,全球主流工作时长仍为每周35至40小时,中国互联网大厂甚至存在“996”现象 [1]
LangChain 不看好 OpenAI AgentKit:世界不需要再来一个 Workflow 构建器
Founder Park· 2025-10-15 13:26
AgentKit产品定位与市场分析 - OpenAI发布AgentKit,提供可视化画布Agent Builder用于通过拖拽节点方式创建、管理和版本化多智能体工作流[2] - LangChain创始人认为市场不需要AgentKit这类可视化工作流构建器,其本质是构建Workflow而非真正的Agent[3][10] - 可视化工作流构建器处于尴尬位置,受到来自高复杂度与低复杂度两个方向的挤压:简单任务用无代码Agent更方便,复杂任务必须用代码实现稳定可靠[3][18] 工作流与Agent的本质区别 - Workflow流程固定,包含分支、并行等复杂逻辑,在可视化界面上体现为各种节点和连接线[2][9] - Agent逻辑被简化并抽象成自然语言,由LLM自主决定循环调用哪些工具来完成目标[2][8] - 工作流以牺牲自主性换取更高可预测性,Agent以牺牲可预测性换取更高自主性,但两者均无法单独保证稳定可靠的良好结果[8] 不同复杂度问题的解决方案 - 高复杂度场景需要代码化工作流实现高可靠性,需支持大量分支、并行处理和模块化设计[14] - 低复杂度场景可用无代码Agent(Prompt+工具)解决,其可靠性已足够且搭建更简单[16] - 随着LLM迭代,无代码Agent能解决的问题复杂度上限将持续提升[17] 无代码工作流构建器的核心问题与发展方向 - 无代码工作流构建器面临非技术用户使用不轻松、复杂任务难以管理导致界面杂乱等问题[22] - 未来方向应聚焦于让用户更轻松地用无代码方式搭建稳定可靠的Agent,而非低代码工作流[23] - 需优化代码生成模型,使其更擅长编写LLM驱动的工作流/Agent相关代码[23]