Agent
搜索文档
吴明辉:DeepSeek之后,每一家公司都是Agent
混沌学园· 2025-04-02 16:32
核心观点 - 未来营销不仅面向人,还需面向大模型,智能体如Manus可能成为每个人的桌面 [1] - 企业本质是超级Agent,一线员工是感知系统,管理层是认知系统 [1][5] - 国产AI领域将在4月迎来Agent发布潮,Manus已与通义千问达成合作 [1] - 大模型能力十倍速提升带来重大机遇,但幻觉问题仍是挑战 [2] - Agent分为供给侧代理和需求侧代理,Manus是成功案例 [3][4] 推理大模型带来的机会 - 大语言模型本质是函数,根据上文生成下文 [1] - DeepSeek-R1等模型推理能力提升10倍,创造新创业机会 [2] - 幻觉问题未解决反而带来机遇,可用企业独有数据解决 [2] - 大模型擅长处理非结构化数据,如社交媒体信息 [11] Agent的定义与分类 - Agent可译为"智能体"或"代理商",需明确代理谁的利益 [3] - 供给侧代理:帮助客户更好使用现有软件 [3] - 需求侧代理:围绕客户需求连接资源,如Manus [4] - Manus成功连接各种工具,类似人类具备感知和行动能力 [5] 企业Agent的构建框架 感知系统 - 贝壳找房案例:工牌录音记录施工过程,数据脱敏分析后赋能一线 [8] - AI可强化感知,如Grok3利用X平台实时舆情数据 [10] - 大模型帮助交易员获取场外非结构化数据,提升感知能力指数级 [11] 认知系统 - 需聚焦高频高杠杆率决策,如用AI变革核心工种 [14] - 建议采用倒三角架构:客户在上,一线员工居中,管理层在下 [15] - 企业应建立自有模型保护数据,开源是更好选择 [15] - 倒三角结构解决两大问题:客户与员工互动、员工与管理层互动 [17] 行动系统 - 物理世界行动系统如宇树机器人,虚拟世界行动系统如API/RPA/Agent [18] - Manus展示Agent强大功能,企业需全员升级工具和分工 [19] - 企业应重构组织,思考员工在新工具中的角色定位 [19] 目标系统 - Agent需明确代理目标,形成感知-响应-行动闭环 [20] - AI可实现自我迭代,如思灵机器人自造自身 [20][21] - 企业需在目标前提下利用AI进行复盘,遵循人机持续迭代原则 [23] 战略建议 - 研发团队需升级,明确AI可替代的工作范围 [25] - 保护核心数据,面向大模型做营销而不仅面向人 [26] - 产品设计需考虑机器人操作场景 [26] - 建议有资源的企业训练自有模型 [26] - 未来战略需基于"智能无限提供"的假设 [27] - 工作分为对人/不对人两类,后者将减少 [27] - 人机交互不可替代,需重视客户情绪价值 [27]
对话飞虎互动:金融行业AI智能体怎么做
钛媒体APP· 2025-03-31 11:52
石海东告诉钛媒体App:"DeepSeek不仅在大模型推理成本和推理能力实现了极大优化。更重要的是, 对于各行业客户而言,过去对大模型存在负面印象,包括幻觉、训练数据等偏见和缺陷性问题, DeepSeek正在抹除这部分担心。这进一步推动了深度垂直智能体的落地。" 未来会有大量专业Agent,而不是只有一个超级Agent 相较于通用型Agent,面向B端垂直场景的Agent其机会窗口正在扩大。春节过后,DeepSeek的出圈,中 国有至少60家银行相继宣布对接了DeepSeek,但基本面向投资者的投研报告、财报分析、客户资料分 析报告等非核心业务场景,亦或者是OA、办公自动化,IT代码开发等非业务场景。 与一些企业或厂商先高调发声再选择行动不同的是,飞虎互动深入金融行业的Agent这件事情已经一年 有余。目前围绕金融银行三大关键环节:营销-风控-交易,飞虎互动构建了三款大模型驱动的Agent用 例,包括对客营销机器人,风控合规机器人,交易服务机器人。 飞虎互动公司创始人董事长石海东及团队与钛媒体交流中指出,AI大模型在银行业务价值和落地优先 级高的其实是在营销、风控领域,目前DeepSeek还没有接入到这些领域 ...
用友网络(600588):转型阶段整体承压 AI赋能后续成长
新浪财经· 2025-03-31 08:31
财务业绩 - 2024年总营业收入91.53亿元 同比下滑6.6% [1] - 归母净利润亏损20.61亿元 较2023年亏损扩大10.9亿元 [1] - 实际亏损超出业绩预告的17.2-19.2亿元区间 [1] 收入下滑原因 - 部分客户需求阶段性延后导致签约金额同比下降 [1] - 订阅业务模式迁移对短期整体收入造成影响 [1] 亏损扩大因素 - 研发投入形成的资本化无形资产摊销金额同比增加3亿元 [1] - 报告期末员工较2023年末减少3666人 离职补偿金增加1.4亿元 [1] - 计提商誉减值损失同比增加1.6亿元 [1] 云业务表现 - 云服务业务收入68.5亿元 同比下滑3.4% [2] - 订阅收入同比增长26.0% [2] - 云业务相关合同负债27.8亿元 较2023年末增长13.0% [2] - 订阅相关合同负债23.1亿元 较2023年末增长25.9% [2] - 云服务累计付费客户数87.25万家 新增付费客户15.75万家 [2] 战略发展 - 发布企业服务垂类大模型YonGPT2.0 采用1个大模型平台和2个应用框架(Agent和RAG) [2] - 基于Agent等框架发布智能助理、数智员工等通用产品及100多个场景化企业智能服务 [2] - 产品覆盖财务、人力、供应链等企业服务领域 [2] 盈利预测调整 - 下调2025-2026年盈利预测 新增2027年预测 [3] - 预计2025-2027年收入分别为105.1亿元、121.9亿元和141.8亿元 [3] - 预计2025-2027年归母净利润分别为1.0亿元、4.1亿元和8.4亿元 [3]
从Copilot到Agent:AI编程的范式革新
西部证券· 2025-03-12 19:16
行业投资评级 - 行业评级为超配 维持前次评级 [5] 核心观点 - AI Coding正在成为Agent商业化的突破口 编程领域的规则明确性为Agent应用提供了天然约束框架 编程环境的技术特性为Agent自纠错提供了理想试验场 编程原子化任务与大模型链式推理机制深度契合 [1][8] - 企业开发效率的刚需创造了明确付费意愿 AI编程领域已逐步形成"技术验证-产品迭代-商业变现"的完整闭环 [1][8] - AI大模型在编程中的应用发展分为"Copilot→Agent→Multi-Agent"三个阶段 目前各大厂商AI coding产品多处于第一阶段向第二阶段迈进的关键节点 [2][9] 技术发展三阶段 - 第一阶段LLM as Copilot:大模型作为Copilot辅助程序员完成任务 不改变软件工程的专业分工 [2][9] - 第二阶段LLM as Agent:Agent能够自主完成一部分任务 成为单一职能专家 自主使用工具完成预定任务 [2][9] - 第三阶段LLM as Multi-Agent:多智能体互相协作完成复杂任务 人类负责创意纠偏和确认工作 [2][9] 国际领先产品分析 - GitHub Copilot:2024年7月ARR达3亿美元 占GitHub整体收入增长的40% 拥有180万付费订阅用户 [13] 2025年2月推出Agent模式 自主执行能力显著提升 可实现自主迭代代码识别错误并自动修复 [15] - Cursor:2024年8月完成4亿美元A轮融资 2024年12月估值达25亿美元 2025年3月ARR可能已增长至1.5亿美元 估值或突破100亿美元 [17][18][19] - Devin:2024年4月估值达20亿美元 2024年12月全面开放 订阅费用为$500/月 客户包括年收入3亿美元的Ramp和年收入17亿美元的MongoDB [20][21] 国内主要产品进展 - 字节豆包MarsCode:2025年3月正式上线国内首个AI原生集成开发环境Trae 配置Doubao-1.5-pro模型 支持切换DeepSeek R1和V3模型 [22][23] - 百度文心快码Comate:公司80%工程师深度使用 代码采纳率达46% 新增代码生成占比29% 已升级至3.0版本 由Copilot模式升级为Agent模式 [26][27] - 阿里通义灵码:正式发布AI程序员 开发效率提升数十倍 生成速度最快达分钟级 能够自主执行任务拆解代码编写缺陷修复测试等全过程任务 [28][29] - 腾讯云AI代码助手:接入DeepSeek-R1满血版 代码生成准确率提升30%+ 支持函数级/模块级代码生成 [31] - 智谱CodeGeeX:截至2024年7月个人用户数量超100万 与英特尔合作发布AIPC版 可部署在端侧完成AI任务 [32][33] - 商汤代码小浣熊:采用2B+2C双轮驱动 C端分为个人免费版和49元升级收费版 B端企业标准版按899元/人/年收费 [34][35] - 艾普阳SnapDevelop:纯国产化低代码IDE 全面满足信创研发需求 集成ChatGPT服务海外用户 [36] - 普元信息:推出低代码Copilot模式 接入DeepSeek 32B和671B超大规模私有化模型 [37][38] 建议关注标的 - 商汤-W(已覆盖)卓易信息普元信息金现代科大国创等 [3]
AI转向”推理模型和Agent时代“,对AI交易意味着什么?
硬AI· 2025-03-10 18:32
行业趋势转变 - AI行业正经历从传统大模型向推理模型和Agent的转变 强调"巧"而非"大" [2][4] - 模型进化方向从死记硬背转向链式思考(CoT) 实现多步验证和精准输出 [5] - 应用范式从聊天机器人升级为能执行任务的Agent 覆盖客户服务 金融分析等场景 [7] 技术路径分化 - 两种发展情景:Chinchilla缩放持续有效则2028年模型达65万亿参数 或预训练停滞转向推理优化 [10][11] - 推理模型代表如OpenAI的o1/o3和DeepSeek R1 已展现更高基准测试成绩及成本优势 [5] - 算力需求结构变化:推理计算占比将超50% 2028年推理算力缺口达2500亿exaFLOPS [13] 产业链影响 - 芯片需求从通用训练芯片转向定制推理芯片 网络设备商持续受益 [9][18] - 开源模型(Llama/DeepSeek)发展迅速 但微调成本仅为大模型训练的小部分 [15][16] - 科技巨头自由现金流可能改善 因推理成本下降减少资本支出压力 [19] 投资逻辑重构 - 缩放定律有效时优先布局芯片/设备供应商 警惕高资本支出科技企业 [1][18] - 预训练停滞则关注科技巨头现金流回升及用户基数大的应用类公司 [1][19] - ChatGPT两月新增1亿用户显示Agent应用爆发潜力 [7]
昨夜3件事,加强中国AI科技叙事?
华尔街见闻· 2025-03-06 19:11
阿里通义开源RL新模型 - 阿里通义开源了QwQ-32B RL新模型 性能比肩满血DeepSeek R1 在AIME24数学测试和LiveCodeBench代码评估中表现优异 [1] - 该模型采用创新训练方法 通过校验生成答案正确性提供反馈 相比传统奖励模型训练时间大幅缩短 [2] - 公司预告将在Qwen Chat平台发布QwQ-Max-Preview模型 并承诺持续开源更多RL模型 [3][4][5] 大模型本地化部署进展 - 高性能大模型本地部署门槛显著降低 仅需NVIDIA 4090显卡或24G内存以上Mac mini即可实现 成本控制在4位数人民币 [6] - 苹果Mac Studio搭载M3 Ultra芯片(32核CPU/80核GPU)可实现满血DeepSeek-R1本地化运行 速度达20token/s 价格从70万降至7万人民币 [8][9] - 512GB内存配置的Mac Studio可支持更强大本地AI运算能力 [11][12] AI行业发展趋势 - RL技术突破将显著提升智能硬件性能 推动应用需求爆发 利好Agent技术发展 [7] - Manus AI等Agent产品引发市场关注 提升应用端对AI能力的期待 将带动算力需求增长 [13][14] - 中国科技公司在RL大规模强化学习领域取得突破 行业估值逻辑面临重塑 [14]
智谱完成超10亿元战略融资:今年为其「开源年」,杭州押注下一个DeepSeek
IPO早知道· 2025-03-03 09:16
融资与战略布局 - 公司完成超10亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等 [2] - 在杭州成立浙江智谱新篇科技有限公司,服务浙江省和长三角地区经济实体,推动数字产业转型升级 [2] - 2024年1月被美国商务部列入实体清单,但公司强调将继续提供世界一流的大模型技术并参与全球竞争 [2] 技术实力与产品 - 研发国产独立知识产权的GLM大模型预训练架构,最新基座模型GLM-4-Plus技术实力世界领先 [3] - 在Agentic LLM方向优势明显,先于OpenAI提出Phone Use概念并推出Agent产品AutoGLM及GLM-PC [3] - 构建开放平台bigmodel.cn,以Model as a Service(MaaS)理念推动AI生态繁荣 [3] - 2024年推出基座模型GLM-4-Plus、Agent模型AutoGLM、推理模型GLM-Zero等,技术对标GPT [5] - GLM预训练架构实现全栈自主创新,包括底层算子、训练框架等核心模块自主研发 [5] 开源与生态 - 2024年是公司的"开源年",将发布全新大模型并开源 [3] - 适配国内40多种GPU芯片,推动进口替代 [5] - MaaS平台支撑70余万企业开发者,私有化部署服务金融、医疗等20多个行业,在万余家企事业单位应用 [5] Agent技术领先 - 2025年或将是Agent爆发年,公司在Agentic LLM领域具有领先优势 [7] - 与三星合作,将Agent体验带到Galaxy S25系列手机,支持实时语音、视频通话等功能 [9] - Agentic LLM将整合物理与数字世界资源,从被动应答转向主动执行,提升生产力 [10] AGI发展路径 - 公司将AGI分为五个层级:L1预训练大模型、L2对齐&推理、L3自我学习、L4自我认知、L5意识智能 [12] - 坚定朝着AGI方向努力,推动AI从学习知识到具备自我认知和探索能力 [17]
Deep Research 团队:Agent 的终极形态是所有任务 All-in-one
海外独角兽· 2025-02-27 20:09
文章核心观点 - OpenAI推出第二个Agent Deep Research,可搜索多网站生成全面报告,团队分享构建技术细节、产品思路及使用场景,未来希望打造终极Agent整合多种功能,且Agent有望在2025年崭露头角 [1][11] 分组1:OpenAI的第二个Agent - Deep Research能搜索多在线网站生成全面报告,在ChatGPT中运行,回答时间5 - 30分钟,能深入研究并详细回答问题,是OpenAI第二个Agent,未来还会发布更多 [5] - 约一年前OpenAI采用reasoning范式训练模型,解锁长时任务处理能力,意识到完成任务需在线研究等能力,开发出对应模型训练方法,项目最初由Isa Fulford和Yash Patil合作原创demo,Josh Tobin 6个月前加入 [6] - Deep Research有澄清流程,在研究前向用户提问,确保用户提供模型所需细节,很多用户先与o1或o1 Pro互动完善prompt后再发给它 [9][10] - 过去几个月OpenAI推出三种不同的Deep Research,因模型构建方式等因素质量有差异,未来希望用户通过终极Agent自然融合多种功能 [11] 分组2:Agent能力来自模型端到端的训练 - Deep Research底层模型是O3微调版本,经复杂浏览和推理任务端到端训练,学会应对策略,能整合信息生成带引用报告 [13] - 端到端训练使Deep Research有创新的Agent能力,能对实时网页信息灵活反应,创造性搜索,与非端到端训练的AI搜索产品有差异 [14][15] - Josh Tobin曾尝试构建Agent,发现按常规方式构建在现实中会有问题,说明Deep Research强大源于端到端训练,还建议按需用人工编写逻辑,在模型整体基础上进行RL调优可能是构建强大Agent的关键 [16][18] - 高质量数据集是Deep Research模型成功的关键因素之一,Edward Sun会对所有数据集进行优化 [19] 分组3:Deep Research的优势 - 当用户需求详细时,Deep Research能通过阅读互联网内容提供最佳答案,问题模糊时也能理清信息,擅长收集冷门事实和综合信息,但提炼新见解和做出新科学发现效果不佳 [20] 分组4:Deep Research的使用场景 - 目标用户是从事知识性工作的人员,适合需大量收集信息、分析数据并决策的人,可应用于工作和个人生活场景 [21] - 商业和个人生活场景中,Deep Research能节省时间,赋予知识型工作者超能力,实现更多事情,访谈提及的场景包括医疗、投资、购物、旅行、编程和个性化教育等 [22][23] 分组5:Agent会在2025年崭露新头角 - OpenAI希望未来Deep Research在产品形态上嵌入图像和生成图表,扩展可访问数据源,提升浏览和分析能力,改进信息准确度,融入Agent路线图扩展应用场景 [30] - Deep Research能完成部分经济上可行的任务,为用户节省时间,OpenAI希望其和后续构建的Agent能根据用户工作类型节省1% - 25%的时间 [31] - Isa Fulford和Josh Tobin认为今年Agent会崭露头角,现在有强大预训练语言模型和监督微调方法,适合根据用户奖励函数调整模型用于各种用例 [32][34]
晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI
晚点LatePost· 2025-01-17 15:46
核心观点 - 公司认为AI行业的核心驱动力是技术迭代而非用户增长,智能水平的提升不依赖大量用户反馈[8][17][19] - 公司明确自身定位为技术驱动型企业,在技术路线与产品需求冲突时优先选择技术突破[22][23] - 行业存在方法论误区,多数企业仍用移动互联网推荐系统思维开发AI产品[12][20][97] - 开源是加速技术进化的有效路径,公司首个开源模型MiniMax-01采用创新线性注意力机制架构[9][14][15] 技术路线 - MiniMax-01系列模型突破性采用线性注意力机制新架构,可高效处理400万token长上下文[9][45] - 模型参数规模超4000亿,是全球首个在此量级实现线性注意力机制的大模型[76] - 技术目标聚焦Agent能力提升,重点突破长上下文记忆、多Agent协同等方向[40][44] - 明确不跟风o系列模型开发,认为蒸馏技术虽可行但非核心创新路径[53][54][58] 产品策略 - 旗下海螺视频生成模型月访问量已达全球第一梯队水平[77] - AI社区产品"星野"用户留存率优于字节等大厂竞品[7][92] - 放弃移动互联网式增长目标,2025年核心KPI转为技术研发指标[106][129] - 测试中的信息获取产品尝试重构推荐逻辑,实现精准学术内容推送[62][63] 行业认知 - 中美AI差距在于中国缺乏原创性技术benchmark,过度依赖对齐国外模型输出[72] - 大模型与推荐系统存在本质差异:前者依赖预设能力分级,后者依赖AB测试[21][66] - 行业已从"Scaling Law信仰"转向寻求算法、组织等层面的持续创新[33][34] - 竞争格局不应区分创业公司与大公司,关键在于技术进化速度[98][114] 组织管理 - 团队结构保持三级扁平化管理,强调客观技术评估文化[79][81] - 人才策略承认字节跳动的人才密度优势,但认为创业公司更利技术人才成长[82][130] - 决策机制建立在共同技术认知基座上,弱化明确分工边界[125][126] - 主动优化团队结构,淘汰非技术驱动型人员[115][116] 创始人反思 - 复盘早期失误包括过度关注用户指标、未及时开源、产品定位摇摆[13][15][24] - 认知升级关键点在于明确技术迭代优先于商业化目标[132][133] - 创业方法论强调简单专注,拒绝"天选之子"叙事[30][140] - 自我定位非技术天才型创始人,重视团队协作价值[96][136]
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]