Workflow
MCP
icon
搜索文档
AI Agent的终极未来|3万字圆桌实录
腾讯研究院· 2025-07-30 17:04
本期为《仲夏六日谈》 第四季 第三期节目文字内容,主题为 《 执行力跃迁,AI智能体的远与近》 。 十大看点: ·何为智能体,用户真正需要的智能体是什么? ·智能体是未来AI原生应用的主形态? ·基模进化是否会挤压垂类Agent产品的生存空间? ·主流Agent产品形态的差异在何,如何判断Agent的通用性? ·智能体产品落地过程中面临的核心难题? ·好坏之分,如何建立智能体的有效评估机制? ·物理与数字,具身智能是智能体吗? ·MCP必将是未来智能体的底层基础协议? ·C端与B端商业化路径异同,Agent as a service成为新商业模式? ·未来Agent爆发将出现在哪?关键因素是什么? 对话嘉宾: 张俊九 实在智能联合创始人 廉和 ami.ai联合创始人兼CEO 揭光发 腾讯专家工程师 刘琼(主持) 腾讯研究院副院长 执行力跃迁,AI智能体的远与近 刘琼: 各位嘉宾朋友们,大家好,欢迎来到腾讯研究院《仲夏六日谈》智能体圆桌研讨的专场。我是今 天的主持人刘琼。昨天在飞机上准备主持稿的时候,我认真地想了一下——如果我有一个智能体,能帮 我完成这些任务就好了。比如自动整理嘉宾信息、实时生成追问,还能润色 ...
Kimi K2拿到了世界第一,也杀死了过去的自己
新财富· 2025-07-28 10:58
月之暗面Kimi K2大模型发布 - 7月12日月之暗面发布最新大模型Kimi K2 模型权重和代码全部开源 在LMArena排行榜中综合排名全球第五 开源大模型中位居全球第一 超越Claude 4和DeepSeek-R1-0528 [2] - Kimi K2提出"模型即Agent"新概念 原生具有调用各种工具的能力 在LiveCodeBench测试中取得53.7%的成绩 超越GPT-4.1的44.7%和Claude 3.5 Opus的47.4% [23][35][44] - Kimi K2参数量扩展至1T量级 放弃自研架构转向DeepSeek V3 通过减少Attention Heads数量增加Experts数量 突破智能上限 [24][28][29] Kimi发展历程与战略转型 - 月之暗面曾是Scaling Law忠实信徒 采取激进买量策略 2024年营销预算接近9亿人民币 但6月月活降至2352万 同比下降2.19% [8][11][17] - 2024年底全球高质量公开数据耗尽 深度求索通过DeepSeek R1开辟新范式 依靠后训练强化学习突破智能上限 月活暴涨至6181万 [13][16][17] - 2025年初公司停掉所有市场营销 集中资源研发K2 转向技术驱动 加入开源阵营 战略重心回归大模型性能提升 [55] Kimi K2技术创新 - 开发MuonClip优化器 解决15.5T tokens预训练稳定性问题 实现零崩溃表现 被海外AI圈称为"完美的Loss曲线" [32][33] - 提出Agent训练新路径 通过AI生成模拟场景合成数百个垂直领域工具调用轨迹 建立自动化Agent数据生产工厂 [38][39][41] - 模型架构上减少DeepSeek V3的Attention Heads 增加Experts数量 在算力有限情况下最大化模型潜力 [28][29] 行业影响与竞争格局 - DeepSeek R1引发AI创业公司存在主义危机 其不花营销预算单靠产品实力月活达6181万 促使行业重新思考发展路径 [17][54] - Kimi K2开源后迅速被阿里Qwen反超 但公司战略转型意义重大 体现从产品驱动转向技术驱动的决心 [55] - 行业验证"模型能力决定市场认可"逻辑 AI公司价值创造核心转向付费用户关注的效率和结果 [53][54]
互联网大厂做AI都这么拼了吗?
佩妮Penny的世界· 2025-07-03 18:44
搜索业务升级 - 百度搜索迎来10年来最大改版 核心是突破传统关键词匹配模式 支持上千字口语化提问和多模态输入(语音/图片/视频等) [2][10][15] - 日均搜索量达数十亿次 在中文用户心智中"百度=搜索"的品牌认知已建立25年 [2] - 新版搜索可理解复杂需求 例如"7-8月带娃避暑旅居地推荐 要求杭州5小时交通圈"这类长文本查询 [10] - 支持14种方言语音搜索 AI识图能识别文物并讲解历史 实现"万物皆可搜" [15][19] AI技术赋能 - 搜索业务天然适配AI技术 需处理意图理解/海量数据检索/持续优化等环节 百度早期"All in AI"战略与此相关 [5] - 大模型显著提升交互体验 广告将融入解决方案而非强制展示 改变传统CPC竞价模式 [7][8] - 智能创作功能支持图文/视频生成 例如自动生成小红书封面或3分钟口播视频 [21][22] 生态体系构建 - 百度AI搜索整合MCP协议 已接入1.8万服务模块和220个AI应用 国内接入规模最大 [26] - MCP协议实现跨平台能力调度 例如搜索潮玩直接跳转交易平台 查询基金费率调用理财接口 [26] - 文心大模型4.5Turbo等组件提供MCP支持 与阿里/腾讯/OpenAI等共同推进生态标准化 [26] 多模态创新 - 视频生成模型MuseSteamer在Vbench-I2V榜单持续霸榜 支持10秒1080P视频生成 [31] - 突破传统默片限制 可一体化生成带定制化配音的视频 预计下月上线 [31] - 推出AI创作平台"绘想" 举办视频大赛鼓励用户用图片生成电影短片 [31][32] 行业竞争格局 - 搜索被视为AI时代核心入口 当前一级市场热门项目多聚焦搜索/浏览器/通用Agent领域 [3] - 大厂争夺超级入口控制权 百度通过MCP协议构建开放生态 意图打破APP数据孤岛 [26][27] - 广告收入占比超50%的现金牛业务面临重构 AI驱动商业模式向解决方案集成转型 [4][8]
卷疯了!这个清华系Agent框架开源后迅速斩获1.9k stars,还要“消灭”Prompt?
AI前线· 2025-06-28 13:13
Agent技术发展现状 - 大模型能力突破推动"可调用工具的智能体"从实验室概念快速落地,成为继大模型后的新爆发点[1] - Agent开发框架生态快速演进,包括LangChain、AutoGPT、OpenAgents、CrewAI等,新一代框架注重自主性、协同性和业务融合[1] - 清华团队发布开源协作框架Cooragent,特点是用一句话生成专属智能体且支持自动协作,开源版本已获1.9k stars[1] Agent商业化进展 - 大模型商业化面临挑战但能力显著提升,关键进步包括长任务思考能力和代码/function call能力提升[5] - 国产开源模型如Qwen2.5/3、Deepseek V3-0526在工具调用准确率和复杂指令遵循上取得长足进步[5] - Manus的ARR快速增长表明用户付费意愿强烈,盈利对大模型发展至关重要[6] Agent技术差异化 - 各Agent产品底层原理相似,差异在于使用方式、场景适配、工作流打磨和Agent优化程度[7] - 长期技术优势需构建完整体系,包括底层模型创新、数据链工程能力和工具使用[7] - 工程能力与算法创新相互依赖,共同决定Agent将大模型能力带入用户场景的效果[7] Agent框架设计趋势 - 未来AI发展趋势是Infra与应用场景紧密结合,需求多样化催生众多框架和新算法[8] - 商业化落地关键痛点是泛化性与精确性平衡,传统调试方式在AI领域效率低下[8] - Cooragent采用动态Agent生成机制解决环境适应问题,强调人-Agent协作提升效率[9] 数据与算力优化 - 数据利用效率是关键挑战,需精细化筛选保证正交性,工程工作主要围绕数据展开[12] - 算力优化潜力巨大,通过提升单机利用率和算法定制可将成本降至原来的十分之一[13] - 上下文治理采用工程化手段如验证推理合理性、精简指令和优化上下文[14] 多Agent系统设计 - 多Agent协作难点在接口设计、架构设计和数据流设计等底层问题[15] - Agent分工遵循人因工程学原理,单个Agent专注1-2个工具使用最易打磨[16] - 多Agent系统设计更原生,关键是场景适配和框架易用性,扩展能力至关重要[17] 开源与商业化路径 - C端开源项目获高热度,计划上线SaaS平台;B端与大型客户开展战略合作[20] - 商业化版本侧重B端数据共享和工作流定制,与头部客户共同成长[23] - 高校开源注重长期价值和技术推动,企业开源侧重品牌影响和获客[24] 行业生态观察 - 国内框架使用率提升,国内外生态围绕不同模型体系构建存在差异[28] - Agent热度取决于实际价值,短期可能高估但长期潜力被低估[30] - 用户接受度提高推动生态发展,关键是根据新需求构建或演进Infra[32]
@所有开发者:Agent变现,阿里云百炼联合支付宝首创「AI打赏」!Agent Store全新发布
量子位· 2025-06-27 12:40
行业趋势 - 2025年成为Agent元年,AI Agent正经历从"玩具"到"工具"的关键转折[1] - 行业面临开发周期长、商业价值验证难等挑战,大量项目卡在POC阶段[2] 阿里云百炼核心升级 - 推出业内首个"Agent打赏"功能,用户可直接为开发者打赏,金额直达AI钱包并可提现[3][4][5][23][24][26][27] - 正式上线Agent Store,提供覆盖各行各业的100+个可一键复制的Agent模板[7][8][10][18][19] - 升级企业级RAG能力至千万级文档处理水平,支持多模态文件统一索引并开源V-RAG方案[29][30][33][34][35] - 升级MCP服务支持KMS加密,免费提供50个加密Key,实现统一鉴权和计量计费[36][37][38] - 发布OpenAPI MCP Server,支持大模型与2W+OpenAPI互联互通[39] 技术能力突破 - 多模态交互开发套件支持低延迟(1.5秒)全双工对话、复杂任务自主规划推理等能力[45][46] - 提供可视化配置界面,开发者可像拼乐高一样自由组合功能[48][49] - 支持后付费或买断License等灵活计费方式[50] 商业化进展 - 已有超50个企业级MCP上架,22000+用户开通服务,构建3万+MCP Agent[41] - 落地案例包括听力熊学习机(扩展50+交互技能)、浙一麻醉评估助手、牧原智能兽医问诊系统等[42][28]
企业管理软件是不是和AI无关?
虎嗅· 2025-06-23 12:36
AI技术演进与设备寄生关系 - AI技术目前主要寄生在PC和手机设备上,依赖键盘输入和屏幕输出[1][2] - 未来将扩展至ARVR、智能汽车、无人机、机器人等设备,这些设备输入输出方式更受限[4] - 语音交互成为非技术用户(如老人、儿童)使用AI的主要方式[5] 信息获取方式变迁 - 过去依赖搜索引擎,网站通过SEO优化提高内容可见性[8] - 当前转向AI大模型,网站通过MCP(大模型友好优化)提升内容调用优先级[10] - 预测大量独立App将被整合进大模型生态,形成流量集中化趋势[11][12] 国内外AI应用路径差异 - 国外企业倾向开放API接入公有云大模型,形成"大模型+行业"模式[15] - 国内企业偏好私有化部署国产大模型(如DeepSeek),形成"行业+大模型"模式[16] 企业管理软件的AI融合 - 企业管理软件在移动互联网时代未受显著影响,未来可能维持现状[6][7] - 企业人员分三层应用AI:决策层用AGI推理、执行层用AIGC生成工具[18][19][20] - AI生成代码成为AGI与AIGC能力交汇点,可动态扩展LLM功能[22] AI原生开发实践 - 通过自然语言描述→提示模板优化→任务分解→自动执行的流程开发Agent应用[24][25][26] - 采用迭代反馈机制调整需求模板,实现代码自动生成与功能修正[27] 技术哲学思考 - AGI(推理)与AIGC(生成)能力同步发展,形成基础层与应用层支撑关系[20][21] - 代码生成具备双重属性:既是生成结果也是逻辑推理的体现[22]
深度|吴恩达:语音是一种更自然、更轻量的输入方式,尤其适合Agentic应用;未来最关键的技能,是能准确告诉计算机你想要什么
Z Potentials· 2025-06-16 11:11
Agentic系统构建 - 从讨论"是否是Agent"转向"Agentic性光谱"的思维转变 更有效减少定义争论[4][5] - 实际应用中更多机会集中在简单线性流程自动化 而非高度自治的复杂系统[6][7] - 企业面临的主要挑战是如何将现有工作流拆解为可自动化的"微任务"并建立评估体系[7] AI开发关键技能 - 掌握LangGraph/RAG/memory/evals等工具的组合应用能力 如同搭建乐高积木[9][11] - 建立系统性评估体系至关重要 可避免在错误路径上浪费数月时间[10] - AI辅助编程显著提升开发效率 但部分企业仍禁止使用[15] - 语音技术栈(voice stack)被严重低估 在降低用户交互门槛方面潜力巨大[15][18] 技术演进趋势 - MCP协议通过统一API标准显著简化数据对接流程 使集成成本从N×M降至N+M[21][22] - Agent间协作仍处早期阶段 跨团队Agent协同目前几乎没有成功案例[23] - 语音交互面临延迟挑战 需采用预响应机制等技巧优化用户体验[19] 初创企业建议 - 执行速度是初创企业成功的第一关键指标[26] - 技术知识深度比商业知识更为稀缺和关键[26] - 编程能力将成为基础技能 能明确表达需求比编码本身更重要[24]
AI展望:NewScaling,NewParadigm,NewTAM
华泰证券· 2025-06-10 09:43
报告核心观点 - 全球AI发展呈现模型端新架构探索、算力端需求上行与硬件设计进入新范式、应用端商业模式变革的趋势,持续看好AI产业投资主线,全球AI应用将进入业绩收获期 [1] 模型:预训练Scaling Law有望开启新起点 - 大模型技术路线从预训练到后训练发展,2018 - 2024年9月为预训练阶段,2024年9月后进入后训练阶段 [13][15] - 腾讯混元Turbo - S通过创新架构实现性能与效率平衡,Google Gemini Diffusion在文本生成上有突破,大厂在预训练参数量和数据量扩大上有尝试,大规模算力集群支持预训练探索,模型架构改进或使预训练Scaling Law开启新起点 [23][24][25] 算力:训练推理两条主线共同推动算力需求持续上行 训练端 - 后训练阶段Scaling Law成大厂共识,新Scaling路径不断涌现,新架构探索有望重启预训练阶段算力需求叙事 [33][34] - 以“星际之门”为代表的大规模算力集群进展顺利,中东版“星际之门”落地,主权AI逐步落地,台积电新产能规划预示算力需求乐观 [38][41][42] 推理端 - Agent需求增长或使推理算力提升几十至上百倍,大量工具调用和信息交互使tokens消耗量大幅提升,产品用户数量增长带动算力需求提升 [43][46][52] 算力硬件新范式 - 大模型对系统综合能力要求提高,NVLink Fusion强化英伟达硬件生态优势,国产算力加速迭代,华为云推出新服务器,高密度机架方案为性能追赶提供路径 [57][58][60] 应用:Agent进展提速,看好AI应用进入业绩收获期 Agent发展情况 - Agent可能是AI应用终极形态,目前雏形初具,但完成复杂长期任务能力有限,“任务长度”是关键衡量指标且提升速度快 [68][73][74] - MCP统一了Agent工具调用生态,促进其快速构建和发展 [79] 海外AI应用 - AI Coding是重要垂类赛道,细分垂类商业化效果好,25Q1业绩大部分超预期,头部2B软件AI产品存量客户渗透率接近10%,全年收入有望加速增长 [82][84][85] 国内AI应用 - 加速从简单环节到复杂环节产品升级,25Q1利润指标率先改善,AI商业化24年初步验证,25年有望加速复制推广,MCP有望加速产业节奏 [88][90][94] 落地节奏展望:商业模式变革有望成为共识,看好细分领域率先放量 商业模式变革 - Agent应用从交付工具转变为交付结果,按效果付费新范式有望成行业共识 [99] 细分场景放量 - 数据复杂度低、幻觉容忍度高的场景率先实现规模化商业落地,2C场景商业化进展领先,2B应用分场景和行业来看,数据复杂度和预算影响落地节奏 [103][104][110] AI + 营销/销售 - 数据丰富、可量化ROI和流程标准化驱动AI快速商业化,企业需求从单一工具向全链路智能中枢升级,市场格局分散,AI有望重塑格局 [113][114][119] 重点公司推荐 - 推荐金山办公、福昕软件、泛微网络等多家公司,均给予“买入”评级 [7]
温和、务实的「炸裂派AI」
搜狐财经· 2025-06-10 07:38
AI视频生成技术发展 - Veo 3发布引发海外社交媒体病毒式传播,AI生成视频难以辨别真伪,连从业者都需费力分辨[1] - Claude 4模型同期上线,在多项任务上达到SOTA水平,显示AI应用仍处于高速发展阶段[1] - 国内快手可灵使用量领先Veo 3,但AI视频未形成大规模传播,内容被规范在特定试验田[1] 中国AI应用发展路径 - 中国公司转向让大众理解和使用AI,而非追求技术"炸裂",与移动互联网发展规律相似[2] - 值得买科技2023年提出"AI即未来"战略,2024年展示显著落地成果,聚焦改变用户购物决策链[2] - 行业对AI狂热情绪降温,转向润物细无声的应用创新[3] 电商平台AI战略分化 - 阿里全面向AI转型,拼多多则保持距离,形成行业观察样本[3] - 值得买科技AI布局强调完整性,包括AIUC引擎、GEN2应用、购物Agent和MCP Server[3] - 大厂普遍采取"生态卡位"策略,布局算力、大模型和应用,为未来爆发领域做准备[5] 值得买科技AI战略核心 - 公司以"提升B端和C端连接效率"为北极星指标,AI应用围绕效率提升展开[6] - "火眼"AIUC引擎为核心,通过知识图谱和多模态解析提升商品内容理解能力[7] - 引擎可缩短用户决策流程,优化内容生产,淘汰低质"水帖",提升站内整体内容质量[8] AI在商业端的应用价值 - AIUC可介入品牌商业决策、营销和内容生产全环节[10] - 借鉴亚马逊策略,关注用户从浏览到下单的用时缩短,匹配效率提升[10] - 值得买4000万月活显示市场对效率提升的强烈需求[10] MCP Server行业价值 - MCP是AI时代的标准化协议,解决大模型、Agent与工具间的交互问题[11] - "海纳"MCP Server开放120亿条内容库和10亿商品链接库,促进行业共建[11] - 该技术将公司内容资产外部化,创造新增长曲线,定位为AI消费决策基础设施[14] 用户导向的发展理念 - "什么值得买GEN2"升级体现对用户需求的响应和承诺[16] - 公司沿袭社区文化,命名"张大妈"Agent,保持与用户的情感连接[16] - 十余年发展历程中,唯一不变的是对用户需求的重视,驱动效率故事持续[16]
别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?
AI前线· 2025-06-07 12:41
智能体技术路径选择 - 公司从RPA技术起步,结合OCR与自然语言处理技术实现初级智能化,2019年提出"数字员工"概念[4] - 2023年ChatGPT爆发后,通过大模型+RPA+视觉技术实现人类形态的工作能力,推出国内首款通用智能体产品[5][7] - 技术路线选择上强调不能完全依赖大模型,需结合外部工具(如RPA、API)解决幻觉和效率问题[7][8][9] - 垂直领域大模型对业务场景的Agent研发具有必要性,公司基于4000家客户数据训练行业专用模型[19][24] 产品转型与架构重构 - 对RPA底层进行两大改造:1) 推出"融合拾取"技术解决通用性问题,拥有15项专利 2) 引入AI-RPA模式提升易用性[11][12][13] - 重构底层通信架构,使任何软件都能被默认识别,效率显著提升[13] - 可靠性系统需满足可控性(结果一致)、稳定性(多次运行无差异)、高效性三大特点[16][17] - 通过外挂知识库、提示词工程、垂直模型微调等手段将大模型幻觉率降至可用阈值[17][20] 商业化与竞争策略 - 收费模式按机器人数量收取年租费,避免价格战,强调差异化价值[32][33][34] - 通过免费社区版转化企业客户,当前已服务超4000家企业[36] - 核心商业价值在于引发生产关系变革,未来企业可能演变为"1人公司+数字员工"模式[30][31] - 护城河在于行业理解深度与技术积累,不直接提供定制化服务而依赖合作伙伴生态[35][39] 行业趋势与产品形态 - 预测2025年为智能体商业化元年,2024年是探索期,企业端应用将大规模爆发[40] - 最终产品形态可能是对话式助手,交互界面简化为单一对话框甚至语音交互[42] - 当前挑战在于快速落地能力,需平衡技术路线选择(大模型/RPA/API组合)与用户需求匹配[41] - 企业员工对AI接受度提升,人机协同被视为现阶段最可靠方案[43][44] 技术实现差异与行业认知 - 通用智能体需解决底层通用性问题,垂直智能体需深耕行业知识与业务逻辑[24] - 大模型本身不是产品,需结合RAG等增强技术解决验收标准问题[28] - MCP技术被过度炒作,实际仅封装问题而非解决本质,过度依赖会导致调试困难[22] - 智能屏幕语义理解属于多模态技术分支,专注于界面元素识别等操作类任务[18]