AI Agent

搜索文档
大模型之后,AI 开始“自己动手”了
AI科技大本营· 2025-05-23 14:14
全球科技巨头AI Agent布局 - 微软在Build 2025大会上推出Copilot Studio解决方案,强调AI Agent将重塑未来工作方式 [8] - Google在I/O大会上宣布为Chrome浏览器、搜索及Gemini应用推出智能体模式,支持自动执行任务 [8] - OpenAI发布能自动执行复杂操作的AI Agent "Operator"并推出面向深度研究的智能体功能 [8] - Anthropic发布Agent最佳实践指南,推动工程落地 [8] 腾讯AI Agent战略与进展 - 腾讯云升级智能体开发平台TCADP,融合知识管理、工作流编排和AI能力 [5] - QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy等C端与B端应用已集成智能体能力 [5] - 腾讯云与汽车、金融、文旅等行业合作,智能体应用在生产环境中落地 [13][15] - 智能体在汽车行业用于故障自诊断,金融行业用于智能客服,文旅行业用于行程规划 [15] AI Agent技术演进 - 智能体具备自主规划能力,能根据自然语言指令调用工具或协同多Agent完成任务 [11] - 工具调用技术经历三个阶段:Function Calling、ReAct模式、Code Agent,执行效率逐级提升 [14] - 腾讯通过文档转问答对、版本比对和运营机制优化RAG效果 [15] - 视觉、多模态、文本与智能体技术协同支撑企业AI应用落地 [12] 行业趋势与驱动力 - 互联网从"信息获取"转向"任务完成",Agentic AI成为关键方向 [1] - 技术演进与业务需求双轮驱动智能体爆发 [6][9] - 客户对个性化、智能化解决方案的需求推动AI应用范式变革 [10][11] - 智能体被视为大模型落地最具系统性、可扩展性与变革性的路径之一 [18]
明略科技宣布与Dify达成生态合作 推动企业级AI Agent应用落地
环球网· 2025-05-23 11:45
资料显示,Dify作为一款开源的大语言模型(LLM) 应用开发平台,融合了"后端即服务"(Backend as Service)和"LLMOps"理念,为开发者及企业用户提供了构建 LLM 应用所需的关键技术栈,包括对全 球1000+大语言模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的 流程编排,并同时提供了一套易用的界面和API。 明略科技副总裁杨威表示:"企业级Agent技术正在从试验阶段迈向生产力阶段,逐渐成为智能化转型的 核心驱动力。通过本次合作,明略科技将与Dify平台形成协同互补,为企业客户提供从应用构建到落地 部署的一站式解决方案,帮助企业解决生成式AI应用投入生产的实际痛点。在复杂业务场景中,我们 将共同致力于优化企业级Agent的可用性、适配性与实用性,推动其深度融入企业核心系统,并为企业 进入AGI时代铺设重要入口。" 此外,依托自身在多模态数据集成、企业知识图谱及数据隐私保护方面的技术积淀和服务经验,明略科 技称将在与Dify的合作基础上提供更丰富的技术服务,以适配企业发展需要。如通过自研的MoE(混合 专家模型)架构,明略科技能够为不同领域动态 ...
Claude 4发布:新一代最强编程AI?
虎嗅· 2025-05-23 08:30
模型发布与性能 - Anthropic正式发布Claude 4系列模型 包括Claude Opus 4和Claude Sonnet 4 [2] - Opus 4是目前全球最强的编程模型 能够稳定胜任复杂且持续时间长的任务和Agent工作流 [4] - Sonnet 4着重强化了编程和推理能力 能更精准地响应用户的指令 [4] - Opus 4在编程基准测试SWE-bench上拿下72.5%的高分 在Terminal-bench上以43.2%领先同行 [6] - Sonnet 4在SWE-bench的成绩达到72.7% 几乎与Opus 4持平 [15] 新功能与特性 - 工具辅助的延伸思考功能 模型在进行深入思考时能够交替使用工具优化推理过程 [7] - 两款模型可并行使用工具 执行更精确的指令 并提升记忆能力 [7] - Claude Code正式发布 支持GitHub Actions、VS Code和JetBrains [7] - API新增四项功能 包括代码执行工具、MCP连接器、文件API和最长可缓存1小时的提示缓存功能 [7] - 引入"思维总结"功能 在模型思考路径过长时自动调用更小模型进行压缩和归纳 [30] 实测表现 - 在Replit的实测中 Opus 4在多文件、大改动的项目中表现出更高准确率 [9] - 在代号为Goose的Agent中 该模型显著提升了代码质量 同时保持稳定性和性能 [10] - 进行高要求的开源重构任务时 连续稳定运行7小时 [11] - 能解决其他模型无法完成的复杂任务 成功处理多个前代模型没法完成的关键操作 [11] - 创建带有动画效果的天气卡片 只用一次机会就成功生成 [12] 行业影响与定位 - GitHub选择Sonnet 4作为新一代Github Copilot的底座模型 [17] - 两款模型为不同层级用户提供明确选项 Opus 4面向极致性能与科研突破 Sonnet 4面向主流落地与工程效率 [39] - 价格与前代保持一致 Opus 4每百万token为$15/$75 Sonnet 4为$3/$15 [38] - 三家头部AI公司几乎在同一时间选择Agent路径 编程是最天然适合AI Agent落地的场景 [55][56][57] - 开发者群体是天然适配Agent产品的用户 他们习惯自定义、愿意尝鲜、擅长集成 [58] 技术演进与未来展望 - 模型开发过程中存在"最后开窍"现象 某些能力在最后一刻才展现出来 [69][70] - 正在进入新世界 开发者可以像管理一支Agent团队一样工作 [74] - 预训练和后训练都有显著进步 扩展规律在预训练阶段依然有效 [78] - 未来一年"代码"方面会出现很多令人惊艳的进展 构建"Agent团队"将对世界产生有意思的影响 [103] - 当写软件的成本大幅下降时 经济和商业结构将发生改变 [104][105]
天工超级智能体上线三小时即限流,昆仑万维股价涨停
新浪财经· 2025-05-22 15:56
产品发布与市场反应 - 昆仑万维发布通用Agent平台天工超级智能体(Skywork Super Agents),上线三小时后因用户量过大导致卡顿并采取限流措施[1] - 该消息推动昆仑万维A股午后触及涨停,成交额超30亿元[1] - 产品聚焦个人生产力场景,采用AI agent架构和deep research技术,可一站式生成文档、PPT、表格、网页、播客和音视频多模态内容[1] 产品性能与行业地位 - 天工超级智能体在GAIA榜单上排名全球第一,超过OpenAI Deep Research和Manus[2] - 产品主打"专业+通用"功能,由5个专家智能体和1个通用智能体组成[3] - 实现生成结果可溯源、可编辑,具备在线私人知识库功能,创新性支持AI生成数据表格和图标[6] 产品功能与架构 - 网站界面覆盖场景较多,包括文档、PPT、表格、网页和通用模式[4] - Office三件套(文档、PPT、表格)均为专家模式[4] - 通用智能体接入数十个MCP,可生成图片、海报、音乐、MV等多媒体内容[4] - 播客智能体可生成脚本并通过语音合成技术完成音频制作,但暂不支持中文[4] 行业竞争与发展趋势 - 2025年AI Agent风口再起,OpenAI、微软、谷歌DeepMind等头部厂商相继推出Agent产品[6] - 国内字节跳动、阿里巴巴、百度在2024年4月入局通用Agent市场[6] - 中信证券研报称2025年有望成为AI应用落地元年,AI Agent应用场景将快速爆发[6] 公司战略与财务表现 - 昆仑万维2023年4月发布天工3.5大语言模型,之后陆续发布音乐推理大模型、视频生成模型等[6] - 2024年研发费用达15.4亿元,同比增长59.5%[7] - 2025年第一季度亏损达7.69亿元[7] - 公司董事长兼CEO方汉表示昆仑万维在PPT生成和PDF生成领域是国内最好产品之一[7]
不甘于工具,谷歌、微软重注AI Agent
21世纪经济报道· 2025-05-21 21:12
"更智能""更主动" 21世纪经济报道记者董静怡 上海报道 在2025年谷歌I/O开发者大会上,AI几乎贯穿整场发布会。自去年 谷歌宣布进入"Gemini时代"后,AI就成了发布会的绝对主角,"更智能"、"更主动"是更新迭代的核心。 在此次发布会上,谷歌除了发布升级版的Gemini 2.5模型,也全面重构了其产品体系,将Gemini AI嵌入 所有核心业务,从搜索到生产力工具,从智能助手到XR(扩展现实)设备。 Gemini不再被视为单一的语言模型,而是将其定位为整个AI生态的核心架构,用户和开发者面对着全 新的AI交互模式。 与此同时,谷歌也在推动AI从被动工具向主动代理(Agent)转变,行业普遍认为2025年将会是AI智能 体爆发的一年。就在一天前,微软在Build大会上广泛布局Agent生态,进一步印证了这一趋势的行业共 识。 站在AI时代的十字路口,科技巨头也面临着前所未有的挑战与机遇。 Gemini重构一切 谷歌对AI时代全面拥抱。据初步统计,在2小时的发布会里,Gemini被提及95次,AI被提及92次。这两 个关键词几乎构成了整场发布会的叙事主线。 谷歌在发布会上公布的数据显示,去年同期,谷歌 ...
ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手
量子位· 2025-05-21 12:01
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示, ChatGPT将从回答问题转变为为用户做事 。 也就是说,AI Agent不再满足于30s回答问题,而是通过浏览网页、深度思考、推理总结以解决更复杂的问题。 此外,他还提到 当下模型成本已是GPT-4的500倍 。 而对于今年由DeepSeek引发的模型成本讨论,他觉得从训练后的角度来看, 模型的效率突破在于硬件的提升和算法的改进 ,效率提升了, 那么成本也会下降。 未来OpenAI将 不断降低API价格 ,以便更多公司能够参与到AI发展中来。 一起来了解更多内容吧。 推理模型的突破在于穿插使用工具 让DeepResearch不仅能与网络相连,还能与内部知识源相连 Kevin Weil在访谈中表示,OpenAI正在做的事情就是让DeepResearch能够同时连接到网络和内部知识源,比如Google文档、 Sharepoint、Jira等。 AI Agent能够整合所有的这些内容,甚至可以跨服务操作 ...
北美老牌基金突袭硅谷,5家隐身华人AI公司获千万级“战略押注”
36氪· 2025-05-21 11:42
Manus平台发展 - Manus宣布向海外用户开放注册,取消等候名单机制,用户每日可免费执行一项任务并获得积分奖励 [1] - 母公司蝴蝶效应完成由Benchmark领投的7500万美元融资,估值飙升至36亿美元,较年初增长近5倍 [1] - 公司正在组建海外团队,新融资将用于加速底层技术研发及全球化布局,并酝酿推出面向企业级市场的"AI自动化工作流"新产品线 [1] Manus技术特点 - 采用"混合架构多模型协同推理"技术,在GAIA基准测试中以86.5%准确率超越OpenAI同类产品 [2] - 产品使用基于阿里千问大模型、Claude等其他模型的微调模型 [2] - 实现"异步处理+自动执行"的产品思维,将规划Agent+执行Agent+验证Agent协同推理,完成AI从"思考建议"到"闭环执行"的跨越 [3] 行业影响 - Manus爆火引发硅谷对华人AI团队的关注,硅谷创投内部流传着标注顶尖院校华人博士主导的AI Agent初创团队的加密名单 [1] - 华人AI团队正将技术突破与硅谷场景需求嫁接,以较为完整的商品化形态快速占领市场 [1] - 形成"中国迭代速度×硅谷产品思维"的双循环壁垒,打破硅谷对"参数规模决定论"的迷信 [3] 相关AI创企 - HeyGen:主攻AI视频生成与翻译,支持40+语言口型同传,年经常性收入突破3500万美元,付费客户达4万家企业 [5] - Opus Clip:AI视频剪辑平台,2025年Q1企业订阅收入占比提升至40%,全球用户突破1000万 [8] - Trae:基于AI IDE打造"真正的AI工程师",兼容VS Code,是Cursor的有力竞争对手 [10] - Notta:多语言会议纪要自动生成工具,2024年收入1800万,估值3亿,正进行B轮融资 [12] 行业趋势 - 华人团队从规则的追随者蜕变为新秩序的书写者,展现"生态破壁"野心 [14] - 多个项目正在构建新型技术联盟,如将国内外大模型与自研工具链结合打造垂直Agent [14] - "中国速度×硅谷场景"模式展现出强大杀伤力,AI商业化的胜负手在于现有技术的极致应用 [14]
马斯克点赞,全球首个设计Agent比Manus更有前景?
创业邦· 2025-05-21 08:03
AI Agent产品Lovart - Lovart是世界上第一个设计领域的AI Agent产品,继Manus之后再次引发市场关注[1] - 产品发布后在推特引发近5000条讨论,官方视频播放量近百万,获得马斯克点赞和Grok官方讨论[1] - 24小时内内测申请人数超过两万,知名投资人朱啸虎转发称赞[1] 公司背景与产品功能 - Lovart由LiblibAI海外子公司独立运作,主要负责人为王浩帆与Takumi[1] - 产品可通过一句话指令完成设计、编辑应用程序、标志、海报、广告、品牌套件等创作内容[1] 市场推广与资源获取 - 用户可通过视频了解产品详情[2] - 更多企业动态可通过睿兽分析平台获取,包括赛道图谱和行业报告[3]
微软大会拉来Altman、马斯克,纳德拉的AI Agent野心藏不住了
创业邦· 2025-05-20 18:20
微软AI战略核心 - 微软在Build 2025开发者大会上全面转向AI Agent战略,提出构建「Open Agentic Web(开放智能体网络)」的愿景 [4][5][33] - 公司CEO纳德拉将AI Agent视为继Windows 32、Web堆栈后的重大平台变革,预计2025年实现大规模部署 [33][35] - 微软已形成从GitHub Copilot到Azure AI Foundry的全栈AI Agent开发生态系统 [7][16][19] 开发者工具升级 - GitHub Copilot从代码助手升级为自主完成错误修复、功能开发的AI Agent,用户量达1500万开发者 [10][11][13] - 新增模型上下文协议(MCP)支持,推出NLWeb开放项目使网页内容可被AI智能体直接交互 [14][17] - Windows AI Foundry支持跨硬件开发,WSL子系统完全开源,强化本地AI模型部署能力 [16][18] 云平台能力扩展 - Azure AI Foundry新增智能体服务,支持协调多个专用Agent处理复杂任务,集成1900多个AI模型 [19][20][23] - 推出Entra Agent ID身份管理系统确保AI访问安全,建立模型排行榜和路由器优化性能 [20][23] - 云服务积压订单达数千亿美元,包括与OpenAI的多年期云容量合同 [6] 生产力软件智能化 - Microsoft 365 Copilot新增Tuning功能,支持企业用低代码方式训练专属Agent [24][25] - Copilot Studio季度创建超100万个定制智能体,新增多智能体编排功能处理复杂任务 [29] - 推出Microsoft Discovery科研平台,斯坦福医疗中心已测试医疗智能体协调器 [29][31] 行业生态布局 - 除OpenAI外,Azure平台新增托管马斯克xAI的Grok模型,强化模型多样性 [5][20] - 与Hugging Face建立合作,推动开源模型生态发展 [20] - 计划2025财年投入800亿美元扩展云基础设施,三个月新增10个数据中心 [37]
易点天下(301171) - 301171易点天下投资者关系管理信息20250520
2025-05-20 17:10
公司业绩情况 - 2024 年营业收入 25.47 亿元,同比增长 18.83%;归属上市公司股东的扣除非经常性损益净利润 2.17 亿元,同比增长 30.10% [5] - 2025 年一季度营业收入 9.29 亿元,同比增长 93.18%;归属上市公司股东净利润 5594.12 万元,同比增长 11.67%;归属上市公司股东的扣除非经常性损益净利润 6124.40 万元,同比增长 30.78% [5] - 2024 年程序化广告平台收入同比增长 210%,单客户 ARPU 值同比下降 29% [2] - 2024 年公司主营业务中效果广告收入占比 97.52% [2] 业务合作与市场布局 - 与 AppLovin 合作进展顺利,公司属于服务贸易范畴,不直接涉及关税问题,业务覆盖全球 200 多个国家地区 [3] - 美国业务收入占比不高,除美国外业务覆盖东南亚、欧洲、中东、南美等地区 [4] 技术应用与发展 - 程序化广告业务在技术与产品层面持续加大投入,将广告技术与 AI 能力深度融合,推理效率提升 7 倍,任务执行总耗时降低 30%以上,计算资源成本降低约 25% [2] - 持续迭代智能化业务平台及中台产品,实现前沿 AI 驱动型产品商业化落地与应用,打造营销领域的 AI Agent,未来聚焦细分应用层开发与实践 [3] 公司规划与策略 - 未来 3 - 5 年业务增长点来自拓展新客户与行业、深化媒体合作、技术产品驱动 [5] - 继续深耕主业,以 AI 赋能为客户提供出海全链路解决方案,帮助出海企业数字化转型和升级 [6] 股东相关问题回应 - 高度重视股东权益,密切关注政策动态,以提升经营业绩为核心回报投资者,具体计划以公司公告为准 [5] - 实控人未减持公司股票,高管合规减持属正常现象,公司按规定履行信息披露义务 [5]