Workflow
智能体
icon
搜索文档
智能体洗牌“六小虎”,模型厂商如何转型?
虎嗅· 2025-07-01 20:04
智能体技术发展现状 - 智能体从内容生成进化到任务执行,代表AI从"生成内容"到"完成任务"的转变[4][5] - 智能体是指能感知环境、做出判断并采取行动实现目标的智能系统[4] - 智能体制造门槛大幅降低,普通用户可通过"美图秀秀"式轻工具制作,专业开发者则使用"Photoshop"级工具开发深度业务场景应用[6][7] 行业竞争格局 - 基础大模型层将形成高度集中格局,类似云计算行业最终仅剩少数头部厂商[12] - 模型微调层和智能体构建层将成为差异化竞争的主要空间[13] - 第一梯队模型厂商正向MaaS平台和智能体平台延伸,提供完整能力包[9] - 第二梯队厂商正转向垂直行业应用、C端应用和海外市场[11] 商业化挑战 - 全球大模型公司尚未找到有效盈利模式,70%收入被GPU厂商获取[30] - C端聊天类工具变现困难,国内外订阅模式均面临挑战[24] - 智能体虽增加tokens调用量,但未能显著提升模型厂商利润[30] - 企业需求聚焦明确ROI,关注降本增效和新产品开发[58][61] 技术演进方向 - 智能体可能成为新型操作系统,通过终端设备抢占入口[41][43] - 企业系统互通仍面临挑战,45岁以上CTO退休后可能迎来变革[40] - 大模型可能突破传统规则引擎,形成新的业务处理范式[50][51] - 工业领域存在"外挂式"和"替换式"两种智能化路径[49] 行业应用现状 - 企业AI应用集中在智能客服、知识库等低风险场景[65] - 制造业头部企业自建算力平台,但实际应用限于广告内容生成[52] - 咨询行业基础分析工作可能被替代,但高端咨询服务仍依赖人际互动[71] - 代码模型已显著提升软件开发效率,改变软件行业工作模式[68]
如何定义智能体价值?容错性与自主性为核心考量指标
21世纪经济报道· 2025-07-01 08:41
智能体行业发展现状 - 2025年被称为"智能体元年",AI发展从对话生成跃迁到自动执行,智能体成为最重要的商业化锚点和下一代人机交互范式 [1] - OpenAI将AI发展分为L1-L5阶段,L3阶段的智能体具备对话能力、推理能力、长记忆和工具调用四项核心能力,其中工具调用是最关键区分要素 [2] - 智能体市场划分为通用型和垂直型,通用型跨领域提供基本认知能力,垂直型专注特定领域深度融合专业知识,目前垂直型更易形成可持续商业模式 [4] 智能体商业化进展 - 编程场景已诞生ARR突破5亿美元的产品Cursor,成为最短时间突破1亿美元ARR的软件产品 [6] - 垂直智能体在办公软件(WPS、钉钉、飞书)、金融(支付宝、微信风控)、法律(通义法睿、金山晓法)等领域开始落地 [4] - 2025年AI手机渗透率预计达34%,端侧模型精简和芯片算力升级推动AI手机向中端价位渗透 [12] 智能体产业链格局 - 产业链分为基础层(大模型与基础设施)、平台层(开发工具与平台)、应用层(应用与场景) [7] - 科技巨头以大模型为底座布局智能体平台和生态,创业团队在核心能力做颠覆性创新,终端厂商依靠设备入口差异化竞争 [8] - MCP协议通过提供统一通信标准推动智能体行业互联互通,降低集成门槛 [10] 智能体技术演进方向 - 多模态基础模型和强化学习训练方法已发展到相对成熟阶段,能理解视觉信息和训练Agent与环境交互 [9] - 智能体正从AI手机扩展到AI浏览器,将对话交互方式植入搜索页面实现实时唤起和多轮对话 [13] - 通用智能体挑战"上限"和"广度",垂直智能体夯实"下限"和"深度",两者发展方向各有价值 [4] 智能体评估框架 - 从"容错性"和"自主性"两个维度建立智能体价值生态评估模型,X轴容错性衡量错误后果严重程度,Y轴自主性衡量决策执行能力 [14] - 医疗等低容错性场景需要更准确信息捕捉和稳定执行,写作创意等高容错性场景错误后果轻微可控 [14] - 不同象限的智能体产品需适配对应的安全风险准则 [14]
首批!蚂蚁数科Agentar通过中国信通院智能体评估,获最高评级
中金在线· 2025-06-30 17:28
行业动态 - 中国信通院公布可信AI智能体评估体系最新进展,蚂蚁数科Agentar成为首批通过评估的智能体平台产品,并获得当前最高评级5级 [1] - 蚂蚁数科Agentar是国内首个获得5级评级的金融级智能体平台产品 [1] - 2024年中国信通院联合近六十家单位编制并发布《智能体技术要求与评估方法》系列标准,从功能完备性、性能表现、智能化水平、应用成熟度等维度建立全面评估框架 [3] 评估标准 - 评估包括智能体平台管理和运营、智能体管理和开发、API管理服务三大维度,共覆盖23个能力项 [3] - 参测智能体平台需要23项全部通过才能达到5级评级,表明Agentar在性能表现、应用成熟度等方面达到国内领先水平 [3] 平台能力 - 蚂蚁数科Agentar平台贯通算力、数据、模型、应用全链路,助力金融机构高效打造自主决策、可信可靠的深度金融智能体应用 [4] - 平台沉淀亿级高质量金融专业数据,并上线业内首个金融MCP服务广场,整合超百个核心金融MCP服务,提供"可插拔式"行业Know-how组件库 [4] - 平台具备金融级数据与内容安全防护及实时监测能力,保障智能体应用的安全合规 [4] 应用场景 - 基于蚂蚁数科Agentar平台打造的金融智能体解决方案已在财富管理、智能风控、营销以及数据分析等多个核心金融场景中实现深度应用 [4] - 平台加速智能体在金融业的规模化应用与价值落地 [4]
微软推出深度视频探索智能体,登顶多个长视频理解基准
机器之心· 2025-06-30 11:18
核心观点 - 大型语言模型(LLMs)和视觉-语言模型(VLMs)在处理数小时长视频时仍存在局限性[1] - 提出新型智能体Deep Video Discovery(DVD),通过分段处理视频并利用LLM推理能力实现自主规划,在LVBench上达到74.2%准确率,超越现有技术[3] - DVD采用多粒度视频数据库和搜索工具集,通过LLM协调实现自主搜索和回答[7][9] 技术架构 多粒度视频数据库构建 - 将超长视频分割为5秒片段,提取全局/片段/帧三级信息,包括摘要、字幕、嵌入向量等[10] 智能体搜索工具集 - 全局浏览工具:获取高层上下文和视频全局摘要[11] - 片段搜索工具:通过语义检索返回相关片段及其时间范围[12] - 帧检查工具:从像素级信息提取细节并提供视觉问答[13] 性能表现 - 在LVBench上:DVD(74.2%)显著超越MR Video(60.8%)和VCA(41.3%)[16] - 辅助转录后准确率提升至76.0%[17] - 各维度表现:事件推理(73.4%)、知识推理(80.4%)、时序理解(72.3%)等[16] 比较分析 - 商业VLM对比:OpenAI o3(57.1%)优于GPT-4o(48.9%)和Gemini-2.0(48.6%)[16] - 开源VLM对比:Qwen2.5-VL-72B(47.7%)低于DVD[16] - 行为分析显示GPT-4o存在过早结束推理的问题[18]
周鸿祎的“AI观”:“能干活”的智能体才是“答案”
经济观察报· 2025-06-29 14:42
AI发展趋势与实践路径 - 中国具备全球最完整的产业链与最丰富的工业场景,为AI技术深度应用创造有利条件,促使企业积极拥抱AI与大模型 [2] - AI大模型存在应用短板:缺乏使用工具和处理复杂任务的能力,以及长期记忆能力,无法自主处理多步骤复杂流程 [2] - AI的未来在于智能体的变革创新,智能体能够完成复杂任务的分解、推理及分布式执行,标志着AI从被动响应转向主动执行 [2][3] 智能体的作用与价值 - 智能体能够全流程执行复杂任务,自动调用工具,完成从规划到执行的完整闭环,形成系统性解决方案 [3] - 智能体最初作为辅助工具优化单个工作节点,逐步发展为取代部分岗位职能,成为"数字员工"或"硅基员工" [3] - 人类员工将转变为智能体的教练和管理者,负责目标设定与价值观判断,把控整体方向 [3] 未来工作模式与企业变革 - 未来应用软件和网站将成为智能体执行任务的工具,形成"员工操作智能体,智能体调用软件"的全新工作模式 [3] - 一名人类员工带领上百个智能体协同工作将成为常态,员工工作效能呈指数级增长,演变为"超级个体" [3] - 企业内每名员工管理大量智能体时,企业运营规模扩大,升级为"超级公司",智能体占比成为衡量AI化水平的关键指标 [3] 企业推进AI应用的建议 - 正确认识AI能力并不断挖掘,培养全员"AI素养",提升企业"含AI量" [4] - 确定AI在企业中的应用场景,解决堵点、卡点问题 [4] AI安全问题 - AI大模型面临内容安全、幻觉、提示注入攻击等新型安全问题 [5] - 智能体具备操作企业生产控制及IT系统的能力,一旦失控可能导致业务中断、生产线停摆等风险 [5]
华创资本王道平:很多AI产品刚上线就被用户抛弃,非常残酷
36氪· 2025-06-26 07:17
AI行业趋势与创业机会 - AI技术仍处于快速发展阶段,尚未进入收敛期或定型期,技术及应用形态存在不确定性 [6] - 创业方向从2022年底的大模型转向2023年的中间层工具(如Dify)、2024年的智能体和AI+硬件(如Even眼镜、机器人)[6][8][10] - AI原生产品与新交互范式(如多模态助手、原生硬件)最可能诞生"一人独角兽"[2] 投资逻辑与赛道选择 - 更关注通用型、市场化程度高的行业(如消费、ToB工具),而非医疗/教育/金融等门槛高、合规复杂的领域[11] - 早期投资核心看团队对AI的洞见、产品化能力和赛道理解(如AI眼镜创始人兼具产品能力与赛道判断)[12][13] - 明确不投大模型方向:资金消耗大、商业模式模糊、大厂优势显著[15][16] AI创业环境变化 - 用户容忍度极低,产品需即时见效,试错空间小于移动互联网时代[18][19] - 大厂跟进速度快,竞争压力空前,创业者需快速差异化并规模化[3][19] - 商业化验证关键:需证明产品"work"且有用户,闭环跑通优先(如出海应对付费习惯差异)[22][23] 融资与商业化挑战 - 资金供给减少,政府背景基金占比提升,融资逻辑转向政策导向[25][26] - 创业者需更早创造收入,团队规模缩小降低启动成本,产业投资成选项[27][28] - 部分领域(如AI硬件)短期难盈利,需平衡融资与生存[29] 智能体(Agent)发展 - 智能体应用在ToB/ToC领域快速演化,标志性案例Manus出现[8][9] - 流量分发逻辑可能颠覆:从争夺用户时长转向调度资源/意图[32] - 行业机会取决于创业者理解力,非预设赛道(如多邻国证明教育领域潜力)[30][31]
周鸿祎:如果今年人工智能不能进化到智能体,那就是一场泡沫和闹剧
快讯· 2025-06-25 19:52
人工智能行业发展现状 - 人工智能特别是大模型的发展给人们带来惊喜 [1] - 当前人工智能技术仍处于初级阶段 [1] - 若年内无法实现智能体进化则存在泡沫化风险 [1] 企业观点 - 360公司创始人周鸿祎多次强调大模型发展的初级阶段特征 [1][1][1] - 企业创始人认为技术突破需要达到智能体阶段才有实质意义 [1] 注:由于原文内容重复且信息密度较低,关键要点经过合并同类项处理,所有观点均来自同一文档[1]的重复表述
花大几千请专家填志愿,竟和AI水平相当!
第一财经· 2025-06-25 19:41
高考志愿填报市场现状 - 高考志愿填报市场需求旺盛,传统市场存在乱象,如"高考志愿填报指导师"认证门槛极低,300-700元即可获得认证,部分机构甚至无需上课即可出证[1] - AI志愿填报工具正快速崛起,清华大学研究显示部分AI产品已达到志愿填报专家水平[1] - 2025年互联网大厂纷纷布局AI志愿填报工具,包括夸克、百度、QQ浏览器、字节、华为、讯飞星火等,市场竞争激烈[3] 互联网大厂AI志愿填报产品发展 - 夸克发布国内首个高考志愿大模型,已服务1.2亿用户,其中50%以上来自三四五线城市[3] - 百度数据显示2024年6月25日单日AI志愿助手用户超1000万[3] - 产品差异化明显,夸克注重数据建设,百度、讯飞星火侧重对话体验升级[4] - 当前竞争核心是精准度、速度、易用性和个性化体验的综合比拼[5] AI志愿填报技术演进 - AI工具从简单搜索向具备推理、反思能力的"专家化"方向发展[7] - 产品设计更注重个性化,如夸克支持12个信息点输入,提供三种优先级的志愿报告[7] - 算法持续优化,如中外合作专业推荐逻辑从优先推荐调整为条件匹配[8] - 2025年被视为智能体元年,各公司通过智能体降低用户使用门槛[11] 行业发展趋势 - AI志愿填报产品仍处辅助工具阶段,最终决策仍需以人为主[12] - 产品未来需增强透明度,如解释推荐逻辑,提升用户交互体验[12] - 该领域成为互联网公司获取年轻用户的重要入口,如讯飞星火通过高考产品渗透Z世代[10]
周鸿祎:当大模型进化为智能体 人也将变为超级个体
快讯· 2025-06-25 19:03
金十数据6月25日讯,在夏季达沃斯论坛期间,360集团创始人周鸿祎表示,当前人工智能发展已经进入 下半场,智能体成为主角。"如果只把大模型当作工具来用,或许只能提升30%、50%的效率;但当大 模型进化为智能体,使其像数字助理一样帮人们处理各种复杂工作,人的角色就会转变为领导智能体、 规划人工智能、管理人工智能,人也将变为超级个体。因此近期的全球创业热潮包括中国的创业热潮, 也因为人工智能重新卷起了一个高潮。"周鸿祎成,"如果今年人工智能不能进化到智能体,那这次人工 智能可能又是一场泡沫,就不是工业革命了,而是一场闹剧。所以我们非常幸运地渡过了这一关。" 周鸿祎:当大模型进化为智能体 人也将变为超级个体 ...
周鸿祎达沃斯谈人工智能向智能体进化:重塑产业格局与人类协作新范式
新浪科技· 2025-06-25 18:35
人工智能发展趋势 - 人工智能发展已进入下半场,智能体技术成为主角,推动AI从"会说话"向"能干活"跨越 [2] - 2025年将成为人类与智能体共生关系的转折点,智能体正从"辅助工具"转变为"自主决策者"和"主动协作者" [2] - 大模型作为工具仅能提升30%-50%效率,而进化为智能体后可使人转变为管理智能体的超级个体 [2] 智能体技术特征 - 智能体具备两大核心能力:完成复杂任务和工具调用,如同为大模型装上"数字手脚" [3] - 360纳米AI超级搜索智能体可自主完成流程规划、任务分解、工具调用和全流程执行 [3] - 智能体可将搜索从"目的"降维为"手段",直达任务目标而非仅提供信息 [4] 行业影响 - 人工智能创业公司规模普遍较小,AI技术使人力需求减少90%(从200-300人降至20-30人) [3] - AI使程序员角色扩展,可同时承担产品经理、市场推广和销售等工作 [3] - 智能体技术正在重塑全球产业逻辑和重构人机协作关系 [2] 技术应用案例 - 纳米AI超级搜索智能体可自主完成宣传片制作全流程,效率较人工提升数倍 [3] - 该智能体可处理旅游规划或产业分析等复杂任务,通过多步推理生成详细报告 [4]