智能体(Agent)

搜索文档
OpenAI董事长Bret Taylor:2010 年的 SaaS 应用,就是 2030 年的智能体公司
AI科技大本营· 2025-07-28 18:42
AI行业现状与趋势 - 当前处于"加了10倍速的互联网泡沫"时代,AI技术变革堪比个人电脑和互联网的诞生,为初创公司创造挑战巨头的机会 [3][31][35] - AI能力已超越三年前对AGI的定义,行业正在不断重新定义技术边界 [8] - 软件行业被AI颠覆的程度可能超过其他任何行业,历史上尚无类似先例 [8] - 技术复合效应显著增强,AI可通过现有全球智能设备网络快速触达用户,增长呈现爆炸性 [33][34] 创业方法论 - 真正的创业机会来自市场或平台转变,需关注技术革新带来的生产力跃迁 [14][15] - 多数B2B公司宣称的"以客户为中心"存在误区,真实价值需通过商业变现验证 [19][21] - 有效创业应始于深度客户需求调研,而非技术推演,典型案例是与Grab CEO长谈后锁定AI客服赛道 [20][21] - 资本主义环境下,金钱交易是唯一诚实的市场信号,免费试用反馈存在误导性 [30] 技术架构演进 - 行业正在探索AI时代的"LAMP"技术栈,当前提示词工程等临时方案未来将显得原始 [46][47] - 模型功能不应过度集成,记忆等辅助功能可通过外部系统实现,这将成为智能体公司的市场机会 [44] - 未来技术栈将明确分工:基础模型集中于研究领域,全栈工程聚焦智能体开发 [42] 公司运营策略 - 应用层AI公司预训练自有模型是最高效的烧钱方式,应避免这种错误 [36][42] - AI市场分为三大领域:前沿大模型(资本密集型)、AI工具(高风险竞争)、应用层AI(最大机会) [37][39][41] - 软件维护成本问题将通过智能体服务解决,延续SaaS对传统软件的优势 [43] 人才需求变化 - "10倍工程师"的定义将被重塑,三年后所需技能组合可能完全不同 [8] - 黑客马拉松价值提升,胜负关键变为操作"代码生成机"的速度 [9] - 教育体系需适应技术变革,AI将放大个体能力,降低专业门槛 [51][52] 历史经验借鉴 - 互联网泡沫时期诞生了亚马逊等巨头,当前AI热潮可能复制这一模式 [32] - 参考云计算市场发展路径,AI工具领域仍可能孕育Snowflake级别的公司 [40] - 2010年的SaaS应用将演变为2030年的智能体公司,垂直领域存在大量机会 [41]
从上海到世界:2025世界人工智能大会见证中国AI刻度
中国证券报· 2025-07-28 05:07
产业格局 - 上海形成"一东一西、一软一硬"的AI产业格局,徐汇"模速空间"聚焦模型生态集聚500余家AI企业,浦东"模力社区"专注具身智能和垂类应用集聚近200家AI企业 [1] - 2025世界人工智能大会汇聚全球1200余位顶尖专家和百余款首发新品,展现中国在全球智能浪潮中的雄心 [1] 技术应用 - 智能体(Agent)成为培育新质生产力的重要一环,2025年被视为"智能体创新应用元年" [2] - 阶跃星辰联合千里科技和吉利汽车展示下一代智能座舱Agent OS,具备多模态融合交互和端云一体记忆能力 [2] - MiniMax Agent展示全栈开发功能,包括编程能力和多模态能力,并展示重塑广告业生态的突破性成果 [3] - 具身智能技术取得进展,中国人形机器人以不到国际顶级产品1/100的成本实现相当性能水平 [3] 产业生态 - 上海市2024年一季度规上人工智能产业规模达1180亿元,同比增长29% [6] - 上海推动大模型企业与场景企业对接,帮助企业快速落地技术并申办业务资质 [6] - 阶跃星辰和MiniMax等企业将多款大模型开源,上海积极构建全链开源生态并引进阿里魔搭等开源社区 [6] - 上海市人工智能人才规模近30万人,约占全国1/3,高校加快AI专业建设和人才培养 [7] 发展目标 - 上海计划到2025年底建成世界级人工智能产业生态,智能算力规模突破100EFLOPS [7] - 目标形成50个行业开放语料库示范应用,建设3-5个大模型创新加速孵化器和一批赋能中心 [7] 治理体系 - 2024世界人工智能大会发布《人工智能全球治理上海宣言》,搭建跨国界治理桥梁 [4] - 全球人工智能创新治理中心启动,促进国际交流合作与规范制定 [5] - 上海持续优化治理体系,修订《上海市促进人工智能产业发展条例》,推动成立人工智能伦理专家委员会 [5] - 深信服安全GPT大模型通过双备案并落地400多家行业用户,中国电信首发智云上海服务AI算力需求 [5]
赛道Hyper | 荣耀之剑指AI能力落地新竞逐
华尔街见闻· 2025-06-20 18:55
AI产业转型方向 - 当前AI产业从大模型参数竞赛转向技术落地成为新竞争焦点 [1] - OpenAI以65亿美元收购硬件公司io 标志AI从云端模型向物理硬件转型的战略拐点 [1] - AGI发展路径中L3阶段智能体需实现自主任务执行 推动AI从被动思考向主动行动跨越 [1] 技术落地核心框架 - AI技术落地能力成为行业竞争核心 价值逻辑从工具效率转向结果闭环 [3][5] - 产品形态从云端计算转向贴身硬件 荣耀新一代折叠屏手机Magic V5定位为"最强AI智能体手机" [3] - 荣耀提出通过"查数据、做PPT、传文件"三动作闭环破解行业信任、性能、场景难题 [3] AI发展三大转变 - 竞争焦点转变:从模型性能参数比拼转向实际场景落地能力 [5][7] - 价值逻辑转变:从提升工具效率转向实现任务发起-执行-完成的完整闭环 [5][7] - 产品形态转变:从云端复杂运算转向多终端硬件贴身存在 [5][7] 智能体与硬件协同 - 智能体成为理解用户需求、执行任务的关键入口 硬件转变为AI人格化延伸 [7] - 荣耀提出"阿尔法战略" 推动向全球AI终端生态公司转型 满足多终端全场景需求 [8] - AI需以自然无缝方式融入生活 荣耀展示安卓/iOS跨系统文件互传技术实现服务随行 [12] 三大闭环突破路径 - 场景闭环:实现跨设备服务流转 覆盖全流程+高质量+跨场景协同 [12][13] - 信任闭环:解决内容真实性、隐私安全与伦理问题 构建可信架构 [13] - 性能闭环:通过端云协同智能分配算力 荣耀"多智能体协同"技术确保流畅体验 [14] 生态共建举措 - 荣耀倡议基于GSMA平台组建AI终端生态联盟 联合模型企业/运营商/终端厂商 [15] - 与中国移动达成合作 以AI大模型+智能体技术驱动终端产品创新 [17] - 参考华为鸿蒙生态与谷歌Android模式 推动系统-芯片-应用协同发展 [17] 行业价值展望 - AI技术普及需要持续技术积累与产业协作 围绕真实用户需求优化 [20] - 终极目标是让AI在生活场景中提供自然帮助 释放产业价值潜力 [18] - 荣耀的生态构想既是阶段性思考 也是打破企业利益壁垒的实践范例 [19]
AI正在重塑软件开发流程,软件ETF(159852)单日“吸金”超2300万元,电科网安10cm涨停
新浪财经· 2025-06-19 13:52
市场表现 - 中证软件服务指数下跌1 39% 成分股中电科网安涨停 中科星图上涨3 10% 启明星辰上涨1 53% 同花顺 恒生电子 财富趋势领跌 [1] - 软件ETF(159852)最新份额达38 23亿份 创近1月新高 近1周规模增长2998 16万元 新增规模位居可比基金第一 [3] - 软件ETF近1年净值上涨29 42% 在指数股票型基金中排名前14 67% 自成立以来最高单月回报为39 35% 最长连涨涨幅达69 40% [3] 流动性及资金流向 - 软件ETF盘中换手2 59% 成交7601 35万元 近1年日均成交1 54亿元 居可比基金第一 [3] - 软件ETF最新资金净流入2311 20万元 近5个交易日合计净流入4169 81万元 [3] 行业动态 - 2025南京软件大会以"工业软件赋智开源创新赋能"为主题 聚焦工业软件 信创产业 开源生态等领域 [3] - AI正重塑软件开发流程 大语言模型与智能体技术将渗透至操作系统开发等底层领域 推动低代码/零代码应用构建 [4] 指数成分股 - 中证软件服务指数前十大权重股合计占比59 85% 包括科大讯飞(11 19%) 金山办公(8 92%) 同花顺(7 79%)等 [5] - 权重股当日普遍下跌 同花顺(-2 95%) 恒生电子(-2 91%) 深信服(-2 47%)跌幅居前 [7]
Seedance 1.0超越可灵2.0?豆包“双箭齐发” 字节跳动摁下Agent加速键
每日经济新闻· 2025-06-12 15:05
豆包大模型1.6发布 - 豆包1.6系列由三个模型组成:doubao-seed-1-6(综合模型)、doubao-seed-1-6-thinking(深度思考强化版)、doubao-seed-1-6-flash(极速版)[4] - 豆包1-6是国内首个支持256K上下文的思考模型 三个版本均支持256K上下文[7] - 在复杂推理 竞赛级数学 多轮对话和指令遵循等测试集上 豆包1-6-thinking表现跻身全球前列[7] - 豆包1-6支持多模态理解和图形界面操作 能自动操作浏览器完成酒店预定 识别购物小票并整理成Excel表格等任务[8] - 豆包1-6首创按"输入长度"区间定价 0K-32K输入区间价格为0-8元/百万tokens 输出8元/百万tokens 综合成本仅为豆包1-5或DeepSeek R1的三分之一[13] 视频生成模型Seedance 1-0 Pro - Seedance 1-0 Pro在国际评测榜单Artificial Analysis的文生视频 图生视频两项任务中排名首位 超越Veo3 可灵2-0等模型[1] - 价格低至0-015元/千tokens 生成一条5秒1080P视频仅需3-67元 为当前行业最低[1] - 具备无缝多镜头叙事 多动作随心运镜 稳定运动与真实美感等技术特点 已应用于电商内容制作 游戏资产生成及影视预演等场景[11] - 生成速度快 仅需几十秒即可完成视频生成[11] 市场表现与行业影响 - 豆包大模型日均tokens使用量超过16-4万亿 较去年5月首次发布时增长137倍[14] - 在中国公有云大模型市场份额达46-4% 排名第一[14] - 服务全球TOP10手机厂商中的9家 8成主流汽车品牌 70%系统重要性银行及超5成985高校[14] - 价格降低带动业界跟进 推动中国大模型发展 可能引发新一轮"价格战"[14] Agent战略布局 - 公司认为AI时代的技术主体是Agent 需基于多模态深度思考模型才能实现复杂任务[12] - Agent的token消耗量大幅提升 需降低模型使用成本才能推动规模化应用[12] - 豆包1-6的能力升级和价格降低旨在促进生态繁荣 成为产业智能化的"地基"[14]
从高考到实战,豆包大模型交卷了
机器之心· 2025-06-12 14:08
豆包大模型1.6升级 - 豆包大模型1.6包含标准版、深度思考强化版和极速版三个主要版本[3] - 性能达到世界前沿水平,是国内首个支持256K上下文的思考模型系列,具备多模态理解和GUI操作能力[4] - 在高考数学测试中,豆包1.6从能读重本升级到能上清北的水平[4] - 编程任务测试中,豆包1.6一次性完成贪吃蛇游戏代码编写且无需修改[15] - 在五位数字密码推理问题中,豆包1.6是国内首个能通过非编程式推理解决该问题的模型[19][22] Seedance 1.0 Pro视频生成模型 - Seedance 1.0 Pro支持无缝多镜头叙事、多动作及随心运镜[6] - 在Artificial Analysis视频竞技场中表现超过Veo3和可灵2.0[6] - 测试显示该模型在动态一致性、细节真实感和镜头语言理解方面表现优异[38][39] AI基础设施与工具 - 火山引擎推出三大AI基础设施套件:AgentKit、TrainingKit和ServingKit[8][65] - veRL强化学习框架已支持DeepSeek 671B和Qwen3 235B等大型MoE模型,GitHub star量超过9300[62][63] - 构建多模态数据湖,为企业提供AI原生数据基建[64] - 推出Prompt Pilot服务,可自动分析和优化提示词[58] 技术发展主线 - 第一条主线是"推理+视觉"范式发展,将推理能力扩展到视觉理解领域[51] - 第二条主线是视频生成走向实用化,高质量视频生成进入实际生产环境[51] - 第三条主线是多步骤复杂任务处理,即智能体(Agent)概念的发展[52] 市场影响与战略 - Meta宣布148亿美元投资Scale AI事件引发市场关注[30] - 火山引擎强调"AI云原生"概念,重新优化AI工作负载的云端架构[8][71] - 公司计划长期投入,目标是成为客户信赖的云服务平台[72]
对话腾讯副总裁吴运声:每个行业都值得被“智能体”重构一遍
中国经营报· 2025-05-26 16:57
腾讯云大模型战略升级 - 公司首次完整阐述大模型战略,提出"四个加速":加速大模型创新、加速智能体应用、加速知识库建设、加速基础设施升级 [2] - 腾讯云大模型知识引擎升级为"腾讯云智能体开发平台",支持Agent自主拆解任务和规划路径 [2] - 公司提出"每个行业都值得被智能体重构一遍"的理念 [2] Agent技术特性 - Agent具备自主思考和决策能力,不同于传统预设流程的软件和SaaS [3] - 能融合确定性工作流与自主规划机制,实现灵活性与确定性的结合 [3] - 技术演进经历了Function Calling、ReAct模式、Code Agent等发展阶段 [4] - Code Agent能直接生成程序处理复杂任务,效率显著提升 [5] 腾讯云智能体平台定位 - 平台融合三方面能力:知识管理能力、工作流编排能力、自主感知与决策能力 [7] - 面向B端企业级市场,强调系统性构建、数据接入、安全隔离等复杂能力 [8] - 与C端产品"元器"形成差异化定位 [8] 行业应用前景 - 浏览器沙箱集成显著拓展Agent行为边界,可覆盖更多真实场景 [10] - 正在研发本地电脑沙箱能力,使Agent能操作本地软件和工具 [10] - 业务复杂度高、知识密度强、人力成本高的行业最适合应用 [11] - 快递行业落地案例整合了语音合成、数字人、多Agent协同等技术 [12] 技术发展现状 - Agent技术快速发展,自主规划和工具调用能力持续增强 [8] - 目前尚未形成泾渭分明的技术路线,公司专注构建能力更强、更丰富的Agent应用 [9] - 技术挑战主要在自主规划环节,模型尚不能100%准确拆解复杂任务 [12] - 客户认知与使用存在鸿沟,需要通过产品优化和培训弥合 [12]
谷歌重磅发布最强通用AI模型!同声传译、全新AI模式搜索,直接通过自然语言发问,支持长达数百字提问
每日经济新闻· 2025-05-21 06:37
谷歌AI战略升级 - 公司宣布全面拥抱AI智能体技术,将智能体整合至核心业务搜索及AI助手Gemini,推出全新AI模式搜索 [1] - 在I/O开发者大会上展示AI、多模态模型、跨设备整合与开发者工具的最新成果,标志AI从"信息工具"进化为"通用智能体" [1] 模型与技术进展 - 推出Gemini 2 5 Pro模型,被CEO称为"迄今为止最强大的通用AI模型",在LLM Arena测评中所有类别排名第一 [2][3] - Gemini模型在AI代码编辑器Cursor上增长最快,每月处理token数量从9 7万亿激增至480万亿(增长近50倍) [3][4] - Gemini App月活跃用户达4亿,公司推出十多款模型和20项AI功能,发布速度创历史新高 [3][4] 智能体模式与应用 - 智能体模式(Agent Mode)将上线Chrome、搜索及Gemini App,可同时管理多达10个任务并自主学习 [5] - 演示智能体完成找公寓任务:搜索Zillow、调整筛选条件、使用MCP协议预约看房 [6] - 智能体模式实验版将向Gemini订阅用户开放,支持私密使用个人信息 [7] 搜索功能革新 - AI概览(AI Overviews)月活用户达15亿,推动某些查询量增长10% [10] - 推出AI Mode标签页,支持数百字复杂提问、自动分解意图、生成结构化答案,已在美国上线 [10] - 深度搜索(DeepSearch)模型整合逻辑结果与多模态内容,提供"博学助理"式答案 [13][14] 多模态与创作工具 - Flow平台整合Veo 3视频生成模型,支持文字/图片生成8秒片段并拼接完整视频 [23][25] - Imagen 4图像模型可生成真实文本,Veo 2新增相机控制与对象移除功能 [25] - 原生音频合成工具Lyria与文本转图像/视频技术同步亮相 [2] 硬件与跨设备整合 - 安卓XR平台联合三星、高通开发,支持AI眼镜设备,已有数百家软件商适配 [26][27] - 首款安卓XR设备Project Moohan将于年内上市,与中国Xreal合作推出AR眼镜 [27] - Gemini AI将拓展至智能手表、汽车控制台、电视及眼镜 [26] 创新功能展示 - 谷歌光束(Google Beam)实现3D光场视频会议,帧率达60fps,年内由惠普首发 [15] - Google Meet支持英语/西班牙语同声传译,保留原声音色与情感,将新增多语种 [19] - 虚拟试衣工具支持用户上传照片预览服装效果,AI购物决策全流程覆盖 [21]
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
虎嗅· 2025-05-08 19:50
公司概况 - 阶跃星辰由前微软全球副总裁姜大昕于2023年创立,总部位于上海,北京办公室距离微软中国办公地仅504米 [1] - 公司核心管理团队包括CEO姜大昕(战略与技术研发)、首席科学家张祥雨(技术研发)、系统负责人朱亦博(AI基础设施) [1] - 公司员工规模达400余人,其中80%为技术研发人员,采用扁平化管理模式,员工可通过私信直接与CEO沟通 [2] - 2024年12月完成B轮数亿美元融资,是"AI六小虎"中少数坚持预训练路线的公司 [3] 技术战略 - 核心聚焦多模态基础模型研发,坚持"理解生成一体化架构"技术路线,认为这是实现AGI的必经之路 [1][11] - 已建立Step系列通用大模型矩阵,涵盖语言模型和多模态模型,2024年下半年多模态API调用量增长超45倍 [1][11] - 2025年1月发布推理模型Step R1-V-Mini,计划未来三个月推出满血版Step-R1 [14] - 近期将算法团队重组为"生成理解"团队,体现对理解生成一体化架构的重视 [1] 行业趋势判断 - 多模态领域尚未出现"GPT-4时刻",核心瓶颈在于缺乏统一的理解生成一体化架构 [1] - 模型演进路径分为三阶段:模拟世界(模仿训练)→探索世界(强化学习)→归纳世界(自主发现规律) [5][7] - 当前两大技术趋势:1) 将长思维链推理能力融入语言/多模态模型 2) 视觉领域理解生成一体化 [18][19] - 智能体(Agent)发展需要两个条件:多模态能力和慢思考能力,2024年这两方面取得突破性进展 [31] 产品应用 - 主要收入来源:面向品牌客户的ToB服务和面向开发者的API接口业务 [3] - 已推出Step 1X-Edit图片编辑模型,采用初级理解生成一体化技术,未来几个月将发布更先进版本 [30] - 重点布局智能终端Agent生态,与手机、汽车、机器人领域头部企业合作,提供云端Agent开发平台 [34][35] - 实际应用案例包括茶百道/瑞幸门店巡店系统,通过视觉推理实现90%以上的操作规范检测准确率 [17] 竞争格局 - 基础模型领域竞争激烈,过去半年仅OpenAI/Google/Meta/Grok/Anthropic就发布不少于8款新品 [3] - 国内竞争对手包括月之暗面、MiniMax等,但阶跃星辰在多模态覆盖广度和原生多模理念上具有差异化优势 [3][12] - 公司认为当前竞争焦点仍是"追求智能上限",将持续投入强化学习和多模态前沿技术研发 [4][15]
AI原生浪潮冲击下,互联网大厂的组织如何进化?
36氪· 2025-04-11 18:20
AI原生组织的崛起 - AI原生组织(AI Native)将AI内化为产品、服务和业务流程的核心驱动力,而非功能附加 [2] - 核心技术均为自研模型(如OpenAI的GPT、DeepSeek的MoE架构),技术迭代速度远超传统企业,OpenAI从GPT-3到GPT-4仅用两年,研发投入占比高达90%以上 [2] - 产品设计天然依赖AI能力,无法脱离AI独立存在,如Midjourney的生成式图像、Character.AI的角色人格化交互 [3] AI原生组织的核心特征 - 技术原生性:自研模型快速迭代,OpenAI单次训练GPT-4成本超1亿美元,DeepSeek MoE架构将参数价值挖掘效率提升300% [4] - 组织液态化:扁平化、自组织结构,DeepSeek科研背景员工占比超80%,通过"影子组织"打破部门墙 [5] - 极客文化与创始人凝聚力:如OpenAI的Altman与DeepSeek的梁文锋以技术远见凝聚顶尖人才 [6] 互联网大厂的挑战 - 大模型开发落后于AI原生组织,大厂虽资源丰富但缺乏领军人才和极致技术追求 [9] - 用户时间争夺战:AI原生APP月活跃用户突破1.2亿,月人均使用时长133分钟,AIGC领域MAU同比增长244.7% [10] - 智能体领域落后:大厂智能体多局限于垂类场景,消费端突破力不足,如阿里钉钉的AI工单系统 [11] 大厂的应对策略 - 数据深化:将数据规模优势转化为智能优势,如DeepSeek重视数据标注,Grok3受益于SpaceX知识库 [16] - 模型竞合:采用合作与自研双轨策略,如微软130亿美元投资OpenAI并成为其独家云服务提供商 [18] - 组织变革:字节设立虚拟小组提升敏捷性,腾讯调整产品线至CSIG,阿里三年投入3800亿元建设AI基础设施 [19][21][22] 组织效率对比 - 决策周期:大厂需周/月级审批,AI原生组织为分钟级数据驱动 [17] - 创新速度:大厂以周/季为单位迭代,AI原生组织以天为单位微调模型 [17] - 人才结构:大厂支持人员占比高,AI原生组织科学家与技术人员密度高 [17] 未来趋势 - "模型-数据-智能体"解构传统互联网公司的"数据-算法-流量"铁三角 [27] - 组织学习速度成为决胜要素,需快速将技术突破转化为商业闭环 [27] - 大厂面临基因突变挑战,如字节用AI-native人才替代搜推广背景人员 [26]