Workflow
Data Agent
icon
搜索文档
喝点VC|BV百度风投:数据治理即生产力,现在是Data Agent的时刻
Z Potentials· 2025-07-30 11:37
行业趋势 - 生成式AI推动数据从静态资产转向实时决策前台,数据成为可被语义标注、即时调用的数字化资源 [3] - 全球数据量2024年达149ZB,2025年将突破181ZB,其中80%为非结构化内容,需即时结构化才能参与推理链路 [5] - 生成式AI每年可贡献2.6–4.4万亿美元新增价值,75%收益源自研发、软件工程等高度依赖结构化数据的职能 [5] - Data Agent赛道终局想象空间远超传统ETL或BI,早期落地者已验证≥60%生产力提升或数百万美元年度节省 [7] Data Agent定义与价值 - Data Agent是围绕数据生命周期全栈自动化的AI智能体,能按自然语言意图自主规划、执行与校验 [7] - 传统数据栈分为"搜索—管理—分析"三段,Data Agent将表格操作对话化,Coding Agent处理定制化查询 [8] - Gartner预测2027年AI Agents将完成50%业务决策,首波落地点为数据流密集的报表、监控与预算场景 [9] - Data Agent接管"找数+清洗"环节,人类分析师转向假设验证与策略设计,形成多Agent协同生态 [9] 技术拐点与市场成熟度 - LLM推理成本三年内从每百万token 60美元降至0.06美元,年化下降1000倍 [10] - AI搜索占美国桌面端查询5.6%(一年翻倍),用户接受"自然语言直连结构化答案"模式 [13] - Databricks以13亿美元收购MosaicML,Snowflake收购Neeva,资本聚焦"模型原生数据平台"叙事 [13] - 开源框架LangChain、Llama-Index等一年内Star总量翻番,为Data Agent提供即插即用运行时 [13] 应用场景与效率提升 - 全球11亿办公人群每日使用Excel,但60–80%工时耗在"找数+清洗"环节 [15] - 开源项目Teable将企业CRM搭建周期从3~5天压缩至7分钟,效率提升约600倍 [17] - Snowflake Cortex使营销机构洞察速度提高30倍,数百次查询节约三周净工时 [18] - 法国Dust为银行部署私域Data Agent,一年节省50,000人工小时及数百万欧元成本 [18] 产品创新与交互变革 - 飞书多维表格通过自然语言实现数据查询、公式生成与自动化工作流,降低操作门槛 [28] - Airtable Omni Agent可秒级完成「找数—分析—决策」链路,支持数万条记录的模式识别 [33] - Perplexity月活1500万,估值180亿美元,其企业API与三星、苹果洽谈预装合作 [27] - Exa提供语义搜索API,支持网页抓取与摘要生成,加速市场调研与竞争分析 [27] 发展阶段与商业模式 - 阶段1(人类主导):Data Agent让自然语言成为操作界面,摩根士丹利理财顾问使用率达98% [36] - 阶段2(场景驱动):Data Agent自动生成完整应用系统,MIT研究显示实时响应企业营收增长率高62% [40] - 阶段3(自治智能):Data Agent演化为"数字COO",东京酒店动态定价系统提升每房收益6–10% [41] 市场机会与竞争格局 - 75%知识工作者已使用生成式AI,但53%企业缺乏组织级效率转化方法论 [42] - 2024年AI Agent赛道融资38亿美元(同比增3倍),超六成流向"数据—洞察—行动"闭环项目 [45] - 头部玩家稀缺,仅Glean、Dust等少数项目月活破百万或ARR过千万,技术栈仍处开荒阶段 [46] - 67%企业2025年将新增Gen AI预算投入数据管线自动化,开源框架距企业级需求仍有差距 [46]
Data Agent如何帮助企业打造懂你的“电子牛马”?|数势xSelectDB
量子位· 2025-07-05 12:03
核心观点 - Agent产品正在从通用型转向垂直企业级,强调"懂业务"的能力,需理解业务概念、逻辑并提出实际操作建议[7][8][11] - 数据Agent通过语义层连接自然语言与业务数据,解决传统BI灵活性不足问题,实现个性化、主动式和强大执行力的数据分析[14][20][21] - 企业智能化发展需结合强模型与优质私域数据,通过Data Agent激活沉睡数据,提升决策效率[24][41][42] 行业趋势 - 数据分析从"User-facing"转向"Agent-facing",未来Agent数量可能是人员10-100倍,要求数据库具备高并发、实时性和多数据类型支持[16][17] - 垂直场景中Data Agent价值更显著,如零售督导巡店、营销反欺诈等需灵活及时决策的领域[27][30][31] - AI Agent将重构企业组织结构,催生"超级个体"和新型角色如"电子牛马饲养员",增强而非完全替代人力[38][39] 技术路径 - 有效路径为NLP-to-Semantic而非Text-to-SQL,需构建企业私域知识体系实现语义映射[15] - 数据库需支持细粒度权限控制(RBAC),应对AI时代数据安全挑战,精确到行列级访问权限[35][36] - 分析型数据库需优化索引、实时查询和多源数据整合能力,如与COS对象存储打通处理非结构化数据[17][26] 应用场景 - 零售行业典型案例:通过Agent实时分析门店销售/员工离职率等数据,支持督导精益化运营决策[27][28] - 封闭场景可实现规则化自动决策,开放场景则提供结构化分析报告辅助人工判断[32][33] - 传统BI模式下被压抑的业务需求得以释放,数据消费频率提升10-100倍[25][26] 实施关键 - 企业需重点治理私域数据和语义系统,建立分析范式并沉淀为Agent模板[39][43] - 业务与平台联合共建至关重要,需持续探索适合落地的use case[44] - 评估标准分两类:封闭场景看规则执行准确率,开放场景看信息呈现完备度[32][34]
大厂Capex加速增长
国盛证券· 2025-05-17 22:44
报告行业投资评级 - 增持(维持) [7] 报告的核心观点 - 推理端对高性能计算的需求快速释放,阿里、腾讯等大厂Capex持续扩张,云上游上行周期正式启动,看好由推理应用带来的云计算需求持续扩张 [1][12] - 云大厂能力全面升级,加速AI应用落地 [2] - 以LLM为核心驱动的Agent背后蕴含庞大的算力需求,算力已成为支撑Agent发展的关键基础设施和核心瓶颈 [3] 根据相关目录分别进行总结 阿里、腾讯Capex实质更乐观,AI基建正式启动 - 阿里资本开支承诺金额超预期,阿里云增速亮眼,2025Q1阿里资本开支为246.12亿元,同比增长120.68%;阿里云收入301.27亿元,同比增长17.71%,未来三年阿里将投入超3800亿元用于建设云和AI硬件基础设施 [13][16] - 腾讯资本开支符合预期,国内AI基建正式启动,2025Q1腾讯资本开支274.76亿,同比+91.35%,公司预计在2025年进一步增加Capex,预期Capex占收入的比例为低两位数百分比 [16] 云大厂能力全面升级,加速AI应用落地 - 字节:6月火山引擎2025 FORCE原动力大会召开在即,5月13日发布豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,升级豆包·音乐模型,Data Agent正式亮相并全新升级,6月11 - 12日大会有望迎来更多AI落地惊喜 [21] - 阿里云:4月9日召开AI势能大会,AI和云计算基础设施全面升级,算力上第九代ECS开启商业化,算力最高提升20%、价格较上一代再降5%;存储上文件存储CPFS面向AI智算能力再升级;运维上跨域网络SLA提升至99.995%,网络智能服务NIS已推出;管控上“灵骏”可主动发现故障并“自愈”,万卡集群有效训练时长占比超93%;推理上人工智能平台PAI面向MoE架构及推理模型全面升级;数据上瑶池数据库产品上新,支持In - DB AI、开箱即用;Agent上线业界首个全生命周期MCP服务,预告Agent Store愿景;生态上“繁花计划”启动,未来三年目标百万家客户、百亿元商机 [26][35] - 华为云:4月10日召开生态大会,创新算力架构,推出CloudMatrix 384超节点;沉淀行业Know - how,推动盘古大模型在行业场景落地;坚定投入生态建设,华为开发者规模超1200万 [36][39] 算力是Agent爆发的前提,支撑中长期成长 - Agent需要处理长上下文和接入外部数据,增加上下文长度和接入外部数据会导致算力需求增长 [42][44] - Agent执行任务验证带来算力开销,如Manus AI的三重校验体系保障输出可靠性,但需要额外计算资源 [45] - 多模态的发展会带来更大算力需求,Agent处理和整合多种类型数据需要大量计算资源 [46] - 算力瓶颈影响Agent服务的用户体验,为保证用户体验需留出冗余算力 [47][48] - 算力需求不仅体现在用户端的推理服务上,也体现在模型训练阶段,如阿里Qwen3系列模型训练需要海量算力 [50] 建议关注 - 算力:寒武纪、海光信息等多家公司 [4][53] - Agent:金山办公、泛微网络等多家公司 [4][53] - 垃圾发电:旺能环境、盈峰环境等公司 [4][53] - 互联网大厂AI链:寒武纪、恒玄科技等多家公司 [5][54] - 军工AI:能科科技、品高股份等公司 [5][54]
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
机器之心· 2025-05-14 12:36
多模态大模型Seed1.5-VL发布 - 火山引擎发布5款AI模型和产品,包括豆包・视频生成模型Seedance 1.0 lite、升级后的豆包1.5・视觉深度思考模型(Seed1.5-VL)、新版豆包・音乐模型等 [1] - Seed1.5-VL具备更强的通用多模态理解和推理能力,新增视频理解、多模态智能体能力 [3] - 模型仅需一张图和提示词就能精准识别多种元素并分类给出坐标 [4] - 在60个公开评测基准中,有38个取得SOTA表现,性能与Gemini2.5 Pro相当 [6] 模型性能表现 - 推理输入价格仅为每千tokens 0.003元,输出价格为每千tokens 0.009元 [7] - 在视觉定位测试中,10秒内精准识别货架商品并完成价格计算 [14] - 能准确识别5只"生气"的小猫并给出坐标 [17] - 10秒内解决公务员图形推理题目,展示强大视觉推理能力 [20] 技术架构创新 - 由视觉编码模块SeedViT(532M参数)、MLP适配器和基于MoE架构的Seed1.5-LLM(20B激活参数)组成 [27] - 训练分为三个阶段:初期对齐视觉语言表征、中期强化知识积累、后期加入视频等新领域数据 [29] - 采用监督微调与强化学习组合策略,整合RLHF/RLVR等先进技术 [30] - 采用多模态并行框架和局部贪心负载均衡算法优化计算效率 [31] 应用场景 - 可用于构建AI视觉助手、巡检系统、交互Agent或智能摄像头 [7] - 多模态智能体能力可识别并点击"点赞"按钮,模拟用户行为 [22] - 正在重塑与视觉世界交互的方式,拓宽通用视觉系统应用路径 [31]
布局AI生态 字节系大模型“实用至上”
上海证券报· 2025-05-14 02:45
大模型产品迭代策略 - 公司发布小而专、聚焦实用的大模型产品,强调"实用至上"和"小步快跑"的迭代思路 [1] - 相比追求"一鸣惊人"的大招,公司更注重多线程并进和可靠的商业场景落地 [1] - 新发布的豆包视频生成模型Seedance 1.0 lite参数规模小但实现影视级质量,支持文生视频、图生视频,生成时长5s/10s,分辨率480P/720P [1] 视频生成模型优化 - 通过优化语义理解能力提升指令遵循精度,增强对人物表情、衣着服装的精确控制 [2] - 模型针对电商广告、娱乐特效、影视创作等场景优化,帮助客户降低制作成本与周期 [2] - 视频生成速度大幅提升,兼顾效果、速度与性价比 [1] 视觉深度思考模型 - 豆包1.5·视觉深度思考模型激活参数仅20B,在60个公开评测基准中38个取得业内最佳表现 [3] - 模型具备强大多模态理解和推理能力,在视频理解、视觉推理、GUI Agent能力等方面处于第一梯队 [3] - 新增GUI Agent能力,可跨PC端/手机端完成复杂交互任务,如自动化检测App功能 [3] AI生态布局 - 公司AI生态已覆盖汽车、智能终端、互联网、金融等行业,服务4亿终端设备、80%主流车企、70%系统重要性银行 [4] - 推出Data Agent智能体,具备主动思考和分析能力,覆盖数据分析、智能营销等企业数据应用场景 [4] - 国内首款AI原生IDE产品Trae升级,支持通过MCP协议让AI主动调用外部工具 [4][6] 技术协议战略 - 公司积极布局MCP协议(模型上下文协议),称其为AI领域的"万能插座",可降低开发成本 [5][6] - 专注于企业端垂类智能体开发,同时为开发者提供便利工具,推动行业标准化 [6] - 通过技术和资源复用实现内外服务统一,提升性价比 [4][6]
Agent 如何在企业里落地?我们和火山引擎聊了聊
Founder Park· 2025-05-08 18:42
核心观点 - Manus的影响力被低估,其让大众真正看到Agent的重要性和可能性 [1][2] - 企业落地需要垂直领域真正懂场景的Agent,火山引擎发布的Data Agent是代表 [3] - Data Agent解决企业数据难题,包括统一管理平台、兼容非格式数据、自然语言查询等 [6][9] Data Agent功能 智能分析Agent - 涵盖智能分析Agent和营销策略Agent,前者主打数据分析,后者提供营销策划 [10] - 智能分析Agent类似chatbot,连接企业数据后可用自然语言对话进行数据分析 [11] - 测试案例显示可快速完成跨表查询任务,5分钟内给出查询和分析结果 [14][20] - 不仅能查询数据,还能解读数据并给出具体建议,如针对不同人群的销售策略 [32] 营销策略Agent - 处理新老用户和活动数据,提供从策划到执行的全流程服务 [39] - 测试案例显示可自动生成营销方案,包括客群筛选、触达内容编辑等 [44][54] - 生成的营销文案直击痛点,如针对不同敏感度客户的精准营销方案 [60][68] - 未来将加入营销后数据分析环节,实现营销活动全流程闭环 [69] Data Agent技术 - 采用MCP架构提升工具调用能力,适合调用稳定性好的服务 [72][73] - 通过工程化手段控制大模型幻觉问题,如单次数据准确性核查等 [71] - 数据库形态将变化,需要融合存储结构化、非结构化等多模态数据 [79][80] - 未来发展方向是自主学习和智能体协同,突破单一Agent能力边界 [87][89] 落地策略 - 大公司追最佳实践,小公司先用起来,数字化程度不同采取不同策略 [74][75] - 不会直接取代传统BI和ChatBI,而是长期共存服务不同场景 [76][77] - 开发团队需拥抱不确定性,深入理解模型原理而非简单加Prompt [82][85] - 产品方向是做更好的大模型容器,而非过度投入补模型短板 [86]