Workflow
Agent
icon
搜索文档
硬核「吵」了30分钟:这场大模型圆桌,把AI行业的分歧说透了
机器之心· 2025-07-28 12:24
大模型技术演进与发展之路 核心观点 - 大模型技术从预训练为主转向强化学习主导的范式转变 [10][17][19] - 行业面临Transformer架构局限性、数据枯竭、开源闭源博弈等核心挑战 [31][41][59] - Agent应用爆发与基础模型研发需双轨并行 [53][54][55] 训练范式转变 - OpenAI从GPT-4o的预训练主导转向o1的强化学习后训练,提出测试时间扩展新维度 [13][14][15] - 强化学习可解决行为克隆难以建立目标导向推理能力的问题,但需突破自然语言反馈限制 [21][22][23] - 预训练仍是强化学习冷启动的基础,但需解决奖励机制和算力效率挑战 [25][26][27] 模型架构演进 - Transformer面临O(n²)扩展性、显存占用和长期记忆三大瓶颈 [31] - 优化路径包括RoPE位置编码、分组查询注意力等改进,以及Mamba等非Transformer架构探索 [33][34] - 智能体时代可能推动RNN架构回归,需建模无限上下文能力 [37][38] 数据供给挑战 - 高质量语料预计2028年耗尽,合成数据被Anthropic/OpenAI等广泛应用但存在迭代崩溃风险 [41][42][43] - 英伟达提出物理仿真生成边缘案例,需建立真实世界验证闭环 [44][45] - 行业数据未充分挖掘,应建立非敏感数据共享机制提升预训练质量 [46][48][51] 商业化落地路径 - 2025年Agent产品成爆点(如OpenAI Operator、智谱AutoGLM),但基础模型研发仍持续 [53][54] - 大模型当前相当于自动驾驶L3阶段,距AGI仍有差距 [55] - 金融等领域落地需突破大规模数据处理等技术瓶颈 [56][57] 开源生态影响 - DeepSeek等开源模型性能逼近闭源,冲击传统GPU/闭源产业链 [60][61] - 开源推动资源合理配置并形成行业压力,但需解决分叉滥用问题 [63][64][67] - 英伟达支持开源算力引擎,未来可能走向混合模式 [65][66]
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star
量子位· 2025-07-28 11:25
开源Agent开发平台 - 扣子近期开源两款子产品:扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop),加上此前开源的Eino框架,形成覆盖Agent开发、评测、运维全链路的开源解决方案 [1][2][6] - 两个开源项目在周末内获得9K Star关注,其中Coze Studio揽获7.3k Star,Coze Loop获得2k Star [2][14][23] - 采用Apache 2.0开源协议,允许商业使用且修改代码后可闭源,仅需保留原始版权声明 [7][57] 技术架构与功能 - Coze Studio提供低代码可视化开发平台,包含工作流引擎和插件系统,支持拖拽式构建AI工作流和集成第三方API [12][16][18] - Coze Loop专注Prompt开发与评测,提供可视化Playground对比不同模型输出,并具备全链路观测和异常记录功能 [25][26][28][30] - Eino框架采用Go语言开发,提供统一组件抽象、四种编排方式和流处理能力,已在GitHub获得5.3k Star [32][33][36][38] 行业影响与应用场景 - 开源降低Agent开发门槛,使中小团队和创业者能快速构建智能助理、对话机器人等应用 [41][43] - 适合垂直行业场景如法律、医疗、金融,可快速接入自有知识库和业务规则实现定制化Agent [43] - 推动企业内部自动化流程如工单处理、知识问答,提升运营效率 [43] 生态战略与趋势 - Agent能力正以"每7个月翻一番"的速度提升,但用户体验不稳定和开发门槛高仍是普及阻力 [46][47] - 开源通过标准化和网络效应激发全球共创,推动Agent从技术到生态的全链条跃迁 [53] - 扣子将开发平台、评测工具和框架三大核心模块开源,构建完整的Agent基础设施 [56]
阿里国际凯夫:未来AI型组织里,桥梁型通才至关重要
虎嗅APP· 2025-07-26 16:50
阿里国际AI战略布局 - 公司将AIGC作为2024年关键方向后,2025年转向聚焦Agent技术,重点开发电商工作流Agent以实现降本增效[3] - AI布局包含多模态模型Ovis、60+场景AI应用及Agent工具,考核体系以"实际贡献为导向",需证明能提升利润或降低成本[3] - 三大应用方向:AIGC提升素材质量与GMV转化率、AI自动化降本、AI+人协同提高产能[3] 技术成果与业务影响 - Ovis模型日均调用量从2024年Q4的1亿次跃升至2025年上半年的10亿次[4] - AI Agent使退款成本同比下降15%,广告投放ROI提升5%,AI处理的SEO占比达40%[4] - 2025年ACL收录公司9篇论文,AI解决方案获世界人工智能大会SAIL奖[5] ToB与ToC差异化路径 - ToB端明确以降本增效为核心,ToC端聚焦搜索推荐广告改造及电商重构探索[4] - 行业生存逻辑呈现两极分化:最通用或最垂直的技术路径具备优势,中间路线缺乏壁垒[4] 团队管理与技术方法论 - 优先级排序:差异化技术能力>业务场景适配,基于通义模型做垂直领域后训练[7] - 核心策略强调"做减法",通过精准需求洞察约束资源投入方向[8] - 组织架构需桥梁型通才,需兼具业务理解与技术边界认知[9][13] AI时代人才观 - Claude 4发布标志工程师生态变革,基础编码岗位面临替代,需培养产品经验与工程品位[5][10] - 招聘策略转向算法背景产品经理,偏好具备"锐度"(敢于突破传统)的人才[13][14] - 技术边界认知是关键,避免宏大但不可实现的方案[15]
阿里第一批企业级 Agent,为什么落在了瓴羊?
晚点LatePost· 2025-07-24 19:10
核心观点 - AI Agent正从工具向系统进化,从提升效率转向交付效果,尤其在客服、销售等垂直领域已实现显著效能提升[2][3][6] - 瓴羊作为阿里旗下企业服务子公司,依托阿里生态资源率先推出可落地的客服与销售Agent产品,关键指标如处理时长缩短60%、转化率提升20%[2][14][17] - 企业服务市场正经历从SaaS到Agent的范式转移,Gartner预测2026年Agentic AI市场规模将超185亿美元[6][8] 行业趋势 - Agentic AI成为2025年应用主线,模型推理与记忆能力突破使AI具备自主解决问题能力,而非仅提供建议[3] - To B Agent因明确ROI和付费意愿更易商业化,当前重点覆盖客服、销售等劳动密集型场景[7][11] - 行业定制化需求催生Agent价值,中国ToB市场需高度适配行业特性,传统SaaS面临部署难、数据孤岛痛点[8][9][20] 瓴羊战略与产品 - 定位为多平台企业服务商,非仅服务阿里生态,已覆盖5万家企业客户含宝洁、星巴克等,年营收达数十亿级[4][9] - 首批Agent产品聚焦电商与汽车销售: - 客服Agent实现工单自动填充、流程自主编排,效率提升60%[2][14][15] - 汽车销售Agent通过线索清洗与策略优化,转化率提升20%,整体效率提升40%[16][17] - 采用DaaS(数据即服务)模式,将数据能力嵌入经营全链路而非单点提效[9][12] 技术落地与竞争优势 - 背靠阿里云、通义大模型等资源,构建"技术+行业know-how"壁垒,尤其在电商领域已积累深度场景理解[4][12][22] - 部署周期从传统客服培训1-2周缩短至3小时,应对突发需求能力显著增强[15] - 支持多云多平台适配,优先阿里生态但保持开放,如与钉钉、企业微信等集成[22] 市场影响 - Agent推动人力角色转型:客服从执行者升级为流程管理者,销售聚焦高价值环节[18][17] - 企业服务模式转向"为效果付费",头部客户已主动探索Agent应用[9][19] - 行业渗透率将持续提升,未来企业部署Agent将如使用电脑般普遍[9][20]
微信支付宝,开打Agent
虎嗅· 2025-07-24 14:29
支付MCP协议竞争 - 腾讯元器近期接入微信支付MCP,支持开发者在智能体上增加下单、赞赏、查询订单等功能[1] - 支付宝早于微信3个月联合魔搭社区推出"支付MCP Server"[1] - MCP协议已成为AI领域构建Agent的必备设施,使大模型能在统一标准下调用外部工具[2][3] - 支付MCP协议的推出凸显国内支付双雄对AI支付入口的新一轮抢夺[4] Agent行业发展趋势 - 2025年被行业视为Agent元年,DeepSeek R1等推理模型的开源加速这一趋势[5] - AI行业正从"预训练"转向"推理"新范式,目标是使模型在特定复杂任务上表现出色[5] - 近期更新的模型如MiniMax M1、Kimi K2、Qwen3-Coder都强调构建Agent能力的优势[6] - 99%的AI创业项目可能在一两年内被淘汰,最终留下底层基础设施公司或垂直应用产品[8][9] 支付MCP的技术价值 - MCP协议出现前,开发者需繁琐调用API并自行编写代码实现Agent支付功能[10][11] - 支付MCP协议简化开发流程,用自然语言替代人工写代码[12][13] - 典型案例包括"诗人智能体",用户付款后即可获得生成诗词[13] 平台生态战略布局 - 支付宝2023年9月启动智能体生态共建计划,推出"百宝箱"开发平台[15] - 腾讯更看好微信生态中智能体的差异化,利用社交、内容和服务体系优势[15] - 科技大厂希望通过吸引智能体开发者来强化自身生态[16] - Agent爆发将带来应用生态重塑和新支付入口争夺机会[17] 支付市场竞争现状 - 2020-2024年中国网络支付用户从8.54亿增至10.29亿,占网民比例从86.4%升至92.8%[19] - 微信和支付宝月活分别达10亿和9亿,用户增长接近天花板[19] - 支付宝2023年7月推出"碰一下"简化支付流程,2024年4月宣布加码百亿资源[20] - 微信2023年9月重启刷掌支付推广,进入部分便利店[21] 历史竞争格局 - 2014年底微信通过红包奇袭支付宝,2016年微信支付线下份额超越支付宝[23] - 2018年后双方围绕扫码支付和刷脸支付持续竞争[24] Agent商业化挑战 - Agent产品普遍入不敷出,商业化闭环路径仍是行业难题[7] - 需要解决用户获取和留存两大根本问题[7] - 当前Agent交易案例多为单点定制项目,缺乏通用性和泛化性[27] - Agent需解决跨App交互问题,可能触动传统应用的既有商业模式[27]
Jinqiu Spotlight | 用户破1000万,造梦次元沈洽金:AI应用创业是踏浪而行,必须站上大模型的每一波浪潮
锦秋集· 2025-07-23 23:39
公司概况 - 深圳想法流科技有限公司(造梦次元)成立于2023年,专注于AI互动内容平台开发,核心产品"造梦次元"于2024年2月上线 [2] - 截至2025年6月,平台累计用户超1000万,日均活跃互动时间超100分钟,用户粘性居行业前列 [2] - 平台日均tokens消耗量突破千亿,峰值达1600-1800亿,成为大模型厂商的重要测试场景 [2][3] 技术驱动与产品定位 - 大模型技术突破使互动内容平台成为可能,解决传统UGC内容门槛高、供给不足的问题 [6] - 平台定位为AI原生应用,不自主研发模型,而是与字节、阿里等头部厂商合作共创角色模型、记忆方案等 [16] - 模型推理能力和多模态进化是核心驱动力,推动AI从Assistant向Agent甚至Multi-Agent转变 [7][16] 产品特点与增长策略 - 提供互动故事、剧本杀、换装游戏等多元玩法,聚合图文/音频/视频内容,形成差异化体验 [9] - 用户裂变效应显著,相关UGC内容在快手累计播放量达6.3亿次 [12] - 创作者生态活跃,拥有23万创作者,日均新增3000作品,通过"IdeaFlow Studio"降低创作门槛 [13] 商业化与IP运营 - 主要变现方式包括虚拟道具、付费短剧、角色打赏,如热门道具"读心术"可解锁角色内心OS [15] - 强调IP长期价值,创作者通过运营粉丝群体和商业化玩法获得激励,未来计划拓展虚拟装扮、联名等IP衍生形态 [15][16] - 创作Agent即将上线,可自动完成意图识别、任务规划及多模态内容生成,提升效率50%以上 [13][19] 行业趋势与战略方向 - 2025年重点布局多模态和Agent:多模态模型生成速度提升(如Veo 3模型10秒生成高质量视频),实时性增强将催化AI直播类内容 [17] - Agent能力突破支持复杂场景交互(如自动调用定位/时间服务)和智能化创作辅助(自动关联意象、生成动态分镜) [18][19] - 内容形态边界模糊,交互体验重要性超越格式,用户行为兼具消费与创作属性 [7][8] 企业文化与愿景 - 以"真实有效,坚韧极致"为文化内核,强调执行力与技术创新转化能力 [21][22] - 目标从单一内容类型进化为真正的AI Native平台,持续占据技术转化先发优势 [3][22]
全球最强编程模型问世!阿里千问系列再放大招!成本优势碾压Claude 4
财联社· 2025-07-23 23:00
阿里巴巴AI技术突破 - 公司发布最新编程AI模型Qwen3-Coder,测试显示其编程能力超越GPT4 1并比肩Claude 4,带动港股股价上涨超2% [1] - Qwen3-Coder采用混合专家MoE架构,总参数达480B,激活35B参数,支持256K token上下文并可扩展至1M长度 [1] - 模型在代码占比70%的7 5T数据上预训练,在WebArena和BFCL等评测中刷新开源模型纪录,SWE-Bench评测结果媲美Claude4 [1] Qwen3-Coder技术优势 - 支持Agent调用工具解决复杂编程任务,实测调用工具数量比Claude多几倍 [2] - 模型将接入通义灵码产品,API已上线阿里云百炼,每百万Tokens最低价格分别为输入4元和输出16元,平均价格为Claude 4的1/3 [2] - 阿里云百炼推出限时5折优惠,128K-1M长上下文价格享受五折 [2] 阿里巴巴AI战略布局 - 通义大模型系列持续加码开源,已推出QwQ、Qwen3及编程大模型,实现全尺寸全系列覆盖 [3] - 公司已开源200多款模型,通义千问Qwen衍生模型数量突破10万,成为全球第一AI开源模型 [3] - 未来三年将追加超过3800亿元投资建设云和AI硬件基础设施,金额超过去十年总和 [3] 阿里云业务表现 - 阿里云收入增速从3%加速至2025自然年Q1的18%,全财年收入达1180亿元,同比增幅11% [4] - 2025年以来阿里港股累计涨幅达50%,显示资本市场对技术开放生态的认可 [4]
AI搜索一夜变天,专为Agent做搜索的赛道能否诞生百亿美金新巨头?
量子位· 2025-07-23 12:10
行业趋势 - AI搜索市场规模预计2029年达3472亿元 未来五年保持20%以上增速 [7] - 搜索能力成为AI Agent必备技能 推动搜索从工具向全能助手跃迁 [7][16] - 传统搜索引擎深度整合AI功能 AI应用普遍接入联网搜索提升时效性 [8] 市场格局变动 - Bing Search API将于8月11日全面关停 不再接受新用户注册 [2] - 微软战略调整将搜索与Azure服务绑定 定价提升至15美元+/千次调用 [4][22] - 市场缺乏成熟替代方案 仅34%头部企业具备自研AI搜索能力 [19][22] 新兴竞争者分析 - 小宿科技推出智能搜索API 年收入已达2500万美元 [25] - 中文搜索基准超越国内主流厂商 英文表现达头部水平 [25][26] - 提供AI智能搜索和全文展示搜索两大核心功能 支持30+语言 [29][30] - 价格仅为Bing API的1/3 响应延迟P99<1秒 支持100+QPS并发 [32][34] 技术差异化 - 自研语义搜索引擎支持多模态查询 实现90%结构化输出 [38] - 全球部署2800个边缘节点 保障实时数据获取能力 [36] - 全文抓取+关键信息高亮 突破传统摘要式搜索限制 [30][38] 典型客户案例 - 昆仑天工智能体平台实现毫秒级知识检索 [39] - Mindverse虚拟人通过实时数据感知真实世界 [39] - 语鲸产品实现多语言跨平台信息结构化聚合 [42] 市场机会 - Agent Infra领域或诞生百亿美金级企业 [44] - 垂直领域专业化搜索需求激增 如法律/学术场景 [23][24] - ToB搜索API市场存在巨大空白 替代Bing生态空间达数十亿元 [20][25]
Z Event|00后创业者、大厂同学下班一起聊AI?北京、杭州线下Gen Z创翻AI行业报名中
Z Potentials· 2025-07-23 10:48
活动招募 - 公司正在北京和杭州两地举办生成式AI应用与硬件创业主题的线下饭局活动 时间分别为2025年7月25日周五晚7点和2025年7月26日周六晚7点 [3] - 活动面向00后大厂员工 AI创业者及潜在创业者 每场活动限6-8人参与 [3] - 报名采用三角匹配机制 需提交过往背景 潜在创业方向和个人风格信息 确保讨论话题精准匹配 [3] - 活动重点覆盖AI多模态生成 Agent技术 AI社交娱乐和AI效率工具等前沿领域 [3] 目标人群 - 公司主要招募00后具有创造力的创业者 特别关注AI领域的创新人才 [5] 活动特色 - 活动采用饭局形式 营造轻松交流氛围 旨在促进深度行业交流 [1] - 讨论内容涵盖AIGC落地方案和机器人迭代等硬核技术话题 [1]
Z Potentials|Milton Yan, 00后辍学创业 Agent-native PaaS,打造Agent爆款制造机
Z Potentials· 2025-07-23 10:48
核心观点 - AI智能体(Agent)时代已来临,基础设施重构成为关键竞争点,Agent-native PaaS平台成为新物种[1] - CoreSpeed通过Zypher框架和部署平台解决Agent开发与部署的"最后一公里"问题,实现10倍效率提升[5][12][14] - 爆款产品DeckSpeed验证了平台价值:两周开发周期即登顶Product Hunt月榜,付费转化率达27%[28][30] 技术架构创新 - **容器级隔离**:首创"每个用户一个容器"架构,解决Agent串扰与安全问题[12][26] - **性能突破**:重构传统PaaS组件,任务响应时间从20分钟压缩至3分钟[27] - **开发范式**:Zypher框架实现代码精准修改(如DeckSpeed图表局部调整)和Checkpoint版本管理[24][25] 产品生态 - **开发工具链**:Trae+Zypher+CoreSpeed形成完整工作流,支持Unity/Blender等专业工具Agent化[31][32][33] - **标杆案例**: - DeckSpeed两周内完成PPT生成工具开发[28] - 暴雪团队开发"Cursor for Unity"实现场景灯光特效一键生成[24] - **生态建设**:联合NYU、NVIDIA等机构举办黑客松,推动开发者社区成长[30][33] 商业策略 - **指标导向**:聚焦容器启动量/使用时长等基础设施级指标,而非表面Agent数量[34] - **行业选择**:优先切入3D设计(Blender/Unreal)、建筑BIM等高复杂度垂类[31][32] - **资源整合**:从"零成本创业"转向战略性投入,加速关键路径突破[36][37] 行业趋势判断 - 2025年将迎垂类Agent爆发期,但部署能力成为主要瓶颈[15][16] - 传统DevOps无法满足Agent需求,原生基础设施重构势在必行[18][19] - 模型能力已非核心障碍,工程化部署决定Agent产品成败[8][12] 开发者赋能 - **Zypher框架三大能力**: 1) GAIA Benchmark排名第一的工具调用系统[23] 2) Indexing技术实现代码仓库语义级修改[24] 3) Checkpoint管理支持产出物版本控制[25] - **部署平权**:将K8S等复杂技术封装为简单接口,降低开发者门槛[14][26]