扣子

搜索文档
大模型专题:2025年大模型智能体开发平台技术能力测试研究报告
搜狐财经· 2025-08-14 23:48
测试概述 - 测试背景聚焦大模型驱动的智能体在产业智能化转型中的多场景渗透态势,评估其知识增强、流程编排和智能决策能力 [7] - 测试选取阿里云百炼、腾讯云智能体开发平台、扣子及百度智能云千帆四个平台,围绕RAG能力、工作流能力和Agent能力展开 [7] - 测试方法构建标准化框架,涵盖场景构建、数据集设计、智能体配置及问题集设计,确保与实际业务高度贴合 [11][12] RAG能力测试 - 文本问答表现优异,单文档及多文档问答准确率超80%,但拒答与澄清处理差异显著,腾讯云对知识库外问题实现100%拒答 [20][21] - 结构化数据问答中百度智能云千帆表现稳定,多表关联查询准确率较高,阿里云百炼和扣子存在信息遗漏与聚合误差 [23][27] - 图文问答中阿里云百炼、腾讯云及扣子图片识别能力较强(83.3%-91.7%),但配图输出率分化,百度智能云千帆因流程bug识别率低 [30][33] 工作流能力测试 - 订单修改场景端到端准确率61.5%-69.2%,腾讯云意图识别准确率达93.3%,参数提取是主要差异点 [36] - 各平台在意图识别环节准确率达100%,但阿里云百炼和腾讯云参数提取准确率(75%)高于扣子和百度智能云千帆(61.5%) [37] - 工作流配置呈现差异化设计,腾讯云采用全局Agent机制,阿里云百炼和扣子分离对话与任务执行引擎 [40] Agent能力测试 - 单工具调用完成率83%-92%,多工具协同及提示词调用有提升空间,腾讯云因工具生态完整表现均衡 [48][50] - 任务分解能力标准化,如行程规划场景均能识别路径规划+天气查询+联网搜索工具组合需求 [48] - 平台工具生态依赖自身资源,百度整合文库/百科,腾讯打通文档/地图,扣子支持轻量化插件开发 [49] 总结与展望 - 平台基础能力趋同但路径分化,需在场景深度适配、技术链厚度构建、生态广度拓展上持续发力 [1] - 当前技术需优化自然语言到结构化查询的精准映射,增强字段格式兼容性校验 [28] - 工作流系统仍依赖人工干预,需结合业务经验与技术特性进行动态校准 [43]
大模型训练进入“后训练时代”,AI编程有望迎来更大突破,这些企业已积累先发优势
财联社· 2025-08-03 12:20
AI应用板块市场表现 - AI应用板块周五午后探底回升 郑中设计涨停 鼎捷数智和果麦文化涨幅超15% 万兴科技等个股跟涨 [1] - 政策催化:国务院审议通过《关于深入实施"人工智能+"行动的意见》 小米应用商店与字节跳动扣子平台合作打通智能体一键发布能力 [1] Kimi K2大模型技术突破 - Kimi K2进入全球大模型第二梯队 国内第一梯队 开源模型参数规模全球第一 [4] - 专家数从256提升至384 实现从L2推理向L3代理能力演进 降低MLA头数提升性价比 硬件成本和算力消耗低于同类模型 [4][5] - 技术架构采用MoE模型 通过分层专家结构提升专业领域处理能力 工程学突破或推动AI编程在2024下半年至2025Q1-Q2实现质变 [7][8] AI编程领域发展现状 - 国内顶尖水平但落后海外 Kimi优于DeepSeek-V2等国内模型 但弱于Claude 3 5等国际产品 [6] - 预训练方式遇瓶颈 代码生成成功率约70% 国际巨头转向开发Coding Agent工具 国内尚未出现成熟商用产品 [6] - 字节跳动Code-IT 2 0和阿里通义灵码在AI辅助IDE工具领先 但底层Coding Agent仍处Demo阶段 [8] 下游应用领域机会 - 企业私有模型构建:MaaS平台部署高性能开源模型降低门槛 推动AI一体机市场二次爆发 [9][10] - 垂直领域商业化加速:税务 法务 编程等专用领域模型需求旺盛 创意类应用如文旅策划效率提升显著 [11][12] - 影视游戏行业:概念设计阶段AI应用成熟 商业化制作环节仍依赖传统工作流 [13] 行业技术演进方向 - 物理AI成为新焦点 需解决实时交互延迟问题 国内在无人机路径规划等离线场景有探索 [14][15] - 数据标注转向企业私有数据处理 税务SaaS等场景存在巨大标注需求 [17] - GPT-5或将实现L3代理能力突破 多模态和物理感知能力进展值得关注 [16] 相关受益标的 - AI编程:卓易信息 金现代 普元信息 [2] - AI税务/法务:税友股份 中科金财 金桥信息 [2] - 数据标注:海天瑞声 汇洲智能 博彦科技 [2] - AI一体机:深信服 浪潮信息 神州数码 [2]
小米应用商店打通扣子发布通路,加速拓展AI智能体生态
快讯· 2025-08-01 14:17
合作动态 - 小米应用商店与字节跳动旗下AI Agent开发平台「扣子」达成合作,打通智能体一键发布能力 [1] - 合作旨在拓展AI智能体分发服务体系 [1]
忘掉Manus的华人背景
虎嗅· 2025-07-10 07:36
公司动态 - Manus裁撤中国区业务,120人团队中保留40余名核心技术人员迁往新加坡,其余员工被裁[1] - 公司回应称调整基于经营效率考量,将专注核心业务发展[2] - 官网Manus.im无法在国内访问,此前备案网址Manus.cn也已失效[10] - 公司将全球总部迁至新加坡,新加坡公司"Butterfly Effect"前年8月已注册成立[16] - 官网显示公司在新加坡、东京及加利福尼亚设有办事处,未提及中国办公室[18] 市场定位 - 公司从一开始就主要面向海外市场,研发团队虽在中国但宣传重心在海外[2][3] - 国内社交媒体账号基本未运营,但在TikTok和YouTube上发布大量内容[4][5] - 创始团队更多时间在海外活动,与国外开发者及科技大佬交流[7][8] - 线下活动和核心用户招募均集中在海外地区[9] - 公司被质疑借助国产AI情绪获取关注,实际是面向海外市场的产品[20] 产品与商业模式 - 产品采用三档付费会员制,价格分别为19/39/199美元每月[15] - 部分功能基于海外模型底座,与通义千问的合作进展不明[11] - 海外AI付费生态更成熟,ChatGPT年营收有望达127亿美元,而国内产品被迫取消付费[13] - 类似产品Perplexity AI年化收入已突破1亿美元[14] 行业趋势 - AI创业者更早开始全球化转型,面临地缘政治、资金和算力等限制[22] - 多家中国AI创业公司将总部设在海外,强调全球化背景[21] - 投资人认为AI应用创业天生具有全球化属性,以全球用户为目标能提升产品上限[21] - 移动互联网时代仅字节跳动实现真正全球化,AI时代更多创业者从开始就立志全球化[21] 融资情况 - 母公司蝴蝶效应完成7500万美元融资,投后估值近5亿美元[23] - 该轮融资由硅谷风投Benchmark领投,正接受美国财政部审查[23] - 早期投资方包括腾讯、红杉中国和真格基金[24]
AI智能体的商业叙事远比技术精彩
36氪· 2025-07-09 07:27
AI智能体市场发展现状 - 全球科技巨头如微软、谷歌、百度、阿里、腾讯、字节跳动等纷纷加码AI智能体布局,覆盖内容创作、客服、手机助手、办公自动化等多个垂直领域 [1] - 2024年仅约1%的企业软件内置AI智能体功能,但到2028年这一比例有望飙升至33%,约15%的日常业务决策将由AI自动完成 [5] - 高盛预测到2030年AI智能体将创造约7万亿美元经济效益,其中相当部分来源于效率提升 [5] 科技公司布局策略 - 百度文心智能体平台已吸引15万家企业和80万名开发者参与,并推出多智能体协作App"心响" [2] - 阿里将AI智能体重点放在To C领域,基于通义千问大模型在高德、飞猪等平台推出智能体 [3] - 腾讯围绕微信生态系统打造差异化智能体AI,连接社交图谱、通信能力和数百万个小程序 [3] - 谷歌将智能代理能力整合到Chrome浏览器、搜索引擎和Gemini应用等全线产品中 [3] 技术发展路径 - AI智能体通过"决策(LLM)+记忆+规划+工具"构建智能闭环,正重塑终端交互中枢 [5] - 手机、PC采用"端优先"策略强化本地推理能力,可穿戴设备通过"端-近端-云"架构解决算力瓶颈 [5] - 在6G应用中,智能体可赋能机器人成为具身智能代表,未来将依赖多个智能体之间的群智协作 [6] 行业发展挑战 - 67.4%业内受访者认为智能体的安全合规问题"非常重要",主要担忧AI幻觉与错误决策、数据泄露、有害内容输出 [8] - 当前智能体在工具组合调度、异常处理、上下文状态保持等方面缺乏"智能",难以应对动态交互场景 [8] - 协议标准"多强混战",不同智能体由不同架构构建,尚未形成统一标准 [9][10] 商业生态影响 - 全球AI智能体市场规模预计从2025年76.3亿美元飙升至2030年503.1亿美元,年均增速45.8% [11] - 智能体可能冲击中心化的平台型结构,改变现有App生态,使服务实现跨应用无缝对接 [12] - 传统广告和电商商业模式可能失效,信息获取逻辑将从"你推给我看"转向"AI找给我看" [13] - 端侧AI将推动订阅变现模式兴起,带动"硬件+服务"并重的发展趋势 [13]
13410亿,字节跳动的万亿野心
投中网· 2025-06-11 10:36
字节跳动AI战略布局 - 字节跳动在2024年显著加强AI领域投入,将原AI Lab并入大模型部门Seed,强化研产一体化和AGI研究,并取消季度考核以保障长期创新 [5] - 公司启动"2026届Top Seed校招计划",面向全球招募30名顶尖博士,提供80万-220万年薪及独立算力资源 [5] - 2024年第一季度推出超过20款AI应用,布局10个赛道,产品线整合包括将"猫箱"和"星绘"并入豆包App,发布Agent产品"扣子" [5][6] 人才战略与组织调整 - 字节跳动延续"抢人"策略,招聘数百个AI相关职位,同时重用资深高管如朱骏(原TikTok负责人)和陆游(原抖音社交负责人)主导新项目 [8][9][10] - 内部采用"先外后内"策略,海外版Coze率先上线测试市场,国内版扣子空间上线首日用户突破50万 [12][14] - 公司向创投圈输送大量人才,包括高管和产品经理,其中字节系产品经理成为VC争抢对象 [6][26] 产品与商业化进展 - 豆包大模型成为战略核心,2024年5月正式发布并升级视频通话功能,为AI眼镜上线铺路 [15][20] - AI硬件布局涵盖耳机、眼镜等设备,2024年收购Oladance后推出AI无线耳机,中秋推出AI玩具"显眼包" [15] - 2024年AI资本开支达800亿元,超过BAT总和,2025年计划支出1600亿元(后被公司否认) [18] 市场竞争与行业影响 - 字节采用"多点开花"策略,与阿里(侧重B端)、腾讯(聚焦微信生态)形成差异化竞争 [19][20] - 字节系创业者2023年以来成立至少30个项目,覆盖硬件、基础设施、应用等方向,获红杉、高瓴等机构投资 [23][24][25] - 公司净利润率从2023年26%降至2024年21%,但预计2025年营收将达1860亿美元(约13410亿人民币),接近Meta水平 [19]
扣子加多维表格,可以干死80%的创业公司
虎嗅· 2025-05-29 09:44
行业趋势与竞争格局 - AI行业普遍接受度大幅提升,导致中小企业AI咨询订单量激增但成单率低,80%咨询为技术白嫖[5] - 大公司入场打破信息差,抖音、视频号等平台普及AI工具教学,企业主更倾向使用大厂标准化产品(如扣子、dify)而非创业公司解决方案[6][7] - 巨头通过资金、流量和技术优势降维打击创业公司,例如字节豆包快速复制ListenHub产品,Google推出Flow+Veo 3+Imagen 4覆盖全内容生产链[10][21][24] 创业公司生存困境 - 技术壁垒被平台化工具瓦解,小公司仅能依靠垂直数据、私域场景和服务深度等巨头难以覆盖的缝隙领域[26] - 大公司拥有显著成本优势,例如字节20人技术团队两年投入2000万进行代码重构,相当于多数创业公司两年人力总预算[16][19] - 标准化AI工具(如多维表格+扣子)已解决80%中小企业需求,私有化部署和数据安全等差异化卖点说服力下降[8][28] 差异化生存策略 - 聚焦模型互补领域,解决基座模型难以触达的细分场景,例如中小企业无力梳理的SOP实施问题[27][29] - 承接大厂不愿涉及的"脏活累活",包括硬件适配(浏览器/显示器问题)、落地培训等非技术性服务[30] - 利用大厂工具生态红利,如通过扣子搭建智能体实现单月20万利润,或切入银发经济等超细分市场[31][34] 创业方法论 - 核心价值应定位在解决"情感成本、决策风险、合规陷阱"等非技术痛点,而非技术炫技[36][37] - 避免红海竞争,通过持续细分市场找到"收入规模小、流程杂乱"但巨头忽略的领域[33] - 优先验证现金流而非规模扩张,将技术转化为服务能力,关注客户真实付费意愿[38][39]
火山引擎发布豆包·语音播客模型,秒级生成“真人对话”播客
财富在线· 2025-05-21 13:08
产品发布 - 火山引擎正式推出豆包·语音播客模型 作为豆包大模型语音语言技术的重大场景化升级成果 [1] - 该模型基于流式模型构建 实现从文本创作到双人对话式播客的秒级转化 [1] - 提供"低成本 高时效 强互动"的全新创作体验 无需复杂剪辑即可将热点内容转化为生动播客 [1] 技术优势 - 双人对话自然流畅 高度拟人的语音效果结合真人专业播客口语习惯 达到专业播客录制水准 [1] - 播客创作高效快捷 构建端到端的便捷链路 一气呵成完成整个创作过程 [1] - 具备深度搜索功能 用户输入热点话题后5秒即可生成利用最新信息的播客音频 [1] 功能特点 - 支持用户灵感创作 将主题转化为深度播客观点 为创作者提供丰富思路和内容 [2] - 支持超长文本转播客 用户输入文档或URL网页地址即可创作媲美真人的播客作品 [2] 产品规划 - 豆包·语音播客模型即将在豆包APP及PC端 扣子等产品中陆续上线 [3] - 更多播客创作玩法将在6月11日「2025火山引擎Force原动力大会」揭晓 [3]
AI创业失败,找工作和割韭菜该如何抉择?
虎嗅· 2025-05-21 07:39
AI创业现状与挑战 - 技术创业门槛极高,除非是行业Top10专家,否则成功率极低,多数技术创业者最终转向卖课等变现方式[1] - 成功创业者通常具备两种特质:前期资源积累充分(如利用前公司红利)或走投无路孤注一掷,偶然成功者依赖运气因素[2] - 脱离公司体系后创业者易陷入机会分散困境,同时开展自媒体、产品研发、外包项目等多线业务导致精力分散[2][3] AI行业2C与2B市场分化 - 2C市场呈现爆发式增长:字节跳动"豆包"月活近6000万,腾讯AI助手"元宝"两月DAU破2000万,网易AIGC降本90%推动游戏利润增34.9%[7][8] - 2B市场面临颠覆性挑战:AI的通用智能能力正在瓦解传统企业软件(如ERP、CRM)的复杂性护城河,企业更倾向为结果付费而非系统采购[9][10][11] - 大厂加速布局Agent入口生态:字节跳动"扣子"、腾讯IMA知识库等平台降低开发门槛,催生低代码Agent搭建的教培市场红利[15][17][20] 平台级AI应用生态 - 大厂主导基础设施投入:字节跳动2025年算力投资达900亿元,阿里三年AI+云投入超3800亿元,腾讯Q1资本开支91%增幅投向AI[7] - 开发者生态分层明显:从"割韭菜"式工具变现到垂直行业工具开发,高阶玩家聚焦行业基座模型(如医疗/法律大模型)[17] - 低代码平台创造新商业模式:基于扣子等平台搭建的Agent虽技术门槛低但市场需求旺盛,部分开发者已实现可观利润[21][23] 企业级AI转型趋势 - 中小企业受益显著:AI将财务、法务等专业服务转化为即插即用数字劳动力,降低单人创业门槛[12] - 大型企业流程重构:AI推动从人力密集型流程驱动转向自动化运作体系,重塑信息流-决策流-执行流[13] - 软件厂商面临战略抉择:需转型为按结果交付的智能服务商,传统License模式面临淘汰风险[14]