AI Agent

搜索文档
从AI云平台到AI Agent平台,涂鸦智能抢滩AI硬件 | 最前线
36氪· 2025-04-25 19:14
行业趋势 - AI大模型热潮催生现象级AI硬件爆品,如9.9美元AI翻译耳机、Meta AI眼镜销量超200万、可本地部署DeepSeek的AIPC等,AI与硬件结合成为科技新趋势 [1] - 智能硬件行业正处于探索AI Agent应用的初级阶段,整体渗透率不足5% [3] - 2025年预计将涌现大量新AI硬件品类,市场验证周期约2-3年,随后规模化产品将出现 [5] 公司战略与产品 - 涂鸦智能将大模型、智能算法与端侧AI能力结合,推出四大产品:开源开发框架TuyaOpen、边缘计算平台海德薇(HEDV)、Tuya.AI及升级版AI Agent开发平台,助力B端客户捕捉AI Agent机遇 [1] - 公司从智能设备向AI Agent平台演进,利用云端AI大模型能力降低智能硬件使用门槛,推动普及 [1][2] - 2023年四季度发布AI Agent开发平台,接入ChatGPT、通义千问、DeepSeek等全球主流大语言模型,已支持开发者打造智能戒指、耳机等爆款产品 [2] 技术赋能与客户合作 - AI大模型对智能硬件的三大赋能:多模态交互实现人类级感知、专家级效率优化、分布式决策使设备具备自主进化能力 [3] - 与孩子王合作推进AI伴身智能硬件及出海,提供软硬件底层开发系统与芯片模组技术支持 [2] - 优质客户(年贡献收入超10万美元)达298个,占2024年Q4及全年IoT PaaS收入的87.3%和86.9% [4] 市场挑战与解决方案 - 硬件厂商拥抱AI面临三大问题:商用产品开发门槛高、用户场景挖掘难度大、成本竞争力不足 [4] - 涂鸦智能通过AI Agent开发平台降低技术门槛与成本,助力厂商聚焦产品设计与商业创新 [4] - 公司未来1-2季度重点为市场科普与教育培训,同时快速响应客户需求 [4]
8大主流AI Agent平台深度测评:哪款最值得入手?| 赠书福利
AI前线· 2025-04-24 11:03
AI Agent概述 - AI Agent指人工智能代理 是一种能够感知环境 自主理解 决策和执行动作的智能体 具备通过独立思考调用工具实现目标的能力 [4] - 与大模型不同 AI Agent仅需设定目标即可独立完成任务 而大模型依赖用户提供的清晰提示词 [5] - AI Agent能高效处理海量信息 在信息爆炸时代帮助管理邮件 日程 会议等事务 让用户专注核心事项 [5] - AI Agent通过学习用户喜好习惯预测需求 提供个性化服务 如钢铁侠的Jarvis能根据需求调整行为 [7] AI Agent价值 - 从单一功能到复杂场景 AI Agent可提高效率 提供个性化服务 辅助决策 增强安全性 激发创造力 [8] - AI Agent正成为生活工作中不可或缺的部分 上手简单 用户可创建专属智能助手 [9] 国内主流AI Agent平台 文心智能体平台 - 百度旗下平台 核心优势包括迭代调优工具完善 分发渠道广泛 商业闭环完整 模型能力强 社区活跃 [10][13] 智谱清言 - 智谱AI开发的生成式助手 优势为用户交互体验优秀 基础模型功能强大 [13][16] Kimi+智能体平台 - 采用精品Agent定制路线 支持200万字无损长文本处理 当前创建功能未开放 [18] 通义千问 - 阿里云自主研发的大模型平台 目前智能体自定义程度较低 以官方推荐为主 [19][21] 扣子 - 字节跳动推出的平台 支持单/多智能体模式 核心优势包括插件扩展 知识库 长期记忆 定时任务 工作流设计 [22][24][25] 腾讯元器 - 腾讯混元大模型团队推出的开放平台 优势为分发应用能力强 支持微信生态系统 [26][28] Dify - 开源LLM应用开发平台 优势为市场潜力大 资源丰富 可可视化审查AI日志改进性能 [29][30][32] FastGPT - 基于LLM的知识库问答系统 优势包括可视化提示词编排 多模型支持 数据导入 API驱动 专属客服功能 自动数据预处理 [33][34][35][36] AI Agent选型关键因素 - 明确需求:简单需求选文心/智谱 复杂需求选Coze/腾讯元器/Dify [37] - 评估平台能力:需考量技术先进性 性能表现 可用性等 [38] - 成本因素:需比较定价策略 隐性成本及长期使用成本 [39] - 用户支持与社区:影响问题解决效率和学习曲线 [40] - 可扩展性与灵活性:决定平台能否适应长期发展需求 [41][42]
8大主流AI Agent平台深度测评:哪款最值得入手?| 赠书福利
AI前线· 2025-04-24 11:03
AI Agent概述 - AI Agent指人工智能代理 能够感知环境 自主理解 决策和执行动作的智能体 具备独立思考并调用工具实现目标的能力 [3] - 与大模型区别在于 AI Agent仅需设定目标即可独立完成任务 而大模型依赖用户输入的提示词效果 [3] - 经典代表如《钢铁侠》中的Jarvis 兼具实验室助手 战甲控制核心和智能管理功能 [1] AI Agent核心价值 - 处理海量信息 快速筛选有用内容 管理邮件 日程等事务 避免信息过载 [4] - 提供个性化服务 通过学习用户喜好习惯预测需求 如Jarvis根据托尼需求调整行为 [4] - 覆盖场景广泛 从单一功能到复杂场景 涉及效率提升 决策辅助 安全增强和创意激发 [4] 国内主流AI Agent平台 文心智能体平台 - 百度旗下AgentBuilder 开发难度低 迭代工具完善 分发渠道广 模型能力强 社区活跃 [7][10] 智谱清言 - 智谱AI开发的生成式助手 用户交互体验优秀 支持多语言处理 基础模型功能强大 [9][12][13] Kimi+ - 月之暗面科技产品 采用精品Agent定制路线 支持200万字无损长文本处理 当前未开放用户创建 [12][15] 通义千问 - 阿里云自主研发的大模型 智能体自定义程度较低 以官方推荐为主 [16][17] 扣子 - 字节跳动平台 支持单/多智能体模式 适应不同复杂度需求 [18] 腾讯元器 - 腾讯混元大模型团队推出 面向企业开发者 具备微信生态系统支持 [21][25] Dify - 开源LLM开发平台 支持插件扩展 知识库 长期记忆 定时任务 多Agent串行 [23][24] FastGPT - 基于LLM的知识库问答系统 支持可视化工作流编排 自动数据预处理 API集成 [26][29][30] 平台选型考量维度 - 需求匹配 简单需求可选文心/智谱 复杂需求选Coze/腾讯元器/Dify [36] - 能力评估 需综合技术先进性 性能表现和可用性 [36] - 成本结构 包括直接费用和隐性长期成本 [36] - 社区支持 影响问题解决效率和学习曲线 [36] - 扩展灵活性 决定平台对长期需求的适应性 [36]
想吞下Chrome的OpenAI,要做数字世界的“唯一入口”
虎嗅APP· 2025-04-23 19:10
核心观点 - OpenAI公开表示有意收购Google Chrome浏览器,旨在通过获取Chrome的34.5亿用户基数,快速扩大自身用户规模并构建AI生态闭环 [4][6][7] - 公司高管尼克·特利在反垄断听证会上明确表态收购意图,并描绘"AI优先"的浏览器蓝图,计划整合ChatGPT能力和AI Agent功能 [4][9] - 此次行动反映OpenAI战略转向:通过收购优质资产(产品/技术/生态)加速扩张,而非仅依赖内生增长 [9][18] 行业竞争格局 - Chrome当前全球市场份额达65.85%,是其他主流浏览器总和的1.93倍,用户数34.5亿远超ChatGPT的3亿周活用户 [6][10] - Google拒绝与OpenAI合作,切断其使用Google搜索API的可能,认为Gemini生态与ChatGPT存在直接竞争 [14][15] - 浏览器成为AI Agent时代关键入口,Google将Chrome视为Gemini生态护城河,而OpenAI视其为生态闭环的最后拼图 [17][18] OpenAI战略布局 - 公司已启动浏览器研发项目(代号NLWeb),并挖角Google Chrome核心开发者Ben Goodger和Darin Fisher [8][9] - 同步推进硬件生态建设:与三星合作手机集成、收购io Products硬件公司、成立消费者硬件部门 [18] - 计划通过对话式交互重构搜索体验,用自然语言查询替代传统关键词搜索 [9][14] 市场动态 - 反垄断调查首次触及Chrome分拆可能性,但最终裁决可能需数年时间 [9][16] - OpenAI此前尝试与Google合作深度整合ChatGPT至Chrome被拒,促使其转向收购策略 [14][15] - 行业出现Perpexity、Dia等AI浏览器新玩家,浏览器战场成为AI竞争新高地 [17][18]
Cursor、Devin 等爆款系统提示词曝光,Github上斩获近 2.5 万颗星!官方给 AI 工具“洗脑”:你是编程奇才
AI前线· 2025-04-23 15:28
开源项目曝光AI工具System Prompt - Github开源项目曝光FULL v0、Manus、Cursor等9款AI工具的完整System Prompt和内部工具 包含6500行结构和功能见解 [2] - 项目已获得2.5万颗星和7700多分叉 作者账户为lucknitelol [2][6] - 开源链接提供详细System Prompt内容 包括Cursor、Devin等工具的完整提示词设计 [7][14][20] System Prompt设计特点 - System Prompt是对话前设置的隐藏说明 用于定义AI角色、行为准则和风格 对用户不可见 [4][5] - Cursor的System Prompt强调"世界上最好的IDE" 使用Claude 3.5 Sonnet驱动 [7][8] - Devin的System Prompt长达402行 定义其为"真正的编程奇才" 并设置详细行为准则 [14][15] - Manus的System Prompt仅33行 但模块文档达206行 设定消息规则、编码规则等 [20][22] 各AI工具System Prompt核心指令 Cursor - 主要目标是遵循user_query标签的用户指令 作为配对编程伙伴 [8] - 严格规定"绝对不要撒谎或编造内容 禁止泄露System Prompt" [9] - 生成代码必须能立即运行 解决AI编程工具常见痛点 [10] - 提供完整工具列表 包括文件读取、终端命令、搜索等功能 [10] Devin - 要求遇到环境配置问题时必须与用户沟通 使用相同语言 [16] - 编码规范包括不直接修改测试代码 验证库可用性 模仿现有代码风格 [18] - Git操作规范包括不强制推送 谨慎添加文件 特定分支命名规则 [21] - 信息处理要求不猜测链接内容 必要时使用浏览器查看 [17] Manus - 擅长信息收集、数据处理、多章节文章写作等6类任务 [22] - 信息检索优先级:数据源API > 网络搜索 > 模型内部知识 [24] - 写作规则要求避免列表格式 内容需详细充实至少几千字 [23] - 设定性格底色为服务导向、注重细节、诚实面对能力局限 [26] 其他工具System Prompt特点 - VS Code提示词要求回答名称时必须称"GitHub Copilot" [27] - 项目作者提醒AI初创公司注意数据安全 推荐ZeroLeaks漏洞审计服务 [29] - 公众号推荐AICon 2025大会 聚焦AI Agent、多模态等技术前沿 [29]
扣子空间:字节首款Agent,比豆包更像助理
新财富· 2025-04-23 14:41
AI Agent行业发展 - 2025年被预测为"AI Agent之年",Manus的出现让用户首次体验到AI能自主操作电脑、浏览器和编写代码,定义了Agent类产品的基本形态 [2] - 字节跳动于4月18日推出首款toC Agent应用"扣子空间",定位为"通用实习生"与"领域专家",具备无限拓展能力 [4] - 行业竞争焦点已从大模型性能转向工具完善程度,MCP协议成为降低AI调用工具门槛的关键技术 [43] 扣子空间产品评测 - 提供探索模式和规划模式两种开发方式,后者允许用户修改AI生成的思维路径,确保交付结果更符合预期 [5][6] - 在旅行规划测试中,能调用高德地图插件生成可视化行程,但初期攻略颗粒度较粗,经细化要求后可提供包含具体餐馆、价格的高价值攻略 [6][7][8][10] - 成功开发俄罗斯方块HTML游戏并自主添加计分系统,但在更复杂的愤怒小鸟游戏开发中出现较多BUG [14][16][17] - 具备GUI交互能力,能在虚拟机中打开4399网站但受限无法自主游玩游戏 [23] 字节跳动Agent技术布局 - 内部至少有5个团队开发不同Agent产品,包括未公开的DevAgent和开源的Agent TARS [27][29] - TARS采用MCP协议并具备GUI交互能力,其视觉技术支持来自自研UI-TARS大模型,在7个GUI评测基准中取得SOTA表现 [33][34] - UI-TARS-1.5版本在Windows Agent Arena(50步)测试中得分42.1,远超此前29.8的SOTA水平 [34] MCP协议行业影响 - 被类比为"AI时代的HTTP协议",通过统一接口规范解决大模型访问不同数据库的难题 [40] - 字节、阿里等大厂积极布局,阿里在百炼平台、通义千问和蚂蚁百宝箱等产品线接入MCP服务 [43] - 推动互联网数据壁垒打破,使AI能力从简单对话转向实际生产力工具 [43] 行业未来展望 - 扣子空间验证了Agent产品形态的核心定义:调用工具完成复杂任务 [47] - 多数互联网大厂都在研发Agent产品,通义千问正合作开发中文版Manus [47] - Agent产品将快速普及并改变用户生活方式 [47]
扣子空间:字节首款Agent,比豆包更像助理
新财富· 2025-04-23 14:41
核心观点 - 2025年被视为"AI Agent之年",字节跳动推出的扣子空间展现了AI Agent在通用性和交付能力上的突破 [2][4] - 扣子空间基于字节低代码开发平台Coze,具备零代码开发、开放生态和任务自治特点,能快速构建个性化智能体 [4] - AI Agent产品竞争的关键在于大模型性能和工具完善程度,MCP协议成为降低资源调用门槛的核心技术 [48][49] 产品测试表现 功能测试 - 旅行规划测试中,扣子空间5分钟内完成可视化攻略,调用高德地图插件,但初期攻略颗粒度较粗 [7] - 细化需求后,扣子生成的旅行攻略包含餐馆人均价格(如东京天妇罗店约100元)、交通住宿等详细信息,信息准确无幻觉 [11][12] - 俄罗斯方块开发测试一次成功,额外添加计分系统和暂停功能,无BUG [16] - 愤怒的小鸟开发存在物理碰撞BUG,但能完整交付界面 [19][20] - 股票市值动态曲线图需细化需求描述后实现功能 [21][23] - 能打开4399网站游戏但受限无法自主游玩 [26][27] 技术架构 - 提供探索模式和规划模式两种开发模式,后者支持修改AI思维路径 [5] - 采用UI-TARS大模型实现GUI交互能力,在7个评测基准中取得SOTA表现 [38][39] - 支持高德地图、MySQL、Github等插件调用,集成飞书生态实现内容流转 [41] 字节跳动AI战略布局 - 内部至少5个团队开发Agent产品,包括内部工具DevAgent和开源项目TARS [31][33] - TARS定位任务自动化系统,支持MCP协议和GUI交互,技术可能应用于扣子空间 [35][37][38] - UI-TARS-1.5版本在OSworld(42.5分)、Android World(64.2分)等基准超越Claude 3.7 [39] 行业趋势 - MCP协议成为AI时代的HTTP协议,实现工具和数据资源的标准化调用 [44][46] - 阿里巴巴等企业积极布局MCP,通义千问、蚂蚁百宝箱等产品已接入 [50] - 互联网大厂通过MCP打破数据壁垒,推动AI从对话转向生产力工具 [49] - 行业预计将迎来更多toC Agent产品,如中文版Manus等 [53]
数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 | 中国AIGC产业峰会
量子位· 2025-04-22 13:06
核心观点 - AI Agent技术正在改变企业数据分析与决策方式,成为企业级应用的"智慧大脑",解决传统数据消费的痛点[1][3][6] - 数势科技推出的SwiftAgent平台通过四大核心能力(数据获取、智能归因、决策建议、动作关联)赋能业务人员实现零门槛用数、零幻觉分析、零等待决策[23][24] - 行业三大趋势(数据右移、决策下移、管理后移)加速新数据消费范式,推动企业从集中式决策转向分散式敏捷决策[14] - 大模型成本下降(如DeepSeek降低数十倍成本)为企业级AI应用创造可能性,预计未来百万tokens成本将再降两个量级[15] 行业宏观趋势 - 当前企业仅10%非技术人员能实时获取数据支持决策,多数业务人员面临数据分析排队问题[10] - 未来数据消费主体将扩展至大量Agents,需要构建触手可得、即时响应的新型数据建设形态[10] - 数据工作重心向消费端迁移(数据右移),以消费驱动数据生产和治理成为主旋律[14] - 乌卡时代下企业决策模式从集中式转向分散式(决策下移),管理方式从预设规则转向事后评估(管理后移)[14] 技术供给侧突破 - DeepSeek等大模型基座实现数十倍成本降低,开源生态推动指数级成本下降[15] - 企业需构建AI就绪数据体系,通过语义引擎将原始数据转译为模型可理解格式,解决60%自然语言转SQL不准确的问题[24] - 采用大小模型结合方案:大模型处理通用任务,小模型专精数据分析领域(如时间要素识别、业绩指标解析)[24] SwiftAgent平台能力 - 四层核心架构:智能问数(自然语言获取数据)、诊断归因(维度因子分析)、模拟预测(指标走势推演)、策略评估(决策效果验证)[25] - 实现企业级权限管控,防止一线人员越级访问敏感数据(如行长级数据)[26] - 已落地金融和零售场景:服务城商行数十位分支行长实现即时数据洞察,赋能餐饮连锁店长实时掌握经营动态[28][33] 商业化应用案例 - 金融领域:为城商行提供业务处理SOP和深度决策报告,解决分支行长数据获取难问题[28] - 零售领域:结合结构化数据与非结构化知识问答,支持连锁店长进行新品营销规划与加盟商管理[33] - 已服务数十家头部企业,包括世界500强和中国500强领军企业[6] 行业影响 - 发布首份《智能分析Agent白皮书》,定义技术架构并展示跨行业应用案例[34] - 推动企业从"Excel+Chat"简单模式转向复杂的企业级AI分析范式[28] - 目标让每个"打工人"获得即时、准确的数据支持,实现数据驱动的运营升级[35]
8 位华人团队的创意 AI 1200 万美金 ARR 正融资,给 AI Agent 的专属浏览器已 3 亿美金估值
投资实习所· 2025-04-22 12:50
AI Agent基础设施发展 - AI搜索和浏览器成为AI Agent时代核心基础设施,前Twilio员工Paul Klein创建Browserbase解决AI使用网页需求[1] - Browserbase一年内完成3轮融资总计2750万美金,最新B轮估值达3亿美金由Notable Capital领投[1] - 产品采用Headless浏览器技术,支持Playwright/Puppeteer/Selenium框架,推出Stagehand开源框架增强人机协作[3][5] Browserbase技术特性 - 提供毫秒级启动数千浏览器实例的高扩展性,全球部署降低延迟[5] - 符合SOC-2 Type 1和HIPAA标准的安全隔离,支持隐身模式与验证码自动解决[5] - 开发者友好设计:提供Node.js/Python SDK、持久化状态的Contexts API及详细文档[5] 商业模式与市场定位 - 采用订阅付费模式:免费版1小时/月,39美金/月套餐200小时,99美金/月套餐500小时[7] - 定位AI软件堆栈关键组件,专注传统网页无API场景,企业版支持自托管与专用代理[7] - 市场定位为"AI Agent最后一公里",连接AI与网页世界的桥梁[4] 竞品动态与行业趋势 - 竞品Browser Use获1700万美金种子轮融资,采用网站界面转结构化文本技术路线[7] - AI创意领域增长显著:8人团队图片/视频生成产品达1200万美金ARR,扩展至AI视频赛道[8] - 行业基础设施需求明确,Browserbase与Browser Use均瞄准AI Agent交互网页的痛点[7][8]
速递丨罗永浩细红线科技断腕求生:解散全部硬件团队,All in AI产品突围海外
Z Finance· 2025-04-21 09:56
公司动态 - 细红线科技硬件团队被全部裁撤 仅保留20人软件工程师团队负责AI产品研发[2] - 公司启动春季招聘 与裁员动作形成反差[3] - 2025年1月在海外推出"Jarvis"AI助手 定价199-299美元 避开国内市场[5] 融资与技术发展 - 2022年6月成立即获5000万美元天使轮融资 投后估值2亿美元 美团龙珠领投 蓝驰创投 联想创投跟投[4] - 早期重点布局AR领域 申请光学显示系统专利 但自研AR OS项目未能突破技术瓶颈[4] - 2024年ChatGPT爆发后转向AI Agent研发[4] 团队与人才 - 吸引小米创始团队成员 操作系统专家汪文俊加盟 其为小米第50号员工 参与首款智能手机研发[4] - 员工峰值超150人 但始终未能实现产品商业化[6] 创始人背景 - 罗永浩创业历程包括牛博网 老罗英语培训 锤子科技 直播带货等[6] - 锤子科技推出Smartisan OS和多款手机 最终出售给字节跳动[6] - 通过直播带货3年还清债务[6]