Workflow
AI Agent
icon
搜索文档
对话壹沓科技庄学坤:供应链智能化迈入全链路自主决策
观察者网· 2025-08-04 14:24
公司战略与产品发布 - 壹沓科技品牌升级为「ONEAIX壹沓」并发布供应链领域首个具备自主规划能力的垂类AI Agent智能体平台——运小沓数字员工4.0 [1] - 运小沓产品迭代路径:1.0实现单场景自动化 2.0跨场景自动化串联 3.0定位为智能执行引擎 4.0具备自主规划能力 [3] - 公司明确不研发通用大模型 专注行业垂类大模型训练 采用开源基座模型如DeepSeek和千问 [3] 行业应用与技术创新 - 海运物流存在数十个环节人工重复劳动 市场潜力与人工成本上升驱动自动化需求 [1] - AI Agent应用分阶段推进:单场景辅助→多场景串联→全自动决策 目前严肃场景仍需人工确认 [4] - 山东港口青岛港采用壹沓垂类大模型构建的"智行问价Agent"实现7X24小时服务 显著提升智能化水平 [6] 行业发展与竞争格局 - 国内大模型能力快速追赶美国 DeepSeek诞生后差距缩小至不足一年 百亿级投入推动行业进步 [7] - 各类型企业积极拥抱AI 包括国企和政府机构 行业响应国家战略形成共识 [8] - 论坛吸引全球供应链上下游200+核心企业参与 覆盖港口、航运、物流等领域头部机构 [8] 技术路径与数据策略 - 垂类模型训练聚焦两类数据:行业专业知识(如海运术语)和操作流程指令微调 [4] - 企业可选择私有化部署或国产方案保障数据安全 大型客户已部署DeepSeek满血版 [7]
深度|Perplexity CEO:为什么决定做Comet浏览器?我们需要自己的客户端,并控制我们自己的命运
Z Potentials· 2025-08-04 13:51
文章核心观点 - Perplexity AI开发Comet浏览器的核心动机是控制用户查询入口,避免被谷歌等平台限制,同时实现AI Agent的深度集成 [3][7][9] - 浏览器作为AI工作流的核心载体,能实现跨标签页、应用的数据整合和任务自动化,这是云端AI无法实现的独特价值 [9][15][16] - 公司采取差异化竞争策略:避开与谷歌的广告模式正面竞争,专注订阅制和任务完成收费的商业模式 [35][36] - AI技术发展将重构工作方式:短期内会导致岗位替代,长期需要社会适应技术迭代速度 [43][45][47] 浏览器战略 - 查询入口控制:全球150亿次日搜索中70-80%通过浏览器地址栏发起,这是必争的流量入口 [3] - 防御性需求:Chrome扩展频繁被平台下架,迫使公司必须拥有自主客户端 [7] - 进攻性功能:浏览器能实现跨标签页的AI Agent协同,完成价格比较、邮件处理等复杂任务 [9][16] - 技术实现:基于Chromium开发,8个月完成从零到发布,重点优化了AI Agent集成体验 [10][11] 竞争分析 - 谷歌困境:AI Agent会破坏其AdWords商业模式(2023年广告收入2000亿美元),且推理成本难以规模化 [20][21] - 安全优势:采用客户端存储登录信息,相比OpenAI的服务器端存储更安全 [14][15] - 市场定位:避开与ChatGPT的聊天层竞争,专注浏览器端的工作流整合 [18][19] 技术架构 - 模型选择:建立内部评估基准PPLX Bench,动态测试模型性能 [25] - 训练方法:结合SFT和GRPO算法进行后训练,专注摘要准确性和浏览器控制能力 [26][31] - 本地化愿景:计划开发能在客户端本地运行的小型专用模型,提升隐私和响应速度 [32][42] 商业模式 - 拒绝广告:避免与谷歌正面竞争,采用订阅制和任务完成收费 [35][36] - 目标规模:1亿用户实现50-100美元ARPU,年收入50-100亿美元 [36] - 增值服务:探索API服务和交易佣金等衍生商业模式 [36] 社会影响 - 就业冲击:AI将使公司用人减少,被替代者需创业或学习新技能 [45] - 适应挑战:技术迭代速度(3-6个月周期)超过社会常规适应能力 [44][47] - 效率悖论:使用AI的高效团队可能获得更多投资,但人才供给存在瓶颈 [46]
OpenAI迎来“Agent时刻”:智能体大战的路线选择
虎嗅· 2025-08-04 10:47
文章核心观点 - OpenAI发布通用型ChatGPT Agent,整合深度研究工具Deep Research与执行工具Operator,可一站式完成复杂任务,但存在速度慢、个性化不足等短板 [1] - ChatGPT Agent采用"浏览器+沙盒虚拟机"架构,与Manus、Genspark形成技术路线差异 [1] - Agent将重塑互联网入口,改变流量分发模式,对创作者商业模式产生影响 [52][56][64] 主流底层架构对比 - 浏览器(Browser-based)代理:万能但运行速度慢,Token消耗高 [12][13][14] - 沙盒(Sandbox)环境:高效但无法联网操作,工具库受限 [16][17] - 大模型加限制沙盒:如Genspark,环境封闭,仅能运行预设程序包 [18][19] - 工作流集成(Workflow API):速度快、结果精准,但业务范围有限 [21] 主要Agent产品优劣势 - OpenAI ChatGPT Agent:深度研究能力强,浏览器执行层面表现优异,基准测试达50多分(其他最高20多分) [4][6] - Manus:虚拟机环境搭建优势,但受浏览器能力限制,执行速度慢(30多分钟/任务) [27][28][31] - Genspark:垂直化模板设计,速度较快但通用性下降 [33][34] - Pokee:执行速度最快(市面产品的4-10倍),采用第三方集成SDK,Token成本降低50%-60% [36][40] 用户体验差异 - 浏览器架构Agent(如Manus、ChatGPT):功能全面但速度慢 [27][28] - 沙盒架构Agent(如Genspark):执行速度快但功能受限 [34] - 工作流集成Agent(如Pokee):专业场景高效但需平台接口支持 [40][41] 商业模式与技术路线 - ToC产品(Manus、Genspark、ChatGPT Agent):面向普通消费者,解决通用需求 [46] - ToB产品(如Pokee):针对专业人士重复性工作场景 [46][48] - 平台接口开放程度直接影响Agent能力边界 [43][48] 行业趋势与影响 - Agent将改变互联网流量入口模式,门户网站流量可能下降 [52][56] - 广告模式可能从流量分成转向知识产权直接付费 [64] - 推荐系统算法可能从排名导向转向连续交互机制 [67][68][69] - 多智能体协作协议(MCP)发展面临可用性挑战 [58][59]
马斯克放大招!推出视频生成器Grok Imagine ,实时AI视频渲染技术有望3到6个月实现——《投资早参》
每日经济新闻· 2025-08-04 07:33
(二)行业掘金 1、马斯克在X社交平台上宣布:开始向所有Grok Heavy订阅用户推出人工智能文本转视频生成器Grok Imagine。 Grok Imagine是马斯克旗下聊天机器人Grok的最新功能,目前正处于测试阶段。用户可以通 过输入文字描述自己想要看到的图像或场景,Grok Imagine就能快速将其转化为带有音效的视频片段。 之后X社交平台上用Grok Imagine生成的视频开始快速流传,各种网红表情包、名人名场面评论火爆。 多位摄影与AI爱好者也开始进行内容创作尝试。 点评:马斯克转发了关于Grok Imagine的最新动态,并表示:"10天前,一段6秒的视频渲染需要60秒, 之后降至45秒,再到30秒,现在已缩短至15秒。我们或许能将时间控制在12秒以内。"他表示:"在此过 程中,视频的视觉质量没有受到任何影响。我们正在对音频轨道进行重大升级。" 马斯克预计,在接下 来的3到6个月内,实时视频渲染技术有望实现。2025年被认为是Agent(智能体)元年,当前AI应用的加 速落地,尤其是在B端领域,较互联网时代有显著提升,预计将超出市场预期。概念股包括宣亚国际、 易点天下、万兴科技等。 每经 ...
【早报】新发国债等利息要交增值税;市场监管总局发文,规范网络交易平台收费
财联社· 2025-08-04 07:09
宏观政策 - 中国人民银行2025年下半年工作会议强调继续实施适度宽松货币政策 保持流动性充裕 引导信贷合理增长 确保社会融资规模与经济增长匹配 [2] - 央行推进人民币国际化 加快贸易项下人民币使用 优化本外币一体化资金池政策 发展离岸市场并完善清算行布局 [2] - 财政部税务总局公告自2025年8月8日起恢复对新发行国债、地方债、金融债利息收入征收增值税 此前已发行债券利息继续免税至到期 [3] 行业动态 - 上海证券同业公会数据显示2025年上半年A股平均佣金率0.201‰ 同比降8.2% 剔除高频量化业务后降幅仍显著 [4] - 国家认监委发布移动电源及锂离子电池强制性认证新规 自2025年8月15日起实施 [4] - 八部门印发《机械工业数字化转型实施方案》 目标2027年智能制造二级以上企业占比达50% 建成超200家卓越级智能工厂 [6] - 2025年暑期档电影总票房(含预售)突破70亿元 [7] - 人形机器人产业加速发展 运动控制系统需求短期看顺周期复苏 中长期受制造业升级与机器人爆发驱动 [16] - 欧盟启动太空地面基础设施研究 商业航天产业化进入加速期 低成本可回收火箭推动行业变革 [17] - AI数据中心电力系统价值量提升 HVDC在AI数据中心渗透率有望提高 供配电设施成为核心基础设施 [19] 公司新闻 - 中国神华筹划发行股份及支付现金购买资产并募资 股票自8月4日起停牌 [1][9] - 理想汽车回应i8碰撞测试争议 称仅验证被动安全性能 未评价其他品牌质量 [8] - 芯导科技拟4.03亿元收购吉瞬科技100%股权及瞬雷科技17.15%股权 构成重大资产重组 [10] - 佳创视讯控股股东筹划控制权变更 股票8月4日起停牌 [10] - 中际旭创高管王晓东拟减持71.91万股 占总股本0.06% [11] - 海康威视2025H1营收418.18亿元(同比+1.48%) 净利润56.57亿元(同比+11.71%) [11] - 九号公司2025H1营收117.42亿元(同比+76.14%) 净利润12.42亿元(同比+108.45%) [11] - 蚂蚁数科通过中国信通院可信AI客服智能体评估 获4+级认证 为首家通过企业 [18] 新能源汽车 - 7月造车新势力交付量分化:零跑交付50,129辆(同比+126.9%) 小鹏交付36,717辆(同比+229.45%) 理想交付量大幅下滑 蔚来维持2万辆区间 [6] 全球市场 - 美国7月非农就业新增7.3万人 低于预期的10.4万人 创9个月新低 [12] - 伯克希尔哈撒韦Q2营收925.15亿美元超预期 现金储备达3441亿美元 连续11季度净卖出股票且未回购 [14] - OPEC+同意9月石油日产量增加54.8万桶 [15]
“人工智能+”战略提速,AI Agent时代正加速到来
中航证券· 2025-08-03 22:45
投资评级 - 社会服务行业投资评级为"增持",维持评级 [3] 核心观点 - 国家层面全面推进"人工智能+"战略,国务院审议通过《关于深入实施"人工智能+"行动的意见》,明确推动AI在经济社会各领域的规模化、商业化应用,构建创新与应用双轮驱动的发展模式 [2][18] - 国产通用大模型GLM-4.5加速开源商用化,在推理、编码、智能体三大能力维度达国产领先,参数效率与调用成本处于国际前列 [2][18] - OpenAI将于8月发布GPT-5,致力于整合推理与多模态模型,强化全场景执行能力 [2][18] - 政策明确"AI+"发展主线叠加通用大模型技术持续突破,形成政策底+能力底共振格局,AI产业即将进入价值释放窗口期 [2][18] - GLM-4.5的发布标志国产大模型在推理能力、代码生成与智能体交互等核心能力实现跨越式发展,其3550亿总参数、320亿激活参数的MoE架构在国际评测中位居全球开源模型前三 [19] - GLM-4.5高效版本GLM-4.5-Air以远低于竞品的规模实现"参数更小,性能更强"的优化突破,API成本仅0.8元/百万token,大幅降低使用门槛 [19] - 微软Azure因AI服务实现Q2营收同比+39%,365 Copilot月活破亿;Meta广告系统引入AI驱动算法后应用业务FoA同比增长22% [20] - GPT-5将采用后台模型路由系统,结合推理模型与多模态模型能力,逐步实现"大一统智能体"构建 [21] 市场行情回顾 - 社会服务(申万)板块指数周涨跌幅0.10%,在申万一级行业涨跌幅中排名5/31 [5] - 子行业涨跌幅排名:教育(2.74%)、旅游及景区(2.69%)、专业服务(-1.23%)、体育II(-1.31%)、酒店餐饮(-2.72%) [5] - 个股涨跌幅排名前五:西藏旅游(46.42%)、中国高科(18.66%)、安车检测(12.69%)、苏试试验(10.42%)、学大教育(6.83%) [5] - 个股涨跌幅排名后五:兰生股份(-9.99%)、大连圣亚(-9.77%)、实朴检测(-9.12%)、中钢天源(-8.87%)、科锐国际(-5.18%) [5] 投资建议 - 2025年下半年将成为"AI应用落地元年",通用型智能体工具逐步成熟,企业AI助手、自动化工作流与智能内容生成将率先形成高频使用场景 [22] - 重点关注两类投资主线:①大模型开发与AI Agent能力提供商【昆仑万维、科大讯飞】;②AI落地场景应用【焦点科技、奥飞娱乐、值得买、上海电影、恺英网络、中文在线、万兴科技】 [22] 行业新闻动态 - 四川发力银发旅游专列扩容,推出《做优银发旅游列车促进服务消费发展行动方案》,构建多层次产品体系和线路网络 [23] - 免签入境已成为外籍人员来华旅游、商贸主渠道,带动2024年外国游客达2694万人次、同比增96% [24] - 浙江启航"AI产业加速器计划",助力中小企业数智化转型,推出四大举措培育研发大脑、智能工具箱、市场智能助手和制控驾驶舱 [24] - 人社部部署开展专业技术人才人工智能通识继续教育,自2025年起在全体专业技术人才队伍中广泛实施 [24] - 即时零售推动餐饮业捕捉"即买即用"增量需求,将餐饮店辐射范围从1.5公里扩至3-5公里,全国3万个前置仓创造50万岗位 [24]
GPT-5要来了!阿尔特曼被“吓坏”:坐立不安,感到恐惧!发生了什么?
每日经济新闻· 2025-08-02 23:18
GPT-5发布时间与信号 - OpenAI CEO萨姆·阿尔特曼透露GPT-5预计将于今年夏天推出,近期迹象表明或于8月上旬正式亮相[1][4] - 7月19日阿尔特曼在X平台发文称"我们即将发布GPT-5",7月24日播客中再次确认"很快就会发布它"[4] - 开发者社区已发现GPT-5测试版本,包括GPT-5-Alpha、GPT-5-Auto和GPT-5-Reasoning模型[5][6] GPT-5技术特点 - 模型思路为"简化、统一、多模态",整合GPT系列基础模型、o系列推理模型及GPT-4o全模态能力[9] - 单次推理算力消耗不会大幅增加,API价格或较GPT-4o仅小幅增长,推理性价比提升一倍以上[9] - 将具备自主规划和执行任务能力,成为拥有终端、图形浏览器、文本浏览器的多工具整合智能体系统[10] - 拥有更强大记忆力和更长上下文窗口(256K),在创意写作、编程和数学计算上表现优异[8][10] - 模型规模将进一步扩大,训练算力需求可能远超GPT-4的百倍增幅[11] 产业链影响 - 算力需求:OpenAI计划2025年末前部署超100万张GPU,推动"能源-芯片-算力"链条资本投入[12] - 芯片厂商:英伟达等GPU厂商持续受益,微软Maia、谷歌TPU、亚马逊Trainium等自研芯片加速发展[13] - 企业软件:将快速嵌入微软Copilot、Notion、Slack等产品,形成"AI即基础功能"的软件新格局[13] - 垂直应用:教育、医疗、营销、法律、金融等行业将优先变现,多模态能力提升专业工具效能[14][15]
全球最赚钱 20 家 AI Agent 公司是这几个
Founder Park· 2025-08-01 19:11
AI Agent行业趋势 - AI Agent正从工具演变为"数字员工",能够自主完成任务并接管销售、法务、客服等核心业务流程[6] - 收入成为衡量AI初创公司竞争力的新门槛,商业化落地能力成为关键指标[6] - 行业呈现垂直化发展特征,覆盖编程、招聘、客服、法律、医疗等20+细分场景[5][6] 头部公司商业化表现 编程领域 - **Cursor**:ARR达5亿美元,拥有36万付费用户,日均生成数亿行代码,客户包括Stripe、OpenAI等[9] - **Replit**:ARR从1000万增至1亿美元仅用6个月,估值有望达30亿美元,主打零配置开发体验[13] - **StackBlitz**:ARR 4000万美元,人均创收114.3万美元,通过WebContainers技术降低开发门槛[18] 企业服务领域 - **Glean**:ARR 1亿美元,处理亿级Agent操作,整合多SaaS应用实现工作流自动化[10] - **Sana**:ARR 2000万美元,帮助企业构建专属AI助理,实现80%以上流程效率提升[24] - **Hebbia**:ARR 1300万美元,专注金融法律领域知识整理,估值7亿美元[28] 垂直行业解决方案 - **Harvey**:法律AI助手ARR 7500万美元,估值50亿美元,可执行法律研究、合同分析等任务[17] - **Nabla**:医疗AI助手ARR 1600万美元,覆盖13万家医疗机构,医生文档时间减少50%[25][26] - **Crescendo**:AI客服ARR 9100万美元,采用人机协同方案处理90%常规咨询[15][16] 高增长典型案例 - **Lovable**:8个月实现ARR 1亿美元,人均创收222.2万美元,支持无代码构建Web应用[14] - **11xAI**:6个月ARR突破200万美元,月增速50%,AI销售员工可自主完成客户开发全流程[33][34] - **Fyxer**:嵌入邮箱的AI助理,ARR从100万增至900万美元,服务Starbucks等100+企业[35][36] 技术创新方向 - 多模型组合架构(如Sierra整合OpenAI、Anthropic等模型)[22] - RAG技术应用(如Sana结合检索增强生成实现知识自动化)[24] - 无代码/低代码平台(如Torq实现安全流程自动化)[21]
Manus还活着,还上新了
虎嗅APP· 2025-08-01 18:26
Manus新功能Wide Research发布 - 公司推出新功能Wide Research(广度研究),目前仅对Pro用户开放,未来将向Basic和Plus用户开放,暂无免费用户开放计划 [3] - 该功能是公司内部耗时最长的开发项目,耗时超两个月 [6] - 功能定位为"广度研究",与OpenAI的"深度研究"形成差异化竞争,直接挑战行业巨头 [6] 技术特点与性能对比 - Wide Research采用并行计算技术,可将任务拆分为批量子任务处理,计算能力扩展100倍,但算力消耗显著增加 [9] - 实际测试显示,Wide Research能完成全球前100MBA学校列表等广度任务,而ChatGPT Agent仅能处理10所学校 [7] - 功能演示显示可同时比较100双运动鞋或生成50张风格海报,展现横向扩展优势 [9] 用户成本与行业竞争格局 - 单个Wide Research任务预计消耗1000积分(子任务约10积分/个),远超免费用户每日300积分限额 [10] - 行业存在技术路线分化:Wide Research强在并行效率,Deep Research长于复杂逻辑推理,两者结果可靠性均需提升 [10] - AI Agent领域陷入同质化竞争,公司通过Wide Research实现差异化创新,突破行业"深度研究"内卷现状 [12] 战略意义与行业影响 - 新功能发布被视为公司技术实力的重要证明,回应市场对其发展状况的质疑 [5] - 从产品推出到功能迭代仅用5个月,展现快速创新能力 [5][6] - 行业面临AGI技术瓶颈,公司尝试通过计算范式创新开辟新竞争维度 [12]
Manus还活着,还上新了
虎嗅· 2025-08-01 17:36
产品发布 - Manus于8月1日发布新功能Wide Research(广度研究) 目前仅对Pro用户开放 未来将逐步向Basic和Plus用户开放 但暂无免费用户开放计划 [1] - 该功能开发耗时超两个月 是公司内部开发时间最长的功能 [6] - Wide Research功能不会以独立产品或页面形式呈现 而是根据用户任务需求自动触发 [9] 技术特性 - Wide Research采用并行计算技术 可将用户任务拆分为批量子任务处理 计算能力提升100倍 [9] - 该技术强调横向扩展和并行处理 但需承担高昂算力消耗和Token剧增成本 [9] - 在测试中成功完成"列出全球前100的MBA学校"任务 而ChatGPT Agent仅能列出10所 [6] - 支持同时比较100双运动鞋和生成50张风格各异的海报等广度任务 [9] 商业模式 - 免费用户每日积分限额为300 credits Wide Research单任务预计消耗1000 credits 相当于每个子任务消耗10 credits [10] - Basic套餐定价为19美元/月 包含每日300 refresh credits和基础功能权限 [4][5] - Pro套餐提供高级模式访问权限 支持2个并发任务和2个图像生成任务等增值服务 [5] 行业竞争 - OpenAI于上月推出ChatGPT Agent 其"Deep Research"功能主打深度信息整合和复杂问题推理 [6][10] - Wide Research被定位为对Deep Research的精准反击 形成"广度"与"深度"的技术路线对决 [6] - 行业陷入同质化竞争 根本制约因素在于AGI(通用人工智能)技术进步速度 [10] - AGI发展遭遇瓶颈期 企业通过细节优化争夺用户 但难以实现颠覆性突破 [11] 市场定位 - Manus自2025年3月进入市场后 持续通过创新功能打破行业固有格局 [11] - 在AI Agent领域普遍聚焦"Deep Research"的背景下 公司率先推出广度研究功能实现差异化竞争 [11] - 行业资深人士指出 两种技术各具优势:Wide Research在广度任务效率占优 Deep Research在复杂逻辑推理更具深度 [10]