Workflow
多智能体
icon
搜索文档
商汤科技贾安亚:企业AI要落地,业务目标与行业理解重于模型本身 | WISE2025商业之王大会
36氪· 2025-12-05 15:34
大会背景与基调 - 2025年WISE商业之王大会在北京举办,主题为“风景这边独好”,旨在不确定中锚定中国商业的确定性未来 [1] - 大会以“科技爽文短剧”为沉浸式体验载体,探讨AI重塑硬件、具身智能、品牌全球化及传统行业转型等核心趋势 [1] AI应用范式的宏观转变 - AI应用范式正从2023年的“智能涌现”向2025年的加速落地经历深刻变革 [3] - 国家政策大力推动“人工智能+”战略,目标在2027年实现智能终端和智能体覆盖率超过70%,其重要性堪比十年前的“互联网+” [7] - 大模型应用范式在过去两年发生显著变化,从预训练、微调转向强化学习、智能体及多智能体,对算力消耗减小,但与场景和落地价值的关联度提高 [7] 企业侧AI落地的现状与挑战 - 现实中仅有极少数企业真正兑现了AI的价值,一项针对美国企业的调研显示,只有5%的企业在落地大模型后于财务报表上看到了实际量化价值 [4][7] - 企业落地面临挑战,包括技术迭代过快导致部署易被颠覆,以及技术与自身数据、流程打通困难 [8] - 企业内部自主进行的AI落地成功率,高于外部合作伙伴帮助落地的成功率,后者不到前者的三分之一 [9] - 员工自发使用AI工具的现象普遍,使得AI在企业侧的实际应用超过了调研报告所展示的数据 [9] 企业AI成功落地的关键策略 - **驱动模式转变**:成功的关键在于从传统IT部门主导转向由业务层驱动,让一线使用者成为技术引入的决策者,以弥补IT与业务部门的需求理解鸿沟 [4][13] - **精准场景选择**:应避开对容错率要求极低的领域(如财务),聚焦于具备容错空间且能产生显著增量价值的业务环节,如供应链、人事、运营等 [4][15] - **系统化解决方案**:企业需要的不是孤立的模型,而是能够端到端解决实际业务问题、深度融合企业数据流程的完整方案 [4][19] AI技术发展趋势与价值层次 - 多模态技术成熟和软硬结合带来成本优化,AI将从生产力工具进化为系统化解决方案 [4] - AI在企业内的价值可分为三层:个人提效、团队协作效率提升、整体管理效率提升 [17] - 越偏向个人应用,越容易有标准化产品;面向企业管理层时,则更需要针对行业和企业的定制化解决方案 [19] - 企业落地对精度要求严苛,需结合多模态能力处理文本、图片、数据库等多样数据要素 [20] 商汤科技的实践与产品演进 - 商汤科技从2023年更多与头部企业合作,发展到2025年已形成标准化产品和解决方案,服务更多中小企业、学校、医院等机构 [12] - 其产品“办公小浣熊”是国内第一款数据智能体,已演进为全新的AI办公系统,计划发布3.0版本 [21] - 通过模型训练和强化学习,该产品在数据分析任务上的企业落地精度超过95%,部分垂直任务可达100%,以满足企业可用要求 [21] - 产品功能聚焦于高精度数据分析智能体和任务规划Agent,以解决企业明确目标及复杂管理任务 [21][22][23] - 公司通过引入多模态协同训练及智能体所需能力(如沙盒、规划),提升模型解决企业业务问题的准确性 [19] - 未来AI发展将通过软硬结合(如推理加速、模型架构优化、硬件优化)来降低企业落地成本 [25][26]
4K超分Agent修图师来了!一键救活所有模糊照片
量子位· 2025-11-21 14:29
技术背景与市场需求 - 图像清晰度提升是计算机视觉领域的经典问题,传统单一模型在处理噪声、模糊、压缩损伤等复合退化,以及AI合成、遥感、生物医学等专业图像时表现不佳[2][3] - 真实世界中的复杂模糊、AI生成图的伪影,以及遥感、医学等专业图像对放大技术提出更高要求,用户需要一个既通用又可控的框架来解决各式图像提升分辨率的需求[5][6] - 将分辨率放大到4K对细节重建和纹理真实度提出极高要求,4KAgent正是在这些现实挑战与需求下诞生的[6] 4KAgent核心技术框架 - 基于多智能体的设计,4KAgent可以为每张图像设计出一条通往4K分辨率的道路[7] - 感知智能体分析图像内容及退化信息,通过图像分析器评估质量指标,退化推理利用视觉语言模型得到退化信息和复原任务列表,任务规划利用大语言模型制定复原计划[11] - 复原智能体采用"执行-反思-回滚"机制,在执行阶段调用九种不同复原任务的state-of-the-art模型,在反思阶段基于质量评分评估候选图像,当质量低于阈值时触发回滚机制[13][16] - 系统集成人脸修复模块,检测并裁剪人脸后应用不同修复方法,基于人脸质量评分选择最优结果贴回原始图像[18] - 设置Fast4K模式控制运行时间,当图像尺寸超过预设阈值时去除推理时间较长的方法来加速推理[18] 技术优势与工具配置 - 4KAgent的工具栏包含九大类复原任务,涵盖亮度调整、去模糊、去雾、超分辨率、去噪、人脸修复等,集成了ConvIR、DehazeFormer、DiffBIR、GFPGAN等先进模型[14] - 设计配置模块提供可配置的使用偏好,如优先感知质量还是保真度、是否激活人脸修复模块等,能适配不同图像复原场景且无需额外训练[20] - 质量评分综合无参考图像质量指标和人类偏好分数,整体流程可视为质量驱动的专家混合系统[16] 性能测试与实际效果 - 在11种不同图像超分辨率任务的26个基准测试集进行广泛测试,涵盖经典图像超分、真实世界图像超分、多重退化图像复原、大尺度图像超分等[21] - 在经典图像超分和真实世界图像超分任务中,生成的图像展现出更丰富、更精准的细节,如树皮条纹、鹿角结构、羽绒服纹理和数字清晰度[21] - 在16倍放大任务中生成高细节度且逼真的纹理,包括岩石与草丛纹理、人脸图片中的发丝、眉毛纹理和眼睛细节[25] - 在DIV4K-50测试集上检验从256×256到4096×4096的复原能力,始终能重建更精细、更自然的细节,如人脸细节和毛发纹理[27] 应用前景与行业价值 - 该系统在多个领域提升图像复原质量,涵盖自然场景、人像、AI生成内容,以及遥感、显微镜和医学影像等专业科学模态[28] - 在无需特定领域再训练的情况下,在各个场景下均能达到优秀复原表现,彰显优秀泛化能力,为消费级、商业级及科研级应用中的通用部署提供实践价值[28]
阿里发布AgentScope1.0:多智能体时代的关键框架
海通国际证券· 2025-09-04 19:31
报告行业投资评级 - 报告未明确提及对中国电子或相关行业的投资评级 [1][10] 报告核心观点 - 阿里通义实验室于2025年9月2日推出多智能体开发框架AgentScope 1.0 定位为面向开发者的生产级开源平台 覆盖开发-部署-监控全生命周期管理 [1][11] - AgentScope核心价值在于帮助开发者高效构建、运行与管理多智能体系统 推动AI从单体模型应用向复杂智能体网络转型 [1][11] - 框架由三部分组成:核心框架负责智能体构建与编排、Runtime提供沙箱安全运行机制并支持Kubernetes部署、Studio提供可视化监控与实时评测 [2][12] - 技术亮点包括实时任务中断与恢复、短期与长期结合的记忆管理能力、高效并行调用外部工具 [2][5][18] - 相较于传统单体智能体框架 AgentScope在复杂企业应用如多部门流程自动化、供应链管理、客服协同中更具落地性 [4][15] - 阿里通过开源策略有望吸引开发者社区 形成类似LangChain的生态网络 并结合通义大模型积累构建全栈式云服务解决方案 [3][14] 技术架构与功能 - Runner模块实现任务全流程编排 Context Manager负责上下文与记忆管理 Environment Manager控制沙箱生命周期 Deployer将智能体部署为Web服务 [3][13] - 组件与底层执行信息、运行环境和外部接口协同 使智能体具备持续性、可扩展性和对外开放能力 [3][13] - Runtime的沙箱与Kubernetes兼容性提升部署可扩展性 技术路线强调工程化能力 更适合大规模生产环境 [4][15] 行业竞争与战略意义 - 全球范围内多智能体被视为继大模型之后的下一个AI应用形态 OpenAI的Swarm、微软的AutoGen、字节的PromptPilot均在探索相关方向 [4][16] - AgentScope 1.0有助于阿里缩小与海外巨头差距 并在国内开发者群体中占据先发优势 [4][16] - 中国在金融、电商、政务等场景的多样化需求将提升阿里在企业级市场中的粘性 [4][16]
2025年7月中国AI大模型平台排行榜
36氪· 2025-08-07 18:12
行业趋势与热点 - WAIC 2025线下观展人次突破35万 汇聚800余家参展企业 展示3000多项前沿科技成果[15] - 具身智能成为焦点 AI从数字世界走向物理世界 宇树、云深处、优必选、银河通用等公司成为核心玩家[15] - 大模型改变具身智能定义 从规则编程演进为语言和感知联合驱动的类人决策模式[16] - 多智能体协作成为新趋势 解决单一智能体在复杂任务中的局限性[17] - 厂商密集开源模型 阿里、月之暗面、智谱、阶跃星辰等头部企业推动开源生态发展[19] - 开源促进技术传播和创新 吸引人才和资源涌入 形成国产模型生态根系[20] 主要企业动态 阿里巴巴 - 7月27日在WAIC上开源三款大模型:千问3基础模型、千问3推理模型和AI编程模型Qwen3-Coder[21] - Qwen3-Coder在SWE-Bench评测中比肩Claude4 使初级程序员一天完成资深程序员一周工作量[22] - 发布自研AI智能眼镜"哇哦Quark Glasses" 融合通义千问大模型和夸克AI能力[21] - 7月23日开源多模态推理模型HumanOmniV2 实现对多模态信息的全面理解[22] 字节跳动 - 7月30日发布豆包・图像编辑模型3.0、同声传译模型2.0和豆包大模型1.6系列升级版[23] - 7月24日发布端到端同声传译模型Seed LiveInterpret 2.0 延迟和准确率接近人类水平[24] - 7月22日推出通用机器人操作大模型GR-3 配套机器人ByteMini有22个自由度[24] - 7月21日推出AI编程助手TRAE 2.0的SOLO模式 开发效率提升40%[24] 华为 - 7月25日在WAIC发布昇腾384超节点 由384颗NPU互联组成 算力达300 PFLOPS[26] - 昇腾已适配和开发超过80个大模型 联合2700+行业合作伙伴孵化6000+行业解决方案[26] - 华为云新一代昇腾AI云服务在芜湖、贵安、乌兰察布和林格尔数据中心上线[27] 百度 - 7月26日在WAIC展示飞桨、文心大模型、昆仑芯等核心技术[28] - 7月17日上线无广告AI搜索App "TizzyAI" 接入文心大模型4.0[28] - 7月2日进行搜索十年来最大改版 搜索框升级为"智能框" 支持超千字文本输入[29] - 接入自研视频生成模型MuseSteamer 实现画面与音效协同创作[30] 腾讯 - 发布四款开源小尺寸模型 参数分别为0.5B、1.8B、4B、7B 消费级显卡即可运行[31] - 7月27日发布并开源业界首个3D世界生成模型——混元3D世界模型1.0[31] - 发布全栈AI IDE产品CodeBuddy IDE 提升软件开发效率[32] - 7月11日发布混元大模型最新版本hunyuan-t1-20250711 采用Hybrid-Transformer-Mamba架构[33][34] 科大讯飞 - 7月16日升级"讯飞星火X1" 多语言支持扩展至130+语种 中英同传首字响应时间缩短至2秒[35] - 星火法律大模型在政法场景应用 审查效率提升50%以上[35] - 在WAIC为40万场次会议提供实时翻译服务 覆盖50多个国家和地区[36] - 发布5款AI录音笔新品 在韩国众筹平台Wadiz实现单品销售冠军[37] 360集团 - 纳米AI升级为"多智能体蜂群" 全球首个迈入L4级别的智能体系统[38] - 已有超过5万个L3级推理智能体 上线10余类多智能体蜂群[38] - 宣布将推出AI录音笔与智能眼镜两款硬件产品[39] 智谱AI - 7月28日发布GLM-4.5系列 采用MoE架构 动态激活参数仅为总参数的1/10-1/3[40] - 在12项评测基准综合平均分中位列全球第三、国产第一、开源第一[40] - API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens 仅为Claude 4的1/10[40] - 获得浦东创投集团和张江集团总额10亿元战略投资[40] 昆仑万维 - 7月30日开源多模态统一预训练模型Skywork UniPic[42] - 7月23日发布音乐模型Mureka V7 同步上线音频模型Mureka TTS V1[42] 商汤科技 - 发布日日新V6.5大模型 多模态推理能力超越Gemini 2.5 Pro、Claude 4-Sonnet[43] - 推理成本降低60% 在教育领域帮助学生提升学习效率15-30%[43] - 联合十余家国产生态伙伴发布"商汤大装置算力Mall"[43] - 发布具身智能平台「悟能」 支持机器人实现自主决策与物理世界交互[43] 快手 - 可灵AI在全球拥有超过4500万创作者 累计生成超2亿个视频和4亿张图片[45] - 服务超过2万家企业客户 覆盖广告营销、影视动画、游戏制作等行业[45] - 发布创意工作台"灵动画布" 提升创作效率及体验[45] 月之暗面 - 7月11日发布Kimi K2大模型 总参数规模达1万亿 采用MoE架构[48] - 在LM Arena排行榜登顶全球开源模型榜首 总榜排名第五[47] - SWE-bench Verified通过率达71.6% API调用价格仅为闭源模型的1/5[48] MiniMax - 在WAIC展示首款全栈通用智能体MiniMax Agent 30分钟开发完成演唱会选座系统[49] - 7月18日发布Agent全栈开发功能 支持零代码开发复杂应用[50] - 即将完成近3亿美元新融资 估值将超过40亿美元[50] 阶跃星辰 - 7月31日开源新一代基础大模型Step 3 总参数量达3210亿 激活参数量为380亿[51][52] - 与吉利汽车联合展示智能座舱Agent OS 具备多模态融合交互功能[51] - 推出Step 3o Vision和Step-Audio 2多模态模型[51] 技术突破与创新 - 多智能体蜂群架构实现智能体从单兵作战到群体协同的进化[17][38] - MoE架构广泛应用 显著降低推理成本[40][48][52] - 3D世界生成技术突破 几分钟内生成可360°漫游的虚拟世界[31] - 端到端同声传译模型达到人类水平 首字响应时间缩短至2秒[24][35] - 多模态融合技术成熟 支持图像、视频、文本联合理解与生成[41][43] 商业化进展 - 智能体在金融、医疗等行业规模化应用 审查效率提升50%以上[25][35] - API调用价格大幅降低 智谱GLM-4.5价格仅为Claude 4的1/10[40] - 硬件产品密集发布 包括AI眼镜、智能录音笔、机器人等[21][39][24] - 企业级应用快速发展 可灵AI服务超过2万家企业客户[45]
智能体向更多终端延伸,隐私保护如何跟上?
第一财经· 2025-07-28 18:15
智能体发展趋势 - 智能体正从单一任务向编程辅助、社会互动、经济治理等复杂场景拓展[1][3] - 智能体由集中式云端算力向轻量化本地终端部署演进,ToC端对隐私保护、响应速度与个性化体验需求增强[3] - 轻量型终端智能体可在手机、穿戴设备等终端直接运行,具备自主推理与快速交互能力,谷歌助手、Siri、Alexa、Cortana等产品已广泛应用[3] - ChatGPT、Copilot等大语言模型智能体正向端侧迁移与轻量化适配[3] 多智能体协同发展 - 多智能体可信互连成为行业趋势,通过协同交互完成复杂任务[4] - 多智能体架构需实现高效通信、深度协作与动态交互,打破信息孤岛并优化资源配置[4] - 复杂任务场景要求智能体系统具备处理海量异构数据、动态环境与多元决策的能力[3][4] 终端智能体安全挑战 - 终端智能体安全边界突破传统信息安全范畴,延伸至数字与物理世界的边缘交互接口[3] - 多智能体发展面临数据泄露、越权操作、隐私侵犯、算法偏见等安全威胁[4] - 单一主体安全能力难以应对跨域协同、攻防升级的系统性挑战,需构建"数据共享、能力协同、标准互认"的安全生态体系[5] 安全生态建设 - 需通过多方参与、资源整合与技术协同构建终端智能体安全可持续发展根基[5] - 数据、技术、应用三方联动是构建终端智能体安全共同体的关键[5] - 高精度、高质量的安全评测数据集是安全风险探测的核心驱动力[6]
全球约八成医疗机构正在部署或设点生成式AI工具 人工智能正重构医疗健康全产业链
上海证券报· 2025-07-28 02:48
AI在医疗健康领域的应用趋势 - 人工智能正以前所未有的深度与广度重塑全球医疗健康产业链,覆盖临床诊疗、药械研发、医院管理等环节 [1] - AI技术为医疗健康产业打开新的发展空间和产业机遇,催生智能化、精准化、个性化的医学新范式 [1] - 全球约80%的医疗机构正在部署或设点生成式AI工具,这些系统被整合进运营、临床、行政等医疗工作流程中 [2] AI技术的具体应用 - AI技术在医疗健康领域的应用包括癌症早筛的智能诊断系统、阿尔茨海默症的AI预测模型、高效缩短新药研发周期的生成式AI以及高精度智能手术机器人 [1] - 从AlphaFold破解生命密码到大模型驱动诊疗效率革命,再到具身智能、生命纤维引领的医疗健康新可能,AI成为医药健康产业跨越式发展的核心引擎 [2] - AI技术呈现出从科研实验室走向临床医疗、卫生政策和医院管理体系的趋势 [2] AI在医疗健康领域的挑战 - AI在医疗健康领域的应用面临数据壁垒、监管伦理和技术标准等多重挑战 [3] - AI模型在医疗健康领域存在模型幻觉、逻辑不一致、缺乏可追溯性等具体问题 [3] - 信任危机与算法"黑箱"成为AI应用于医疗健康领域的最大障碍 [3] 行业应对措施 - 为确保AI医疗发展的安全性和有效性,需建立透明、包容和公平的制度,并加强机构合作 [3] - 推动数据安全网建设,加快制定医疗健康数据应用相关实施方案,完善数据分级分类管理体系,创新"数据可用不可见"的安全共享机制 [3]
腾讯研究院AI速递 20250721
腾讯研究院· 2025-07-21 00:02
开源模型竞争 - Kimi K2超越DeepSeek成为全球开源模型第一,总榜排名第五,紧追顶尖闭源模型 [1] - K2继承DeepSeek V3架构并进行参数调整,包括增加专家数量、减半注意力头数、保留第一层Dense及专家无分组 [1] - 全球TOP 10开源模型中唯二入选的均来自中国,"开源=性能弱"的印象正被打破 [1] 视频生成技术突破 - Decart发布MirageLSD,首个实时(40毫秒延迟)、无时长限制的扩散视频模型,可处理任意视频流 [2] - Karpathy成为天使投资人,预见其在实时电影制作、游戏开发和AR领域的广泛应用 [2] - 技术突破在于实时流扩散(LSD)架构,通过逐帧生成和历史增强方法解决误差累积问题 [2] AI音乐创作升级 - Suno V4.5+版本提供人声与器乐分层生成与融合功能,用户可上传个人人声或伴奏进行AI辅助创作 [3] - 新增"Inspire"模式允许用户上传3秒至8分钟的个人干声,AI学习演唱特点后创作符合个人声音气质的音乐 [3] - 谱乐AI平台已同步上线Suno V4.5+核心生成能力,优化创作门槛并提升AI协作效率 [3] 音乐AI助手整合 - 腾讯元宝App 2.30版本正式接入QQ音乐服务,实现"一句话搜歌、划线即播"功能 [4] - 混元大模型与DeepSeek-R1双引擎驱动,能识别模糊音乐描述并结合情境推荐 [4] - 用户体验包括无缝账号体系连接、多模态交互和创作辅助功能 [4] AI Agent竞争 - OpenAI推出ChatGPT agent,面向Pro用户,但遭到Manus、Genspark等竞品公司的直接对比和批评 [5] - ChatGPT agent整合了Deep Research、Operator和ChatGPT功能,能自动完成退休计划、购物清单等任务 [5] - 实测各有特色,Manus输出更美观,Minimax提供多种格式报告,Kimi内容详细且询问用户具体需求 [5] 角色动画技术 - PhysRig是UIUC与Stability AI提出的角色动画可微物理绑定框架,将刚性骨架嵌入弹性软体 [6] - 通过MPM可微分物理模拟替代传统LBS,解决了体积丢失与变形伪影问题 [6] - 在17类角色和120组动画测试中全面优于传统方法,支持跨物种动作迁移 [6] 通用推理模型突破 - OpenAI的神秘通用推理模型在IMO 2025中解出5道题目,获得35分,达到金牌水平 [7] - 该模型具备持续数小时的深度创造性思维能力,远超以往AI的秒级或分钟级推理 [7] - 这是通用强化学习突破而非特定任务训练的成果 [7] AI工具设计理念 - 最佳AI编程工具应是简单、通用的"乐高积木",而非功能堆砌的复杂系统 [8] - Claude Code创造者主张将控制权还给用户,工具不应替你决定工作流,而是提供底层能力 [8] - 有效工作流包括:先探索规划再由用户确认后编码、使用测试驱动开发、对照目标迭代改进 [8] AI产品战略 - 聚焦Agent:预训练模型已含工具知识,只需激发能力,智能上限由模型决定 [9] - 开源:提升知名度、获取社区贡献,防止用技术捷径粉饰效果,倒逼模型真正进步 [9] - 选择DSV3架构:实验证明自研结构无法胜过DSV3,资源有限下避免引入无效变量 [9] AI未来发展方向 - 许多人构建的辅助工具与路由系统最终会被扩展模型取代,真正遵循扩展法则的方向是直接提高模型能力 [10] - 当前AI模型学习数据效率远低于人类,算法改进比简单扩大数据规模更重要 [10] - 多智能体研究新方向:研究如何让模型从15分钟推理扩展到数小时甚至数天,建立AI"文明" [10]
深度|OpenAI 多智能体负责人:许多人正在构建的产品并未真正遵循Scaling Law,最终都会被所取代
Z Potentials· 2025-07-20 10:48
多智能体与游戏AI研究 - OpenAI开发的Cicero系统在《Diplomacy》游戏中达到人类玩家前10%水平,并通过AI反哺训练使开发者Noam Brown成为2025年世界冠军[3][4] - Cicero采用27亿参数的小型语言模型,开发过程中发现更大模型能显著提升性能[8] - 多智能体研究不仅关注博弈策略,更探索如何扩展模型推理时间至数小时甚至数天以解决复杂问题[55] AI推理范式演进 - 测试时计算成为下一代AI核心能力,模型思考时间从15分钟向更长周期扩展带来数量级性能提升[32][34] - 系统一(直觉)与系统二(推理)能力需协同发展,模型规模扩大后推理性能呈现涌现特性[15][16] - OpenAI通过o系列模型验证推理范式,o3已具备网页浏览和深度研究能力,性能持续迭代[11][26] 数据效率与算法改进 - 当前AI数据效率显著低于人类,算法改进是提高数据利用率的关键方向[38][39] - 强化学习微调(RFT)可针对性优化模型,收集的数据对未来模型迭代仍具价值[30] - 预训练模型需结合中训练和后训练才能实用化,纯预训练模型表现欠佳[88][90] 行业竞争与技术路线 - 自对弈在两人零和游戏(如围棋)中有效,但在多人非零和场景面临目标函数设计挑战[66][69] - 模型路由等辅助结构可能被扩展范式取代,开发者需警惕技术快速迭代带来的架构淘汰风险[26][28] - OpenAI采用集中资源进行大规模实验的策略,区别于传统实验室的小型分散研究模式[40][41] 应用场景与商业化 - Codex编程助手可独立完成代码提交,未来将覆盖从问题提出到PR审核的全流程[43][51] - 虚拟助手成为继软件开发后的重点应用领域,AI对齐需求使其可能超越人类表现[52] - 生成式媒体(Sora)与推理模型形成技术矩阵,推动商业订阅增长[71] 前沿研究方向 - 显式建模其他智能体的必要性存疑,大规模模型可能自发形成心理理论能力[64] - 万智牌等超复杂不完美信息游戏暴露现有AI方法的局限性,状态空间爆炸问题待解[99][100] - 生物模拟器开发被视为突破药物研发瓶颈的关键路径,需跨学科协作[86]
2025下半年TMT投资策略展望
2025-07-16 14:13
纪要涉及的行业和公司 - **行业**:AI算力、运营商 - **公司**:亚马逊、微软、谷歌、Meta、英伟达、华为、新一胜、中国移动、中国电信、中国联通 纪要提到的核心观点和论据 AI算力行业 - **核心观点**:AI算力景气度仍值期待,但市场对未来持续投入存在分歧,建议保持适当仓位,精选个股,关注北美链 [1][28][29] - **论据** - **资本开支强劲**:今年一季度北美四大厂商亚马逊、微软、谷歌和Meta资本开支总金额773亿美金,同比增长62%;Meta将全年资本开支由600 - 650亿美元上调至640 - 720亿美元 [2][3] - **算力需求大**:模型参数量增加、推理场景、agent应用等对算力消耗大;国内大模型商用落地日均token消耗量激增,如2024年下半年从千亿级到万亿级,月复合增长率45%;单个agent算力需求显著高于简单模型,单个用户查询token处理量预计两年内增加100倍 [5][8][9][10] - **历史复盘**:以光模块等算力公司为例,过去经历两轮大周期,当前基于PTTM计算公司估值较便宜,虽AI与云计算不同,但可作为参考 [21][22][27] 运营商行业 - **核心观点**:运营商虽面临经营压力,但业绩增速大概率可实现两到三年维度的平稳增长,是AI大赛道中有想象力的布局方向 [34][36] - **论据** - **业绩增速放缓但有望提速**:今年一季度三大运营商营收同比仅增长0.8%,但二季度开始随着政企订单恢复,预计收入和利润端业绩将提速 [35] - **收入端增长有持续性**:家庭端天照宽带用户渗透率有提升空间,宽带up值可提升;云计算等ICT项目和产品保持不错增速 [36][37] - **利润端平稳增长**:成本费用压降,资本开支持续下降,折旧和摊销占收比及绝对值可能下降,自由现金流变好,支撑净利润平稳增长 [37] - **股息充裕**:自由现金流强,可供分配股息充裕,虽一季度经济现金流下降,但全年有望平稳 [38][39] 其他重要但是可能被忽略的内容 - **AI算力行业** - **强化学习遵循scale law**:强化学习成为激发复杂推理的核心技术,遵循规模、参数量和算力的法则,agent构建也遵循此规律 [7][8] - **算力投资性价比**:英伟达和华为推出机柜方案,研究表明K = 36以上对性能提升明显,但大于72或等于5760时性价比不高 [16][17] - **估值锚点**:基于未来盈利预测的估值可信度不高,可基于历史PTTM给出合理估值锚点 [20][21] - **Agent应用** - **成为AI应用落地主要承载**:OpenAI给出agent公式,国内也在加速发展,如Manus提出通用Agent概念、智博的陈词成为国内首款公开可用的Digital Search等 [30][33] - **对算力和token消耗大**:agent从规划到执行各环节对token消耗大,如上下文窗口、验证模块、多模式场景等 [14][15] - **运营商行业** - **资本开支下降**:运营商资本开支在2023年出现拐点,2024年下降10%,今年预期下降9%,因6G商用远、AI投资可控 [39] - **资产质量高**:运营商资产质量高,坏账风险低,个人和家庭用户预付费为主,政企用户欠费少 [40]
Agentic AI时刻!多智能体驱动,「一人公司」这就要来了
机器之心· 2025-06-20 18:37
AI行业趋势与预测 - AI领域权威人士对未来持超预期乐观态度,Geoffrey Hinton预测AI将取代多数人类工作,仅顶尖技能岗位不可替代 [2] - Andrej Karpathy提出"软件3.0"时代概念,自然语言成为新编程接口,大模型承担主要工作 [2] - 预计到2028年15%日常工作决策将由Agentic AI自主完成,2024年该比例近乎为零 [68] Agentic AI技术突破 - 智能体技术实现从被动响应到主动执行的跨越,可长期独立运行并自主使用工具 [3] - 多智能体协作系统已实现中央协调器自动分配任务,完成PDF解析、报告生成等复杂流程 [15] - 智能体遵循大语言模型测试时扩展规律,通过强推理持续提升解题能力 [3] 亚马逊云科技技术栈 - 提供全栈式Agentic AI开发工具:Bedrock Agents支持复杂流程编排,Strands Agents实现轻量级开发 [17][46] - Amazon Q Developer实现90%代码自动生成,支持从需求分析到部署的全流程自动化 [6][8] - Amazon Transform实现5000行代码环境迁移,1分钟完成4800行修改 [9] 行业应用案例 - 复星医药利用生成式AI将医学报告检查从1周缩短至5分钟,翻译成本降低30% [24] - 合合信息构建文档处理Agent DocFlow,分钟级完成文档分类与信息抽取 [21] - 汤森路透应用现代化改造速度提升4倍 [60] 企业效率提升数据 - Java版本升级项目节省4500+开发工时,实现2.6亿美元年化成本节约 [56] - 五人团队两天完成1000个Java应用升级,单应用耗时从2天压缩至10分钟 [54] - 医学领域AI处理1.6亿字翻译,制药企业文档工作量占研发30-50% [23][24] 技术架构创新 - Bedrock平台集成DeepSeek R1、Claude等12种顶尖模型,支持多模型智能路由 [33][42] - 独家推出自动化推理校验功能,有效防止大模型幻觉 [38] - 模型蒸馏技术提升500%响应速度,成本降低75% [41] 商业价值与战略 - Agentic AI被定位为亚马逊云科技下一个十亿美元级业务,已成立直属CEO的专项团队 [64] - 生成式AI在生产力提升、成本优化和创新加速三方面验证商业价值 [19] - 中国区已有超1000家深度合作客户,全球超10万企业使用机器学习服务 [63]