Workflow
人工智能
icon
搜索文档
忘掉《Her》吧,《记忆碎片》才是 LLM Agent 的必修课
Founder Park· 2025-07-29 16:05
言午 . 贩卖你想要的人生 以下文章来源于言午 ,作者yan5xu 然而,进入 2025 年,风向几乎在一夜之间改变。 一款现象级 Agent 的横空出世,让 Agent(智能体) 迅速取代 Chatbot,成为行业叙事绝对的主流。大 家讨论的不再是「意图识别」和「多轮对话」,而是 任务分解 、 工具调用 和 自主规划 。从硅谷到北京,「第一个通用 Agent」、「第一个 AI 程序 员」的发布会此起彼伏,这股火热的浪潮,让人感觉仿佛重回了那个移动互联网大爆发的 2016 年。 在这个全新的 Agent 时代,又有那部电影,阐述了什么是 agent。我心里有一个未被认可的答案,它和 AI 毫无干系,却可能是最好的 Agent 入门电影。它 不探讨 AI 的灵魂,只展示一个系统如何在信息不完整的残酷现实中,为了一个目标去 「思考」 和 「行动」 。它,就是克里斯托弗·诺兰的第一部长篇电 影——Memento(《记忆碎片》)。 主角莱纳德不是一个被动的聊天伙伴。他是一个有明确目标(复仇)、会使用工具(相机、笔)、并试图在复杂的真实世界中执行任务的 自主系统 (Agent) 。他关心的是 「完成任务」 ,而不是「取 ...
世界人工智能大会亮点纷呈,如何布局?
大同证券· 2025-07-29 15:59
报告核心观点 上周权益市场主要指数大幅走高,债券市场长短端利率上行,基金市场有涨有跌;权益类产品配置可采用事件驱动和资产配置策略,稳健类产品配置需关注市场情况并选择重点产品 [2] 市场回顾 权益市场 - 上周主要指数继续上攻,科创 50 涨幅最大为 4.63%,近 1 月、近 3 月和今年以来榜首指数分别是创业板指、创业板指和北证 50 [5] - 申万 31 个行业多数收涨,周期板块大幅反弹,建筑材料、煤炭等行业排名靠前,银行、通信等行业排名靠后 [5] 债券市场 - 上周央行公开市场操作净投放,资金面由紧转松,长短端利率上行,期限利差走阔,长短端信用利差大幅走阔 [8] 基金市场 - 受权益市场反弹影响,偏股基金指数上涨 1.81%,二级债基指数上涨 0.31%;受债市回调影响,中长债基金指数下跌 0.30%,短债基金指数下跌 0.10% [11] 权益类产品配置策略 事件驱动策略 - 十部门印发《促进农产品消费实施方案》,可关注工银农业产业、嘉实农业产业 A 和银华农业产业 A [2][13] - 2025 世界人工智能大会在上海举办,可关注博时半导体主题 A、嘉实科技创新和诺德新生活 A [2] - 雅鲁藏布江下游水电工程开工,可关注工银创新动力、景顺长城中国回报 A 和长城品质成长 A [2][15] 资产配置策略 - 整体采用均衡底仓 + 杠铃策略,杠铃两端为红利和科技 [16] - 红利资产有配置价值,低利率环境凸显其稀缺性,政策利好且有防御避险属性 [16] - 均衡风格基金能降低单一行业波动影响,在不同市场环境中保持稳定表现,当前可提高抗风险能力 [16][17] - 科技成长方向有配置价值,受国家政策支持,行业景气度高,国产替代需求紧迫 [17] - 可关注安信红利精选、工银精选回报、华夏智胜先锋、嘉实港股互联网核心资产和华安制造先锋 [17] 稳健类产品配置策略 市场分析 - 央行公开市场操作净投放 1295 亿元,资金面由紧转松 [18] - 7 月 LPR 报价维持不变,1 年期为 3.0%,5 年期以上为 3.5% [18] - 人身险产品预定利率再度下调,当前普通型人身保险产品预定利率研究值为 1.99% [19] - 可转债等权价格中位数近期大幅走高,需警惕估值较高带来的调整风险 [19] 重点关注产品 - 核心策略可关注诺德短债 A 和华安纯债 A [2][3] - 卫星策略可关注固收 + 基金,如安信新价值 A 和南方荣光 A [2][3]
WAIC盛况空前,关注AI算力与应用
华金证券· 2025-07-29 15:58
报告行业投资评级 - 领先大市(维持) [3] 报告的核心观点 - 国产算力芯片性能提升,华为展示的CloudMatrix384AI超节点算力和推理吞吐量提升,支持多种模型推理,应用效果显著 [1] - 数据中心电力消耗攀升,面临供电稳定性、成本控制和碳排放管理挑战,需算电协同 [1] - AI技术从参数竞赛推进到应用端,B端和C端应用场景不断丰富,全球AI产业市场规模持续扩大 [2] - AI技术推动车端智驾能力和机器人具身智能水平提升,应用场景不断拓展 [5] 相关目录总结 算力芯片 - 华为CloudMatrix384AI超节点算力提升至超节点300pFLOPS,单卡推理吞吐量提升至每秒2300token,支持混合专家MoE大模型推理,算力有效使用率提升50%以上 [1] - 该超节点在新浪、硅基流动、中科院、面壁智能、360、讯飞等应用中助力推理交付效率或性能大幅提升 [1] 算电协同 - 数据中心能源管理面临供电稳定性、成本控制和碳排放管理三重挑战,传统能源使用方式难以满足需求 [1] - 重构电力供给侧引入新能源,挖掘算力需求侧负载灵活性,实现算电深度协同 [1] AI应用 - B端AI在内容生成、营销等传统应用场景有实质性推进,C端未来将加速出现新消费场景 [2] - 内容生成与营销方向应用普及,内容流量平台创作者和内容产量增速提升,AI与终端结合将带来更多业态增长 [5] 智能驾驶与机器人 - WAIC大会众多具身智能机器人和智能驾驶厂商参展,展示智能交互、运动控制和智驾方案 [5] - AI技术赋能智能驾驶算法迭代,智能辅助驾驶系统更智能安全,搭载车型增多;赋予机器人具身智能,应用场景泛化,成本降低,即将高速增长 [5] 投资建议 - 看好国内算力市场,关注进入国内产品供应链或有相关技术储备厂商,如寒武纪 - U、海光信息等;PCB厂商如胜宏科技、沪电股份等 [6] - 看好AIDC算电力协同、构网型技术等方向应用,关注国能日新、双杰电气等公司 [6] - 关注AI + 应用相关公司,包括蓝色光标、浙文互联等传媒互联网公司 [6] - 关注率先布局智能驾驶的整车车企,如比亚迪、吉利汽车等;零部件关注智能化、国产替代及机器人等成长赛道公司,如电连技术、耐世特等 [7]
开启RL Scaling新纪元,siiRL开源:完全分布式强化学习框架,支持超千卡规模高效训练
机器之心· 2025-07-29 15:44
强化学习扩展性瓶颈与趋势 - 当前顶尖基础模型(DeepSeek-R1、o3-pro、Gemini 2.5-pro、Claude-4)的卓越推理能力依赖大规模强化学习,RL Scaling成为大模型领域"军备竞赛"核心[1] - xAI发布的Grok 4在200,000块GPU集群上运行强化学习,推动后训练规模达到新高度[1] - 解决RL扩展性瓶颈是解锁下一代AI高级推理能力的关键战略[2] siiRL框架创新设计 - 采用多控制器范式和全分布式架构,将数据加载/计算/流转任务均匀分散到工作节点,消除单一控制器瓶颈[3][11] - 核心组件:DAG Planner(逻辑工作流分解)、DAG Worker(GPU绑定执行)、Data Coordinator(数据生命周期管理)[13][14][15] - 支持华为昇腾NPU,实现跨硬件平台兼容[3] 性能优势验证 - 在1024 GPU规模下实现近乎线性扩展,512卡时保持80.5%线性扩展效率[3][21] - PPO/GRPO算法训练中最高实现2.62倍吞吐提升,72B模型训练时基线框架出现OOM而siiRL稳定运行[19] - 数据密集型任务(64k长上下文)中性能优势从1.48倍扩大至2.03倍[26] 技术突破点 - 端到端训练吞吐最高提升7倍(VLM任务)[21][25] - 动态数据缓冲机制自动调整数据分片(数据并行度变化时)[17] - 收敛性验证显示在保持与基线相同精度的前提下大幅减少训练耗时[28] 行业应用前景 - DAG设计为多智能体系统奠定基础,未来将重点拓展MARL算法兼容性和复杂交互机制[29] - 全链路开源框架(代码100%开放)支持国产硬件,目标实现"大模型跑在中国芯"[33] - 产学研团队背景涵盖万卡集群建设者、CUDA开发者、芯片优化专家等[33]
大模型智塑全球产业新秩序论坛在沪举办
中国经济网· 2025-07-29 15:29
大模型技术发展趋势 - 大模型技术在智能体、多模态、开源等领域持续创新,成为全球共同发展方向 [1] - 大模型产业应用进入深水区,正在重塑全球产业格局与生态,需关注真实效果与实际价值 [1] - 7月28日上海举办"大模型智塑全球产业新秩序论坛",聚焦前沿产业突破与垂直领域应用实践 [1] 中国信通院与政府战略部署 - 中国信通院作为国家智库,通过深化研究、完善基础设施、参与国际治理三方面推进大模型产业高质量发展 [1] - 上海徐汇区贯彻"建成全国人工智能高地"战略,已形成产业链创新闭环,未来将加速构建大模型产业生态体系 [1] 行业合作与倡议发布 - 中国信通院联合10家机构发布"大模型开源安全倡议",提出构建安全标准体系、保障开源要素安全等四点倡议 [2] - 上海人工智能实验室等联合发布《终端智能体安全(2025)》,提出全方位安全防护体系,推动智能体应用安全发展 [2] 论坛组织与支持 - 论坛由世界人工智能大会组委会指导,中国信通院主办,多家单位协办和支持,打造大模型行业顶尖盛会 [3]
金工周报-20250729
中邮证券· 2025-07-29 15:29
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称**:OpenReasoning-Nemotron推理模型 **模型构建思路**:基于Qwen2.5架构,通过从6710亿参数的DeepSeek R1 0528模型中蒸馏提炼而成,旨在为数学、科学及代码生成等结构化任务提供高效推理支持[12] **模型具体构建过程**: - 利用NeMo Skills框架生成500万个涵盖数学证明、科学推导和编程解决方案的高质量数据轨迹 - 通过纯监督微调(SFT)而非强化学习进行训练,确保逻辑一致性和符号推理精准度 - 采用GenSelect算法实现"重型推理模式",通过并行启动多个智能体生成候选解并筛选最优答案 - 公式:GenSelect@64技术,在32B模型上将HMMT数学竞赛成绩从73.8提升至96.7[13] **模型评价**:在GPQA、MMLU-PRO和AIME24等基准测试中刷新同参数规模纪录,32B版本在AIME24获得89.2分,超越OpenAI的o3-high模型[15] 2. **模型名称**:Qwen3-Coder **模型构建思路**:以4800亿参数规模、原生支持256K上下文窗口的混合专家架构(MoE)为核心,实现开源编程模型的性能突破[19] **模型具体构建过程**: - 采用稀疏化MoE设计,总参数4800亿但每次推理仅激活350亿参数,包含160个专家网络并动态选择8个参与计算 - 使用7.5万亿token的语料库,其中70%为代码数据,覆盖80余种编程语言及20多种标记语言 - 通过Qwen2.5-Coder对低质量数据清洗改写,生成高质量合成数据 - 引入代码强化学习与长程强化学习,构建分布式系统并行运行2万个独立环境[19] **模型评价**:HumanEval pass@1正确率达93.7%,超越Claude 3.5的92.4%;在SWE-Bench Verified上以31.4%任务成功率首次超过GPT-4的30.9%[20] 3. **模型名称**:AI评审框架 **模型构建思路**:通过赋予AI评审员自主调用外部工具的能力,构建兼具效率与严谨性的混合评审体系[25] **模型具体构建过程**: - 采用三级决策机制:初始领域评估、工具调用环节(事实核查/代码执行/数学核查)、综合评审结论生成 - 工具优先策略,仅在无适用工具时回退至基线模型评审 - 模块化设计实现领域适配,数学核查工具可灵活替换为Wolfram Alpha等专业引擎[26] **模型评价**:将数学问题评审错误率从纯模型评估的28%降至6%,代码评审误判率下降逾40%[29] 模型的回测效果 1. **OpenReasoning-Nemotron模型** - AIME24得分:32B版本89.2分,7B模型78.2分,1.5B模型45.6分[15] - LiveCodeBench得分:从70.2提升至75.3[13] - HMMT数学竞赛成绩:GenSelect@64技术下从73.8提升至96.7[13] 2. **Qwen3-Coder模型** - HumanEval pass@1正确率:93.7%[20] - SWE-Bench Verified任务成功率:31.4%[20] - 上下文处理能力:原生256K扩展至1M token[20] 3. **AI评审框架** - 数学问题评审错误率:从28%降至6%[29] - 代码评审误判率:下降逾40%[29] - MMLU基准测试指标一致性:提升约15%[29] 量化因子与构建方式 (注:研报中未明确提及量化因子的构建内容,故本部分暂缺) 因子的回测效果 (注:研报中未提及量化因子的测试结果,故本部分暂缺) 以上总结严格基于研报中涉及的量化模型相关内容,未包含风险提示、免责声明等非核心信息。模型构建细节引用自原文技术描述部分,测试结果数据均来自基准测试报告[12][13][15][19][20][25][26][29]
最新公布,AI新成果!
中国基金报· 2025-07-29 15:01
头部券商AI技术应用成果 - 中信证券、中信建投、中金公司、华泰证券等头部券商在2025世界人工智能大会上展示"AI+"研究实践成果,涉及投融资主题论坛和科技金融创新论坛 [2] 中信证券AI系统与数字员工 - 发布全市场首套AI算法与市值管理相结合的上市公司企业级服务平台CapitAI-Link,利用大模型技术提供个性化决策支持 [3][4] - 推进AI数字员工体系建设,为每位员工提供"数字分身",实现"以一抵十"的效能跨越,构建人机协同工作生态 [4] 中金公司智能化投研平台 - 展示自主研发的中金点睛数字化投研平台及中金点睛大模型,限时开放用户注册通道 [5][6][7] - 累计保荐科创板上市公司50余家,融资规模超2000亿元,占科创板IPO融资总额约20%;硬科技直投项目逾1100个,累计投资超900亿元 [9] - 发布《科技金融》《具身智能:AI下一站》《人形机器人:商业与经济》等研究报告 [10] 中信建投AI产业发展研究 - 发布《AI新纪元:砥砺开疆・智火燎原》报告,贯穿AI垂直产业链核心环节,实现软硬件研究全链路贯通 [11][12] - AI大模型发展趋势:参数量规模扩大性能提升、强化学习提升推理性能、模态融合丰富、向AGI发展 [12][13] 华泰证券AI智能体应用 - 关注AI智能体应用落地机会,AI服务器有望取代智能手机成为最大科技硬件品类 [14][15] - 2024年全球数据中心应用AI芯片市场规模达1782亿美元(同比+77%),PC和智能手机芯片市场分别为539亿和352亿美元 [15] - 建议关注服务器产业链量价齐升机会,中国是美国外唯一具备完整AI产业链的国家 [16]
Al商业化应用有望加速落地!恒生科技ETF(513130)年内获30.19亿元资金加仓
新浪基金· 2025-07-29 15:01
2025世界人工智能大会 - 2025年7月26日-28日以"智能时代,同球共济"为主题的2025世界人工智能大会在上海举行,为人工智能产业高质量发展注入新动能 [1] - 受大会催化,恒生科技ETF(513130)获资金关注,7月28日单日净申购2.01亿份,份额攀升至374.82亿份,规模达281.49亿元 [1] 恒生科技ETF市场表现 - 截至2025/7/28,年内超187亿元资金净流入跟踪恒生科技指数的ETF,其中恒生科技ETF(513130)获30.19亿元加仓 [1] - 该ETF年内日均成交额达48.87亿元,流动性水平居同类前列 [1] - 恒生科技指数市盈率回落至21.58,处于近五年21.46%分位数水平,估值吸引力提升 [2] 恒生科技指数成分与AI产业 - 恒生科技指数涵盖AI产业链的算力基建、大模型开发、商业应用及终端生态等多环节 [2] - 前五大成份股为腾讯控股、小米集团-W、网易-S、阿里巴巴-W、比亚迪股份,均为AI领域龙头企业 [2] - AI产业正从技术探索向价值深耕转变,新兴技术加速在各场景落地转化为生产力 [2] 华泰柏瑞基金管理能力 - 华泰柏瑞基金是境内首批ETF管理人,保持18年ETF零差错运营纪录 [3] - 旗下标杆产品包括沪深300ETF(510300)、红利ETF(510880)等 [3] - 恒生科技ETF(513130)2021年至2025年上半年收益分别为-30.24%、-21.43%、-8.89%、21.13%、16.37%,与基准表现接近 [3] 产品交易特性 - 恒生科技ETF(513130)支持场内T+0交易,场外投资者可关注其联接基金(A类015310/C类015311) [2]
专访中金公司董事长陈亮:努力做好“科技金融”大文章
国际金融报· 2025-07-29 14:45
科技金融与人工智能发展 - 科技与金融的"双轮驱动"是人工智能跨越式发展的关键引擎,需要匹配科技实力的科技金融体系 [1] - 国家强调以科技创新催生新质生产力,金融活水激发创新动能,形成"科技—产业—金融"良性循环 [2] - 中金公司累计保荐科创板上市公司50余家,融资规模超2000亿元,占科创板IPO融资总额约20% [2] - 中金公司对硬科技直投项目逾1100个,累计投资金额超过900亿元 [2] 中金公司的科技金融服务案例 - 中金公司助力汉朔科技登陆创业板并募集资金11.62亿元,提升终端产线自动化水平 [3] - 中金公司作为唯一中资投行,助力小米集团完成55亿美元港股配售,推动智能电动汽车产能扩建 [3] - 中金公司完成上交所首单"实验室经济"科技创新公司债券发行,募集资金10亿元用于科技创新企业 [3] - 中金公司担任影石创新科创板IPO联席主承销商,募集资金19.38亿元用于智能影像设备生产基地建设 [4] 人工智能产业的市场前景 - 中国AI产业的市场需求到2030年将达到5.6万亿元,2024年至2030年总投资规模将超过10万亿元 [5] - 大模型驱动的新商业模式有望为金融业带来规模达3万亿元的增量商业价值 [7] - 人工智能具备通用技术特征,能在几乎所有经济活动中发挥作用,提高金融服务质量和效率 [5] 人工智能在金融领域的应用 - 大模型技术提升金融从业者展业效率,解决信息不对称问题,降低交易成本 [7] - 大模型技术创新客户交互模式,覆盖更广泛的中长尾客户,提供定制化金融服务 [7] - 大模型技术赋能投资、投研核心场景,提升投资决策的科学性与时效性 [7] 中金公司在AI领域的探索 - 中金公司对大模型进行前瞻性布局,在基础设施搭建、数据治理与运营等方面取得阶段性成果 [8] - 中金财富完成与DeepSeek-R1大模型的深度融合,升级智能投顾助手IC-Copilot [8] - 中金公司构建投顾服务领域"热点发现—资讯处理—策略生成"的三位一体服务生态 [8] 中国AI产业的发展优势 - 中国凭借超大规模市场、完备产业体系与海量应用场景,展现出强大的韧性与潜力 [9] - 中国加速人工智能在产业领域的深度赋能,推动效率革命与模式创新 [9] - 中国提升人工智能核心技术和产业链的自主可控能力 [9]
AI爆款营销的时代,已经来了
首席商业评论· 2025-07-29 14:44
AI时代,品牌的新考验来了。 2025年的消费市场,复苏中透着复杂。能在越来越复杂的市场中搞出声量,AI是一个关键赋能工具。但如何真正用好AI,是摆在所有从业者面前的痛点。 都知道流量为王,初创品牌如何摆脱短视频有量无质?运营人如何用AI一站式管理短视频?如何在AI助力下做到内容为王?有类似困惑的创业者不在少数。 很多人可能没听过筷子科技,它是一家专注于企业级AIGC(人工智能生成内容)创意智能生产和协作增长平台的公司,通过AI技术提升内容生产的效率和质量, 优化内容营销策略,也是当下AI时代助力企业运营的黑马公司代表。 本次分享交流主要围绕AI技术在内容创作、矩阵管理及品牌营销中的应用展开,陆智成在AI工具赋能视频剪辑、内容生成、账号运营、舆情管理等方面进行详细 阐述,满满干货。 01 流量为王时代,AI成了老板们的香饽饽? 对于传统企业营销,内容生产的局限性主要有几点。 第一是效率局限性 ,一个内容营销团队生产力的极限大概是每个月50条。如果企业想要做更大的量,要么平台付费投流,要么再聘请新团队,无论哪种方式,企 业的成本只能有增无减。 第二是创意瓶颈, 过去创意靠编导岗位,更多依赖经验和个人能力来产出相 ...