大模型智能体
搜索文档
数字政通“政通人和,百业具兴——人和大模型2.0行业智能体发布会”圆满召开
证券时报网· 2025-11-03 18:57
产品和战略发布 - 公司发布“人和大模型2.0”行业智能体,标志着从AI技术试点示范到全面推广“治理生产力”的新跨越 [1] - 新产品聚焦大模型智能体在智慧城市治理中的深度融合与实战落地 [1] - 发布会汇聚了住建、城管、应急管理、政务服务等多个地市政府部门与企事业单位的领导 [1] 技术能力与架构 - 人和大模型2.0通过构建“数据-算法-应用”智能体研发技术矩阵与MCP服务化架构,实现业务系统从“鼠标操作”到“自然语言交互”的范式变革 [2] - 平台以全链路数据运营体系为基石,依托AI工程化平台实现智能体的统一开发和高效运维,并与低代码工具链深度集成以降低融合门槛 [4] - 该技术体系实现了从通用能力到行业专用智能的跃迁,支撑在15天内完成行业大模型训练、5天内实现智能应用上线的快速交付能力 [4] 应用场景与落地 - 行业智能体已在北京、深圳、天津、福建、重庆、南京等多地落地 [3] - 深入五大行业应用场景:运管服领域实现建筑垃圾黑工地/黑消纳场监管;行政执法领域构建全程监督闭环;为城市生命线安全构建主动防护体系;驱动政务热线全流程智能化;借力“星揆计划”开拓低空治理新赛道 [2] - 具体智能体应用包括智能问数Agent、智能报告Agent和悟空大脑Agent,分别解决业务数据应用、分析报告撰写和城市大脑建设运营的痛点 [2] 生态合作与解决方案 - 公司与华为昇腾、华为云、百度智能云、海康威视等行业领军企业发布了四项联合解决方案 [5] - 联合解决方案包括:政务热线行业大模型联合解决方案、政务数字人联合解决方案、城市治理行业大模型联合解决方案、低空行业联合解决方案 [5] - 合作体现了以开放生态推进技术融合、以行业深耕驱动场景创新的发展路径 [6] 商业模式与市场影响 - 新产品基于公司在城市治理领域多年的业务理解,将数据资源与前沿大模型技术深度融合,驱动了公司商业模式的升级和创新 [6] - 政务AI Agent作为核心产品,通过为客户持续提供AI算力、模型优化和运营服务,未来有机会带来更稳定、可持续的订阅收入 [6] - 此举有助于公司在智慧城市赛道中抢占制高点,获取更多市场份额 [6]
高智商 ≠ 高财商?50天实盘测试:LMArena 高分王者也可能是「韭菜」
机器之心· 2025-11-02 11:10
项目概述 - 项目名称为LiveTradeBench,是一个在真实金融市场动态数据上运行的大语言模型交易与投资评测平台[11] - 该项目旨在让大模型“下场交易”,在真实市场的动态博弈中检验其感知、推理与决策能力,而非仅进行静态知识问答[3] - 研究团队来自伊利诺伊大学厄巴纳-香槟分校,项目已进行为期五十天的实盘测试,覆盖美股和去中心化预测市场PolyMarket[3] 核心创新点 - 采用实时流式数据,直接对接真实市场数据,让模型动态决策,彻底杜绝信息泄漏,相比以往依赖离线回测的工作是重大突破[14][15] - 引入组合级别的动态配置任务,要求模型在收益与风险间权衡,随市场信号调整资产比例,而非单一资产的买卖决策[16] - 设计多市场比较,通过跨市场(如美股与PolyMarket)系统评估模型的策略迁移、事件敏感度与长期判断力[17] 任务设定与智能体框架 - 将投资决策过程建模为部分可观测的马尔可夫决策过程,模型需根据有限信息在持续变化的环境中推理和行动[19] - 智能体在每个时间步接收观测,包含仓位信息、市场价格和市场新闻,并输出新的资产配置向量,形成完整的“观察-决策-反馈”闭环[20][21][22] - LLM被赋予完整决策闭环:通过工具使用实时抓取信息,通过记忆保留过往状态,通过推理进行链式思考并生成策略[25][26][27][28] 实测结果与发现 - 对21个主流LLM进行了50天实测,结果显示静态推理能力与动态决策能力无显著相关性,高智商不等于高财商[30][31] - 不同模型展现出独特的投资风格,有的激进追涨,有的稳健防御[31] - 结合实时市场动态与新闻信号后,模型的决策更为理性和稳定[31] 行业意义与未来展望 - 该平台标志着大模型智能体评测从文本理解扩展到环境反馈,从逻辑推理进阶到连续决策的新维度[34] - 为研究社区提供了全面开源、可复现、可验证的大模型实盘测试基准,所有数据源、决策记录和推理过程均公开[4] - 预示着未来智能体的发展方向应是在瞬息万变的市场中感知世界、管理风险和创造价值,而非仅在静态题库中取得高分[34]
数字政通发布新产品“人和大模型2.0”行业智能体
智通财经· 2025-10-31 19:32
发布会核心信息 - 公司于2025年10月30日召开以"大模型智能体"为核心的"人和大模型2.0"行业智能体发布会 [1] - 发布会聚焦大模型技术在智慧城市治理中的深度融合与实战落地 [1] - 新发布标志着公司从应用AI技术试点示范到全面推广"治理生产力"的新跨越 [1] - 公司通过构建"数据算法-应用"智能体研发技术矩阵加速智慧城市领域AI Agent落地应用 [1] 基础能力智能体 - 智能问数Agent汇聚了公司20多年来超5000个项目的管理经验并深入绑定生产数据 [1] - 智能问数Agent可接入MCP服务匹配需求并对统计结果进行二次加工 [1] - 智能问数Agent通过构建指标库与规则库辅助大模型精准获取数据实现数据的快速查询、精准分析和专业总结 [1] - 智能报告Agent致力于将数据转化为深度洞察与决策价值通过构建覆盖数据指标、问题成因、管理建议及案例模板的全域知识库 [2] - 智能报告Agent不仅能自动生成规范文本更能完成对主题的多维分析、精准定位与根因研判交付定制化报告 [2] - 悟空大脑Agent汇集300+城市大脑项目落地经验结合AI数字人技术打造能搭会建、能说会道、能想会动的"真"大脑 [2] - 悟空大脑Agent实现大屏的自然语言交互、数据深度洞察与指标智能预警构建城市决策的新交互生态 [2] 行业应用与影响 - 行业智能体包括城市治理五大领域的行业Agent驱动城市治理从"被动处置"迈向"主动预警" [2] - 在城市运管服领域实现建筑垃圾黑工地/黑消纳场的高效精准监管 [2] - 在城市行政执法领域构建全程监督闭环重塑执法监督新模式 [2] - 在城市生命线安全管理领域构建主动防护体系实现隐患高效排查和管线超期服役预警分析 [2] - 在城市政务热线领域驱动热线全流程智能化应用数智赋能基层减负 [2] - 在城市低空经济领域开拓智能化低空治理新赛道全方位拓展城市治理的深度与广度 [2]
云栖大会今开幕,阿里云将展示超大规模集群、分布式训练、推理加速等能力,首次展出高密度AI服务器和高性能网络架构
上海证券报· 2025-09-24 07:58
2025云栖大会核心看点 - 大会将于2025年9月24日至26日举行,主题为“云智一体·碳硅共生”,AI软件产品与新模型、Agent应用及AI服务器等基础设施硬件是主要看点 [1] - 阿里云将展示超大规模集群、分布式训练、推理加速等能力,并首次展出单柜支持144个计算节点的高密度AI服务器和新一代高性能网络架构HPN8.0 [1] - 通义大模型将带来“全尺寸、全模态”开源矩阵,魔搭社区将展现其超过7万个模型和1600万开发者的生态 [1] - 上百家企业的AI落地实践、200多个Agent应用和300款AI终端产品将参展 [1] 软件生态链公司AI布局 - 阿里云生态链软件公司以“模型+行业场景”为核心,在金融、政务、医疗等领域落地智能体解决方案 [2] - 新致软件以“新致新知人工智能平台”等为核心基座,在金融领域推出营销展业、智能核保等Agent,在企业服务领域上线司法Agent“新知智法”,在汽车行业推进“营销智能工牌”Agent [3] - 中科软持续推进AIGC技术研发,在保险领域试点保险MaaS平台、智能营销平台等应用,在政务领域提供训练推理一体化平台,在医疗卫生领域提供肺结核智能识别等多模态AI应用 [4] - 博彦科技依托“人工智能计算平台”和“AI Agent平台”为行业客户部署AI应用,在金融领域构建全场景AI解决方案并中标多个行业级AI项目 [4] 硬件生态链公司进展与投入 - 阿里巴巴集团2026财年第一季度对AI+云的资本支出投入达386亿元,同比增长220% [6] - 在RISC-V芯片领域,芯原股份的半导体IP已获10余款RISC-V芯片采用,并为20家客户的23款芯片提供定制服务,项目正陆续进入量产,公司拟收购芯来科技以加快CPU IP布局 [6] - 在x86 CPU领域,海光信息深化与整机厂商合作,加速产品在客户端导入 [7] - 在IDC领域,数据港已在多地建成35座数据中心,实现国家“东数西算”战略布局;润泽科技2025年上半年合计新增交付220MW算力中心 [7] 行业合作与生态建设 - 阿里云曾联合信雅达、新致软件、中科软、博彦科技等18家合作伙伴共同发布七大场景多个智能体 [3] - 阿里云在自主算力体系上拥有“CPU+GPU”双自主能力,CPU绑定RISC-V生态,GPU依靠平头哥,生态建设能力较强 [6]
RL 圈的夏夜之约!12 人唠嗑局:当强化学习撞上大模型 Agent
机器之心· 2025-07-08 12:09
强化学习新范式探索之夜活动概况 - 活动主题为强化学习新范式探索 聚焦从基础模型到Agent的进阶之路 [3] - 活动时间定于2025年7月26日19:00-21:10 与WAIC展会形成联动 [3] - 活动地点位于上海世博展览馆附近 采用12人封闭式深度交流模式 [3][7] 核心讨论议题 - 探讨强化学习与大模型智能体的协同效应 分析技术组合优势 [4] - 辩论训练推理环节的策略选择 平衡探索新方法与保持稳定性 [4] - 研究智能体对齐评估体系 提升智能体执行效率与可控性 [4] 参会专家阵容 - 清华大学交叉信息研究院助理教授吴翼 代表学术理论研究前沿 [5] - OPPO AI个性化实验室负责人周王春澍 提供产业落地实践经验 [5] - Pokee AI CEO朱哲清 分享创业公司技术商业化案例 [5] 目标参会群体特征 - 学术界研究人员需携带最新研究成果与未解决问题 [6] - 产业界从业者需准备实际应用案例与解决方案 [6] - 创业公司代表需提出产品技术痛点与合作需求 [6] 活动差异化价值 - 采用小众深度交流形式 确保每位参与者充分输出观点 [7] - 设置非正式交流场景 促进跨领域灵感碰撞 [7] - 覆盖学术到产业全链条资源 构建高质量技术社交网络 [7]
【焦点】香港中文大学(深圳) 赵俊华:大模型智能体在电力系统中的应用初探
搜狐财经· 2025-06-29 21:01
人工智能发展历程 - 决策式AI阶段(1950s~1980s):以逻辑程序和专家系统为主,1956年首次人工智能研讨会召开标志着领域诞生,1965年Logic Theorist程序实现数学证明推理[4] - 技术积淀阶段(1980s~2010年):1986年Backpropagation算法突破,1997年Deep Blue击败国际象棋冠军,2006年深度学习技术发明[4] - 快速发展阶段(2011-2016年):2011年IBM Watson在Jeopardy获胜,2014年GAN出现,2015年AlphaGo战胜围棋冠军[4] - 爆发阶段(2017年至今):2017年Transformer架构提出,2018年GPT/BERT发布,2022年ChatGPT推出,2024年Sora面世[4] 大语言模型技术架构 - 预训练三要素:大数据(无标注文本)、大模型(深度神经网络)、大算力(并行计算集群)[11][12][13] - 训练流程:预训练(月级/千级GPU)→有监督微调(天级/百级GPU)→强化学习(天级/百级GPU)[22] - 微调技术:LoRA方法仅需训练百万参数,效果媲美全参数微调,GPU需求降至3090*4级别[15][20] - 强化学习:通过RLHF量化人类喜好,训练打分模型优化最终输出[18][19] 智能体关键技术 - 工具使用:通过API调用、搜索引擎、代码执行等扩展能力[26][27] - 任务分解:实现复杂任务的子目标拆解与试错机制[28][30] - 长期记忆:存储经验、知识、技能,支持读写持久化[31][32][33] - 自主学习:结合权重微调、提示优化、自我反思等多路径提升[35][36][38] 电力系统应用场景 - 负荷预测:ITA-LF框架整合新闻文本,预测准确率达94.7%,显著优于LSTM(82.08%)和SARIMA(89.93%)[64][68][71] - 调度系统:构建70b参数调度大模型集群,支持检修单成票(94.46%准确率)、规程检索问答(RAG召回率58.7%)[77][91][94] - 市场仿真:多代理模型实现碳市场均衡分析,量化价格弹性系数(煤炭企业7,278吨/元)[113][115][120] - 机理研究:AI4S框架处理10万节点电网建模,年算例超10亿,推动动态建模与稳定性分析[125] 技术融合路径 - 模型融合:推理大模型+PINN+因果模型+符号模型,保留准确性同时提升计算速度[54][56][58] - 人机协同:必要场景引入人工反馈,作为最终决策质量判定者[56][59] - CPSSE仿真:结合真人、因果模型和大语言模型,构建数字孪生系统[62] - 范式演进:从参数学习(机器学习)→提示工程(大模型)→机制工程(智能体)的能力获取转变[40]
大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI
机器之心· 2025-05-30 12:16
大模型智能体可用性瓶颈 - 当前大模型智能体应用主要集中在专业领域如代码生成、科研辅助等,在大众日常场景中普及率较低 [1] - 核心制约因素并非模型能力不足,而是Agentic ROI(投资回报率)未达实用化门槛 [1][3] - Agentic ROI衡量信息收益与使用成本比值,需同时满足信息质量阈值和成本节省比例要求 [4] Agentic ROI关键构成要素 - Information Quality:智能体生成信息的准确性和完整性 [5] - Human Time/Agent Time:人类与智能体完成任务的耗时对比 [5] - Interaction Time:用户与智能体交互过程的时间消耗 [5] - Expense:模型调用和API使用的经济成本 [5] 当前应用场景矛盾 - 高人力成本场景(如科研)因替代效应显著而ROI较高 [7] - 日常场景(如电商)因任务简单且交互成本低,智能体边际价值不明显 [7] - 额外交互成本和延迟导致日常场景Agentic ROI偏低 [7] 发展路径优化策略 - 采用「之字形」发展模式:先规模化提升信息质量,后轻量化降低使用成本 [8][9] - OpenAI模型系列(o1-mini到o3-mini)验证该路径有效性,新一代小模型在保持性能同时降低60%推理费用 [9] 规模化提升阶段 - 预训练规模化:扩大模型参数/数据量,扩展上下文窗口和记忆机制 [11] - 后训练规模化:通过用户反馈构建数据飞轮实现持续优化 [12] - 推理时规模化:构建多模态世界模型,支持复杂任务处理 [13] - 多智能体协作和工具调用扩展可提升任务分解能力 [15] 轻量化优化阶段 - 记忆机制复用历史知识减少重复计算 [18] - 模型压缩技术可降低50%推理延迟而不显著影响性能 [18] - 优化推理策略避免冗余链条,硬件升级(如Groq芯片)提升实时响应 [18] - 主动意图理解设计可降低30%用户交互时间 [18]
探元计划香港站|AI 赋能历史溯源,解码九龙寨城中华文脉基因
腾讯研究院· 2025-05-23 15:47
探元计划2024香港场景活动 - 活动聚焦文化与科技融合 推动文化遗产数字化保护 来自文化 技术 运营领域的专家共同参与[1] - 活动包括实地调研九龙寨城公园 香港历史博物馆 现场体验大模型智能体 AI互动叙事游戏与三维虚拟空间[3] - 项目成果将在深圳文博会和香港书展展出[13] 项目背景与发起方 - 探元计划由国家文物局科技教育司指导 中国文物信息咨询中心 腾讯SSV数字文化实验室等联合发起[3] - 香港联合出版集团与华粹星光公司合作开展"在九龙城 阅见香港"项目[3] - 项目从全国81个文化需求场景中脱颖而出 入选探元计划六大文化共创场景[4] 项目技术应用 - 开发多模态知识智能体 支持两文三语交互 助力用户了解九龙城历史并创作故事[4] - 设计AI互动叙事游戏 以寻物解谜玩法激发历史文化探索兴趣[4] - 构建九龙寨城三维虚拟空间 还原不同历史时期风貌[4] 项目意义与目标 - 通过数字科技活化出版资源 构建AI赋能的沉浸式文化场景[9] - 增进香港居民对国家身份认同 向海外展现中华文化影响力[9] - 解决历史记忆碎片化 青年认知片面化等文化传承挑战[10] 专家研讨重点 - 强调技术与文化双向赋能 借助大模型提升传播精准性[11] - 推动用户参与从单向输出向共建共享转变[11] - 聚焦教育与文旅场景 构建可持续发展模式[11] 项目创新路径 - 技术应用创新:重构故事创作生产线[10] - 内容传播创新:游戏化沉浸体验激活传播场景[10] - 持续生态创新:开放知识库鼓励社会共创[10]