大模型技术

搜索文档
积极拥抱人工智能 构建大模型实践新范式
中国证券报· 2025-07-03 10:02
大模型技术应用 - 公司自主研发"小江智脑"大模型应用平台,聚焦办公、营销、运营管理、信贷管理、技术研发五大领域,实现成本优化与效率提升 [1] - 平台已在PC端和移动APP端部署数十项业务场景,包括办公领域11项助手应用(如知识问答、会议纪要生成)、营销领域4项工具(如AI陪练)、运营管理领域OCR方案(字符识别精度99.5%) [1][2] - 技术研发领域部署6项专业助手(如Java/Python开发辅助),信贷管理引入多模态图片质检技术提升合规性 [2][3] 风控数智化体系 - 与江苏省公安反诈中心成立联合实验室,实现黑灰名单数据跨行高效流通,2024年累计拦截涉案账户245户,冻结资金1629万元 [3][4] - 开发反洗钱AI小助手和实时反欺诈模型,集成多模态鉴伪技术升级身份验证方案 [3] - 信贷调查环节推出语音录入与AI客户画像功能,提升信息录入效率并强化风控可追溯性 [4] 运营效率提升 - 大模型图像采集实现实时自动审核,2024年节约工时40万小时;企微客服助手效率提高16倍,有效回复率提升30% [4] - 代码辅助工具使用达14.2万人次,生成7621.4万字符,编码效率提升25% [4] - OCR方案在票据信息录入中条目抽取精度达95%,集中对账环节提升他行交易明细处理效率 [2] 区域协同与平台建设 - 2024年11月起联合江苏农商行落地"AI大模型智能体平台",形成四大功能矩阵(如知识库管理、智能体构建) [5][6] - 平台完成三次版本迭代,部署向量数据库等核心组件,开发文本润色、合同审核等工具提升业务流程标准化 [6] - 技术应用为区域农商机构提供可复制的智能化解决方案,强化省域技术协同效益 [5]
暑假报辅导班 会给孩子选低价AI课吗|「教」量
21世纪经济报道· 2025-07-02 22:22
行业趋势 - 2024年暑期曾有家长给孩子报近10个辅导班或花费近10万元 反映传统辅导班存在高成本和奔波劳累的痛点 [1] - 2025年中国AI+教育市场规模预计超700亿元 2030年将达近三千亿元 复合增速47% 显示AI教育市场潜力巨大 [11] - AI教育产品单节课程价格低至10元 仅为传统辅导班价格的几十分之一 大幅降低学习成本 [2][10] 技术突破 - 大模型在题目理解领域取得突破性进展 催生一批原生教育应用 实现题目答疑功能 [3] - 新AI课程采用大模型技术实现真互动 可理解学生随意表达并进行反馈 接近真实教学场景 [5] - 课程内置思维链(CoT)技术 模拟人类逐步思考过程 生成结构化中间推理步骤 提升教学针对性 [9] 产品创新 - 新东方发布"AI 1对1 S体系原版营" 包含完整英语学习流程 实现课上课下全流程AI辅导 [4] - 洋葱学园推出AI私教动画课 支持课程暂停实时提问 AI结合上下文针对性解答 [7] - 高途8月将上线毛豆爱学AI课堂 提供1对1和1对4两种班型 [5] - 豆神教育内测"AI多对一直播课" 设置举手发言按钮实现即时提问 [8] 商业模式 - AI课主要成本为研发成本 随着用户增加迅速摊薄 具备规模效应 [10] - 动画课研发成本高昂 每节5-8分钟课程平均研发周期2个月 成本超10万元 [9] - 部分公司选择使用数字人教师增强亲和力 部分则主动回避数字人形象 策略分化明显 [11] 发展挑战 - AI语音技术尚未达到真人水平 "AI味"明显 数学公式等互动内容播放效果不佳 [11] - AI生成内容准确性存疑 复杂推理场景易出错 如部分大模型在高考数学中表现不佳 [12] - 动画课程需高度结构化 内置标签和思维链 研发门槛较高 [9]
阿里与荣耀进一步深化AI 生态合作
新浪科技· 2025-07-02 20:40
产品发布 - 荣耀发布全新年度折叠旗舰手机荣耀Magic V5,搭载阿里巴巴基于通义千问打造的高德、飞猪旅行两个智能体(Agent)[1] - 该机型在模型层搭载了通义千问3、VL等大模型,支持手机文档深度思考问答[1] - 双方将基于通义大模型探索语音、视频模式下的实时互动,这是阿里首次整合大模型及垂直场景Agent应用于智能手机终端[1] 功能亮点 - 荣耀展示基于通义千问开发的"一语问屏"功能[1] - 用户可通过荣耀AI助手YOYO上传各类文档后进行深度思考问答,并实现联网知识挖掘[1] - 通义千问3、VL模型支持语音模式下的口语陪练、情感陪聊、商务谈判、角色扮演等互动场景[1] - 视频模式下可识别真实物理世界并与之实时互动[1] 生态合作 - 高德、飞猪旅行两个Agent率先接入荣耀Magic V5,用户可通过YOYO直接调用相关Agent执行指令[2] - 两个Agent还接入了荣耀智能体商店、YOYO建议、服务负一屏卡片等入口[2] - 飞猪旅行Agent支持行程规划、目的地探索、景点美食推荐及旅行服务预订[2] - 高德Agent提供基于位置的吃喝玩乐推荐及一体化出行服务,持续拓展更多场景[2] 技术整合 - 阿里与荣耀达成AI Agent生态领域深度合作[2] - 双方将共同探索将大模型技术能力延伸至更多智能终端设备与应用场景[1]
赛道Hyper | 腾讯混元开源Hunyuan-A13B:1张AI卡搞定
华尔街见闻· 2025-07-02 20:15
腾讯混元开源混合推理MoE模型Hunyuan-A13B - 公司开源首个混合推理MoE模型Hunyuan-A13B 总参数800亿 激活参数130亿 在推理效率上有优势 [1] - 对比同等架构开源模型 该模型推理速度提升明显 计算资源消耗较低 [1] - 在Agent工具调用和长文处理方面表现突出 具备差异化竞争力 [1] 模型技术特点 - 采用多Agent数据合成框架 整合MCP协议、沙箱、大语言模型模拟等环境 通过强化学习提升工具调用能力 [2] - 支持256K原生上下文窗口 能处理学术论文、法律条文、商业报告等长文 缓解上下文丢失问题 [3] - 预训练使用20万亿高质量网络词元语料库 覆盖多领域知识 [5] - 构建MoE架构Scaling Law联合公式 为模型设计提供量化指导 [5] - 后训练采用多阶段方式 针对性提升推理、创作等能力 [5] 开发者友好性 - 支持中低端GPU卡部署 如NVIDIA GeForce GTX系列 [4] - 接入主流开源推理框架生态 支持INT4/INT8等量化格式 吞吐能力达前沿模型2倍 [4] - 通过Github、Huggingface等平台开源 腾讯云提供API [4] 配套数据集 - 发布ArtifactsBench数据集 包含1825个任务 覆盖9大领域 评估代码生成能力 [5] - 发布C3-Bench数据集 含1024条测试数据 聚焦Agent场景能力评估 [6] - 数据集填补行业评估标准空白 推动大模型评估体系完善 [6][7] 应用现状与规划 - 已在腾讯内部400多个业务应用 日均请求量1.3亿次 [6] - 未来计划推出0.5B-32B dense模型和13B MoE模型 适配不同需求 [6] - 将持续开源多模态基础模型及插件模型 丰富大模型生态 [6]
【高端访谈】“自动化生成授信尽调报告,人机协同重构银行智慧内核”——专访中国光大银行副行长杨兵兵
新华财经· 2025-07-02 16:38
场景应用 - 大模型技术在银行核心场景深度实践,包括客户经理赋能、合规运营、远程坐席、分行智能化经营等[2] - 授信尽调报告生成时间从7天压缩至3分钟,基于大模型和大数据技术自动获取加工行内外数据[2] - 智能政策问答助手平均响应时间20秒,提升政策解读一致性与决策规范性[3] - 远程坐席单通电话处理时间缩短15秒,坐席满意度达90%[3] - 经营分析画像自动化报告覆盖807项业务指标,实现秒级响应[3] 效率提升 - 授信尽调智能报告功能已推广至39家一级分行,服务近2000名客户经理,生成5000余份报告,平均耗时3-5分钟[3] - 自动生成报告质量取决于外部数据丰富度与内部数据颗粒度[2] - 大模型嵌入办公流程辅助坐席人员处理客户问题并生成工单总结[3] 未来规划 - 大模型将整合全行知识库打造智能助手,实现跨渠道服务协同[4] - 运用多模态数据构建深度客户画像,驱动精准营销与个性化推荐[4] - 辅助银行从经验决策转向科学决策,分析宏观经济与行业周期[4] - 深度推理能力用于分析企业多维度信息,构建前瞻性风险预警机制[4] 组织适配 - 光大银行成立总行一级部门统筹模型管理与数字化转型[6] - 推动转向以"人机协同、任务驱动"为核心的小单元协作体系[6] - 中小银行可利用架构层级简单、决策链条短的组织敏捷性优势[7] - 建议中小银行集中资源于核心业务领域,探索行业共研共创机制[7] 风险防控 - 构建四道防线应对AI幻觉:源头拦截、数据治理、模型协同、责任归属[9][10] - 采用"大模型统筹决策+小模型精准评估"协同运营机制[10] - 建立"谁应用、谁审核、谁负责"责任机制,要求业务人员合规审核[10]
淘宝推荐大模型RecGPT上线,“猜你喜欢”精准度大幅提升
凤凰网· 2025-07-01 12:25
技术发布 - 淘天集团发布自主研发的百亿参数推荐大模型RecGPT,标志着淘宝首页"猜你喜欢"功能迎来基于生成式推荐(AIGR)技术的全面革新 [1] - RecGPT以淘宝星辰LLM大模型为技术底座,通过强化学习训练用户历史行为数据,增强电商场景下的推理分析能力 [1] - 该模型能够深度解析用户在淘宝平台超过十年的消费轨迹,并运用多模态认知技术整合数亿级商品的图文信息 [1] 性能表现 - 搭载RecGPT的推荐系统实现用户点击量两位数增长,用户加购行为和页面停留时长均提升超过5% [1] - 系统展现超前预判用户需求的能力,例如根据婴儿用品购买记录推断家庭状况变化并预测不同阶段的商品需求 [1] - 在购物节期间能结合用户品牌偏好提供精准的促销商品组合 [1] 功能创新 - 实现个性化推荐理由自动生成,为每件商品配备定制化推荐文案 [2] - 推荐信息流包含特色标注如"新晋顶流不来看看吗?"和地域化提醒"杭州梅雨季防潮神器"等 [2] - 提升用户与推荐内容的互动体验 [2] 技术体系 - 该技术是淘天集团AIGX技术体系的重要应用成果 [2] - AIGX已构建覆盖电商全业务场景的AI解决方案矩阵,包括索引、推荐、出价、拍卖、创意、数据等 [2] - 在淘宝天猫多个业务线实现规模化部署 [2] 行业影响 - 体现电商平台在平衡转化效率与用户体验方面的技术探索 [2] - 通过大模型技术重构推荐算法,有望同时提升商业转化和用户体验 [2] - 这一模式或将推动整个电商行业的技术演进方向 [2]
南威软件20250630
2025-07-01 08:40
纪要涉及的公司 南威软件、长寿健康公司、茶寿健康、蓝 V 公司、蓝威公司 纪要提到的核心观点和论据 南威软件 - **转型优势**:转型是使命延伸和能力赋予,拥有在复杂数据系统推动制度创新和普惠服务的独特基因,是制度创新设计者推动者、有国家级信任基石、具备 G 端加 B 端加 C 端全链路整合实战经验,可将 G 端能力转化为大健康赛道竞争优势[2][3][4] - **转型策略**:采取明确定位和资源积累策略,重构传统业务、自建行业大模型、布局 B 端业务、推出第二增长曲线强化经营质量[23] - **算力布局**:2021 年申请建设创意中心,2024 年获批,预计建成后算力中心规模达 20,000P,超 2023 年全中国总算力[3][27] - **应对政府投入不足策略**:采取只做有利润、有现金流项目策略,明确经营目标,2025 年上半年接近实现现金流为正,一季度增长 58%,二季度预计增长更快[24] - **大健康赛道优势与风险**:有十多年数字化健康经验、实现大模型与智能体商业闭环应用落地、将推出茶座商城及生态系统;面临市场竞争压力和技术研发与应用落地挑战[25] - **大模型和智能体应用独特之处**:专注行业应用,实现商业闭环,为客户和生态合作伙伴创造价值,实现平台价值变现[26] - **商城业务布局策略**:通过差异化和个性化方案布局,重点发展个性化营养、运动方案及成套医疗设备,与生态伙伴合作,利用软件能力激活硬件价值,通过 AI 能力和平台为客户提供精细化推荐[34] - **药品推荐精细化及市场推广**:长期维护用户健康数据,根据用户行为推荐适合药品,串联优质医疗资源,为用户提供更好治疗选择[35] - **年底计划**:2025 年年底在国家政策支持下继续推进清欠工作[36] 长寿健康公司 - **核心商业模式**:围绕提供高效智能大健康解决方案,通过大模型技术实现个性化医疗干预、高效医患沟通和智能疾病风险预测等功能,提升医疗服务质量与效率[5] - **盈利来源**:个人智能体订阅费用、企业客户定制解决方案、政府及公共机构合作项目、数据分析与咨询服务、广告收入[7] - **会员制服务**:计划推出年费 5,999 元和 4,999 元的会员制服务,提供上门采血和全面检测[32] 茶寿健康 - **发展目标**:未来三年为 C 端消费者提供个性化、高质量健康管理服务[10] - **成功衡量指标**:从健康价值、健康服务、用户心智三方面衡量,关注平台价值、数据价值与社会价值等本质指标[11] - **研发投入**:拥有独立预算并优先保障研发投入,希望不久实现盈亏平衡,为南威软件贡献利润和价值[13] - **业务合作**:有望与华为在医疗工程领域合作;计划将业务与地方政务 APP 结合[17][18] - **知识库情况**:健康大模型整合北大医学部及三甲医院专家知识库,部分具有排他性知识产权,未来将扩大与各领域专家合作[19] - **差异化优势**:超越垂直问答机器人局限,实现更广泛、综合应用[20] - **用户体验提升**:与大量穿戴设备合作,计划引入更多生态合作伙伴,构建软硬件一体化数据采集终端体系,规划建立线下检测机构[30] 蓝 V 公司 - **2024 年财务表现**:应收账款回款近 20 亿元,现金净流量达 3.9 亿元,实现现金流为正[37] - **海外市场发展**:2024 年拿下阿尔及利亚国家平台项目,2025 年 7 月一期上线,规划二期扩展到 300 个审批事项,与华为合作是成功重要因素[39] - **人工智能进展**:通过人工智能重构数智公安社会治理,大模型智能体推理机产生 2000 多万元订单,推广面向企业端的大模型一体机推理机并产生收益[40] 蓝威公司 - **疫情后发展战略**:重构业务,开启第二增长曲线,采用人工智能重构传统业务,从底层建设大模型智能体,实现商业落地与闭环应用,从 G 端走向 C 端[44] - **数据要素布局**:早期布局多种数据工具,支持数据交易,若政府数据产生效益,将成为最大受益者[43] 其他重要但是可能被忽略的内容 - **AI 医疗产品现状及资质申请**:当前 AI 医疗产品包括影像辅助决策和手术导航类软件,需通过三类证,健康大模型和临床决策支持系统未纳入三类证范围,团队有丰富三类证经验,未来紧跟政策申请资质[16] - **数据要素流通挑战及解决办法**:数据要素流通需解决隐私计算、可信流通等技术问题,通过人工智能手段解决,第一步由政府层面先行运营和共享内部数据[43] - **蓝威公司估值模型**:传统估值模型不适用于当前蓝威公司,应考虑其从 G 端走向 C 端的全新定位[45]
助力3000亿参数昆仑大模型,科大讯飞有何硬实力?
和讯网· 2025-06-30 14:44
昆仑大模型发布 - 由中国石油、中国移动、华为公司和科大讯飞联合打造的3000亿参数昆仑大模型正式发布,标志着中国石油在人工智能领域迈出关键一步 [1] - 昆仑大模型是能源化工行业首个通过国家备案和首个通过中国信通院油气大模型系统能力评测的行业大模型 [1] - 该模型成为中国石油人工智能发展的重要里程碑,也是我国能源化工行业大模型建设的标志性成果 [1] 技术能力与场景应用 - 昆仑大模型的语言大模型参数从700亿提升至3000亿,视觉大模型参数从3亿提升至44亿,多模态大模型参数从160亿提升至800亿 [2] - 同步落地100个创新应用场景,覆盖勘探开发、炼化、装备制造、销售等全产业链 [2] - 科大讯飞重点参与建设了3000亿参数的语言大模型及众多专业、场景大模型,打造了32个场景应用 [3] - 科大讯飞与中国石油、中国移动等央国企合作完成了昆仑大模型的多次迭代,训练了全国产化行业模型和一批专业模型、场景模型 [3] 科大讯飞的技术实力 - 科大讯飞自主研发的讯飞星火大模型在中文领域的文本生成、知识问答、数学能力3个维度超越了ChatGPT [4] - 讯飞星火X1是基于全国产算力训练的具备深度思考和推理能力的标杆模型,在数学、代码、逻辑推理的表现更加优异 [4] - 科大讯飞承建的语言模型在行业理解与行业推理能力上的综合精度分别超出国内主流通用大模型6.51%和6.53% [4] 差异化战略与市场竞争力 - 科大讯飞在行业大模型领域制定了三大差异化战略:坚持全国产化、深入研究行业、组建"星火军团"推动落地 [6] - 形成了"通用大模型+专业大模型"的差异化市场竞争力,成为行业领先的全栈自主可控大模型厂商 [6] - 已支持包括中国石油、中国海油、国家管网等央国企及20多个行业头部企业建设行业大模型 [6] - 2024年由央国企发起的大模型相关采购项目中,科大讯飞中标数和中标金额均居第一 [6] 行业影响 - 昆仑大模型是央国企改革深化提升行动重点改革任务的典型案例 [7] - 大模型技术正不断在各行各业催生出与AI融合的业务新范式 [7]
华为首个!重磅发布!
证券时报· 2025-06-30 12:37
华为开源大模型技术 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B模型性能 - Pro MoE 72B模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为开发者大会2025发布内容 - 公司发布盘古大模型5.5,包含五大基础模型,分别面向NLP、多模态、预测、科学计算、计算机视觉领域 [3] - 同时发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [3] 盘古Ultra MoE模型 - 公司推出参数规模高达7180亿的盘古Ultra MoE模型,是全流程在昇腾AI计算平台上训练的准万亿MoE模型 [4] - 发布该模型架构和训练方法的技术报告,披露众多技术细节 [4] 全栈国产化成果 - 盘古大模型基于昇腾云的全栈软硬件训练而成,实现从硬件到软件、从训练到优化的全流程自主可控 [4] - 在集群训练系统性能上实现业界领先,完成国产AI基础设施自主创新能力的验证 [4] 行业应用成果 - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 五大盘古行业思考大模型(盘古医学、盘古金融、盘古政务、盘古工业、盘古汽车)同步上线 [4] 开源战略意义 - 开源盘古模型有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [5] - 吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型赋能千行百业 [5]
零帧起手AI Agent,一文看懂「金融智能体」
36氪· 2025-06-28 16:02
核心观点 - 2025年是AI Agent从前沿技术到应用落地的进阶之年,金融行业迎来智能体时代,头部金融科技公司如蚂蚁数科、奇富科技已发布相关产品[1][2] - 金融智能体具备自主性,能感知环境、推理决策、规划执行复杂任务并持续进化,相比传统RPA和数字化工具实现质的飞跃[7][9][11] - 金融智能体通过五大颠覆式潜力重塑行业生产力:端到端自动化、实时响应、复杂任务执行、持续学习优化、降低服务门槛[16][17][18][19][20] - 应用场景已渗透至信贷、财富管理等核心业务环节,蚂蚁数科探索超100个深度应用场景覆盖银行/证券/保险等领域[22][24][26] - 技术落地面临数据孤岛(40%企业存在50+孤岛)、人才缺口(2030年达500万)、高投入(百万量级)等挑战[29][30][31] 技术演进 - 传统RPA需预设规则仅能处理固定流程,金融数字化阶段实现部分去人工化(如网商银行"310模式"、保险AI核保)[5][6] - 大模型技术赋予AI自然语言理解/生成/推理能力,金融智能体将其转化为业务执行力实现"端到端交付"[11] - 智能体具备"感知-推理-规划-执行-进化"闭环机制,能灵活处理超纲问题并持续自我优化[9][11][19] - 蚂蚁数科定义金融智能体四大要素:金融大模型、知识库、工具集、安全评测体系[12] 行业应用 - 信贷领域:奇富科技推出"信贷超级智能体"实现业务流程重构[22] - 财富管理:智能体可分析客户画像/持仓/市场变化,提供"千人千面"的资产配置建议[24][26] - 应用场景覆盖客户服务、风险管理、产品创新等六大领域,银行/证券/保险均受益[22] - 单智能体解决简单需求,多智能体系统实现跨领域协作形成虚拟职场生态[32] 实施路径 - 建议从具体业务场景切入试用,逐步扩展至多智能体协同[32] - 需配套解决数据孤岛问题(孤岛导致模型精度下降20%-30%)[29] - CEO直接参与对EBIT提升效果显著,需战略级重视[35] - 蚂蚁数科总结四条落地路径(具体内容未披露)[33]