大模型

搜索文档
神州鲲泰发布业界首款鲲鹏技术路线大模型训推产品
证券时报网· 2025-07-29 10:27
发布现场,神州数码信创业务集团副总裁、研发中心总经理周川表示,大模型的价值在于实际应用到千 行百业。神州鲲泰系列产品的设计初衷,就是用更高性能、更具性价比的产品,让每个行业都能真 正"用得上、用得起"大模型。 作为华为"鲲鹏+昇腾"合作伙伴,神州鲲泰此次发布的两款新品是双方技术协同的重要成果。产品从处 理器选型到架构设计阶段,便与鲲鹏技术团队深度联动,不仅实现硬件性能最大化释放,更同步接入鲲 鹏+昇腾生态的软件栈,形成"端-边-云"一体化的算力网络。 据相关行业趋势预测,2025年国内大模型相关算力需求将持续增长,国产服务器市场潜力巨大。神州鲲 泰此次推出的新品,正是顺应这一趋势的关键布局,以技术创新与生态开放,推动算力基础设施向高性 能、高性价比演进,让更多行业告别"算力焦虑",加速迈入大模型驱动的智能时代。 2025世界人工智能大会(WAIC2025)日前在上海盛大启幕。作为信创与AI算力融合领域的重要参与者, 神州数码(000034)旗下品牌神州鲲泰在大会上正式发布两款年度新品,业界首款基于鲲鹏技术路线的 大模型训推一体服务器KunTai R624K2及推理服务器KunTai R622K2,在持续强化自 ...
互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议
南方都市报· 2025-07-29 09:53
7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在"大模型治理和有序发 展生态分论坛"上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有 专家指出,互联网数据将在2026年左右被大模型训练"耗尽"已成行业共识,要建设新的高质量数据集, 应从垂直行业获取、通过"众包众创"方式与前沿学校学者开展合作等实现。 论坛现场 对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过 程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其 上游产业需求大量增加。 他强调,合成数据通常存在缺陷、误差、歧视等问题。原因在于合成数据也是基于现有数据生成或是受 到现有数据的影响。"如果算法有偏见的话,它可能会带来更大的数据偏见,导致'Garbage in garbage out'。"另一方面,合成数据存在伦理、公平性和隐私泄露的风险。"通过合成数据的'逆向工程',能够 猜到原本数据中包含的一些个人隐私。" 施佳樑也表示,如今行业内已基本达成共识,无论国内国外,2026年左右互联网数据即将被大模型训练 耗尽。那 ...
7月29日早间新闻精选
快讯· 2025-07-29 08:27
中美经贸会谈 - 中美经贸团队在瑞典斯德哥尔摩举行会谈 [1] - 美国同意暂停对中国实体出台新的出口管制措施 [3] - 外交部表示中美经贸合作本质是互利共赢 [3] 国家育儿补贴政策 - 育儿补贴制度2025年1月1日起实施,覆盖3周岁以下婴幼儿 [2] - 国家基础标准为每孩每年3600元,按年发放 [2] - 2025年前出生的婴幼儿按应补贴月数折算计发 [2] 上海市人工智能政策 - 上海市发放6亿元算力券,降低智能算力使用成本 [4] - 加强算力调度平台建设,支持企业研发和应用大模型 [4] 广东省造纸行业倡议 - 广东省造纸行业协会倡议杜绝低于成本的倾销行为 [5] - 抵制通过不正当手段套取补贴或抢占市场 [5] 新能源汽车与光伏行业 - 工信部强调巩固新能源汽车行业"内卷式"竞争综合整治成效 [6] - 加强光伏等重点行业治理,以标准提升倒逼落后产能退出 [6] 市场监管与自动驾驶 - 市场监管会议要求依法依规治理企业劣质低价竞争 [7] - 上海计划年内实现浦东新区自动驾驶测试道路全域开放 [8] 人工智能大会 - 2025世界人工智能大会发布300项采购需求,意向金额约162亿元 [9] - 3000余项前沿展品亮相,涵盖40余款大模型、50余款AI终端产品 [9] 银行与AI合作 - 四大行近期接入阿里AI,建设银行智能编码项目由阿里云中标 [10] - 工商银行将阿里Qwen模型应用于智能风控 [10] 公司动态 - 智谱发布GLM-4.5模型,实现推理、代码、Agent等多能力原生融合 [11] - 药明康德上半年净利润85.61亿元,同比增长101.92% [12] - 中联重科在雅下水电项目中均有中标 [13] - 幸福蓝海电影《南京照相馆》累计票房超4.12亿元 [14] - 岩山科技全资子公司在脑机接口领域取得突破 [15] - 复星医药控股子公司获AR1001药物在华开发权利 [16] - 热景生物基孔肯雅病毒检测试剂盒适用于科研场景 [17] - 达华智能因涉嫌信息披露违法违规被证监会立案调查 [18] - 世名科技实际控制人被采取留置措施 [18] 并购与投资 - 同程旅行拟取得大连圣亚控制权 [19] - 光库科技拟收购安捷讯控制权 [19] - 中化国际拟购买南通星辰100%股权 [19] - 中化装备拟发行股份购买两家公司100%股权 [19] - 江特电机实控人变更为王新、朱军 [19] - 海大集团拟使用不超过100亿元自有资金进行委托理财 [20] - 中钨高新拟投资1.78亿元实施PCB用微钻智能制造技改项目 [20] 金融市场 - 美股三大指数涨跌不一,道指跌0.14%,纳指涨0.33% [23] - 对冲基金以一年来最快速度减仓美国科技股 [25] 能源与地缘政治 - 交易员预计OPEC+将同意9月份增产54.8万桶/日 [26] - 泰国和柬埔寨停火协议正式生效 [27]
世界人工智能大会闭幕,法媒:大会体现中国AI领域雄心
环球时报· 2025-07-29 06:47
2025世界人工智能大会概况 - 大会展区面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品及100余款"全球首发""中国首秀"新品 [1] - 现场发布300项项目采购需求,预计达成意向采购金额约162亿元 [1] - 数十款人形机器人亮相,涵盖倒啤酒、打麻将、拳击等多样化功能 [1] 人工智能技术发展趋势 - AI技术正从"渐进式创新"转向"指数级跃迁",大模型呈现"周级迭代"爆发态势 [2] - 人工智能从算法层云端计算下沉至现实操作终端,落地进程全面加速 [1] - 中国AI融入日常生活的速度正在加快,服务型与工业型机器人加速落地 [1] 中国企业大模型进展 - 京东言犀大模型升级为JoyAI,750B大模型进入世界第一梯队 [2] - 阿里巴巴开源三款大模型,性能可比肩Claude4、GPT4.1、Gemini2.5 pro等顶尖闭源模型 [2] - 腾讯发布混元3D世界模型1.0并宣布全面开源 [2] - 月之暗面Kimi K2模型上线后开源,代码和智能体任务达到顶尖闭源模型水平 [4][5] 中美AI发展模式对比 - 美国AI企业主要采用闭源模式,中国采取开源模式,通过工程实现和市场规模优势实现商业冲击 [3] - 中国AI企业从低中端市场起步快速商业变现,逐步向高端发展,技术紧随美国创新步伐 [5] - 月之暗面Kimi K2在无法获得最先进GPU条件下,通过算法创新实现性能突破 [4][5] 行业生态与用户特征 - 中国电信首席科学家指出国产AI大模型在自然语言处理领域表现耀眼,但在图像视频领域仍需提升 [5] - B站数据显示每月超1.4亿用户观看AI内容,用户画像呈现"高线、高知、年轻"特征,一、二线城市占比近50% [6] - 中国AI应用开发势头强劲,企业积极拥抱AI技术商业化 [6] 国际合作与行业影响 - 中方倡议成立世界人工智能合作组织引发外媒关注,美国对此态度相对消极 [1] - 英伟达CEO黄仁勋点名中国大模型DeepSeek R1、阿里通义千问和月之暗面Kimi,认可其在受限环境中的创新 [4]
抢跑GPT-5,智谱开源新SOTA模型,一句话搞出能看视频、发弹幕的B站!
量子位· 2025-07-28 22:44
核心观点 - 智谱发布新一代旗舰大模型GLM-4.5,首次在单个模型中实现代码、Agent和推理能力的原生融合[1][2][3] - GLM-4.5在12个评测基准中综合平均分全球第三,开源和国产维度均排名第一[4][5] - 模型采用MoE架构,包含GLM-4.5(3550亿参数)和GLM-4.5-Air(1060亿参数)两个版本[9] - 生成速度达100 tokens/s,API价格显著低于主流竞品(输入0.8元/百万tokens,输出2元/百万tokens)[6][8] - 在编程任务测试中表现优于Claude Code等开源模型,工具调用稳定性和任务成功率突出[22][24] 技术架构 - 采用MoE架构,通过无损均衡路由机制和Sigmoid门控提升计算效率[30] - 模型设计缩小宽度(隐藏维度和路由专家数量)但增加深度(层数),实验证明更优[30] - 自注意力模块引入分组查询RoPE位置编码,注意力头数量增加2.5倍(5120隐藏维度下96个头)[31] - 优化器采用Muon加速收敛,引入QK-Norm稳定注意力对数范围[32] - 加入MTP(多标记预测)层支持推测式解码[33] 训练与性能 - 预训练分两阶段:15T通用语料+7T代码与推理语料,后续加入特定领域数据集强化关键任务表现[35][36] - 强化学习基础设施Slime支持高效训练,采用混合架构(同步/异步)最大化GPU利用率[38][40] - 参数效率显著:GLM-4.5参数量为DeepSeek-R1一半、Kimi-K2三分之一,但性能更优[44] - GLM-4.5-Air在推理基准上媲美Gemini 2.5 Flash和Claude 4 Sonnet[44] - SWE-bench榜单显示GLM-4.5系列处于性能/参数比帕累托前沿[45] 应用与评测 - 实测可生成功能完整的百度搜索页面、小红书式社交网站及B站式视频网站(支持播放和弹幕)[13][14][17] - 教育场景中能自动收集资料生成HTML格式教学PPT,超越传统模板套用方式[19][21] - 52个编程任务测试覆盖6大开发方向,开源评测题目和Agent轨迹供复现验证[23][29] - 对比Claude-4-Sonnet,多数场景可达替代效果,部分任务如《羊了个羊》实现超越[25][27] 行业意义 - 突破参数军备竞赛思维,以MoE架构和系统工程实现更高效能[49] - 在GPT-5传闻前抢先开源Agent能力,展现技术前瞻性[50][51] - 推动国产开源模型标准定义能力,增强全球社区影响力[52][53][54]
金融智能体走向规模化应用 仍有四项“基本功”不足
21世纪经济报道· 2025-07-28 21:05
金融智能体应用进展 - 金融智能体从概念验证走向规模化应用,部分科技厂商在金融领域的智能体应用解决方案已超过100个[1] - 落地场景从对客辅助工具扩展到授信决策等核心业务场景[1] - 金融业被认为是AI率先落地应用的绝佳行业,因其数字化程度高、数据密度大、应用场景丰富[2] 行业应用案例 - 太保集团在健康险理赔审核、审计数字员工等核心环节推进数字劳动力建设[3] - 蚂蚁集团展示了财富、保险、投研、风控等核心金融场景的智能体demo[3] - 盈米基金上线了"个人基金理财助手""持仓诊断"等一系列金融智能体应用[3] - 奇富科技搭建了授信决策智能体系统,涉及信贷业务全流程[4] 技术架构创新 - 头部银行实现"通用大模型+垂类模型+智能体"技术架构落地[2] - 智能体系统与传统风控系统相比具有三大优势:全流程覆盖、类人操作、大模型驱动[4] - 上海银行推出以"对话即服务"为核心的AI手机银行,覆盖十余项高频交易[5] 行业挑战 - 大模型幻觉问题成为智能体落地应用的最大挑战[6] - 金融知识碎片化问题亟待解决,需要建立高质量数据集[6] - 部分金融机构缺乏将业务需求、算力、模型等协同的工程化实践能力[7] - 智能体落地应用的实效评估体系尚未完善[7] 交互模式变革 - "对话即服务"模式取代传统点选,重塑金融服务本质[5] - AI手机银行能分析用户资产负债、现金流等信息,从数百款产品中快速筛选[5] - 服务模式实现从"人找服务"到"服务找人"的转型[5]
WAIC 2025观察:算力竞赛升维,模型寻路落地
经济观察网· 2025-07-28 20:55
行业趋势 - 2025年世界人工智能大会(WAIC)展区面积超7万平方米,参展企业800余家,单日票价一度炒至3000元,显示行业热度空前 [2] - 行业呈现"一体两面"发展路径:硬件厂商聚焦算力基础设施性能竞赛,模型与应用厂商转向商业场景深度落地 [2] - 产业金融力量如芯鑫租赁已累计向集成电路产业投放2100亿元,其中80亿元专门支持AI数据中心和算力租赁等基础设施 [3] 算力基础设施 - 华为展出昇腾384超节点(Atlas 900 A3 SuperPoD),单集群算力达300PFLOPS(每秒30京次浮点运算),采用全对等UB总线和无阻塞Clos架构 [2][3] - 神州数码发布业界首款基于鲲鹏技术的大模型训推一体服务器KunTai R624 K2和推理服务器KunTai R622 K2,计算效能提升2倍,兼容国内外主流AI加速卡 [5] - 曙光存储与中国移动联合落地国内首个全局统一文件存储系统,覆盖长三角、成渝等四大国家级枢纽节点,服务"东数西算"战略 [6] - 存算协同技术可将AI处理的tokens数量从每秒数百提升至2000-3000水平,每在存力上投入1元可节约10元算力成本 [6][7] - 超云数字发布全栈液冷智算服务器R8429 L13,应对单机柜功率超20kW时的散热需求 [8] 模型与应用落地 - 商汤科技提出AI进化需走向物理世界,通过"具身智能"与"世界模型"获取新数据 [10] - 阶跃星辰发布Step 3基模,在国产芯片上推理效率达DeepSeek-R1的3倍,联合华为昇腾等近10家芯片厂商成立"模芯生态创新联盟" [11] - 百望股份基于953.5万亿元交易数据构建"业务大脑",与阿里通义千问等合作推进"开源模型+行业场景"落地 [12][13] - 数字王国发布"AI DOMAIN"影像创作平台,集成文生图等七大功能,联合香港科技大学等成立"数字视觉创新联盟" [14] - 出门问问推出TicNote AI录音笔,内置"Shadow AI"实现记录、总结等复杂功能 [16] 技术演进方向 - 企业需求呈现两大趋势:大模型私有化部署需求增长,训练与推理场景分化 [5] - 存储系统面临数据"看不全、理不顺、用不好"三大难题,需解决兼容性、跨域调度等问题 [6] - 跨域数据调度需保证业务连续性和数据强一致性,对元数据管理和网络延迟提出挑战 [7] - AI需从技术参数比拼转向真实应用场景,解决"模型性能是否完全等同于模型价值"的产业之问 [10]
70亿元建公寓!京东又有大动作,3.5万岗位校招
中国基金报· 2025-07-28 17:15
校招与人才培养 - 公司启动2026校园招聘,开放3.5万个岗位,其中应届毕业生岗位2万个,实习生岗位1.5万个 [4] - 校招岗位覆盖零售、科技、物流、健康、产发、工业、创新零售和国际等业务,超300种岗位类型 [4] - 公司推出"五年成长计划"和"后浪计划",为校招生提供定制化培养方案和跨级晋升机会 [4] - 过去一年公司连续七次提高员工薪酬激励,并全面上调校招岗位薪酬 [5] - 公司投入70亿元在北京打造近5000套青年公寓,其中实习生公寓将于9月迎来首批学生 [5] 人工智能领域布局 - 公司在世界人工智能大会期间发布全新大模型品牌JoyAI和开源企业级智能体JoyAgent [8] - 公司推出智能品牌JoyInside,与数十家机器人企业合作,将对话智能体植入硬件设备 [8] - 公司近期领投千寻智能、逐际动力、众擎机器人等具身智能领域头部企业 [8] - 公司5月参与投资智元机器人 [8] 业务发展与员工规模 - 公司持续发力外卖、酒旅板块业务 [7] - 创始人预计二季度末员工数达90万人,未来将突破100万人 [8] - 公司表示新兴板块业务持续推进将带动员工规模增长 [8]
对话联想创投:在喧嚣与泡沫中寻找具身智能的真实落点
中国基金报· 2025-07-28 16:46
核心观点 - 具身智能并非短期风口,而是AI赋能物理世界的长期演进节点,其核心价值在于理解、感知并参与复杂物理环境,最终替代或增强人的劳动角色[3][10] - 当前具身智能领域存在估值快速扩张现象,部分项目两个月内估值翻倍,但泡沫本质在于能否兑现承诺而非估值高低[5] - 具身智能的崛起依赖于跨产业协同联动,资本进入带来新的资源组织方式,技术跨界验证是规模化落地的关键前提[6] - 联想创投通过"研、产、供、销、服"全链条深度协同构建产业生态,已投出130多家专精特新企业和50多家"小巨人",近50%被投企业为新质独角兽[7][10] 机器人行业定位 - 机器人不是新热点,而是交互方式根本性演化的延续,从键盘屏幕到触摸屏、语音助手再到具身智能体的演进路线可验证[3] - 联想已在工厂真实部署机器人与AI融合系统,机器人从"未来产品"转变为已落地的"系统协同体"[3] - 传统AGV/AMR仅能做局部动作,通过具身智能升级后已能承担搬运、装卸、接驳等完整流程,在酒店服务场景可实现两周内数据采集计算ROI并快速复制[10] 投资策略与产业协同 - 投资重点从算法转向底层基础设施,包括算力芯片、数据接口、低功耗架构等,解决AI"用得起、跑得动、接得上"的实际问题[7] - 通过"光明计划"提供柔性产线服务、"星辰计划"对接联想业务线、海外销售网络支持被投企业出海,形成非资本价值的深度协同[7][8] - 不追逐最热项目,专注寻找具备技术闭环、清晰商业路径和可协同性的长期价值公司[11] 商业化路径 - 垂直场景中的"点突破"是当前机器人商业落地最现实路径,被投企业已通过复合智能实现端到端任务闭环[10] - 技术路径、市场机会、政策变量、人才结构、生态适配能力等结构性因素将决定创业项目成败[10] - 2023-2025年为概念验证期,未来三五年将进入决定产业格局的淘汰赛阶段[11]
上海:支持优质企业发展风险投资基金 聚焦算力、语料等关键要素
快讯· 2025-07-28 14:54
上海市人工智能产业支持政策 - 上海市经济信息化委发布《上海市进一步扩大人工智能应用的若干措施》 [1] - 政策提出完善产业投融资体系 发挥国家人工智能产业投资基金和市级人工智能先导产业母基金引导作用 [1] - 联合区级投资基金和社会资本进行早期、小型和长期投资 [1] 风险投资基金支持方向 - 支持优质企业发展风险投资基金 [1] - 聚焦算力、语料等关键要素 [1] - 关注大模型、具身智能、科学智能等赛道 [1] 专题子基金设立计划 - 联合相关区级基金推动设立专题子基金 [1]