Workflow
大模型
icon
搜索文档
AI下半场,大模型要少说话,多做事
虎嗅· 2025-07-01 09:33
大模型性能与竞争格局 - DeepSeek模型性能快速提升 2024年4月排名靠后 8月进入TOP10 12月成为基础能力第一的开源模型[1] - 基础模型TOP10中中国占6个 美国占4个 包括通义千问 豆包 混元 文心等[3] - 模型排名轮动加速 GPT-4o曾保持200天第一 现在十几天就会变化[7] - 训练成本高企 每次至少几百万美元 保鲜期短导致玩家减少[8] 模型训练技术趋势 - 预训练与后训练并存 预训练提升基础能力 强化学习从实战中学习潜力大[14] - 下游企业减少参与训练 转向提示词工程 检索增强 工作流等工程化方法[9] - 智谱AI坚持预训练路线 技术团队实力和资源储备是关键[12] Agent发展与应用 - Agent成为运行在大模型上的软件 自主规划能力显著提升[21] - 提示词仍重要 精心设计的系统提示词可充分激发模型能力[22] - Agent可能不是单一产品 而是多功能集合 开发平台将成关键[29] - 未来或形成个位数基座模型+垂直行业应用平台的格局[30] 基准测试体系价值 - "方升"测试体系包含700万条数据 聚焦产业实战应用[1][44] - 测试方法标准化 题目非开源 每次抽取1-2万题后作废[47][48] - 基准测试是指挥棒 定义方向 中美差距缩小因目标一致[51] 技术路线与产业方向 - 谷歌DeepMind强化学习路线被低估 在生物 材料等领域价值巨大[34][37] - 当前模型缺乏世界模型能力 需突破空间关系 物理定律等[38] - AI下半场需减少信息过载 增强意图理解 任务规划等能力[52]
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
量子位· 2025-07-01 08:53
招商局狮子山人工智能实验室 投稿 量子位 | 公众号 QbitAI 大模型可以不再依赖人类调教,真正"自学成才"啦? 新研究仅通过 RLVR (可验证奖励的强化学习),成功让模型自主进化出 通用的探索、验证与记忆能力 ,让模型学会"自学"! 当前主流的LLM Agent依然高度依赖于提示词工程、复杂的系统编排、甚至静态规则表,这使得它们在面对复杂任务时难以实现真正的智能 行为演化。 而来自招商局狮子山人工智能实验室的研究团队认为,RLVR范式是智能体(Agent)通往更高通用性和自主性的重要突破口。 于是,他们从两个关键层面出发构建了端到端Agent训练pipeline—— L0系统 : 智能体架构层面 提出了结构化智能体框架——NB-Agent,在经典"代码即行动" (Code-as-Action) 架构基础上进行扩展,使智能体能够操作记忆/上下 文,从而获得类人类的记忆存储、信息总结与自我反思能力。 学习范式层面 探索了一个核心问题:是否可以仅通过RLVR范式,引导智能体从零开始,学会如何规划、搜索、验证与记忆,最终解决复杂的多轮推理 任务? L0系统的框架、模型及训练集已 全部开源 ,详细可见文末链接。 ...
百度开源文心系列大模型,多款模型代码已于飞浆平台开放;谷歌推出虚拟穿衣应用Doppl丨AIGC日报
创业邦· 2025-07-01 07:47
百度开源文心系列大模型 - 百度旗下文心系列大模型已在飞桨平台开源 包括ERNIE-4.5-VL-424B-A47B-Paddle、ERNIE-4.5-300B-A47B-Paddle等数十款最新模型 [1] - 开源动作集中于6月29日-6月30日 公司未主动披露但飞桨平台已更新信息 [1] - 内部人士表示官网已上新并公布开源代码 显示公司正在推进开源举措 [1] 紫荆智康发布智慧医疗系统 - 紫荆智康与清华大学智能产业研究院联合发布基于大模型智能体的智慧医疗系统"Agent Hospital 1" [2] - 系统将加速推进基于拟像的可进化医学智能体学习技术落地应用 [2] - 计划7月启动临床验证、系统公测和试点运行 预计下半年正式运行 [2] - 已在北京、江苏、广西等地区确定首批合作方 并向更多医疗机构开放合作 [2] 谷歌推出虚拟穿衣应用 - 谷歌推出实验性AI应用Doppl 可直观呈现不同服装穿在用户身上的效果 [3] - 应用工作原理是先上传用户全身照 然后使用不同服装照片进行虚拟试穿 [3] 华为开源盘古大模型 - 华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型 [4] - 同时开源基于昇腾的模型推理技术 [4]
媲美千亿级模型,华为首个开源大模型上线
选股宝· 2025-07-01 07:32
华为开源大模型技术 - 华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - Pro MoE 72B大模型在参数量720亿、激活160亿参数量的情况下,通过动态激活专家网络设计,实现媲美千亿级模型的性能表现 [1] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [1] - 华为云计算CEO表示开源有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态,并推动大模型赋能各行业 [1] - 招商证券指出华为盘古5.5发布718B参数MOE架构大模型,涵盖自然语言、视觉、多模态等领域,并推出"世界模型"赋能自动驾驶等行业应用 [1] 华为AI算力解决方案 - 华为提供从昇腾芯片、CANN异构计算架构、超节点到盘古大模型的完全自主、深度优化的闭环解决方案 [2] - 昇腾超节点已在中国电信等数据中心商用落地,带动国内供应链发展 [2] - 全球AI算力竞争转向大规模系统效能、生态构建与产业链能力全面对抗,华为重塑中美对立下的新算力格局 [2] 相关公司动态 - 华胜天成与华为在昇腾芯片、AICC智能联络中心等方向展开广泛协作 [3] - 软通动力推出软通昇腾AI工作站,提升AI本地化推理与生产效率 [4]
陆家嘴财经早餐2025年7月1日星期二
Wind万得· 2025-07-01 06:33
宏观经济指标 - 6月中国制造业PMI回升至49.7%,非制造业PMI达50.5%,综合PMI为50.7%,分别较上月上升0.2、0.2和0.3个百分点,装备制造业、高技术制造业和消费品行业连续两月处于扩张区间 [2] - 上半年A股市场表现稳健,上证指数年内涨2.8%,深证成指和创业板指涨幅约0.5%,北证50指数大涨39%,港股恒生指数涨幅达20%,位居全球主要指数第三 [3] - 6月钢铁行业PMI为45.9%,环比下降0.5个百分点,连续两个月下滑,预计7月需求端将进一步承压 [12] 政策与监管动态 - 境外投资者2025-2028年期间以境内企业分配利润再投资可享受10%税额抵免 [2] - 深交所放宽创业板"轻资产、高研发投入"企业募资限制,涉及200余家信息技术、生物医药等战略性新兴产业公司 [2] - 国家外汇管理局向QDII机构新增发放30.8亿美元投资额度,支持跨境投资业务 [4] - 商务部对欧盟等进口不锈钢产品继续征收20.2%-103.1%反倾销税,实施期限5年 [10] 资本市场动态 - 上半年港股IPO数量同比增长43.3%至43家,募资1067.1亿港元超去年全年,60余家A股公司筹备赴港上市 [7] - 上交所上半年受理30单IPO申请,科创板占比超70%,包括摩尔线程等5家"独角兽"企业 [7] - 公募机构上半年调研1943家A股公司达40093次,机械设备行业汇川技术获386次调研居首 [8] - A股上市公司上半年筹划1984单并购重组,重大资产重组102单同比增121.74%,民营企业占比60.4% [8] 行业与企业动态 - 光伏玻璃企业计划7月起集体减产30%,以改善供需失衡状况 [12] - 特斯拉中国首批V4超充桩投入使用并向非特斯拉车辆开放 [15] - 华为开源盘古70亿参数稠密模型和720亿参数MoE模型,百度开源文心大模型4.5系列 [14] - 苹果考虑采用Anthropic或OpenAI技术升级Siri,可能搁置自研模型 [14] - 电影《哪吒之魔童闹海》国内票房154.45亿元,全球票房破159亿元 [11] 国际金融市场 - 美股三大指数创新高,标普500上半年涨5.5%,纳指涨5.48%,道指涨3.64% [18] - 日经225指数涨0.84%至40487点创近一年新高,韩国综指上半年涨28.01% [19] - LME期铜上半年涨超12%,COMEX黄金期货上半年涨25.52% [22][24] - 美元指数上半年跌10.79%创1973年以来最差表现,离岸人民币对美元升155基点至7.1575 [25] 重点公司公告 - 中信证券获批发行不超过300亿元永续次级债 [10] - 通富微电遭国家大基金减持1%股份 [10] - 隆基绿能拟10.8亿元增资子公司建设高效单晶电池项目 [10] - 弘信电子子公司签署3.73亿元算力合同 [10] - 新世界发展获882亿港元债务再融资 [8]
我国已有433款大模型完成备案并上线提供服务—— AI产业迈入规模化应用新阶段
经济日报· 2025-07-01 06:10
中国人工智能大模型产业发展 - 截至当前中国已有433款大模型完成备案并上线服务,反映研发能力显著跃升[1] - 形成基础层-模型层-应用层完整产业体系,贯通基础研究-技术创新-商业应用创新链[1] - 通用大模型和行业大模型产品矩阵完备,在金融政务医疗等领域深度应用[1] 行业应用与竞争优势 - 制造业利用大模型预测需求波动,缩短库存周期实现成本节约[2] - 农业领域结合卫星遥感与气象数据,提供全生命周期种植指导提升产量[2] - 服务业重构生产力体系,成为金融政务医疗等领域的知识引擎[2] - 开源模式推动基座大模型创新生态,形成技术-数据-场景循环迭代路径[2] 技术创新与场景驱动 - 制造业数字化智能化转型为大模型提供精深场景支撑[3] - 智慧医疗交通等未来产业需求反向拉动大模型高精度迭代[3] - 企业加速底层技术突破,从应用端向基础研究延伸发展[3] 数据要素与生态建设 - 大模型显著提升数据使用能力,实现系统化交叉关联分析[2] - 低成本高效能特质叠加开源战略,促进技术普惠化应用[1] - 中小开发者可便捷微调优质模型,加速创新应用扩散[2]
6月份券商调高11只个股评级 617只个股获评“买入”
证券日报之声· 2025-07-01 00:39
券商评级调整及行业分布 - 6月份券商合计调高11只个股评级,下调29只个股评级,并对411只个股进行首次覆盖 [1] - 617只个股获"买入"评级,电子、医药生物、机械设备行业受关注度最高 [1] - 11只评级上调个股中,7只从"增持"升至"买入",包括万达电影、寒武纪-U、华东医药等 [1] - 29只评级下调个股中,16只从"买入"降至"增持",3只从"买入"降至"优大于市" [1] 个股评级差异及案例 - 寒武纪-U评级出现分化:浙商证券上调至"买入",国信证券下调至"优大于市" [2] - 评级差异源于分析师对定增计划、市场风险及盈利情况的不同评估 [2] 高关注度个股及行业分布 - 147只个股获2家及以上券商"买入"评级,比亚迪、鼎捷数智等7家券商推荐 [3] - 电子行业在"买入"评级中占比最高(102只),医药生物(60只)、机械设备(50只)次之 [3] - 411只首次覆盖个股中,电子行业(57只)、机械设备(39只)、计算机行业(超30只)居前 [3] - 科创板新股影石创新获9家券商首次关注,包括4家"买入"评级 [3]
234亿元!科研投入创新高,蚂蚁AI再进化
搜狐财经· 2025-06-30 22:32
可持续发展战略刷新 - 公司2024年可持续发展战略进行整体刷新 AI成为关键词 聚焦医疗服务 理财服务等场景 [1] - 技术是战略底色 2024年科研投入达234 5亿元 连续三年研发投入占比超营收10% 巨额资金持续注入AI领域 深度融入金融 医疗等场景 超1 3亿用户已从中受益 [1] AI应用场景落地 - 公司AI特点为"接地气" 三大AI管家服务超1 3亿用户 43%来自三线及以下城市 应用场景涵盖打车 买咖啡等日常生活及医疗 金融等专业领域 [4] - 医疗场景发布AI健康应用"AQ" 具备追问功能 提供健康科普 就诊咨询 报告解读等上百项功能 模拟真人医生问诊体验 [5] - 理财场景升级AI助理"蚂小财" 新增接入推理大模型并进行金融领域增强 实现产品功能 沟通表达 交互体验全面升级 专业力超越通用大模型 [5] - "蚂小财"新增盯盘 诊基功能 可解读持仓基金相关大事 提示波动风险 分析全市场基金 45%服务人群来自三线及以下城市 [6] 技术研发投入 - 2024年科研投入234 5亿元创新高 2022年 2023年分别为204 6亿元 211 9亿元 连续三年研发投入占比超营收10% [7] - 投入方向包括人工智能 数据要素技术 布局大模型 强化学习 智能体等 构建全面智能技术体系 同时探索具身智能 可穿戴设备等人机交互技术 [8] - 加快密态计算 可信执行环境等技术建设 为数据要素价值释放提供技术底座 推出"Plan A"AI人才专项 招募全球顶尖研究人员 [8] AI战略与伦理建设 - 2024年提出"AI优先 支付宝双飞轮 加速全球化"三大新业务战略 将继续加码技术投入和AI探索 [9] - 需解决"最后一米"应用生态 通过多模态传感器融合等技术实现自动交易 降低大模型能耗 防范数据安全风险 [10] - 成立科技伦理委员会 联合行业专家探索AI伦理建设 将"向善"基因融入技术研发全链路 [11]
从感知能力提升到轻量化落地,具身这条路还要走很长一段时间~
具身智能之心· 2025-06-30 20:21
具身智能技术发展趋势 - 感知能力升级与多模态融合成为技术发展重点 触觉感知特别是灵巧手领域的力控技术显著提升操作精细度及反馈能力 多模态传感器融合技术实现视觉、听觉、触觉信息的硬件与算法深度整合 [1] - 大模型驱动认知能力突破 基于多模态数据提升人形机器人感知与自主学习能力 轻量化模型设计成为行业落地关键需求 需低算力、跨平台的多模态模型支撑 [1] - 仿真环境与数据生态加速训练效率 通过物理世界规律建模实现运动、形变、环境变化的模拟仿真 sim2real技术推动虚拟与现实环境对齐 大规模仿真数据应用于真实场景是当前研究难点 [1] 行业技术资源体系 - 全栈技术社区覆盖40+开源项目与60+数据集 包含强化学习、视觉语言导航、多模态大模型、机械臂策略等16个技术路线 整合主流仿真平台与学习路径 [6] - 数据生态支持本体多样化 双足、轮式、轮足复合等形态数据需抽象共同特征 关节与执行器数据标准化是技术突破基础 [2] 产业应用与研究方向 - 国内外200+头部机构参与生态 涵盖斯坦福、清华等高校及优必选、小米等企业 涉及教育、医疗、物流等8大应用领域 [6][12] - 前沿技术应用场景明确 包括VLM在机器人抓取规划、分层决策优化、Diffusion Policy生成等20+细分方向 [7][44] 行业知识库建设 - 研报与文献覆盖大模型、人形机器人等热点 汇总30+企业研报及机器人动力学、视觉控制等专业书籍 [14][16] - 零部件供应链体系完善 整合芯片、激光雷达、ToF相机等核心部件厂商技术手册与产品数据 [18][22] 人才发展与技术交流 - 提供高校实验室与公司岗位双通道 汇总国内外知名研究机构方向 同步头部企业招聘需求 [9][11] - 实时技术问题讨论平台 涉及仿真平台选型、模仿学习方法、研报获取等实操性议题 [7][58]
南方万国数据中心 REIT (508060.SH)申购价值分析报告
申万宏源证券· 2025-06-30 19:22
发行要素 - 南方万国数据中心 REIT 于 2025 年 3 月 26 日受理,6 月 16 日获批,募集份额 8 亿份,拟募资 20.14 亿元,询价区间 2.014 - 3.021 元/份[6] 底层资产 - 国金数据中心位于昆山,是重大产业项目,电力设计容量 29,044kW,有 4,192 个机柜[8] - 长三角区域数据中心审批难,24 年签约率、计费率同比回升 4.6pct、3.8pct,高功率机柜供不应求[11][13] - 项目主要客户为上海联通、上海电信,签约机柜 2,160 个/1,912 个,客户搬迁难度大,合作稳定性强[1][25] 运营成效 - 22 - 25Q1 营收 1.73/1.68/1.64/0.43 亿元,EBITDA 1.49/1.45/1.42/0.38 亿元,使用率从 94.13%升至 95.73%[1][39] - 项目毛利率稳定在 58%以上,EBITDA 率从 85.99%升至 87.57%,优于南方润泽数据中心 REIT[1] 项目估值 - 25/26 年预测净现金流分派率为 6.05%/6.20%,低于南方润泽数据中心 REIT[1] - 报酬率 7.75%与可比一致,截至 25 年 3 月底,资产评估增值率 254.48%,低于可比[1] - 初步测算 P/FFO 为 12.39 - 18.58 倍,区间高于南方润泽科技数据中心 REIT[1] 风险提示 - 行业需求增长不及或供给大增,可能加剧竞争致价格下行[1] - PUE 政策趋严,若实施液冷改造,成本约 0.58 亿元,或影响收益[1]