大模型

搜索文档
从感知能力提升到轻量化落地,具身这条路还要走很长一段时间~
具身智能之心· 2025-06-30 20:21
具身智能技术发展趋势 - 感知能力升级与多模态融合成为技术发展重点 触觉感知特别是灵巧手领域的力控技术显著提升操作精细度及反馈能力 多模态传感器融合技术实现视觉、听觉、触觉信息的硬件与算法深度整合 [1] - 大模型驱动认知能力突破 基于多模态数据提升人形机器人感知与自主学习能力 轻量化模型设计成为行业落地关键需求 需低算力、跨平台的多模态模型支撑 [1] - 仿真环境与数据生态加速训练效率 通过物理世界规律建模实现运动、形变、环境变化的模拟仿真 sim2real技术推动虚拟与现实环境对齐 大规模仿真数据应用于真实场景是当前研究难点 [1] 行业技术资源体系 - 全栈技术社区覆盖40+开源项目与60+数据集 包含强化学习、视觉语言导航、多模态大模型、机械臂策略等16个技术路线 整合主流仿真平台与学习路径 [6] - 数据生态支持本体多样化 双足、轮式、轮足复合等形态数据需抽象共同特征 关节与执行器数据标准化是技术突破基础 [2] 产业应用与研究方向 - 国内外200+头部机构参与生态 涵盖斯坦福、清华等高校及优必选、小米等企业 涉及教育、医疗、物流等8大应用领域 [6][12] - 前沿技术应用场景明确 包括VLM在机器人抓取规划、分层决策优化、Diffusion Policy生成等20+细分方向 [7][44] 行业知识库建设 - 研报与文献覆盖大模型、人形机器人等热点 汇总30+企业研报及机器人动力学、视觉控制等专业书籍 [14][16] - 零部件供应链体系完善 整合芯片、激光雷达、ToF相机等核心部件厂商技术手册与产品数据 [18][22] 人才发展与技术交流 - 提供高校实验室与公司岗位双通道 汇总国内外知名研究机构方向 同步头部企业招聘需求 [9][11] - 实时技术问题讨论平台 涉及仿真平台选型、模仿学习方法、研报获取等实操性议题 [7][58]
南方万国数据中心 REIT (508060.SH)申购价值分析报告
申万宏源证券· 2025-06-30 19:22
发行要素 - 南方万国数据中心 REIT 于 2025 年 3 月 26 日受理,6 月 16 日获批,募集份额 8 亿份,拟募资 20.14 亿元,询价区间 2.014 - 3.021 元/份[6] 底层资产 - 国金数据中心位于昆山,是重大产业项目,电力设计容量 29,044kW,有 4,192 个机柜[8] - 长三角区域数据中心审批难,24 年签约率、计费率同比回升 4.6pct、3.8pct,高功率机柜供不应求[11][13] - 项目主要客户为上海联通、上海电信,签约机柜 2,160 个/1,912 个,客户搬迁难度大,合作稳定性强[1][25] 运营成效 - 22 - 25Q1 营收 1.73/1.68/1.64/0.43 亿元,EBITDA 1.49/1.45/1.42/0.38 亿元,使用率从 94.13%升至 95.73%[1][39] - 项目毛利率稳定在 58%以上,EBITDA 率从 85.99%升至 87.57%,优于南方润泽数据中心 REIT[1] 项目估值 - 25/26 年预测净现金流分派率为 6.05%/6.20%,低于南方润泽数据中心 REIT[1] - 报酬率 7.75%与可比一致,截至 25 年 3 月底,资产评估增值率 254.48%,低于可比[1] - 初步测算 P/FFO 为 12.39 - 18.58 倍,区间高于南方润泽科技数据中心 REIT[1] 风险提示 - 行业需求增长不及或供给大增,可能加剧竞争致价格下行[1] - PUE 政策趋严,若实施液冷改造,成本约 0.58 亿元,或影响收益[1]
95后,边改造业务边发AI顶会论文,是怎样的体验?
机器之心· 2025-06-30 18:23
机器之心报道 编辑:杜伟 在 AI 时代的浪潮下,顶尖人才影响力空前高涨,其地位更被市场推升至了前所未有的高度。无论是谷歌 Transformer 论文八子,还是从 OpenAI 出走的科学家,他 们要么自立门户,拿到亿级投资、百亿级估值,或者跳槽到他处,凭己之力拉近企业间的技术代差甚至影响竞争格局。 顶尖人才的供给增长速度似乎跟不上互联网大厂、初创公司急剧膨胀的需求,因此拥有极强议价能力。企业为了招揽这些具备突破性能力、能引领方向或解决关 键瓶颈的人才,使出了浑身解数。 这场看起来一时不会结束的人才军备竞赛,在国内同样呈现出了高强度、系统性、全球化的竞争态势。 互联网大厂纷纷放大招,京东 TGT 顶尖青年技术天才计划、字节 Top Seed 人才计划、腾讯青云计划、百度文心・新星计划…… 各种行业 Top 薪酬甚至薪酬不设 上限,钞能力拉满,誓要将顶尖人才收入麾下。 企业与人才双赢的实现,需要" 双向奔赴 "。 最近,一场聚集了产业技术大佬和高校技术天才的线下技术沙龙上,我们听到了他们对于前沿技术方向的深度探讨和双方对技术人才发展共同的思考和期待。 京东技术沙龙零售专场 这是今年 5 月全球启动的 "京东技 ...
北水动向|北水成交净买入52.2亿 内银股再现分化 北水加仓建行(00939)、抛售中行(03988)
智通财经网· 2025-06-30 17:54
港股通资金流向 - 6月30日北水成交净买入52.2亿港元,其中港股通(沪)净买入23.93亿港元,港股通(深)净买入28.26亿港元 [1] - 北水净买入前三:建设银行(00939)9.57亿港元、中芯国际(00981)7.14亿港元、美团-W(03690)3.77亿港元 [1][6][7] - 北水净卖出前三:阿里巴巴-W(09988)5.51亿港元、腾讯(00700)3.25亿港元、友宝在线(02429)7485万港元 [1][9] 个股资金明细 - 建设银行(00939)获净买入9.57亿港元,中国银行(03988)遭净卖出3.8亿港元,显示内银股分化 [6] - 中芯国际(00981)获净买入7.14亿港元,主要因美国计划撤销半导体豁免政策可能削弱外资晶圆厂竞争优势 [6] - 美团-W(03690)获净买入3.77亿港元,公司收缩社区团购业务聚焦核心,闪购和小象超市优先级提升 [7] - 快手-W(01024)获净买入3.14亿港元,其可灵AI技术获央视报道,年研发投入超100亿元人民币 [7] - 信达生物(01801)获净买入3.13亿港元,公司拟配股筹资42.65亿港元用于创新管线研发 [8] - 小米集团-W(01810)遭净卖出1.14亿港元,尽管YU7车型订单超预期 [9] 行业动态 - 银行板块近期走弱,中信证券认为短期波动后仍有绝对收益空间,因重估净资产逻辑未充分演绎 [6] - 半导体行业受政策影响,若美国撤销豁免权将利好本土晶圆厂如中芯国际 [6] - 香港虚拟资产交易服务扩容,国泰君安国际(01788)获准升级牌照 [9] 公司战略 - 美团战略调整:收缩社区团购,重点发展闪购和小象超市,保持海外扩张节奏 [7] - 信达生物筹资42.65亿港元,90%用于全球研发创新管线 [8] - 宜搜科技(02550)与华为云供应商合作开发RWA代币化产品,为期10年 [8]
华为宣布开源盘古7B稠密和72B混合专家模型
雷峰网· 2025-06-30 12:32
开源模型发布 - 公司正式开源盘古Pro MoE 720亿参数混合专家模型权重及基础推理代码[1][2][3] - 同时开源基于昇腾的超大规模MoE模型推理代码[4] - 盘古7B相关模型权重与推理代码将于近期上线开源平台[5] 技术性能突破 - 公司通过昇腾+鲲鹏双核架构实现MoE训练速度提升20% 内存节省70%[7] - 昇腾原生72B MoE架构在SuperCLUE评测中位列国内千亿参数内模型第一梯队[7] 生态战略布局 - 此次开源是公司推进昇腾生态战略的关键举措[2] - 公司邀请全球开发者 企业伙伴及研究人员共同参与模型完善[5] - 开源平台地址为https://gitcode.com/ascend-tribe[5]
李彦宏出手!百度大模型终于开源
搜狐财经· 2025-06-30 12:25
百度开源文心大模型4.5系列 - 公司正式开源文心大模型4.5系列,包含10款模型,涵盖47B、3B激活参数的混合专家(MoE)模型和0.3B参数的稠密型模型,实现预训练权重和推理代码完全开源 [2] - 开源模型已可在飞桨星河社区、Hugging Face等平台下载部署,并在百度智能云千帆大模型平台提供API服务 [4] - 此次开源不包括升级版文心大模型4.5 Turbo系列 [4] 开发者反馈与模型性能 - 开发者认为300B参数版本可与DeepSeek V3 671B竞争,21B版本可与阿里Qwen 30B竞争 [6] - 28B模型因在基础文本能力上增加视觉功能受到开发者关注 [7] - 文心大模型4.5在多个测试集上表现超过GPT-4o,具备理解多种图片形态和音视频特征的能力 [8] 技术性能对比 - 在C-Eval基准测试中,文心4.5 300B-A47B得分为91.5,高于Qwen3 30B的87.2和DeepSeek-V3 671B的90.2 [9] - 在MMLU基准测试中,文心4.5 300B-A47B得分为87.4,高于Qwen3 30B的81.0 [9] - 在GSM8K数学基准测试中,文心4.5 300B-A47B得分为91.8,高于Qwen3 30B的70.8 [9] 技术创新 - 采用多模态异构MoE预训练,通过统一架构实现文本、图像、音频、视频等多模态数据的原生级融合 [10] - 提出异构混合并行和分层负载均衡策略,预训练吞吐量提升,FLOPs利用率达到47% [12] - 针对特定模态进行后训练优化,包括视觉语言理解、任务定向微调和多模态思路推理 [12][13] 行业影响与发展 - 公司日均调用量从2023年同期的5000万次增长至2024年的16.5亿次,增长达33倍 [14] - 专家认为开源行为提高了行业标准,给闭源模型提供商带来压力 [14] - 公司已形成从文心大模型4.0 Turbo到4.5 Turbo的完整产品系列,模型数量和类型持续增加 [14]
浙江加快建设全国首个“智慧农业引领区”
新华网· 2025-06-30 10:56
智慧农业引领区建设 - 浙江正加快制定《智慧农业引领区建设实施方案(2025—2030年)》,将依托一体化智能化公共数据平台推进AI技术在农业领域的深度应用 [1] - 大模型技术赋予农业自主分析与预测能力,驱动无人化生产和全链条智能化变革 [1] - 浙江计划到2027年底建成数字农业工厂1000家、未来农场100家 [5] 数字孪生技术应用 - 兰溪杨梅产业应用数字孪生技术构建杨梅生长模型,实现精准施肥和病害预警 [2] - 浙江君缘生物科技利用金针菇生长调控模型实现日均65吨稳定产出 [2] - 华欣牧业湖羊数字孪生系统通过AI视觉识别技术减少15%饲料浪费 [2] 无人机与全域数字化 - 无人机在农田进行高精度三维建模,完成测绘、测产等任务 [3] - 湖州南浔区实现全域数字化覆盖,综合节本增效超700万元 [3] - 金华金东区"低空+AI"农事服务中心无人机服务成本降至每亩5分钱 [3] 设施农业与育种创新 - 舟山引进农业科技龙头企业14个,总投资3亿元,设施蔬菜面积增至5000余亩 [4] - 浙江省农科院利用大模型进行育种,已完成上百个品种数据录入 [6] - 宁波微萌种业构建数字化育种平台提升育种效率 [6] 农产品流通与电商发展 - 嘉兴海宁"三只懒蚂蚁"花卉电商年产值超2000万元 [7] - 江山"工匠主播"等年度"云订单"总额超30亿元 [7] - 浙江省1-4月农产品网络零售额达289.7亿元,同比增长8.49% [7] 智慧物流与供应链 - 明辉蔬果开发"食安眸"大模型系统,年处理订单业务营收6.5亿元 [8] - 该系统服务500多家用户,带动1500余户种植户年均增收35% [8] - 浙江计划构建"感知—传输—分析—决策"智能闭环的智慧农业体系 [8]
CVPR2025 WAD纯视觉端到端 | 冠军方案技术报告~
自动驾驶之心· 2025-06-29 19:33
技术方案 - 采用3B参数VLM模型解决视觉端到端自动驾驶长尾场景问题 [1] - 两阶段训练方法:阶段一预训练采用自监督方式,使用83小时CoVLA数据和11小时Waymo长尾数据集进行next-token prediction训练 [2] - 阶段二微调使用500段人工标注数据,采用GPRO强化学习方法增强模型鲁棒性 [2] 数据集 - 使用Qwen2.5-VL 72B Instruct模型自动标注WOD-E2E和CoVLA数据集,生成240.5K高质量caption [3] - CoVLA数据集包含10000张前视图片,30秒20Hz日本驾驶视频 [11] - WOD-E2E数据集提供4021段长尾驾驶场景,每段20秒10Hz,8个相机 [11] 模型训练 - 预训练采用Qwen-2.5-VL-3B-Instruct模型,CoVLA VLT训练24小时,WOD-E2E VLT训练10小时 [11] - RL后训练进行2000steps,8 rollouts per sample,耗时12小时 [11] - 推理阶段使用1e-6 temperature for CoT,Greedy decoding for trajectory prediction [11] 评估结果 - 在Waymo test set RFS评分达到7.99,排名第一 [2] - Poutine方案7.99分,Poutine-base 7.91分,RL提升效果不明显但解决头部困难问题 [13] - 验证集消融实验显示Poutine-base No CoVLA得分7.95,Poutine-base No Lang得分7.94 [15] 技术特点 - 将轨迹预测建模为四阶段COT推理序列问题 [9] - 预测5个waypoints后使用cubic-spiline插值生成密集轨迹 [9] - 评估采用RFS指标,通过三个专家打分构建信任区域计算 [11] 行业思考 - 基于VLM/LLM的轨迹预测方法在长尾场景表现优异,但对物理世界理解仍有限 [19] - 3B模型目前尚无法支持10Hz城区NOA,主要作为慢系统配合工作 [19] - VLM+Action model的VLA架构可能是更合理的解决方案 [19]
刚刚,OpenAI四位华人学者集体被挖,还是Meta重金出手
机器之心· 2025-06-29 10:21
Meta从OpenAI挖角人才 - Meta近期从OpenAI挖走四名核心研究人员,距离上次挖走苏黎世办公室团队仅隔几天[1] - 被挖人员包括GPT-4、GPT-4o及轻量化模型研发的中坚力量,涉及ViT等重要研究领域[5][8] - 具体人员为:余家辉(领导o3、o4-mini和GPT-4.1研发)、任泓宇(创建o3-mini/o1-mini)、毕书超(多模态组织负责人)、赵盛佳(GPT-4/o1关键贡献者)[6][8] 人才争夺战与行业竞争 - OpenAI CEO称Meta开出"1亿美元签约奖金"挖人,但强调顶尖人才未被挖走[3] - Meta CTO回应称实际报价条款复杂,非一次性现金支付[4] - 此次挖角可能强化Meta在大模型微调和多模态对齐的技术短板[8] 被挖研究人员背景 - 赵盛佳:清华本科/斯坦福博士,参与GPT-4/GPT-4o/o1训练,获ICLR 2022杰出论文奖[10][11][13] - 余家辉:中科大少年班/UIUC博士,曾任谷歌DeepMind Gemini多模态负责人,主导OpenAI图像生成等项目[16][17][21] - 毕书超:浙大本科/UC伯克利博士,研究方向涵盖多模态推理、智能体系统整合等前沿领域[23][24][27] - 任泓宇:北大本科/斯坦福博士,创建o3-mini/o1-mini,领导GPT-4o mini研发[28][29][31] Meta的AI战略动向 - 公司在4月发布Llama 4模型后启动大规模招聘,但模型表现未达CEO预期[2] - 行业质疑Meta在基准测试中使用特定版本Llama的做法[2] - 人才引进可能加速下一代模型Llama 5的研发进程[8]
马斯克再批特朗普政府税改法案;事关“对等关税”,商务部发声;特斯拉Model Y首次实现全自动驾驶交付;巴菲特捐赠60亿美元股票丨每经早参
每日经济新闻· 2025-06-29 06:38
国际贸易与地缘政治 - 商务部批评美国加征"对等关税"是单边霸凌行为,严重冲击多边贸易体制和国际贸易秩序,中方坚决反对并警告将反制任何牺牲中方利益的关税减免交易[3] - 中国驻加拿大使馆强烈反对加政府以"国家安全"为由命令海康威视停止在加运营,认为此举损害中国企业权益并干扰中加经贸合作,要求加方停止将经贸问题政治化[3] 资本市场改革 - 深交所正谋划创业板改革,考虑支持优质创新企业上市、提升股债融资灵活度、加大并购重组支持力度并促进投融资平衡[4] - 上交所"并购六条"实施以来沪市披露676单资产重组方案(同比增长15%),其中80单为重大资产重组(同比增长200%),将继续推进科创板"1+6"改革[4] 自然灾害应对 - 国家发改委紧急追加1亿元中央预算内投资支持贵州洪涝灾区应急恢复,累计安排2亿元用于交通、水利、医疗等基础设施重建[4] - 贵州榕江县启动防汛Ⅰ级响应,已组织撤离41574人(涉及11992户),全县拉响警报并公布七大洪区撤离路线[5] - 预报显示6月29日至7月1日我国将迎强降雨,长江上游、黄河下游等流域可能出现明显涨水,嘉陵江支流涪江可能发生超警洪水[6] 科技创新 - 国内首场机器人足球3V3 AI赛落幕,清华火神队以5:3夺冠,中国农业大学山海队获亚军[7] - 国家能源集团发布我国首个发电行业千亿参数大模型"擎源",为行业提供智能化解决方案[12] - 特斯拉完成Model Y全自动驾驶交付测试,车辆在无人控制情况下以115km/h最高时速完成30分钟路程[10] 汽车产业 - 小米YU7标准版实测综合续航达784km(CLTC标准835km),交付等待期最长57周(标准版),订单按锁单顺序排产[11] 消费与文娱 - 泡泡玛特因订单激增导致部分产品延迟发货,预计7天内完成积压订单处理[13] 资本市场事件 - *ST紫天因连续两年虚增收入近25亿元可能被强制退市,公司及相关人员被罚3840万元[14] - 巴菲特捐赠价值60亿美元伯克希尔股票,创单笔年度捐赠纪录,累计慈善捐赠超600亿美元[15] 企业人事变动 - 中国东方航空原董事长刘绍勇涉嫌严重违纪违法接受审查调查[6]