Workflow
盘古模型
icon
搜索文档
谷歌发布世界模型Genie 3;微软宣布将OpenAI的gpt-oss模型引入Azure AI Foundry丨AIGC日报
创业邦· 2025-08-07 08:09
微软与OpenAI合作 - 微软宣布将OpenAI的GPT-oss模型引入Azure AI Foundry 用户可通过混合AI灵活组合不同模型优化性能与成本并直接在数据所在位置处理 [1] - OpenAI发布两个开放权重AI模型分别为GPT-oss-120b和GPT-oss-20b [1] 谷歌AI进展 - 谷歌DeepMind发布世界模型Genie 3 可生成实时互动的3D环境 模型能记住物体位置即使用户移开视线后也能准确定位 [2][3] OpenAI估值动态 - OpenAI员工股票二次出售计划显示公司估值达5000亿美元 计划出售价值数十亿美元股票 上一轮融资估值为3000亿美元 [3] 华为开源AI模型 - 华为开源盘古70亿参数稠密模型和盘古Pro MoE 720亿参数混合专家模型 基于昇腾的模型推理技术已上线开源平台 [4] 行业数据服务 - 提供人形机器人商业航天AGI等热门赛道行业图谱和报告 包含2万+LP数据10万+基金数据1万+专精特新小巨人企业数据 [5]
腾讯研究院AI速递 20250806
腾讯研究院· 2025-08-06 00:01
Claude Opus 4.1内测与行业动态 - Claude Opus 4.1正在内部测试,预计半月内发布,主打提升推理和规划能力 [1] - Anthropic年收入增长5倍达50亿美元,编程客户Cursor和GitHub Copilot贡献14亿美元API收入 [1] - Claude在AI编程领域优势明显但面临OpenAI等竞对威胁 [1] 腾讯ima功能更新 - ima新增AI播客功能,基于混元大模型提供自然对话与优质听感 [2] - 支持文件夹一键导入功能,大幅简化知识导入流程 [2] - 新增Xmind脑图解读与知识库内容置顶功能,提升知识管理效率 [2] 阿里开源Qwen-Image模型 - 通义千问开源200亿参数图像生成模型Qwen-Image,中英文文本渲染能力出色 [3] - 模型能精准生成含复杂文字的图像,包括PPT、海报和商品宣传图 [3] - 采用MMDiT架构和渐进式训练策略,多项基准测试达SOTA水平 [3] 华为开源盘古模型与CANN架构 - 华为开源三款盘古模型,规模分别为1B、7B和718B,Ultra MoE达7180亿参数 [4] - AI计算架构CANN及Mind系列应用使能套件全面开源开放 [4] - 采用Multi-head Latent Attention和负载均衡策略等创新技术 [4] 纳米AI多智能体蜂群技术 - 纳米AI推出多智能体蜂群,一句话生成10分钟高质量AI视频,降低95%制作成本 [5] - 引入L4级智能体标准,实现多智能体共享记忆和协作 [5] - 单步智能体成功率达99.97%,支持无限Token和上下文长度 [5] 谷歌大模型对抗赛 - 谷歌发起首届大模型对抗赛,8款顶级AI模型将在国际象棋领域对决 [6][7] - 参赛模型包括OpenAI、DeepSeek、Kimi、谷歌、Anthropic和xAI等 [6] - 比赛采用单败淘汰制,全程透明直播 [7] 苹果脑控技术进展 - 苹果与Synchron合作推出BCI HID协议,让脑电波成为原生输入方式 [8] - 渐冻症患者通过Stentrode脑机接口设备成功操控iPad [8] - 相比Neuralink采用低风险无创手术方式 [8] 宇树科技机器人产品 - 宇树科技发布四足机器狗Unitree A2,可负重100kg,最大奔跑速度5米/秒 [9] - 此前发布人形机器人R1,售价3.99万元起,被称为行业"价格屠夫" [9] - 公司2024年营收突破10亿元,Go1机器人全球出货量超5万台 [9] AI对社会结构影响预测 - 前谷歌高管预警2027年起AI将开启15年"地狱期",中产阶级或被消灭 [10] - 预测未来社会将只剩顶端0.1%富人和底层民众 [10] - 2042年后或进入AI主导的乌托邦时代 [10] 阶跃星辰开源基座模型 - 阶跃星辰开源基座模型Step 3,为3210亿参数的多模态推理模型 [11] - CEO坚信多模态生成与理解统一是通往AGI的必由之路 [11] - 聚焦智能终端Agent和垂类Agent两大方向 [11]
算力催生数据中心向智算发展,推动PCB向高阶升级迭代,看好相关产业链投资机会
长城证券· 2025-07-09 14:37
报告核心观点 - 算力催生数据中心向智算发展,推动 PCB 向高阶升级迭代,看好相关产业链投资机会 [1] - 持续看好 AIDC 产业链和 PCB 未来产业发展 [2][6] 行业观点 市场表现 - 本周通信(申万)指数下跌 0.10%,沪深 300 指数上涨 1.54%,行业跑输大盘 1.64pct [11] - 通信本周涨幅在 TMT 各子板块中居第三位,通信板块最新估值市盈率为 21.35,位于 TMT 各行业第四位 [12][13] 本周策略观点 OpenAI 向甲骨文租赁数据中心算力,看好未来 AIDC 产业链投资机会 - OpenAI 以每年约 300 亿美元租 4.5GW 计算能力,交易超甲骨文云基础设施业务规模 [15] - 甲骨文将多地开发数据中心,花 400 亿美元买英伟达芯片为 OpenAI 新建数据中心供算力 [22][25] - 阿里云扩张数据中心,阿里未来三年投超 530 亿美元建云计算和 AI 基础设施 [16] - 2023 年中国智算中心市场投资规模 879 亿,同比增 90%以上,预计 2028 年达 2886 亿元 [17] 算力需求催生 PCB 升级,持续看好未来 PCB 产业发展 - AI 服务器算力增强带动电源发展,其电源用 PCB 在多方面升级 [18] - 2023 年全球 AI/HPC 服务器系统 PCB 市场规模近 8 亿美元,预计 2024 年达 19 亿美元,2028 年达 31.7 亿美元 [18] - AI 端侧设备性能提升使 PCB 需同步升级,如 HDI 板阶数、材料升级等 [19] - 2024 年全球可穿戴设备出货量预计 5.6 亿台,同比增 10.5%,预计 2028 年底达 6.5 亿台 [19] 建议关注组合 - 涉及运营商/国资云、主设备商&服务器、光模块等多个领域众多标的 [20][21] 本周专题解析 OpenAI 向甲骨文租赁数据中心算力,看好未来 AIDC 产业链投资机会 - OpenAI 与甲骨文交易及甲骨文数据中心建设情况同策略观点 [22] - 我国阿里云数据中心扩张及阿里投资计划同策略观点 [26] - 智算中心产业链涵盖设计制造、设施建设、服务提供和模型研发应用等环节 [26] - 国家出台多项政策促 IDC 行业发展,数据中心用电量和碳排放增长,建设低碳化进程有望加快 [30][31] 算力需求催生 PCB 升级,持续看好未来 PCB 产业发展 AI 服务器算力增强推动 HDI 等高端板增长 - AI 服务器算力及电源情况和 PCB 升级同策略观点 [38] - PCB 嵌入功率模块技术有性能潜力,AI 服务器相关 HDI 需求增速快 [43][46] AI 端侧设备性能不断提升,PCB 技术持续提升 - 小米推出首款 AI 眼镜,AI 端侧设备性能提升使 PCB 技术需同步提升 [48][54] - 不同应用领域对覆铜板性能有不同需求,未来智能可穿戴设备市场前景广阔 [56][55] 通信行业动态 行业动态新闻 - 百度、华为开源大模型,多家公司有采购、业务进展及产品发布等动态 [59][60][61] 上市公司动态 - 视源股份、四会富仕、三花智控发布股份回购、可转债转股等进展公告 [62]
格林大华期货股指早盘提示-20250702
格林期货· 2025-07-02 12:03
报告行业投资评级 - 对 A 股和港股维持超配建议 [2] - 看多四大股指期货合约 [2] 报告的核心观点 - 周二两市主要指数强势整理收盘微涨,中央财经委会议推进全国统一大市场建设,高盛预计美联储多次降息,多家外资巨头唱多中国资产,市场有望向趋势上涨行情演化 [1][2] 根据相关目录分别进行总结 行情复盘 - 周二两市主要指数强势整理收盘小涨,创新药板块涨幅居前,两市成交额 1.46 万亿元变化不大,中证 1000、中证 500、沪深 300、上证 50 指数均上涨,行业与主题 ETF 及两市板块指数有涨有跌,中证 1000 指数股指期货沉淀资金净流入 28 亿元 [1] 重要资讯 - 中央财经委会议研究推进全国统一大市场建设,治理企业低价无序竞争 [1] - 国家医保局等支持创新药研发,提供医保数据服务 [1] - 华为开源盘古模型及推理技术 [1] - 国内头部光伏玻璃企业 7 月开始集体减产 30%,7 月产量预计降至 45GW 左右 [1] - 高盛预计美联储今年 9、10、12 月三次降息 25 个基点,下调终端利率预测 [1][2] - 高盛预计第二季度标普 500 盈利增长大幅放缓至 4% [1] - 大摩称科技巨头开源 AI 工具,中国在“机器人竞赛”可能领先 [2] - 马斯克表示 Neuralink 探索人类意识本质 [2] - 上半年美元指数大跌 10.8%,投资者减持美元资产 [2] - 美国财长预计签署新贸易协议,扩大长期国债发行规模不合理 [2] 市场逻辑 - 周二两市主要指数强势整理收盘微涨,中央财经委会议推进全国统一大市场建设,高盛预计美联储降息,多家外资巨头唱多中国资产 [2] 后市展望 - 中央财经委会议推进全国统一大市场建设,光伏玻璃企业减产改善供需,高盛预计美联储降息,外资唱多中国资产,市场有望向趋势上涨行情演化 [2] 交易策略 - 股指期货方向交易看多四大股指期货合约,成长类指数弹性更高 [2] - 股指期权交易买入股指远月深虚值看涨期权 [2]
华为,重大宣布!
第一财经· 2025-07-01 18:34
华为开源盘古大模型 - 华为正式开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术 [1] - 盘古Pro MoE 720亿参数的混合专家模型权重、基础推理代码及基于昇腾的超大规模混合专家模型推理代码已上线开源平台 [1] - 盘古70亿参数相关模型权重与推理代码将于近期上线开源平台 [1] 盘古大模型发展历程 - 盘古是华为开发的人工智能模型,2020年11月立项、2021年4月正式对外发布 [1] - 2023年6月,华为发布盘古大模型5.5,实现自然语言理解、计算机视觉、预测、多模态、科学计算基础模型的全面升级 [1] - 在自然语言大模型方面,华为推出完全由国产算力训练而成的7180亿参数深度思考模型,标志着我国已具备用国产算力训练世界一流大模型的能力 [1] 开源战略与生态建设 - 此次开源部分盘古模型是华为践行昇腾生态战略的关键举措,旨在推动大模型技术的研究与创新发展 [1] - 华为希望通过开源加速推进人工智能在千行百业的应用与价值创造 [1] - 华为邀请全球开发者、企业伙伴及研究人员下载使用并提供反馈,共同完善模型 [1]
特朗普签署行政令结束对叙利亚制裁;伊朗外交部发言人:伊朗正在记录以色列的侵略和犯罪行径;17省披露前5月财政数据丨早报
第一财经· 2025-07-01 08:53
国际政治与贸易 - 美国总统特朗普签署行政令终止对叙利亚制裁 允许放宽部分商品出口管制并取消部分外国援助限制 [2] - 欧盟强调数字相关立法不在美欧贸易谈判议题之列 不会更改包括《数字市场法》《数字服务法》在内的法律 [22] - 商务部回应加拿大关闭海康威视在加业务 表示强烈不满和坚决反对 [7] 国内经济数据 - 17省披露前5月财政数据 吉林增速最高 15个省份一般公共预算收入保持增长 [4] - 6月制造业PMI为49.7% 连续两个月回升 非制造业商务活动指数为50.5% [8] - 我国法人和其他组织数量突破2亿家 其中法人机构超6600万家 个体工商户超1.27亿家 [14] 产业与消费 - 文旅部暑期将发放5.7亿消费补贴 举办超4300项约3.9万场次文旅消费活动 [9][10] - 长三角铁路暑运启动 预计发送旅客1.9亿人次创历史新高 同比增幅6.7% [11] - 成都上半年土地收入440亿元 同比增幅超100% 金牛区地价首次突破2万/平方米 [16] 科技与创新 - 百度开源文心大模型4.5系列10款模型 华为开源盘古70亿参数稠密模型等 [29] - AI医疗场景加速落地 上海新华医院奉贤院区打造AI深度赋能医疗全流程创新试验场 [37][38] - 比亚迪在全球多个核心区域市场销量超过特斯拉 中国汽车产业链加速出海 [36] 资本市场 - 美股上半年完美收官 标普纳指创历史新高 道指涨0.63% 纳指涨0.47% 标普500涨0.52% [31] - 三部门发布境外投资者以分配利润直接投资税收抵免政策公告 2025-2028年期间可抵免10% [12] - 国家外汇局新发放QDII额度30.8亿美元 支持机构依法合规开展跨境投资 [13] 企业动态 - 阿里系三大品牌冠名"苏超"球队 淘宝闪购冠名常州队 支付宝冠名徐州队 花呗冠名无锡队 [30] - 《哪吒2》下映累计票房159.12亿 观影人次3.24亿 打破113项纪录 获308项里程碑成就 [18][19] - 机构6月30日净买入成飞集成2.5亿元 雄帝科技1.38亿元 晨曦航空1.15亿元 [32][33][34][35]
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
雷峰网· 2025-06-09 21:37
算力集群技术演进 - AI算力集群通过连接上万台计算机形成"算力航空母舰",解决大模型训练中的协同工作、故障恢复等世界级难题 [3] - 万卡集群可用度达到98%,实现训练+推理场景下的秒级快速恢复 [1] 超节点高可用技术 - 采用系统层/业务层/运维层三级容错方案,将故障转为亚健康问题并通过运维手段消除 [5] - 系统层通过超时代答欺骗OS和网络路由切换防止超节点级故障 [5] - 业务层实现租户无感知的网络闪断重试,运维层通过主动感知技术削减亚健康事件影响 [6] 集群线性度优化 - 华为提出TACO、NSF、NB、AICT四项关键技术,实现算力规模与性能的近似线性增长 [8] - 实测Pangu Ultra 135B模型在4K卡集群线性度达96%,718B MoE模型在8K卡集群线性度95.05% [8] 万卡训练恢复技术 - 采用进程级重调度恢复技术将训练中断恢复时间缩短至3分钟内 [12] - 进程级在线恢复技术针对硬件UCE故障实现30秒内恢复,算子级在线恢复实现通信算子秒级重执行 [12] MoE模型推理容错 - 大EP组网架构下提出三级容错方案,实例恢复时间从20分钟降至5分钟 [14][15] - TOKEN级重试技术实现30-60秒实例恢复,减卡弹性恢复技术实现用户无感知的秒级恢复 [15] 故障诊断体系 - 构建全栈可观测能力,包含集群运行视图、网络链路监控等模块 [17] - 故障诊断覆盖全栈故障模式库、跨域诊断、计算节点诊断等维度 [17] 建模仿真平台 - 马尔科夫建模仿真平台实现训练吞吐提升4.5%-8.24%,通信暴露时间降低89.84% [20] - 推理建模仿真平均误差低至6.6%,高可用建模实现全周期故障场景仿真 [21] 框架迁移方案 - MindSpore通过MSAdapter工具覆盖90%以上PyTorch接口,实现第三方框架无缝迁移 [23] - 推理阶段支持HuggingFace权重一键部署,盘古72B模型实现推理性能提升 [23] 行业发展趋势 - 算力基础设施将形成"应用需求→硬件创新→工程反哺"的闭环演进路径 [25] - 未来方向包括算法驱动算力专用化、光电混合架构革新、AI智能化运维等 [25]
华为如何驯服AI算力「巨兽」?
虎嗅APP· 2025-06-09 20:54
通用人工智能(AGI)与系统工程创新 - 单点技术演进边际效应递减,系统性能天花板转向系统工程上限,需通过系统工程创新实现效能最优[1] - 华为推出《华为技术披露集》系列,首次全面详述技术细节,助力昇腾生态在中国发展[1][2] 万卡集群技术 - AI算力集群将上万台计算机整合为"算力航空母舰",解决协同工作、高效运行和快速修复等世界级难题[3] - 华为团队提出拓扑感知协同编排技术TACO等四项关键技术,训练Pangu Ultra 135B稠密模型时4K卡集群线性度达96%[8] 超节点高可用 - 算力集群采用"系统层容错"、"业务层容错"和"运维层容错"方案,将故障转为亚健康问题,确保24小时不间断运行[5][6] - CloudMatrix 384超节点通过超时代答欺骗OS和网络路由切换,避免系统级故障[6] 集群线性度 - 华为技术实现盘古模型训练线性度提升,8K卡A2集群训练Pangu Ultra MoE 718B稀疏模型时线性度达95.05%[8] 万卡集群训练快速恢复 - 进程级重调度恢复技术将训练恢复时间缩短至3分钟以内,进程级在线恢复技术进一步缩短至30秒以内[10][11] - 算子级在线恢复技术实现网络故障影响的通信算子秒级重执行,训练任务不中断[11] 超大规模MoE模型推理恢复 - 三级容错方案实现实例间切换、实例内重启恢复和实例内无损恢复,实例恢复时间从20分钟降至5分钟[13] - TOKEN级重试技术在CloudMatrix 384超节点场景下实现30~60秒实例恢复[13] 故障管理与感知诊断 - 华为提供昇腾AI硬件灾备高可靠架构设计,涵盖故障隔离、容错能力和故障预测等[15] - 全栈可观测能力和故障诊断技术实现大规模集群在线故障感知和诊断[16] 建模仿真 - 马尔科夫建模仿真平台实现训练、推理和高可用领域的多维度建模分析,训练吞吐提升4.5%-8.24%[18][19] - 推理建模仿真平台平均误差低至6.6%,高可用建模仿真框架实现全周期监控仿真[19] 框架迁移 - 昇思MindSpore构建MSAdapter生态适配工具,覆盖90%以上PyTorch接口,实现第三方框架无缝迁移[21] - 推理阶段支持HuggingFace权重配置一键部署,实现盘古72B模型推理性能提升[21] 未来展望 - 算力基础设施将形成"应用需求→硬件创新→工程反哺"闭环,实现高效、弹性、自愈的下一代系统[23]