AI推理
搜索文档
华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本
新浪科技· 2025-08-12 15:22
行业趋势 - 行业正经历从AI训练向AI推理的结构性转变,并因此快速增长 [1] - AI推理体验已成为AI应用的关键,其重要性愈发凸显 [1] - 推理体验的核心指标包括回答时延、答案准确度及复杂上下文推理能力 [1] - 国外主流模型的单用户输出速度已进入每秒200个Token区间(时延5毫秒) [1] - 国内模型的输出速度普遍小于每秒60个Token(时延50至100毫秒),存在显著差距 [1] - 解决推理效率与用户体验的难题迫在眉睫 [1] 公司技术与产品 - 华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器) [1] - 该技术旨在实现高吞吐、低时延的推理体验 [1] - UCM是一款以键值缓存为中心的推理加速套件 [1] - 该技术融合了多类型缓存加速算法工具 [1] - 其核心功能是分级管理推理过程中产生的键值缓存记忆数据 [1] - 该技术可扩大推理上下文窗口 [1] - 该技术有助于降低每个Token的推理成本 [1]
张忆东:震荡是港股长期行情的蓄电池!恒生科技ETF基金(513260)、港股通科技ETF汇添富(520980)连续回调“吸金”!
新浪财经· 2025-08-12 14:57
港股市场表现 - 港股集体下跌 恒生科技ETF基金跌0.43% 近10日净流入资金6.4亿元 基金规模达53.63亿元 [1] - 恒生科技ETF基金融资余额1.3亿元 单日融资买入额3957万元 [1] - 港股通科技30ETF跌0.99% 单日成交额3.13亿元 近20日资金流入8.6亿元 [1] 科技板块个股表现 - 华虹半导体涨超4% 中芯国际涨超3% 比亚迪电子涨超2% 小米集团微涨 [4] - 快手跌超8% 阿里巴巴跌超1% 腾讯控股跌0.71% 美团微跌0.42% [4][5] - 网易涨0.99% 京东集团持平 小鹏汽车跌2.63% [5] 机构观点与市场预期 - 兴业证券坚定看多港股 认为将走出超级大行情 港股PE低于历史1/4分位数 [6] - 招商证券判断港股进入震荡阶段 恒指PE仅11.1倍 显著低于标普500的26.7倍 [8] - 科技板块存在补涨需求 恒生科技指数PE不足纳斯达克50% [9] 资金流向与市场动态 - 南向资金持续流入港股市场 聚焦科技板块机会 [7] - 54.1%港股公司发布盈喜 金融/原材料/科技/消费行业盈喜比例较高 [6] - 华为将发布AI推理突破性技术 或降低对HBM技术依赖 [5] 行业与政策环境 - 港股投资逻辑转向"在岸市场化" 成长溢价成为新赚钱模式 [6] - 科技产业资本开支将转化为企业盈利 AI产业链拉动作用明显 [8][9] - "反内卷"政策效果逐步显现 经济有望走出通缩周期 [8]
华为即将发布AI推理领域突破性黑科技;供需失衡,第三季DDR4合约价或季增85%-90%——《投资早参》
每日经济新闻· 2025-08-12 09:01
美股市场表现 - 美股三大指数小幅收跌 道指跌0.45% 纳指跌0.3% 标普500指数跌0.25% [1] - 大型科技股多数下跌 英特尔跌超3% 特斯拉涨超2% 房利美涨超15% 房地美涨逾13% 均创2008年以来收盘新高 [1] - 中概股多数下跌 纳斯达克中国金龙指数跌0.29% 好未来跌逾3% 理想汽车跌近3% 百度、阿里巴巴跌超1% [1] 商品及欧洲市场 - COMEX黄金期货跌2.80%报3393.7美元/盎司 COMEX白银期货跌2.33% [1] - 国际油价小幅上涨 美油主力合约涨0.19%报64.00美元/桶 布伦特原油主力合约涨0.15%报66.69美元/桶 [1] - 欧洲三大股指涨跌不一 德国DAX指数跌0.34% 法国CAC40指数跌0.57% 英国富时100指数涨0.37% [1] 华为AI技术突破 - 华为发布AI推理加速技术 降低中国AI推理对HBM技术依赖 提升国内AI大模型推理性能 [2] - CANN全面开源开放 支持用户自主深度挖潜和自定义开发 可对标英伟达CUDA [2] - 概念股包括东方国信、软通动力、云从科技等 [2] 内存市场供需 - 2025年下半年DDR4市场持续供不应求 价格强势上涨 服务器订单挤压电脑和终端市场供应 [3] - 7月ConsumerDDR4合约价飙涨60%-85% 第三季合约价上修至季增85%-90% [3] - 第三季LPDDR4X合约价涨幅扩大至季增38%-43% 因美韩系厂商2025-2026年减少或停止供应DDR4X [4] 存储产业受益 - 内存原厂有意扩大售价涨幅 DDR4仍将供不应求 推动各类存储原厂端供应价格上行 [4] - 国内存储长期受益 概念股包括同有科技、朗科科技、兆易创新等 [4] 具身智能机器人政策 - 杭州市促进具身智能机器人产业发展 建立多元智算供给服务体系 降低算力使用成本 [4] - 聚焦具身智能"大脑"、"小脑"及"本体"三大核心环节 支持研发平台建设和运营 [4] 人形机器人产业前景 - 2025年有望成为人形机器人从0到1阶段关键时点 行业头部公司加速推进零部件性能升级和成本降低 [5] - 具身智能市场规模加速打开 预计2026年突破万亿规模 概念股包括东土科技、汉宇集团、汉威科技等 [6] 股东减持动态 - 奥康国际股东项今羽拟减持不超过1200万股 占总股本3% [7] - 天孚通信股东询价转让价格为88.55元/股 受让方为14名机构投资者 拟受让990万股 [7] - 奇德新材实控人饶德生拟减持不超过167.91万股 占总股本2% [7] 继续股东减持 - 天合光能股东有则创投拟减持1247.49万股 占总股本0.57% 为实控人一致行动人 [7] - 诺邦股份金诺创及任建永拟合计减持不超过155.7万股 占总股本0.88% 为控股股东一致行动人 [7] - 南亚新材实控人包秀银拟减持不超过373.6万股 占总股本1.59% 监事金建中拟减持27万股 占总股本0.12% [8] 银行股减持交易 - 飞鹿股份股东何晓锋拟减持不超过303.37万股 占总股本1.48% 股东刘雄鹰拟减持不超过337.76万股 占总股本1.65% [8] - 重庆银行股东重庆水投拟减持不超过5200万股A股 占总股本1.5% 持股比例由8.5%降至7% [8] - 重庆市地产集团收购上述股份 交易金额不高于5.8亿元 获重庆市国资委批复同意 [8]
沪指再创年内新高,A股超4200只股票上涨,锂矿股大爆发
每日经济新闻· 2025-08-11 16:16
市场整体表现 - 市场全天震荡走高,创业板指领涨1.96%,沪指涨0.34%,深成指涨1.46%,盘中均创年内新高 [1] - A股全天成交额1.85万亿元,较上个交易日放量1136.68亿元,全市场超4200只股票上涨,逾百股涨超9% [1] - 港股横盘震荡,恒生指数涨0.01%,恒生科技指数跌0.23%,南向资金净卖出超14亿港元 [8] 板块表现 - PEEK材料概念股爆发涨幅7.54%,中欣氟材5天4板 [3][4] - 锂矿板块大涨5.24%,盛新锂能等多股涨停,赣锋锂业港股涨超20%,天齐锂业涨超17% [3][4][9] - 算力硬件股走强,胜宏科技创历史新高,高新发展涨停 [3][6] - 跌幅居前板块包括银行跌1.03%、黄金珠宝跌1.93%、煤炭开采跌0.34% [3][4] 重要事件驱动 - 宁德时代宜春项目采矿证到期暂停开采,碳酸锂期货主力合约涨停8%报81000元/吨 [5] - 江西锂矿停产可能影响每月7000-8000吨碳酸锂当量,瓷土矿转锂土矿税率提高成本 [5] - 华为将于8月12日发布AI推理突破性技术,可能降低对HBM技术依赖 [6] 机构观点 - 中信建投认为A股处于牛市中继,建议关注AI算力、半导体、人形机器人、有色等新赛道低位品种 [7] - 财通证券与天风证券均认为碳酸锂供给收缩预期加剧,或迎来价值重估 [5]
金融AI论坛来袭!华为将发布突破性成果,聚焦信息技术自主可控的——信创ETF基金(562030)盘中涨超1%
新浪基金· 2025-08-11 11:02
信创ETF基金市场表现 - 信创ETF基金(562030)8月11日场内价格盘中涨超1% 现涨0.79% [1] - 成份股东方国信涨超5% 电科网安涨逾4% 致远互联、云天励飞、赢时胜跟涨 [1] 华为AI技术突破 - 华为将于8月12日发布AI推理领域突破性技术 降低中国AI推理对HBM技术依赖 [3] - 华为高性能AI存储将数据加载时间从小时级缩短至分钟级 算力集群效率从30%提升至60% [3] - 长记忆存储能力避免重复运算 大幅降低推理成本 [3] 信创产业发展前景 - 信创产业按"2+8+N"节奏推进 从政策驱动转向政策+市场双驱动 [4] - 党政信创向县乡级下沉 行业信创在金融、能源等领域加速渗透 [4] - 2025-2026年市场规模增速分别达17.84%和26.82% 2026年突破2.6万亿元 [4] - 超长期特别国债扩容及化债方案落地为信创采购提供资金保障 [4] 信创产业投资逻辑 - 地缘政治扰动加剧自主可控需求 国家从安全角度大力扶持信创领域 [5] - 地方化债力度加码推动政府信创采购回暖 [5] - 华为等国产厂商实现新技术突破 国产软硬件市场份额有望攀升 [5] - 信创推进到达关键时间节点 采购标准进一步细化 [6] 行业趋势与需求 - AI大模型加速端侧AI和Agent应用落地 带来网络安全及信创建设需求 [3] - AI大模型自主可控已迫在眉睫 [3] - 存力是激活数据价值、赋能垂直行业的关键基础设施 [3]
增长迅猛如火箭!网络业务成英伟达(NVDA.US)AI芯片霸主地位隐形支柱
智通财经网· 2025-08-11 10:41
数据中心业务 - 英伟达第二季度财报焦点集中在数据中心业务 该板块是公司销售高性能AI处理器实现营收的核心 [1] - 数据中心业务不仅包括芯片销售 还涵盖网络技术产品如NVLink InfiniBand和以太网解决方案 这些技术对芯片通信和服务器互联至关重要 [1] - 上一财年数据中心板块总收入1151亿美元 其中网络业务贡献129亿美元 超过游戏板块的113亿美元 [1] 网络业务表现 - 第一季度网络业务为数据中心板块391亿美元营收贡献49亿美元 随着AI算力扩展需求增长 该业务将持续扩张 [2] - 网络业务占数据中心营收11% 但增长速度极快 被Deepwater Asset Management称为最被低估的部分 [2] - 网络技术包括NVLink(连接GPU) InfiniBand(连接服务器节点)和以太网(前端网络) 三种网络对构建AI计算机均不可或缺 [2][3] 技术需求与行业趋势 - AI推理需求增强 企业开发大型AI模型和自主代理功能时 GPU间同步要求提高 网络技术对推理性能至关重要 [3][4] - 行业初期误认为推理算力需求低 但实际运行中高性能系统能显著提升推理速度和处理能力 网络技术与CPU GPU DPU耦合对推理体验起关键作用 [4][5] - 竞争对手如AMD和云计算巨头(亚马逊 谷歌 微软)研发自有AI芯片 行业组织推出UALink技术挑战NVLink 但英伟达仍保持领先地位 [5]
华为将发布AI推理黑科技;工业富联业绩创新高丨科技风向标
21世纪经济报道· 2025-08-11 10:30
巨头风向标 - 中国工程院院士倪光南强调构建AI+机器人生态系统 提升机器人智能审评 实现脑-眼-行动协同系统[2] - OpenAI宣布GPT-4o重新上线 供Plus和Team用户使用 用户可通过启用"显示旧版模型"访问[3] - 华为联合中国银联将于8月12日发布AI推理应用成果 旨在降低对HBM技术依赖 提升国内AI大模型推理性能[4] - 宇树科技CEO王兴兴表示低价机器人策略为提高出货量并建立开发生态 指出机器人硬件已基本够用 但具身智能尚未达到"GPT时刻"临界点[5] - 特斯拉Dojo超级计算机团队负责人离职 马斯克终止该项目 转向依赖英伟达、AMD等外部技术合作伙伴[6] - 长安汽车集团董事长朱华荣拜访华为任正非 交流产业竞争态势及未来格局 任正非对长安汽车及阿维塔品牌提出指导性意见[6] - 智元机器人与富临精工达成数千万元合作 近百台远征A2-W机器人将落地工厂 成为国内工业领域具身机器人首例规模化商业签单[6][7] 技术突破 - 本源量子实现全球首个基于量子边编码技术的药物分子性质预测应用 在"本源悟空"超导量子计算机完成真机验证 大幅提升分子行为预测精度[8] - 中国中铁隧道局发布国内首个隧道与地下空间垂直大模型 依托773条工程线路和1200亿条建造数据 已在多项隧道工程完成验证[11] - 北京亦庄启动具身智能社会实验计划 开放近千个真实场景数据采集点位 首批20个实训场及近百个点位将于本月开放[12] 产业合作 - 中创新航与广汽高域签署eVTOL领域战略合作协议 共同推进电源标准化产品 广汽高域GOVY AirCab搭载能量密度超300Wh/kg电池 计划2026年下半年量产交付[9] - 小红书开放语音评论功能体验申请 要求用户满足实名认证且近28天每日访问平台 需版本8.94及以上[10] 芯片与硬件 - 歌尔股份控股子公司向Haylo提供不超过1亿美元借款 用于收购Plessey Semiconductors并投资Micro-LED技术 支持AI智能眼镜和AR业务发展[13] - 三安光电SiC MOSFET产品向台达、光宝等数据中心及AI服务器电源客户批量供货 湖南基地年产25万片6英寸SiC晶圆 二期项目将导入8英寸产线[14][15] 资本运作 - 万兴科技筹划发行H股股票并在香港联交所上市 具体细节尚未最终确定[16] - 万通发展计划投资8.5449341亿元取得数渡科技62.9801%股权 数渡科技主营PCIe高速交换芯片研发 已推出支持PCIe5.0协议产品[17] - 世运电路投资1.25亿元取得新声半导体3.8238%股权 新声半导体主营SAW/BAW滤波器及FEM模组研发生产[18] - 天孚通信股东朱国栋拟通过询价转让方式减持1.27%股份 合计990万股 转让原因为自身资金需求[19] 业绩表现 - 工业富联2025年上半年营收3607.6亿元同比增长35.6% 归母净利润121.1亿元同比增长38.6% 第二季度云服务商服务器营收同比增长超150% AI服务器营收同比增长超60% 800G高速交换机营收较2024全年增长近三倍[20]
AI与机器人盘前速递丨智元机器人获富临精工数千万元订单;华为将发布AI推理领域突破性成果!
每日经济新闻· 2025-08-11 09:37
市场表现 - 上证指数收跌0.12% AI应用、半导体、PEEK材料、机器人等概念股回调 [1] - 科创人工智能ETF华夏收跌2.72% 持仓股福昕软件领跌8.54% 云从科技、金山办公、合合信息跌幅超6% [1] - 机器人ETF收跌1.38% 持仓股信邦智能逆势涨停20% 东杰智能领跌11.06% 晶品特装跌9.02% 中大力德、博杰股份、云天励飞跌超4% [1] - 机器人ETF单日获资金逆势加码超5800万元 最新规模达159.75亿元 最新份额172.17亿份居同类首位 [1] 行业动态 - 智元机器人与富临精工达成数千万元项目合作 近百台远征A2-W机器人落地工厂 系国内工业具身机器人首例规模化商业签单 [2] - 华为将于8月12日发布AI推理领域突破性技术成果 或降低中国AI推理对HBM技术依赖 提升AI大模型推理性能 [2] - 北京经济技术开发区发布具身智能社会实验计划 配套专项支持政策十条硬核措施 全方位支持具身智能机器人产业发展 [2] 技术演进 - 具身大模型将在模态扩展、推理机制与数据构成三方面持续演进 下一阶段有望引入触觉、温度等感知通道 [3] - Cosmos架构通过状态预测赋予机器人想象力 实现感知-建模-决策闭环 构建更真实世界模型提升环境建模与推理能力 [3] 产品特征 - 机器人ETF是全市场唯一规模破百亿、流动性最佳、覆盖中国机器人产业链最全的主题ETF [4] - 科创人工智能ETF华夏具备20%涨跌幅与中小盘弹性特性 定位AI产业奇点时刻捕捉工具 [5]
华为即将发布AI推理领域突破性成果;GPT-5差评如潮GPT-4o紧急重新上线
观察者网· 2025-08-11 08:59
华为AI推理技术突破 - 华为将于8月12日发布AI推理领域突破性技术成果,可能降低中国AI推理对HBM技术的依赖,提升国内AI大模型推理性能 [1] OpenAI模型调整 - GPT-5上线后收到差评,OpenAI紧急重新上线GPT-4o供Plus和Team用户使用 [1] - OpenAI CEO预测GPT-8时代AI或能治疗癌症 [1] AI医疗应用进展 - NASA与谷歌合作开发AI医疗助理"CMO-DA",目前诊断准确率:腰痛74%,耳痛80%,脚踝损伤88% [2] 机器人产业发展 - 中国工程院院士倪光南强调构建"AI+机器人"生态系统,提升机器人智能审评水平 [3] - 宇树科技CEO指出具身智能机器人大模型是行业关键挑战,发展仍处早期阶段 [3] - 未来2-5年智能机器人技术三大方向:统一的大模型、低成本硬件量产、分布式算力 [3] 机器人商业化应用 - 全球首家机器人4S店和主题餐厅在北京开业,推动机器人技术融入日常生活 [4] 政策支持 - 北京亦庄发布"具身智能机器人十条"政策,包含8条创新支持措施推动产业发展 [6] 小鹏汽车积分纠纷 - 小鹏汽车被曝私自使用车主5000积分,消费者维权受阻 [7]
董明珠喊话:不用格力你就是在犯错误;华为将发布AI推理领域突破性成果,或能降低对 HBM 依赖;京东将在智能机器人领域投入超百亿
雷峰网· 2025-08-11 08:41
家电行业 - 格力电器董事长董明珠在品牌大会上强调格力冰箱具有保鲜技术优势,蔬菜水果存放20天后仍能保持新鲜,并称"不用格力的洗衣机和冰箱,那就是你犯的错误"[4][5] - 格力电器正在推动多元化战略,布局冰箱(晶弘)、小家电(大松)甚至手机领域,试图打破"空调专业户"的单一品类形象[4][5] - 格力电器在2021年推出十年免费保修政策,至今未有竞争对手跟进[5] AI与科技 - 华为将于8月12日发布AI推理领域突破性技术成果,可能降低对HBM技术的依赖并提升国内大模型性能[7] - 华为昇腾已实现多项性能突破,包括单卡Decode吞吐突破1920 Tokens/s和单卡吞吐达到808 Tokens/s[8] - 京东宣布将在智能机器人领域投入超百亿资源,计划三年内助力100个智能机器人品牌销售破10亿[8] - 京东智能机器人品类在618期间整体增速超过3倍,其中具身智能品类增速达17倍[9] - 阿里云通义千问Qwen Code宣布每日可免费运行2000次,仅限中国大陆用户[24] 汽车行业 - 理想汽车CEO李想回应被黑事件,称知道是哪个品牌在操控专业水军机构[9][10] - 蔚来CEO李斌表示电池寿命与车寿命不匹配是亟需解决的问题,蔚来通过换电站保障电池安全[24] - 第三代蔚来ES8车型将于8月20日亮相,采用900V超充快换平台,5分钟可充电超过250km[27][28] - 智界品牌进入2.0阶段,武汉首家专网用户中心已在施工中,将由华为主导、奇瑞配合[15][16] - 长安汽车董事长朱华荣拜访华为任正非,就支持长安汽车、阿维塔品牌等交流意见[19][20] 机器人领域 - 宇树科技CEO王兴兴表示现阶段期待机器人干活产生大价值不太现实,应先从表演、格斗等场景切入[12] - 王兴兴提出未来国家可以对机器人征税,机器人产出可直接上交给国家[34][35] - 宇树科技R1机器人起售价3.99万元,不同产品系列按型号划分价格[35] 显示技术 - OPPO、vivo和小米将很快升级双层OLED屏幕,目前已在苹果、华为和荣耀机型上应用[37][38] - 双层OLED采用两层发光层设计,理论亮度可达单层OLED的两倍,但成本较高将仅用于高端旗舰机型[38] 国际科技 - 英特尔CEO陈立武回应特朗普离职建议,表示要重振英特尔[41][42] - OpenAI宣布ChatGPT-4o面向Plus和Team用户重新上线,即将推出迷你版GPT-5[42] - 微软明确Win10 ESU计划细则,必须绑定Microsoft账户,费用为30美元最多更新十台电脑[43][44] - 马斯克表示可能失去对特斯拉的控制权,希望持股比例达到25%以确保影响力[46][47] 互联网平台 - 抖音电商成立安全与信任中心,首期严打直播间盲盒违规营销,已清退达人账号1000余个[18][19] - 小红书推出语音评论功能,用户可申请体验资格[30]