Workflow
AI推理
icon
搜索文档
华为,AI大动作!
证券时报· 2025-08-10 15:00
华为AI推理技术突破 - 华为将发布AI推理领域突破性技术成果 可能降低中国AI推理对HBM技术的依赖 [1] - 该技术有望提升国内AI大模型推理性能 完善中国AI推理生态关键部分 [1] - 华为联合中国银联将于8月12日共同发布AI推理最新应用成果 推出推理加速黑科技 [1] HBM技术重要性 - HBM是解决"数据搬运"问题的关键技术 [2] - HBM不足会导致AI推理体验下降 出现任务卡顿、响应慢等问题 [2] 金融AI推理论坛议程 - 8月12日将召开"2025金融AI推理应用落地与发展论坛" [3] - 论坛议程包括: - 14:10-14:30 银联推理应用成果介绍及发布仪式 [5] - 14:30-14:45 华为AI存储推理加速解决方案介绍 [5] - 14:45-15:00 大模型推理优化技术突破与产业落地新范式(信通院专家) [5] - 15:00-15:15 以KV Cache存储为中心的大模型推理架构(清华大学专家) [5] - 15:15-15:30 讯飞MaaS平台大模型高性能推理实践(讯飞专家) [5]
华为,AI大动作!
中国基金报· 2025-08-10 11:17
华为AI推理技术突破 - 公司将于8月12日发布AI推理领域突破性技术成果,可能降低中国AI推理对HBM技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态关键部分 [1] - 当前AI产业从"追求模型能力的极限"转向"追求应用价值的最大化",推理成为AI下一阶段发展重心 [1] - HBM是解决"数据搬运"的关键,HBM不足会导致AI推理体验下降,出现任务卡顿、响应慢等问题 [2] 金融AI推理应用 - 公司携手中国银联共同发布AI推理最新应用成果,探索AI推理技术在金融领域的规模化落地路径 [3] - AI成为金融行业智能化转型核心驱动力,AI推理技术落地应用正在加快提升金融服务效率 [3] - 截至6月,公司在金融行业已携手全球超过1.1万名伙伴,在80多个国家和地区服务超过5600家金融客户 [3] 行业论坛与专家观点 - 信通院、清华大学和科大讯飞专家将在"2025金融AI推理应用落地与发展论坛"上分享大模型推理加速与体验优化实践 [2] - 公司是国家人工智能应用中试基地生态建设合作伙伴 [3] 相关ETF表现 - 食品饮料ETF(515170)近五日涨0.53%,市盈率19.93倍,最新份额60.0亿份,主力资金净流出668.8万元 [7] - 游戏ETF(159869)近五日涨7.91%,市盈率46.48倍,最新份额58.0亿份减少3.5亿份,主力资金净流入3106.7万元 [7] - 科创半导体ETF(588170)近五日涨0.37%,最新份额3.9亿份增加600.0万份,主力资金净流出664.7万元 [7] - 云计算50ETF(516630)近五日跌1.63%,市盈率114.56倍,最新份额3.9亿份减少200.0万份,主力资金净流出1490.2万元 [8]
华为将发布AI推理领域突破性成果 完善中国AI推理生态关键部分
中国基金报· 2025-08-10 11:10
事件概述 - 华为计划于8月12日发布AI推理领域的突破性技术成果 [1] - 该技术或能降低中国AI推理对高带宽内存技术的依赖,提升国内AI大模型推理性能 [1] - 华为将携手中国银联共同发布AI推理在金融领域的最新应用成果 [1] 行业趋势 - AI产业已从“追求模型能力的极限”转向“追求应用价值的最大化”,推理成为AI下一阶段的发展重心 [1] - AI推理技术的落地应用正在加快提升金融服务效率,AI已成为金融行业智能化转型的核心驱动力 [1] - 提升AI推理体验成为AI发展进入深水区的重要课题 [1] 技术背景 - 高带宽内存是解决“数据搬运”的关键技术 [1] - 高带宽内存不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题 [1] 相关活动 - “2025金融AI推理应用落地与发展论坛”将于8月12日召开 [1] - 来自信通院、清华大学和科大讯飞的专家将分享大模型推理加速与体验优化的实践 [1] 公司背景 - 华为是国家人工智能应用中试基地生态建设合作伙伴 [1] - 截至6月,华为在金融行业已携手全球超过1.1万名伙伴,在80多个国家和地区服务超过5600家金融客户 [1]
华为,AI大动作!
中国基金报· 2025-08-10 11:05
华为AI推理技术突破 - 公司将于8月12日发布AI推理领域突破性技术成果 可能降低中国AI推理对HBM技术的依赖 [2] - 该技术有望提升国内AI大模型推理性能 完善中国AI推理生态关键部分 [2] - 公司携手中国银联共同发布AI推理最新应用成果 探索金融领域规模化落地路径 [5] AI推理行业趋势 - 行业已从"追求模型能力极限"转向"追求应用价值最大化" 推理成为下一阶段发展重心 [3] - HBM技术是解决"数据搬运"关键 供应不足会导致AI推理体验下降 出现任务卡顿等问题 [4] - 金融行业智能化转型中 AI推理技术正加快提升金融服务效率 [5] 华为AI生态布局 - 公司是国家人工智能应用中试基地生态建设合作伙伴 [5] - 截至6月 公司在金融行业已与全球超1.1万名伙伴合作 覆盖80多个国家和地区 服务超5600家金融客户 [5] 行业活动 - "2025金融AI推理应用落地与发展论坛"将于8月12日召开 信通院、清华大学及科大讯飞专家将分享大模型推理加速实践 [4]
揭秘:OpenAI是如何发展出推理模型的?
硬AI· 2025-08-04 17:46
OpenAI的AI发展路径 - OpenAI的成功源于数学领域的探索,而非ChatGPT的意外走红,数学被视为逻辑和推理能力的试金石[3][4][5] - 公司内部代号"草莓"的计划旨在通过数学训练提升AI的推理能力,最终目标是开发通用AI智能体[4][8] - 2024年推出的o1推理模型展现了突破性进展,其核心研究员成为行业争抢对象,Meta以亿美元薪酬挖走5人[10] 技术突破与创新 - 结合大语言模型(LLM)和强化学习(RL),开发出"思考链"(Chain-of-Thought)方法,使AI能展现完整解题思路[9][10][12] - 测试时计算技术让模型在给出答案前反复验证步骤,IMO金牌模型采用多智能体协作探索最优解[12][15] - AI推理机制不同于人类思考,但能实现更强大结果,如同飞机与鸟类飞行的差异[13] 未来发展方向 - 当前AI擅长客观编码任务,但处理主观任务(如旅行规划)仍存在数据瓶颈[15] - 下一代AI将向多智能体协作演进,从处理事实转向理解主观意图[16] - 终极目标是开发能自主处理互联网任务并理解用户偏好的超级智能体[16] 行业竞争格局 - OpenAI面临Google、Anthropic、xAI和Meta等对手的激烈竞争[17] - 行业焦点已从能否实现智能体未来转向谁将率先突破[17]
【深圳特区报】云天励飞董事长兼CEO陈宁:选准了赛道来对了城市
搜狐财经· 2025-08-04 07:51
公司发展历程 - 公司成立于2014年 初心是通过NPU降低AI算法计算成本 并凭借NPU课题获得政府人才引进项目第一名及研发资金支持[3][9] - 公司推出首个智慧警务产品"深目"系统 上线后使深圳某区警情下降50% 并实现15小时跨省找回被拐儿童[3][9] - 2019年获得国家发改委 科技部和工信部芯片项目 其中科技部项目已完成验收[3][9] - 2020年全面转向国产工艺 成为首家采用国产Chiplet工艺的AI芯片公司[4][10] - 经过11年发展 从几人团队成长为近千人规模的上市企业[4][11] 技术研发成果 - 基于FPGA实现首款自主知识产权神经网络处理器 应用于加速卡及边缘计算盒子 主要用于目标识别与特征提取[3] - 2018年第二代自主知识产权神经网络处理器芯片正式投片 应用于智能相机 政务终端 机器人及工业智能检测等领域[3] - 已推出五代NPU芯片 针对边缘推理 大模型推理和具身智能场景推出系列产品矩阵[6][13] - 获得海内外授权专利1000余项 其中发明专利700余项 发明专利占比超70%[13] - 自研深界DeepEdge10系列AI推理芯片采用"算力积木"架构 满足从边缘设备到智算中心的高性能计算需求[13] 战略布局与规划 - 在2025世界人工智能大会宣布全面聚焦AI芯片 围绕边缘计算 云端大模型推理和具身智能三大核心布局 打造国产算力加速器[4][10] - 提出"自进化城市智能体"战略蓝图 深圳市政府连续三年将其纳入规划 较全球AI Agent概念领先5年[5][12] - 构建覆盖云端 边缘和智能终端的AI推理产品系列 包括模组 边缘智能盒子 AI推理加速卡 大模型推理一体机及智算服务器[14] - 在具身智能领域与十余家机器人厂商合作 边缘芯片产品已进入服务型机器人实际部署阶段[15] - 致力于打造涵盖高性能 低成本和强适配三大优势的国产AI推理芯片体系 成为AI大模型时代关键加速器[15] 行业趋势判断 - 2025年是人工智能重要转折点 大模型技术成熟度提升且调用成本显著降低 AI从专家工具演变为全民基础设施[6][13] - AI从训练时代迈入推理时代 推理算力需求将迎来爆发式增长[6][13] - 中国有机会在AI推理时代定义推理芯片标准[13] 区域发展环境 - 深圳被评价为全国最适合海归创业的城市 粤港澳大湾区是全球最具潜力的人工智能创新先行区[4][11] - 深圳通过深度研判技术潜力与产业方向适配性 推动技术从实验室走向产业化 构建产学研深度融合的创新生态[5][11] - 过去4年深圳积极推动鹏城自进化智能体建设 将AI技术应用于警务 交通 教育 医疗和城市治理等领域[5][12]
IPO周报 | 云天励飞赴港上市;蓝箭航天、艺妙神州启动科创板IPO
IPO早知道· 2025-08-03 20:41
云天励飞 - 公司于2025年7月30日向港交所递交招股说明书,拟主板挂牌上市,华泰国际、中信证券和招银国际担任联席保荐人,迈向"A+H"双重上市新阶段 [3] - 公司长期专注于AI推理芯片研发设计,推出面向企业级、消费级、行业级三大场景的NPU驱动AI推理芯片产品,构建从基础设施到商业化落地的完整闭环 [3] - 以2024年中国市场收入计算,公司是全场景AI推理芯片行业前三、NPU驱动AI推理芯片领域前二的提供商 [4] - 2022-2024年营收分别为5.46亿元、5.06亿元和9.17亿元,2025年Q1营收同比增长168%至2.64亿元 [4] - 中国AI推理芯片行业规模从2020年113亿元以94.9%复合年增长率增至2024年1,626亿元,预计2029年达13,830亿元 [4] - 公司宣布加大对AI推理芯片投入,未来布局边缘计算、云端大模型推理、具身智能三大方向 [4] 蓝箭航天 - 公司于2025年7月25日同中金公司签署辅导协议,启动科创板上市进程,或将成为"科创板商业航天第一股" [6] - 公司致力于构建中大型液氧甲烷运载火箭全产业链条,为全球提供高性价比航天运输服务 [6] - 作为全国首家取得全部准入资质的民营运载火箭企业,2023年7月实现全球首款液氧甲烷火箭朱雀二号遥二成功入轨 [6] - 朱雀三号可重复使用运载火箭计划2025年下半年首飞,起飞重量约570吨,已完成我国规模最大的九机并联地面热试车 [7][8] - 2025年4月15日第100台天鹊系列液氧甲烷火箭发动机下线,标志民营商业航天进入规模化应用新阶段 [8] 艺妙神州 - 公司于2025年7月23日同中信证券签署辅导协议,启动科创板上市进程 [10] - 专注于原研基因细胞药物技术,拥有自主研发和产业化平台,已获批7项中国和1项美国CAR-T新药临床试验批准 [10] - 血液肿瘤产品IM19已在中国提交上市申请并获得受理,实体肿瘤产品IM96获中美临床试验批准 [10] - IM19采用创新CAR分子设计,可显著提升r/r DLBCL患者生存质量,填补国产CAR-T药物市场空白 [11] - IM96是全球唯一中美获批的靶向GUCY2C的CAR-T候选药物,国内首个针对结直肠癌的CAR-T候选药物 [11] - 成立至今累计完成10轮融资,投资方包括君联资本、国投创业等30余家机构 [12] 行业动态 - 科创板将重启未盈利企业适用第五套标准上市,扩大适用范围至人工智能、商业航天、低空经济等前沿领域 [6]
GPU的替代者,LPU是什么?
半导体行业观察· 2025-08-03 11:17
核心观点 - Groq的LPU(语言处理单元)架构专为AI推理设计,消除了传统GPU在推理速度和精度之间的权衡,能够在保持高质量的同时实现极低延迟 [2] - 通过TruePoint数值技术、SRAM主存储器、静态调度等创新,LPU在运行1万亿参数模型时展现出显著性能优势 [3][4][6][7][9] - 该架构支持张量并行和流水线并行,使Moonshot AI的Kimi K2等大模型能实时生成令牌 [10] - 在MMLU等基准测试中,Groq解决方案在保持高准确率的同时,速度比BF16提升2-4倍 [3][15] 技术架构创新 数值处理 - TruePoint技术允许在无损精度的区域降低计算精度,以FP32执行矩阵运算,同时选择性量化输出,速度比BF16快2-4倍且无准确率损失 [3] - 采用100位中间累积存储,确保无论输入位宽如何都能实现无损累积 [3] 内存设计 - 使用数百兆片上SRAM作为主权重存储器(非缓存),相比DRAM/HBM将访问延迟从数百纳秒降至最低 [6] - 支持混合精度存储:FP32用于注意逻辑,块浮点用于MoE权重,FP8用于容错层激活 [5] 执行模型 - 编译器预先计算整个执行图至时钟周期级别,消除动态调度带来的延迟 [7][9] - 静态调度实现无尾延迟的张量并行和流水线并行,支持第N+1层在N层计算时即开始处理 [9] 性能优化 并行处理 - 张量并行将单层拆分到多个LPU芯片,使单次前向传递更快完成,适合实时应用 [10] - 推测解码技术通过草稿模型预测令牌,LPU架构能高效验证批次,支持每个流水线阶段处理2-4个token [11] 芯片互连 - RealScale互连协议消除时钟漂移,使数百个LPU对齐为单核心,编译器可精确预测数据到达时间 [12] 实际应用表现 - 在OpenBench框架测试中,运行Kimi-K2-Instruct模型时保持高准确率得分 [15] - 第一代14nm LPU已实现优异性能,近期使Kimi K2在72小时内性能提升40倍 [16]
又一家AI芯片企业,获巨额融资
半导体芯闻· 2025-07-30 18:54
融资动态 - AI芯片初创公司Groq正洽谈新一轮6亿美元融资 估值接近60亿美元 若达成则较2024年8月28亿美元估值实现一年内翻倍[1] - 最新融资由风投机构Disruptive领投 已注资超3亿美元 2024年11月融资则由贝莱德领投 参与方包括Neuberger Berman 思科 KDDI及Samsung Catalyst Fund等[1] - 公司此前累计融资额约10亿美元 2024年8月曾以6.4亿美元融资创28亿美元估值[1] 财务与业务进展 - The Information报道称Groq将2025年收入预期下调超10亿美元 但知情人士表示下调部分预计在2026年实现[2][3] - 2024年5月与加拿大贝尔达成独家合作 为其大型AI基础设施提供算力 4月与Meta合作加速Llama4模型推理效率[3] 技术定位与竞争格局 - 公司专注LPU(语言处理单元)芯片设计 专攻AI推理场景而非训练 采用不同于英伟达GPU的技术路径[3] - 创始人乔纳森·罗斯曾参与开发谷歌TPU芯片 强调LPU避免使用高带宽内存等昂贵组件 供应链集中于北美[3][4] - 推理芯片领域竞争者包括SambaNova Ampere Cerebras及Fractile等 公司计划在多维度与英伟达等形成差异化[3] 行业背景 - 英伟达GPU主导AI模型训练芯片市场 但推理芯片领域存在多家初创企业争夺份额[3] - 公司技术路线选择反映行业对专用推理芯片的需求增长 尤其在实时数据处理场景如聊天机器人等[3]
传英伟达(NVDA.US)“挑战者”Groq接近完成新一轮融资,估值或翻倍至60亿美元
智通财经· 2025-07-30 15:09
融资动态 - AI芯片初创公司Groq正洽谈新一轮6亿美元融资 估值接近60亿美元 若达成则较2024年8月28亿美元估值实现一年内翻倍 [1] - 本轮融资由Disruptive公司牵头 2024年11月融资由贝莱德领投 Neuberger Berman等多家机构参与 [1] - 公司此前累计融资约10亿美元 2024年8月曾以6.4亿美元融资刷新估值 [1] 技术定位 - Groq设计的LPU芯片专攻AI推理场景 针对预训练模型实时数据处理 如聊天机器人响应生成 [2] - 公司CEO指出LPU不依赖高带宽内存等昂贵组件 供应链集中于北美 与英伟达GPU形成差异化 [2] 行业竞争 - 英伟达GPU主导AI训练芯片市场 但推理芯片领域涌现Groq、SambaNova、Ampere等多加初创公司竞逐 [2] 商业合作 - 2024年5月与加拿大贝尔达成独家合作 为其AI基础设施提供算力支持 [1] - 2024年4月与Meta合作推出AI基础设施 加速Llama4模型推理效率 [1] 公司背景 - 创始人乔纳森·罗斯曾参与开发谷歌TPU芯片 公司2016年进入公众视野 [1]