人工智能

搜索文档
先见石破茂后见特朗普!李在明赴美前先学日美“关税”咋谈的?
第一财经· 2025-08-24 12:29
值得注意的是,李在明首次针对特定国家的外访首先选择日本,而非美国,打破了此前历任韩国总统首 访必须美国的先例。 对此,上海市朝鲜半岛研究会副会长、上海对外经贸大学朝鲜半岛研究中心主任詹德斌告诉第一财 经,"李在明此次先访日再访美,其实最终目的还是铺垫对美国的访问。" 向日方"取经" 李在明此行也是为了"取经",向日方了解如何与这届美国政府打交道。 时隔17年,日韩领导人再度发表联合新闻公报。 据韩国政府此前的吹风信息,韩国总统李在明于8月23日至24日先访日本,与日本首相石破茂会晤。随 后启程访问美国,与美国总统特朗普举行会谈。两次访问都属于工作性质。 8月23日,李在明抵达日本,这是他就任韩国总统以来的首次访日。当天傍晚,李在明在东京首相官邸 与石破茂举行会谈。这是两国领导人自今年6月加拿大七国集团(G7)峰会期间会晤以来的第二次面对 面会谈。24日,李在明结束访日行程,启程访美。 "实用主义"外交 23日,日韩双方领导人在东京会谈后发表联合新闻公报。这是日韩领导人时隔17年再次以联合文件的形 式公布会谈成果。 据新华社报道,两国首脑一致同意稳步推进双边关系:包括在安全领域加强战略沟通;推动双方在氢 能、人 ...
4万亿AI帝国继承之战!黄仁勋「王储」曝光:长公主比他还狠,太子低调进入权力核心
首席商业评论· 2025-08-24 12:27
前不久往返中美频繁发声的黄仁勋,是把英伟达打造成 4 万亿帝国的「AI教父」,今天 The Information 曝光了一个老黄布局多年的秘密。 而这个秘密的揭开,要从今年早些时候的一次英伟达全员大会说起。一个敏感问题通过匿名提问系统跳出来,现场数千名员工的目光瞬间都聚焦到了台上的黄仁 勋身上。 英伟达员工的二代正在进入公司,这种裙带关系你怎么看? 穿着标志性黑皮夹克的黄仁勋没有回避,身体微微前倾,拿起话筒:公司确实雇佣了不少员工的孩子。他还笑着补充说,这些父母要是没把握孩子不会给自己丢 脸,绝对不敢推荐,而且很多「二代」表现得比他们爹妈还要出色。 这场看似即兴的问答更像是一次精心的安排。就像往平静湖面扔了颗石头,瞬间在英伟达内部掀起了不小的波澜,也让外界第一次把目光聚焦到了两个最特殊的 「二代」身上——黄仁勋自己的一双儿女:35 岁的斯宾塞和 34 岁的麦迪逊。 在这个全球市值最高的 AI 帝国里,一场关于自我证明、摆脱父辈光环、以及企业内代际传承的史无前例的大戏,正拉开帷幕。 逃离硅谷的甜点师与调酒师 很长一段时间里,没人能想到黄仁勋的子女会踏入英伟达的大门。当硅谷其他科技巨头的子女们正按部就班地在常春 ...
DeepSeek加速国产AI芯片的"算力突围战"
首席商业评论· 2025-08-24 12:27
文章核心观点 - 深度求索发布V3.1版本大模型 提出UE8M0 FP8浮点数格式 专为下一代国产芯片设计 体现国产AI生态从软件到硬件的深度协同变革 [6][11][13] - UE8M0 FP8采用范围优先策略 放宽小数精度 确保数值范围稳定 适配国产芯片硬件逻辑 虽损失细节但避免计算溢出风险 [11] - FP8标准竞争本质是算力生态争夺 国产阵营需从模型到芯片协同创新 大模型厂商主动调整技术路线 与国产硬件对齐 即便暂时性能妥协 [13][14] 技术背景与行业现状 - 模型参数通常以浮点数形式存储计算 传统FP32精度高但显存占用大 FP8通过牺牲部分精度 换取显存占用减半和计算速度大幅提升 [7] - 英伟达在H100等GPU上实现FP8高效支持 通过动态缩放策略和Tensor Core指令优化 成为训练千亿级大模型标配 但这些优化深度绑定英伟达硬件 [7] - 国产GPU若直接照搬英伟达方案 面临数值不稳定和训练难以收敛等问题 [7] UE8M0 FP8技术特点 - UE8M0 FP8是范围优先变体格式 大幅放宽小数精度 优先确保数值范围稳定 适配国产芯片硬件逻辑 [11] - 设计类似于用粗糙但足够长卷尺测量 虽损失细节但避免计算溢出风险 [11] - 调整背景是国产GPU在指令集和底层架构上与英伟达存在差异 [11] 国产芯片生态进展 - 沐曦曦云C600计划2025年推出 原生支持FP8 采用多精度混合算力架构 [13] - 燧原科技L600主打训推一体 优化FP8计算效率 [13] - 合作模式成为未来趋势 模型端优化低精度计算策略适配国产芯片特性 芯片端针对主流大模型需求定制计算单元和指令集 生态端建立国产FP8标准逐步摆脱对英伟达依赖 [18] 产业意义与展望 - UE8M0 FP8背后是国产AI行业从单点突破迈向全栈协同的关键一步 [16] - 在算力被卡脖子背景下 软硬件深度绑定探索比单纯模型规模增长更具长远价值 [16] - FP8标准竞争本质是算力生态争夺 国产阵营需从模型到芯片协同创新 [13]
成都华微携手燧原科技开启大模型、高算力GPU领域深度合作
证券时报网· 2025-08-24 12:13
公司战略合作 - 成都华微与燧原科技正式签署战略合作协议 在大模型和高算力GPU领域展开深度合作[1] - 合作旨在整合双方优势资源 共同推动国产人工智能技术的创新与产业应用[1] 成都华微业务发展 - 公司不断加大在人工智能芯片方向的研发投入[1] - 探索芯片在大模型推理等场景下的优化应用[1] 燧原科技业务优势 - 作为人工智能云端算力产品领军企业 自主研发高算力GPU产品[1] - 产品具备强大计算能力与高效能耗比 在人工智能训练和推理领域表现出色[1] - 已服务于互联网、金融、科研等众多行业客户[1]
2025年从“千人一面”到“一人千面”:人工智能引领广告行业智能化转型报
搜狐财经· 2025-08-24 12:07
核心观点 - 生成式人工智能推动广告行业从计算广告时代进入智能广告时代,实现从"千人千面"到"一人千面"的深度个性化转型 [2][24][26] - AI深度赋能广告全链路:素材生产自动化与精品化两极发展、投放优化实现智能匹配、广告形态从展示位转向对话式嵌入 [2][26][27] - 行业生态重构,平台方、服务商、广告主形成新协作关系,多模态大模型和智能体成为新型基础设施 [2][29][36] 行业地位与经济价值 - 广告业规模超1.5万亿元人民币,占GDP比重约1.15%,数字广告渗透率达83.4% [32][34][36] - 广告支出每增加1元平均带动约7元经济产出,具有显著乘数效应 [32][35][37] - 行业创造高收入就业岗位,美国广告岗位平均薪资比全国水平高12% [32][35] 技术演进历程 - 广告技术从传统媒体(印刷/广播/电视)演进至数字广告(横幅/搜索广告),最终进入智能广告阶段 [39][40][44] - 1994年第一条可点击横幅广告标志互联网广告时代开启 [40][44] - 生成式AI实现从效率工具到创造伙伴的范式跃迁,推动实时个性化生成与分发 [40][42][44] 素材生产重构 - 效果导向型广告依赖AIGC实现批量自动化生产,品牌导向型广告仍以人类创意为核心 [2][26] - 文生文、文生图成为标配能力,图像与视频素材从辅助设计升级至动态生成 [2][24][26] 投放优化突破 - AI通过生成式召回、数据增强和多模态理解突破传统广告引擎毫秒级天文计算困境 [2][9][25] - 匹配范式从"千人千面"升级至"一人千面",实现供需智能匹配 [2][9][25] 广告形态升维 - 广告入口从用户界面转向智能代理,形态从展示位变为对话式嵌入 [2][25][27] - 催生无感嵌入式原生广告,如游戏影视动态品牌生成、社交平台内容植入 [2][27] 全球实践案例 - 谷歌通过Gemini模型构建生态协同,Meta依托Llama4推进广告沉浸化 [2][9] - 腾讯整合混元大模型与广告系统提升投放效果,快手通过可灵AI降低中小企业成本 [2][9] - 微盟以多层产品矩阵打通AI与电商SaaS,WPP和蓝色光标重构营销全链路 [2][10] 场景应用深度 - 大健康领域兼顾合规与创意生成,电商直播采用7×24数字人驱动运营 [10][27] - 微短剧通过AI精剪助力爆点传播,垂直零售如孩子王实现AIGC私域营销自动化 [10][27] 未来发展趋势 - 智能体成为端到端营销管理新服务模式,催生按效果付费等新商业模式 [11][29] - 多模态大模型、推理引擎和智能体协议构成新型基础设施 [11][29] - 行业分工重塑,平台方构建AI原生基础设施,代理商转向智力密集型服务 [29][36]
今年我国智能算力规模增长将超40%
搜狐财经· 2025-08-24 12:06
中国算力平台建设进展 - 已有10个省区市的算力分平台正式接入中国算力平台[1] - 平台汇聚不同地域和行业算力资源 构建算力调度"一张网"[1] - 实现100多个算力服务商入驻 完成1000余家行业用户注册[3] - 接入主流基础大模型和垂类模型近百个 为1000多个开发者提供在线调用服务[3] 算力互联互通规划 - 到2026年建立完备的算力互联互通标准、标识和规则体系[5] - 到2028年基本实现全国公共算力标准化互联 形成具备智能感知能力的算力互联网[5] - 平台能调度全国1/6的算力规模 支持每天上亿次算力调用[10] 算力与AI协同应用 - AI无人机反制系统实现99%以上识别精度 响应时间不到3秒[8] - 全球首个人工智能生产流水线在山东济南投入运行 年产能达1000多个订单[12][14] - 算力服务平台可自动匹配用户需求与算力资源 促进东西部供需衔接[10] 智能算力发展态势 - 中国算力总规模年增速达30% 智能算力需求呈现迅猛增长[14] - 2025年智能算力规模预计增长超40%[16] - 到2035年人工智能预计为中国GDP贡献超过11万亿元 占比4%-5%[14] - 算力应用大赛累计征集超2.3万个创新项目 在工业金融医疗等领域实现规模化推广[16]
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心· 2025-08-24 12:02
大模型技术发展推动AI专用芯片需求 - 大模型技术进步显著提升对AI专用芯片的关注度 专用芯片在计算任务负载中效率更高 谷歌TPU自2015年部署后已迭代至第7代 采用最先进制程工艺并针对机器学习推理任务优化架构[1] - TPU技术推动Gemini等大模型发展 加拿大西安大略大学团队基于学术研究目的开发开源TinyTPU芯片 支持机器学习推理和训练功能[1] TinyTPU开发动机与设计理念 - 项目初衷包括构建机器学习负载芯片的实践吸引力 以及填补同时支持推理和训练的开源加速器代码库空白[5] - 团队采用"Hacky Way"设计理念 优先尝试自主方案而非依赖逆向工程或AI代码生成工具 强调基础原理推导和硬件设计学习[6] - 开发过程注重深度学习算法与硬件设计的结合 通过图形化表达强化理解[6] TPU技术原理与架构特性 - TPU作为专用集成电路(ASIC)专注于提升机器学习推理和训练速度 与通用GPU相比在数学运算效率上具有显著优势[9] - 核心采用脉动阵列结构 由处理单元(PE)网格组成 每个PE执行乘累加运算 在时钟周期内同步处理数据[26][28] - 矩阵乘法占Transformer计算操作的80-90% 在超大型模型中达95% 占CNN计算操作的70-80% 脉动阵列专门优化此类运算[14] TinyTPU实现方案与技术细节 - 选择XOR问题作为验证场景 使用2x2脉动阵列(而非TPUv1的256x256) 输入为4x2矩阵代表4种二进制组合[18][21][23] - 采用权重平稳架构 通过矩阵旋转90度 输入交错延迟和权重转置实现数据对齐[35][38][44] - 集成偏差模块和LeakyReLU激活函数(泄漏因子α=0.5) 采用流水线技术将操作分解为多时钟周期以提升效率[50][52][58] - 创新性引入双倍缓冲机制 通过影子缓冲区预加载权重 减少50%时钟周期 支持持续推理[61][64] - 控制单元采用24位指令集(ISA)实现标志控制和数据加载 后期扩展至94位指令集以满足训练需求[68][117] 训练功能实现与优化 - 支持反向传播训练 使用均方误差(MSE)作为损失函数 通过链式法则计算梯度[71][74][75] - 发现前向传播与反向传播的数学对称性:前向使用转置权重矩阵相乘 反向使用未转置矩阵相乘[79][108] - 开发向量处理单元(VPU)统一处理逐元素操作 整合偏差 激活 损失和梯度计算模块[89][92] - 设计统一缓冲区(UB)模块存储激活值 权重和临时数据 配备双读写端口减少数据争用[97][98] - 对激活导数模块实施缓存优化 减少统一缓冲区访问次数[102][104] 性能验证与实际应用 - 通过GTKWave波形模拟验证权重更新功能 展示一个训练周期后参数变化[119] - 完整架构支持持续数据流处理 最大化脉动阵列利用率 实现推理和训练的硬件级协同[118]
AI基建狂潮--让华尔街“假也不休”的“为五年后不知道是什么的技术进行20-30年期限的融资”
华尔街见闻· 2025-08-24 12:01
一场史无前例的AI基建融资狂潮正席卷华尔街,数百亿美元资金涌向数据中心建设,银行家们连8月假期都顾不上 休。与此同时,业内高管和分析师开始质疑这股投资热潮是否正在催生新的泡沫,尤其是当投资者为一项五年后形 态未卜的技术提供长达30年的融资时。 8月23日,据报道,知情人士透露,摩根大通和三菱UFJ金融集团本周正在牵头一笔超过220亿美元的贷款,支持 Vantage Data Centers建设大型数据中心园区。Meta则从太平洋投资管理公司和Blue Owl Capital获得290亿美元资金, 在路易斯安那州农村地区建设大型数据中心。这交易凸显了市场对AI基建融资的狂热追捧。 然而,在资本疯狂涌入的背后,质疑声也开始浮现。行业关键参与者承认AI投资者可能面临痛苦。OpenAI首席执行 官Sam Altman表示,他认为当前的人工智能投资狂热与1990年代末的互联网泡沫存在相似之处。麻省理工学院一项 研究显示,95%的企业生成式AI项目未能产生任何利润。 分析人士指出,这种反差正让信贷观察人士感到紧张,特别是考虑到许多融资安排都基于数据中心未来现金流的预 测,而这些技术的长期盈利能力仍存在不确定性。花旗集团美 ...
重要算力产业链企业都来了,中国算力大会释放这些信息
21世纪经济报道· 2025-08-24 11:50
综合算力发展现状 - 截至2025年6月底中国在用算力中心机架总规模达1085万标准机架 智能算力规模达788 EFLOPS (FP16) [1] - 算力呈现"智算主导 多元协调发展"特征 智算规模显著提升 [2] - 全国存力规模超1680EB 较2023年增长约40% [3] - 国家枢纽间传输时延不超过20ms 集群到周边城市时延不超过5ms 区域内节点间时延达1ms [3] 区域算力分布格局 - 河北连续3年保持算力分指数全国第一 浙江和内蒙古分别提升6名和8名 [4] - 存力规模前十位中东部地区占80% 河北和广东存力规模均超160EB [4] - 运力前十位东部省份占70% 浙江 上海 江苏位居全国前三 [4] - 模力分指数呈现"东强西弱"态势 前五名均为东部地区 [5] - 环境分前十名中东 西部省份各占50% 西部具资源环境优势 东部具市场环境优势 [6] 算力平台建设进展 - 中国算力平台完成10个省区市分平台接入 实现"平台 主体 资源 生态 场景"全面贯通 [1] - 平台注册企业用户超1000家 入驻算力服务商逾100家 承载9000余张离散卡服务 [7] - 超算互联网平台连接全国30家超算/智算中心 提供七大类商品 国产算力占比超95% [10][11] - 山西建成以大同为核心的环首都算力集群 全省机架规模达51.4万标准机架 智能算力规模32EFLOPS [6] 产业生态协同发展 - OISA生态共建战略启动 为GPU卡间互联提供高性能方案 推动IP 芯片和超节点研发 [9] - 算力平台实现五大贯通:平台贯通形成全国算力资源一本账 主体贯通构建精准匹配机制 资源贯通构建算力调度一张网 生态贯通搭建社区 场景贯通形成技术攻坚榜单 [7] - 需深化算网协同 提升供给质效 筑牢存运基础 加速绿色转型 强化融合创新 [6]
中国通信服务(00552):AI算力基建和应用落地,带动集客市场和ACO业务较快发展
光大证券· 2025-08-24 11:14
投资评级 - 维持"增持"评级 [5][7] 核心观点 - AI算力基础设施建设和行业应用落地带动集客市场和ACO业务较快发展 [1][2][3] - 战略新兴业务成为高质量发展新动力 新签合同额超420亿元且占比超过40% [4] - 公司积极把握AI驱动算力建设及产业数字化转型机遇 开拓新成长空间 [4][5] 财务表现 - 1H25实现收入769.39亿元 YoY +3.4% 归母净利润21.29亿元 YoY +0.2% [1] - 毛利率10.3% YoY -0.6pct 销售及管理费用占比8% YoY -0.8pct [1] - 调整后25-27年归母净利润预测为36.82/38.53/40.27亿元 对应EPS 0.53/0.56/0.58元 [5] 市场结构分析 - 集客市场收入365.85亿元 YoY +12.9% 其中TIS业务YoY +18.5% ACO业务YoY +13.6% [2] - 运营商市场收入382.03亿元 YoY -4.6% 但ACO业务部分抵消影响 YoY +9% [2] - 海外市场收入21.51亿元 YoY +8.7% 在拉美、非洲等新市场取得突破 [2] 业务板块表现 - 电信基建服务(TIS)收入382.72亿元 YoY +1.6% 营收占比49.7% [3] - 业务流程外判服务(BPO)收入223.83亿元 YoY +1.0% 营收占比29.1% [3] - 应用、内容及其他服务(ACO)收入162.84亿元 YoY +11.7% 营收占比21.2% [3] 战略发展布局 - 数字基建新签合同额超120亿元 YoY +20% 覆盖金融、互联网等行业 [4] - 智慧城市新签合同额超185亿元 YoY +15% 聚焦城市数字化转型 [4] - 重点拓展"基建+产数+通服智维"新业务 开发千行百业及海外新客户 [4] 估值指标 - 当前股价4.83港元 总市值334.53亿港元 总股本69.26亿股 [7] - 预测25年P/E为8.3倍 P/B为0.6倍 [6] - 近3个月绝对收益率16.9% 相对收益率9.5% [10]