大模型

搜索文档
寒武纪辟谣巨额订单,新一代芯片有多项优化
凤凰网· 2025-09-18 19:34
业绩表现 - 2025年上半年公司实现收入大幅增长并成功扭亏为盈 [1] - 人工智能算力市场火热带动AI芯片与软件平台需求增长 [1] 产品与技术研发 - 2025年上半年持续推动智能处理器微架构及指令集的迭代优化 [2][9] - 新一代智能处理器微架构及指令集针对自然语言处理大模型、视频图像生成大模型及垂直类大模型的训练推理场景进行重点优化 [2][9] - 新一代产品将在编程灵活性、易用性、性能、功耗、面积等方面提升竞争力 [2][9] - 基础系统软件平台同步优化迭代 训练软件平台规划新功能和通用性支持并推进大模型预训练和强化学习训练业务优化 [3][5] - 推理软件平台在技术创新、产品能力和开源生态建设取得重要成果 [3][5] - 智能芯片产品可高效支持LLaMA系列、GPT系列、BLOOM系列、GLM系列及多模态等主流开源大模型的训练和推理任务 [12] 客户与市场拓展 - 产品已在运营商、金融、互联网等多个重点行业规模化部署并通过客户严苛环境验证 [2][6][8] - 凭借研发能力、产品质量和客户服务水平积累优质客户资源并获得广泛认可 [6] - 产品广泛服务于大模型算法公司、服务器厂商、人工智能应用公司 辐射云计算、能源、教育、金融、电信、医疗、互联网等行业智能化升级 [12] 定增资金投向 - 40亿元定增资金投向面向大模型的芯片研发、先进封装和软件平台 [2] - 募投项目旨在建立覆盖算法开发到应用部署的全链条能力 [2][5] - 软件平台项目将构建面向大模型算法开发和应用部署的高效支撑与服务能力 提升软件生态开放性和易用性 [5][6] 开发者生态建设 - 建立开放开发者社区 提供在线课程、开发文档、软件工具及编程示例 [6] - 支持用户直接使用相关镜像并将已有模型高效迁移至公司产品 [6] 存货管理 - 2025年6月末存货较上年同期增长主要系产成品增加所致 [7] - 存货增长源于对大模型算力需求的乐观判断及云端产品线备货 [2][7] - 公司已依据存货跌价计提政策充分计提相应跌价准备 [2][7] 市场传闻回应 - 明确否认网上传播的100万颗出货量预测、载板订单、收入预测、新产品情况、送样及潜在客户、供应链等相关信息为不实信息 [2][7] - 强调公司经营相关情况以法定披露媒体信息为准 [2][7][8] 行业前景与战略 - 大模型快速发展推动人类社会迈向强人工智能时代 引发智能算力市场空前增长机遇 [5] - 中国作为全球最大集成电路消费国 市场需求增长为行业带来广阔空间 [11] - 公司专注于人工智能芯片产品研发与技术创新 致力于打造核心处理器芯片 [9][10] - 主营业务为云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售 [10]
大模型“造血”、云算力暗战升温,百亿级投入如何支撑AI长跑?
第一财经· 2025-09-18 18:25
AI驱动云计算市场增长 - 云计算市场增速显著回升 2024年下半年中国公有云市场增速达17.7% 为近两年最高点 全球云基础设施服务支出连续四个季度保持超20%同比增速 [2] - AI成为云计算核心驱动力 客户交流焦点全面转向AI和大模型 云计算话题关注度相对下降 [1] - 互联网云厂商通过GPU算力和大模型投入抢占AI云市场先机 [2] 企业级AI应用加速渗透 - 企业决策流程因AI普及加速 从传统技术评估转为主动推动技术应用 [5] - 中国企业级大模型日均消耗量达10.2万亿tokens [5] - B2C企业、互联网行业、现代服务业和文档密集型行业AI应用进展最快 [6] 云厂商财务表现与投入 - 腾讯企业服务收入增速加快 金融科技及企业服务收入同比增长10% [5] - 阿里云收入同比增长26% AI相关收入连续8季度三位数增长 [5] - 百度AI云业务营收首次超过100亿元 [5] - 头部云厂商启动大规模基础设施投入 腾讯三个季度资本开支达831亿元 阿里云宣布三年3800亿元投入计划 [8] AI技术应用场景拓展 - 智能体(Agent)成为重要发展方向 阿里云多个团队推进容器产品和AI平台PAI的智能体应用 [6] - 具身智能被视为关键算力消耗场景 未来机器人算力消耗可能远超人类 [6] - 腾讯超40%新增代码由AI自动生成 C端AI应用元宝DAU位列国内前三 ima MAU半年增长80倍 [7] 行业挑战与商业模式探索 - AI幻觉问题制约商用落地 部分场景幻觉率难以降至1%以下 [9] - B2B领域因低幻觉容忍度应用进展较慢 生产制造等关键业务存在应用障碍 [9] - 云厂商AI业务仍处投入期 尚未实现利润覆盖 商业模式可持续性待解 [10] 市场竞争格局变化 - 2024年中国公有云市场百度智能云与阿里云份额并列第一 腾讯云和华为云紧随其后 [11] - AI引发价格竞争新态势 token价格持续下降 部分厂商提供半价迁移优惠 [11] - 价格战策略更复杂 涉及芯片供应链等多因素 仅少数资源充足厂商采取激进策略 [11] - 腾讯优先保障内部算力使用 未参与GPU算力价格竞争 注重长期竞争优势 [12]
DeepSeek紧急声明!
证券时报· 2025-09-18 16:57
9月17日晚,深度求索(DeepSeek)发布声明指出,近期,有不法分子冒充"深度求索"公司或在职 员工,伪造工牌、营业执照等材料,在多个平台以"算力租赁"、"股权融资"等名义向用户收取费用实 施诈骗。该行为严重侵害用户权益,并损害公司声誉。 深度求索严正声明: 1. 深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2. 任何冒用公司名义开展"算力租赁"、"融资"等行为均属违法,将依法追究其法律责任。 深度求索提醒用户,通过公司官方渠道获取信息,其官方网页、App产品目前均为免费。 deenseek 关于防范冒用"深度求索"名义 实施诈骗的声明 近期,有不法分子冒充"深度求索"(DeepSeek)官 方或在职员工,伪造工牌、营业执照等材料,在多个 平台以"算力租赁"、"股权融资"等名义向用户收 取费用实施诈骗。该行为严重侵害用户权益,并损害 我司声誉。 现严正声明如下: 1. 深度求索从未要求用户向个人账户或非官方账户付 款,任何要求私下转账的行为均属诈骗; 2. 任何冒用我司名义开展"算力租赁"、"融资"等 行为均属违法,我们将依法追究其法律责任。 自今年年初发布R1以来, ...
易点天下:已完成对GPT-5模型的接入工作
新浪财经· 2025-09-18 16:36
公司技术进展 - 公司已完成GPT-5模型的接入工作 [1] - 公司将继续密切关注国内外大模型的最新发展动态 [1]
中美AI竞逐:模型与资本开支差距缩小 财通证券称联想有望走出慢牛趋势
格隆汇· 2025-09-18 16:21
全球AI大模型竞争格局 - 全球大模型竞争格局初步形成 由OpenAI Anthropic 谷歌及特斯拉主导 [1] - 中国企业DeepSeek及阿里通义千问跻身第一梯队 [1] - 根据GPQA测试结果 前25名主要由OpenAI Anthropic 微软 谷歌 Meta旗下大模型构成 中国企业占比较低 [1] - DeepSeek-V3/R1于2024年12月/2025年1月发布后代表中国/开源大模型对齐SOTA [1] - 阿里Qwen-3表现进入第一梯队 [1] 科技厂商资本投入与算力需求 - 头部科技厂商大力投入大模型训练 并通过推理使模型适用于自身业务 [2] - 训练+推理共同提振自用算力需求 [2] - 云厂商在自有云计算平台上提供大模型API MaaS商业模式带动外供算力放量 [2] - 微软/谷歌/Meta/亚马逊资本开支密度于2Q2025达到34.8%/23.3%/35.8%/18.7% [2] - 2Q2025百度/阿里/腾讯资本开支分别同比+10.2%/+162.7%/+319.1%至23/318/366亿元 [2] - 国内大厂加速AI投入开启时点晚于海外一年左右 CapEx占收入比重相比海外巨头差距仍较大 [2] 投资标的关注方向 - 美团估值回调后具备修复空间 [2] - 金蝶国际云业务持续高增 订阅化转型带来可持续ARR增长 AI+ERP有望打开新一轮增长曲线 [2] - 联想集团有望走出慢牛趋势 AI PC产品周期开启 数据中心业务受益AI算力需求提升 [2] - 腾讯控股被列为长期优选标的 [2]
恒生聚源总经理吴震操:决胜未来,数据是关键胜负手
21世纪经济报道· 2025-09-18 16:05
行业趋势 - 大模型马太效应日益显著 未来市场中实际应用的通用大模型或将高度集中 [1] - 行业将推动算法平权与算力平权两大趋势 大中小机构在算法与算力上的差距将逐步缩小 [1] 核心竞争力 - 金融机构在投资决策和市场研判等核心业务上的成果差距 将取决于取数、用数、算数环节的能力 [1] - 金融机构的核心竞争力将转向数据能力 [1] 战略方向 - 机构应聚焦获取通用大模型本身不覆盖的稀缺数据 [1] - 机构需深度挖掘与高效利用自身内部数据 [1] - 对于规模相近且业务模式易同质化的机构 内部数据挖掘利用能力将成为竞争胜负手 [1]
均胜电子发布多款机器人部件新品
新浪财经· 2025-09-18 15:07
产品发布 - 公司发布AI头部总成、全域控制器、电池包、无线充电系统等机器人部件新品 [1] 技术规格 - 机器人全域控制器基于英伟达JETSON THOR芯片 [1] - 产品搭载阿里通义大模型 [1] - 支持车规级接口和协议 [1]
中国大模型首登《自然》封面,AI医学的DeepSeek时刻还远吗?
第一财经· 2025-09-18 15:02
在最新一期《自然》封面上,首次出现了来自中国AI科技公司DeepSeek的大模型R1。此前,全球的科技公司中仅有拿下过诺贝尔奖的DeepMind的 AlphaFold获此殊荣。 人工智能工具已经在其他科学领域展现出潜力,例如极端天气预报。自2022年底ChatGPT推出以来,生成式AI的迅猛发展在医学领域也掀起热潮。从药物 设计到医学影像,AI企业正在加速与临床应用的融合。随着中国大模型更多技术细节的披露,未来也有望推动大模型在医学领域的落地,AI医学的 DeepSeek时刻即将到来。 从药物设计到医学影像,AI企业正在加速与临床应用的融合。 "人工智能的吸引力在于它可以快速浏览分子数据库,将化合物与靶点相匹配。"一位制药领域专家对第一财经记者表示,"但这只是药物发现的第一步,还 有很多问题目前尚无法用人工智能来预测,例如药物的毒副作用。" 上述专家表示,在纸面上看起来不错的药物在临床试验中仍然有90%的失败率。"AI制药最终走向现实,其过程堪比自动驾驶汽车上路,除了解决技术算法 上的核心难题之外,还面临复杂的生物学问题以及最终走向应用时所面临的监管问题。"他说道,"这是因为人类对于自身的生物学问题仍然知之甚 ...
恒生聚源吴震操谈AI爆款攻略:数据决定未来,三大场景落地指南
21世纪经济报道· 2025-09-18 13:28
(原标题:恒生聚源吴震操谈AI爆款攻略:数据决定未来,三大场景落地指南) 21世纪经济报道 实习生 张长荣 记者 崔文静 北京报道 在金融科技加速渗透的行业背景下,机构竞争的 重心正悄然生变。 如今,从底层技术架构的数字化重构,到前端业务场景的智能化升级,金融科技已从"可选项"变为行 业"必答题"——大模型、云计算等技术的规模化应用,不仅降低了中小机构的技术准入门槛,更让行业 整体的技术底座逐步趋同。 "未来大中小机构在算法与算力上的差距必将逐步缩小,金融机构的核心竞争力也将随之转向数据。"恒 生聚源总经理吴震操判断,对于规模相近、业务模式易同质化的机构,内外部数据的挖掘利用能力将成 为竞争胜负手。 第二,对结果进行溯源验证。目前主流商业大模型平台通常会提供来源链接、参考文献或相关图表,用 户应主动核查来源的发布时间及可靠性,以评估信息的时效性和可信度。 第三,可借助智能体平台自定义工具。目前不少智能体平台开放自定义功能,用户可根据自己的投资习 惯和分析方法搭建专属智能体。 21世纪:面对机器逐渐替代部分基础岗位的趋势,我们应如何建立"人机协同"的工作模式?需要掌握哪 些关键技能才能与机器深度合作而非被替代? ...
DeepSeek,打破历史!中国AI的“Nature时刻”
证券时报· 2025-09-18 13:24
中国大模型,首登Nature封面。 9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。 该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推 理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并 发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。 Nature在其社论中评价道:"几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被 DeepSeek打破。" 中国AI大模型的"Nature时刻" 自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终缺乏一个权威的"科学认证"机制。 OpenAI、谷歌等巨头虽屡有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。 DeepSeek以其公开性和透明性打破了这一局面。DeepSeek-R1模型的研究论文最早于今年年初发布在预 印本平台arXiv上。自今年2月14日向Nature投递论文至今,历经半年,8位外部专家参与了同行评审, DeepSeek-R1推理模型研究论文终 ...