AI模型训练 - 财报，业绩电话会，研报，新闻 - Reportify

AI模型训练

搜索文档

Deepseek最新AI模型使用英伟达AI芯片进行训练？中方回应

中国新闻网· 2026-02-24 16:35

事件概述 - 美国一名高级官员称，中国人工智能公司DeepSeek最新的AI模型据称是使用英伟达的AI芯片“Blackwell”进行训练的，这可能违反了美国的出口管制规定[1] - 中国外交部发言人在回应相关提问时表示，不了解记者提到的具体情况，并重申中方已多次就美国对华芯片问题表明原则立场[1] 行业与公司动态 - 该事件涉及美国对华先进芯片（特别是英伟达AI芯片）的出口管制政策，以及中国AI公司（如DeepSeek）在获取和使用高端算力硬件方面的情况[1] - 英伟达的“Blackwell”是其新一代高性能AI芯片，受到美国出口管制法规的限制[1]

英伟达(US:NVDA)

美国出口管制规定

Deepseek最新AI模型

英伟达AI芯片Blackwell

美国出口管制规定

Deepseek最新AI模型

英伟达AI芯片Blackwell

迪士尼维权后，谷歌 Gemini停止生成迪士尼角色内容

环球网资讯· 2026-02-12 11:31

核心事件概述 - 谷歌旗下AI产品（包括Gemini、Nano Banana等）已开始拦截并拒绝生成迪士尼相关角色内容，以回应迪士尼的侵权指控 [1] - 这一变化发生在迪士尼于去年12月发出停止侵权函约两个月后 [1] 侵权指控与谷歌的应对 - 迪士尼于去年12月通过外部律师向谷歌发出长达32页的停止侵权函，指控谷歌的Veo、Nano Banana与Gemini等AI工具“在大规模侵犯迪士尼版权” [4] - 函件中附有实例图片，显示通过简单提示词即可生成达斯·维达、钢铁侠等迪士尼角色的精细渲染图像 [4] - 迪士尼在函件中提出四项明确要求，包括要求谷歌立即停止侵权行为、停止使用迪士尼IP训练AI模型，并指出此前已多次表达担忧但谷歌未明显改进 [4] - 谷歌发言人回应称，公司与迪士尼长期保持互利合作关系并将继续沟通，同时表示其AI模型使用开放网络的公开数据训练，并已推出Google-extended、YouTube Content ID等版权控制机制 [5] 技术执行与现状 - 今年1月，相关媒体曾通过提示词在谷歌AI工具中成功生成高质量迪士尼角色图像，但目前相同提示词会触发系统提示，称“由于第三方内容提供方的相关顾虑”无法生成 [4] - 目前存在例外情况：若用户自行上传迪士尼角色照片并搭配文本提示，谷歌AI产品仍可生成相关IP内容 [4] 行业合作动态 - 在向谷歌维权的同时，迪士尼与OpenAI宣布达成一项价值10亿美元的协议，迪士尼将旗下角色授权给OpenAI的生成式视频应用Sora [5]

知识产权侵权

知识产权侵权

20cm速递｜科创芯片ETF国泰（589100）回调超2%，中国AI模型训练进程有望加速

每日经济新闻· 2025-12-16 13:47

文章核心观点 - 东海证券指出，近期外围政策或将加速中国AI模型训练进程，同时电子行业需求复苏、供给出清、存储芯片涨价及国产化超预期，行业呈现包括AI算力、半导体设备、关键零部件和存储涨价等结构性机会 [1] 行业动态与趋势 - 博通2025财年第四季度业绩超预期，其AI芯片销售额同比增长74%，预计下一季度保持高速增长 [1] - 当前电子行业需求持续复苏，供给有效出清，存储芯片价格上涨，国产化力度超预期 [1] - 行业呈现结构性机会，包括AI算力、半导体设备、关键零部件和存储涨价等领域 [1] 相关金融产品 - 科创芯片ETF国泰（589100）在12月16日回调超2% [1] - 该ETF跟踪科创芯片指数（000685），单日涨跌幅可达20% [1] - 科创芯片指数从科创板市场中选取涉及芯片设计、制造、封装测试等全产业链环节的上市公司证券作为指数样本，聚焦半导体材料、设备及设计等核心技术领域，反映科创板芯片相关上市公司证券的整体表现 [1]

科创芯片ETF国泰

科创芯片ETF国泰

长城汽车：九州超算中心总算力规模达5EFLOPS，硬件扩容至超万卡级别且持续升级

第一财经· 2025-11-28 17:40

算力基础设施规模与效率 - 九州超算中心总算力规模达到5EFLOPS，硬件扩容至超万卡级别，并持续升级[1] - 通过高速RDMA网络与高性能存储系统深度协同，提供极高的线性加速比，避免数据传输和存储延迟造成的算力浪费[1] - 技术优势使复杂AI模型的训练周期大幅缩短[1] 公司技术战略与投入 - 未来将基于“森林生态”体系，坚持精准投入研发[1] - 持续技术投入旨在确保公司在行业变革中保持技术领先与竞争力[1]

九州超算中心

九州超算中心

被轻视的巨大市场，大厂做不好的Local Agent为何难？

36氪· 2025-11-12 19:51

AI行业范式转变：从参数竞赛到效率革命 - 大模型边际收益递减，训练成本飙升，GPT-4级别模型成本突破1亿美元，最尖端模型训练成本已接近10亿美元[1] - Scaling Law遭遇瓶颈，单纯增加参数对模型能力提升效果减弱[1] - 产业界从“参数竞赛”转向“效率革命”，小模型在多项任务中表现超越大模型，运营成本仅为后者1/10到1/30[2][4] 小模型技术突破与性能表现 - DeepSeek R1-0528将671B参数模型蒸馏到8B，在AIME 2024测试中反超原模型10%[2] - Qwen3-VL 4B/8B模型保持256K-1M超长上下文和完整多模态能力，在低显存设备上稳定运行[2] - GreenBitAI的GBAQ算法实现突破，3-bit模型用30-40%的Token消耗达成FP16级别推理质量[23] - 在Multi-Agent任务中，GreenBitAI 3-bit模型完成率达到100%，而竞品4-bit方案全线失败[25] 端侧AI基础设施技术创新 - GreenBitAI开发Local Agent Infra技术栈，包含模型层优化、性能层优化和上下文工程三大核心模块[22][28][29] - 模型层优化采用GBAQ算法框架，实现测试时扩展技术，无需训练即可提升推理性能[22] - 性能层优化采用混合精度策略和量化感知校准，实现跨硬件部署优化[28] - 上下文工程通过动态Context Engineering和信息降维技术，使16GB内存设备可处理百页文档[31] 本地AI市场机遇与商业化路径 - AI PC市场快速成长，预计2025年占PC市场31%，2026年达55%，出货量1.43亿台[35] - 2030年全球智能终端市场规模将达2.6万亿美元，行业应用占比超60%[36] - GreenBitAI规划三步走商业化路径：ToC端订阅、ToB端授权、平台化生态建设[36][37] - 端侧AI设备普及路径类似家庭Wi-Fi中继器，预计3年内50-80%任务迁移到本地[34] 硬件厂商的差异化战略布局 - 苹果采用垂直整合策略，自研芯片实现CPU、GPU和AI神经引擎内存共享，能效比提升三倍[6] - 英伟达推动GPU通用计算化，通过Tensor Core将AI训练矩阵乘法加速百倍[7] - 华为在鸿蒙生态中押注端侧大模型，英伟达推出桌面级DGX Spark产品[10] - 苹果M5芯片单位功耗AI计算效率相比M4提升数倍，消费级设备智能上限大幅提高[10] 专业级Local Agent产品突破 - GreenBitAI发布Libra beta release，全球首个支持完全本地化、断网运行的专业级Agent产品[32] - Libra专注于专业文档处理与生成，输出质量媲美人工专家，支持金融分析、学术论文等高标场景[32] - 产品在Apple M3芯片上实现预填速度1351.7 tokens/s，解码速度105.6 tokens/s，体验接近云端API[27] - 采用多领域专家协同模式，通过智能工作流配置实现复杂文档任务分工协作[33]

小模型逆袭

小模型逆袭

七年后，才发现误会了老实人李彦宏

搜狐财经· 2025-09-18 22:34

Anthropic隐私政策变动 - 估值超过1800亿美金的AI公司Anthropic宣布禁止中国公司控制的实体及其海外分支机构使用Claude系列AI服务[2] - 公司修改用户隐私政策，从9月28日起个人用户与AI的对话、编码等互动数据将被默认授权用于模型训练，除非用户手动点击"不同意"[2] - 选择"同意"的用户数据保留5年，选择"不同意"的数据保留30天，此政策涵盖Claude所有免费和付费的个人用户[2] - 企业客户、政府机构客户、学术机构客户以及通过谷歌、亚马逊等API接口调用的商业用户不受此政策变动影响[2] AI行业数据使用标准 - OpenAI在2023年确立行业主流态度：付费或明确拒绝的用户数据不用于训练，低付费和免费用户若不主动拒绝则默认数据可用于训练[5] - Anthropic原本是行业异类，旧政策明确规定默认不使用用户数据训练模型，近期调低隐私标准与主流厂商看齐[6] - 中国2024年2月颁布的《生成式人工智能服务安全基本要求》规定使用用户输入信息作语料时需有使用者授权记录[8] - 中国法规要求为使用者提供便捷的关闭数据用于训练的方式，从主界面到达选项不超过4次点击[9] 国产大模型合规现状 - 国产大模型基本在用户协议的隐私政策部分完成授权合规，要求用户授权使用数据[9] - 豆包、通义千问在App客户端界面提供语音信息的便捷关闭功能，但不涵盖非语音输入数据[10] - 腾讯元宝和DeepSeek在"用户设置-数据管理-优化体验"中提供用户对话内容的完全授权撤回功能[10] - 多数国产大模型撤回授权需通过联系客服或发送邮件，不符合法规要求的"不超过4步点击"便捷标准[9] 数据安全与泄露事件 - 2025年夏季发生多起用户隐私泄露事故，包括恋爱辅助AI应用"撩骚AI"16万张用户聊天截图被公开[14] - OpenAI因产品设计失误导致逾7万用户对话记录出现在谷歌搜索结果中[14] - xAI旗下Grok因类似设计失误泄露超37万条用户对话记录，包含敏感个人隐私和危险操作内容[15] - 泄露内容包含生成恐怖袭击图像、破解加密钱包、编写恶意软件等危险信息，甚至出现"暗杀马斯克的详细计划"[15] 训练数据质量挑战 - 公开网页爬虫遭遇抵制，部分网站因AI厂商密集爬取导致服务器崩溃关站[17] - 联合研究发现GPT中文训练数据集超23%词元被非法广告污染，GPT-4o对日本成人片女星姓名的熟悉度是中文问候语"你好"的2.6倍[18] - 中国国产大模型的中文语料污染程度显著低于海外大模型，GPT-4o被污染数为773，而千问系列为48、GLM4为19、Deepseek为17、MiniCPM为6[20] - 中文语料污染主要来自非法网站在正常网页内容中插入的成人和赌博广告[18] 真人数据的重要性 - 2023年6月研究提出用AI合成数据训练会导致"模型崩溃"现象，AI会越学越错[22] - 《自然》杂志2024年7月封面论文证实，使用上代AI生成数据训练会使模型逐步丧失对真实数据分布的认识，9次迭代后模型完全崩溃[22] - Meta公司研究发现即使合成数据只占训练集的1%，仍可能导致模型崩溃[24] - 真人创造的数据被比喻为"洁净的空气与饮水"，是生成式AI必须依赖的维生补给[24]

AI合成数据训练问题

Artificial Intelligence

AI合成数据训练问题

Artificial Intelligence

美股异动丨巨额订单遭多家投行质疑，甲骨文收跌超6%

格隆汇APP· 2025-09-12 09:26

股价表现 - 甲骨文股价在暴涨36%后单日收跌超6%至307.86美元 [1] 财务与业务预期 - 公司预计2026财年云基础设施营收大增77%至180亿美元超华尔街预期 [1] - 未来四年云营收预计攀升至320亿美元、730亿美元、1140亿美元及1440亿美元 [1] - 未实现履约义务达4550亿美元同比激增359% [1] 大额订单与客户集中度风险 - OpenAI签署五年期价值3000亿美元算力采购协议为史上最大云服务合同之一 [1] - 分析师指出积压订单几乎全部来自OpenAI 未来增长高度依赖单一客户 [1][2] - 客户集中度上升带来单一依赖性风险新增订单主要集中于AI巨头 [1][2] 收入确认与盈利性担忧 - 4550亿美元未实现履约义务中仅约10%将在未来12个月内确认为收入 [2] - 新增订单多与AI模型训练相关该类业务利润率相对较低 [2] - 公司是否有足够资金支撑天文数字级基础设施建设存疑 [2]

甲骨文(US:ORCL)

大模型下半场：谁在掘金数据标注？

36氪· 2025-09-02 16:25

Meta收购Scale AI交易分析 - Meta以约150亿美元收购Scale AI 49%股份交易后Scale AI估值达290亿美元[1] - Scale AI创始人兼CEO汪滔将卸任并加入Meta组建超级智能小组同时保留Scale董事会席位[1] - 收购反映Meta对高质量训练数据的迫切需求因其Llama4Behemoth模型30%语料来自低质量社交媒体内容导致多模态理解等核心指标落后GPT-4.5约12%[2] 数据标注行业概况 - 全球数据标注行业市场规模约20亿美元其中美国市场占8.38亿美元份额达40%[5] - 行业主要分为三类玩家：纯人力型公司（低成本劳动力标准化任务）、互联网大厂众包平台（自有业务需求+外部劳动力池）、智能型服务商（自主研发平台+算法能力+定制化解决方案）[3] - 头部智能型企业多从人力公司进化而来 Scale AI前身为"ScaleAPI" 通过"人力API"模式积累数据后逐步采用AI替代人力[4] Scale AI业务模式演变 - 公司最初通过"人力API"模式为开发者提供远程劳动力团队服务客户包括丰田本田等企业[4] - 2018年起构建"机器预标注+人工复核"混合工作流用算法完成预标注后由人工专家审核修正[4] - ChatGPT平均标注成本低于0.003美元比传统众包平台便宜20倍 GPT-4标注准确率达88.4%超过人类标注员的86.2%[4] 全球市场竞争格局 - 美国企业凭借全球化分工将基础任务外包至菲律宾肯尼亚等低成本地区 Scale AI通过Remotasks平台拥有超24万注册工人[6] - 中美技术存在明显差距：中国云测数据自动标注主要应用于智能驾驶领域海天瑞声智能化水平有限仍高度依赖人工[6] - 美国形成完整产业生态除Scale外还有SurgeAI（微调服务）、Turing、Lionbridge（文本语音）等专业公司[8] 行业技术发展趋势 - AI标注目前仅适用于交通图像人脸识别等标准化任务规则制定和质量把关仍需人工介入[8] - 大模型训练重心从预训练转向强化学习对医疗影像法律文本等专业化数据需求增加[9] - 标注员需具备专业知识与跨学科能力任务涉及推理链条和多模态对齐等复杂场景[10] 代表性企业对比 - Surge AI专注于高质量数据生成（如编程代码数据） 2024年营收达10亿美元超越Scale AI的8.7亿美元[10] - 合成数据作为替代路径存在局限性：现实场景变化时有效性不足数据安全风险限制大规模应用[10] - 数据标注行业正向更高质量和更强专业化方向演进技术壁垒不断拔高[11]

Meta Platforms(US:META)

数据标注服务

数据标注服务

微软发布Mu模型：支持Windows智能体，小参数跑出10倍性能；研究称美国30%代码已由AI生成，年创百亿美元价值 | 全球科技早参

每日经济新闻· 2025-06-24 07:50

微软发布Mu模型 - 微软发布创新小参数模型Mu，参数仅3.3亿，性能比肩Phi-3.5-mini但体量为其十分之一 [2] - Mu在离线NPU笔记本设备上可实现每秒超过100 tokens的响应速度，在小参数模型中表现罕见 [2] - Mu支持在Windows中设置智能体，可将自然语言指令实时转化为系统操作 [2] AI编程在美国的应用 - 研究显示2024年美国开发者提交的Python代码中30.1%由AI生成 [3] - AI辅助编程每年为美国创造96亿至144亿美元的经济价值 [3] - 数据基于2018-2024年GitHub上8000万条代码记录的分析 [3] 谷歌使用YouTube视频训练AI - 谷歌正使用200亿条YouTube视频资源库训练新一代AI工具 [4] - 公司强调仅使用部分内容并遵守与创作者及媒体公司的协议 [4] - YouTube表示已投入开发保护机制以保障创作者权益 [4] 关于AI监管的争议 - 微软首席科学家警告特朗普政府禁止州级AI监管的提议将阻碍技术发展 [5] - 该提议计划禁止各州在未来十年内制定任何限制AI的法律或法规 [5] - 专家认为禁止监管与科学进步目标背道而驰 [5] Perplexity推出AI浏览器 - Perplexity计划向Windows用户推出搭载"搜索智能体"的Comet浏览器 [6] - Windows版本已完成并开始小范围测试，Android版本也在快速推进 [6] - 浏览器内置AI助理支持购物折扣检查、邮件提醒和虚拟试衣等功能 [6][7]

微软(US:MSFT)