DeepSeek

搜索文档
公安部回应美方威胁再加征
券商中国· 2025-02-28 23:39
中美贸易摩擦 - 美方威胁将于3月4日起以芬太尼问题为由对中国输美产品再加征10%关税 [1] - 中方对美方加征关税的威胁表示强烈不满和坚决反对 [1] 中国禁毒政策与国际合作 - 中国是全球禁毒政策最严格、执行最彻底的国家之一 [1] - 中国积极与世界各国开展禁毒国际合作,并为美应对芬太尼问题提供了支持 [1] 美方芬太尼问题根源 - 美国芬太尼危机的根源在其自身,减少国内毒品需求、加强执法合作才是治本之策 [1] - 美方无视客观事实,不从根本上解决毒品需求问题,却一味向他国甩锅推责 [1] 中方立场与呼吁 - 中方敦促美方纠正错误做法,维护中美禁毒合作来之不易的良好局面 [1] - 中方呼吁美方回到造福两国人民的正确轨道 [1]
速递|OpenAI发布GPT-4.5模型,旨在提升写作与编程能力
Z Potentials· 2025-02-28 14:37
图片来源: Unsplash OpenAI 正在向部分用户推出备受期待的新人工智能模型 GPT-4.5 的早期版本,此前在去年开发该 AI 系统时遇到了障碍。 在周四的一篇博客文章中,这家总部位于旧金山的人工智能初创公司表示, GPT-4.5 在捕捉和回应用户书面提示中的细微线索方面表现更佳, 尤其在聊 天、写作和编码方面尤为出色。 OpenAI 还预计,新模型相较于之前的软件,虚构内容的频率将有所降低。 起初, OpenAI 将这一模型作为"研究预览"提供给一小部分每月支付 200 美元订阅 ChatGPT Pro 的软件开发者和用户。公司计划在向更广泛受众推出之 前,先整合首批试用者的反馈意见。 OpenAI 在 2022 年底推出了 ChatGPT ,由此掀起了生成式 AI 的热潮,该产品最初由名为 GPT-3.5 的早期模型驱动。自那时起,公司发布了一系列日益复 杂的系统,包括多个模拟人类推理过程的选项。但 OpenAI 也面临着来自中国初创公司 DeepSeek 、埃隆·马斯克的 xAI 以及 Anthropic 的激烈竞争,这些公 司都在最近几周内推出了新模型。 OpenAI 研究副总裁 Nick ...
英伟达业绩超预期股价却跌超8%,市值蒸发2740亿美元
证券时报网· 2025-02-28 10:21
公司业绩 - 2025财年第四财季营收393.31亿美元同比增78%超预期 调整后毛利率73.5% 净利润220.91亿美元同比增80% [1] - 2025财年全年营收1304.97亿美元同比增114% 净利润728.80亿美元同比增145% 首次迈入营收“千亿美元俱乐部” [1] - 新财年第一季度营收预计430亿美元(上下浮动2%)高于市场预期 但季度毛利润率指引未达市场预期 [2] 公司股价 - 财报发布后股价大跌8.5% 市值蒸发2740亿美元 收盘报120.15美元/股 财报公布前当日收涨3.67% [1] - 一个月前因DeepSeek发布模型股价一度暴跌近17% [1] 公司产品 - CEO黄仁勋强调新一代AI芯片Blackwell需求“非常强劲” 第四季度销售额110亿美元 是营收拉升最快新产品 [2] - AI推理需求增长将推动对Blackwell芯片需求 甚至可能比当前多出数百万倍计算能力 [2] 市场反应 - 部分投资者对业绩增长有“高预期” 财报虽超预期但未达“爆炸性”增长预期 [1] - DeepSeek低成本模型和开源工具改变AI行业规则 投资者担心英伟达GPU需求下降 [2] - 美国芯片出口管制和潜在关税政策对英伟达全球业务构成不确定性 [2] - 部分分析师因毛利润率指引未达预期、AI投资热度降温、微软或缩减数据中心租约 担心对AI投入过剩 [2]
Meta To Launch AI App That Could Compete With OpenAI and Google Offerings, Report Says
Investopedia· 2025-02-28 07:26
文章核心观点 公司计划在二季度推出独立的Meta AI应用,有望触达10亿用户,还打算探索订阅模式 [1][2][3][4] 产品计划 - 公司计划在二季度推出独立的Meta AI应用,该应用目前可通过网页浏览器及Meta现有应用使用 [1][4] - 公司打算探索基于订阅的模式,类似竞争对手对高级版本的收费方式 [3][4] 业务数据 - 公司首席执行官马克·扎克伯格称Meta AI将是公司最具变革性的产品之一,今年有望触达10亿人 [2][4] - 公司首席财务官苏珊·李表示,该AI助手月活用户已达7亿 [2] - 公司今年计划在AI领域投入巨资,预计资本支出为600亿至650亿美元,高于2024年的390亿美元 [2] 股价表现 - 公司股价周四常规交易时段下跌2%,盘后交易时段涨幅不足1%,年初至今累计上涨约12% [3]
CEO Jensen Huang Just Uttered 8 Words That Every Nvidia Investor Should Hear
The Motley Fool· 2025-02-28 04:42
文章核心观点 - 英伟达季度业绩出色 打消投资者对其前景的担忧 未来增长有望持续 股票值得买入 [1][3][11] 公司业绩表现 - 2025财年第四季度(截至1月26日)营收达393亿美元创纪录 同比增长78% 环比增长12% 调整后每股收益0.89美元 飙升71% 轻松超越分析师预期 [4] - 数据中心业务需求创新高 该业务营收同比增长93%至356亿美元 推动整体业绩强劲增长 [5] - 第四季度毛利率降至73% 此前几个季度呈逐渐下降趋势 首席财务官称符合预期 预计今年晚些时候将回升至“70%中段” [6] - 过去一年现金储备大幅增长 现金及有价证券达432亿美元 增长66% 运营现金流166亿美元 增长44% [6] 市场担忧与回应 - 有报道称中国初创公司DeepSeek用旧款GPU开发出先进AI模型 部分投资者担心英伟达处理器需求会骤降 [2] - 首席执行官詹森·黄解释此类发展会增加而非减少对英伟达处理器的需求 DeepSeek-R1开源的推理AI模型将推动未来推理模型对计算的需求增长 [7][8] 公司未来展望 - 管理层预计公司将持续增长 预计第一季度营收达430亿美元创纪录 同比增长65% 高于华尔街预期 [9] - 生成式AI市场未来几年经济影响可达2.6万亿至4.4万亿美元 英伟达作为AI芯片领先供应商 将受益于这一趋势 [10] - 尽管过去几年快速增长 但股票估值仍具吸引力 约为明年预期收益的28倍 预计2026财年营收和每股收益增长超50% [11]
毛利率75%,涨了
汽车商业评论· 2025-02-27 23:48
英伟达财报表现 - 2025财年毛利率达75%,创历史新高[3] - Q4营收393.31亿美元(同比+78%),净利润220.66亿美元(同比+72%)[6][7] - 全年营收1304.97亿美元(同比+114%),净利润728.8亿美元(同比+145%)[9] - Q4毛利率73%,环比下降1.6个百分点,主因Blackwell芯片初期交付成本较高[7][9] 业务板块分析 - 数据中心业务贡献90%收入,Q4收入356亿美元(同比+93%),全年1152亿美元(同比+142%)[10] - 汽车与机器人业务增速最快,Q4收入5.7亿美元(同比+103%),全年17亿美元(同比+55%)[10] - 游戏和AI PC业务全年收入114亿美元(同比+9%),专业视觉业务19亿美元(同比+21%)[10] 市场动态与竞争 - DeepSeek推出低成本R1模型引发行业震动,导致英伟达市值单日蒸发6000亿美元[3][13] - 公司CEO黄仁勋认为DeepSeek将刺激AI芯片需求,Blackwell芯片首季销售额达数十亿美元[13][16] - 微软取消两处AI数据中心租约,反映低成本模型对传统高投入模式的冲击[16] 行业趋势 - AI推理需求激增,Blackwell芯片设计支持预训练、后训练和扩展推理三大扩展定律[14] - 全球AI开源竞争加剧,Meta计划资本支出增加70%应对挑战[20] - DeepSeek R1模型7天用户破亿,成本仅为OpenAI同类产品一小部分[18] 地缘影响 - 意大利、韩国禁止DeepSeek应用,美国加强半导体设备出口限制[18][20] - 中国20余家车企计划整合DeepSeek技术,腾讯、阿里等巨头加速产品融合[18]
与 00 后开源者聊 DeepSeek 开源周:一直开源最强模型,可能是不想赚钱,也可能是想推动更大变化丨开源对话#2
晚点LatePost· 2025-02-27 22:03
开源策略与趋势 - DeepSeek宣布"开源周"计划,连续5天开源5个代码库,包括训练与推理工具,比技术报告和模型权重更深度[5] - 开源正成为行业趋势,部分原闭源公司开始发布首批开源模型,OpenAI CEO称"不开源是站在历史错误一边"[5] - DeepSeek通过详细技术报告(如V3达50多页)建立行业声誉,V3作为基座模型涵盖预训练、微调等完整流程[13][15][17] 开源技术层次 - 大模型开源分为四个层次:技术报告、模型权重(HuggingFace发布)、推理框架(如vLLM)、训练框架(如字节Verl)[19][26] - vLLM推理框架GitHub星数近4万,有840多位贡献者,基于PagedAttention论文优化[20][25] - 训练框架开源较少,因涉及复杂代码规范,字节开源的Verl框架支持强化学习算法如PPO和分布式策略[26][27] 工程优化与效率 - DeepSeek创新聚焦效率提升:V3采用多令牌预测、FP8低精度训练、优化流水线并行减少闲置计算单元[40] - FlashMLA开源项目实现算子层优化,类似FlashAttention通过GPU指令重组提升矩阵运算效率[45][46][48] - 工程实现难度高,如在线训练需同时处理生成与模型更新,对底层框架能力要求极高[49][50][51] 商业考量与行业影响 - 开源策略差异源于商业模式:非盈利机构Ai2开源最强模型+数据集,商业公司可能保留核心模型[54][56] - 开源可能重构行业生态,成为技术标准,但未来AI能力极强时开源最强模型或引发滥用风险[55][59] - 公司转向开源需额外投入:代码规范(如阿里代码规约)、适配外部框架(如ESFT适配耗时一周多)[36][34][35] 社区与开发者价值 - GitHub社区活跃度可通过星数(vLLM近4万)、Issues数(数千)、PR数(数百)衡量[20][25] - 开源项目需持续维护,如DeepSeek计划整合5个库功能并修复潜在bug[52] - 开发者诉求多样,包括支持FP8精度、NPU芯片适配等,反映实际应用场景需求[52]
对谈 98 年就做开源的章文嵩:要像维基百科那样,开源共建大模型数据集丨开源对话#1
晚点LatePost· 2025-02-27 22:03
大模型开源趋势与行业影响 - DeepSeek重塑全球大模型格局,扭转行业对开源的理解,推动百度、MiniMax、阶跃星辰等公司转向开源[2][3] - DeepSeek计划开源5个训练、推理相关的代码库,超越多数公司仅开放模型权重的做法[4] - 开源大模型通过降低创新成本、建立生态可能形成"事实标准",如DeepSeek模型推理成本低推动生态自然形成[5][17] 开源数据集与模型性能 - 激进主张认为真正的大模型开源需包含训练数据集,类似维基百科由非营利机构牵头共建[6][9] - 开源模型串接(Llama/Mistral/Qwen)评测表现优于GPT-4o近10个百分点,证明开源数据集潜力[10][11] - 模型能力核心依赖训练数据质量,建议采用GPL类传染性许可证强制商业公司回馈数据集[13][14] 开源商业化路径 - DeepSeek未融资使其能专注技术追求,但未来需探索开源生态商业化如Red Hat的订阅服务模式[23][24] - 开源成功案例显示商业化可通过API服务、技术支持实现,生态需允许其他玩家盈利[28][39] - 中国开源受限于企业定制化需求强、软件采购方强势,但工程师规模全球第二[25][26] 公司开源策略差异 - Meta因错过云计算选择开源AI构建生态,阿里开源驱动因素包括技术品牌建设与云计算业务协同[29][30] - 阿里通过开源委员会流程化管理,将开源贡献纳入职级评审,推动外部贡献者占比提升[35] - 字节闭源、阿里部分开源、DeepSeek全开源的分化源于商业化路径选择差异[28] 开源生态建设经验 - 阿里早期开源tair缓存系统提升技术声誉,工程师因代码公开更注重质量[34] - 开源虽可能被竞品利用(如京东使用阿里开源软件),但能积累不可复制的数据资产与人才吸引力[38] - 中国大模型开源将持续,需多方共建生态形成正反馈,类似Linux成功模式[27][37] 技术演进与行业竞争 - OpenAI闭源因商业化压力难以回头,其有限开源o3-mini模型被视作挽回关注度的举措[19][21] - 芯片禁运背景下,DeepSeek开源策略为中国大模型发展提供关键路径启示[18] - 未来行业可能并存开源非营利巨头与闭源商业巨头,中等规模玩家共存[39]
36氪正式接入DeepSeek,让有价值的企业更快被发现!
36氪· 2025-02-27 21:48
36氪与DeepSeek合作推出AI生成融资报道服务 - 36氪正式接入DeepSeek AI技术 打造高效率高成本效益的融资报道生产新模式 仅需半小时即可生成专业可读的融资报道[2] - 过去融资报道需耗时数天 涉及策划采访撰写审核修订发布等多个环节 成本高昂且消耗人力物力机会成本[2] DeepSeek技术能力与市场表现 - DeepSeek凭借卓越高密度推理能力和信息整合语言组织能力脱颖而出 被称为中文智能写作新物种[3] - DeepSeek累计下载量超1.1亿次 周活跃用户规模最高近9700万 展现出独特认知进化能力[3] 合作背景与历史渊源 - 36氪2023年5月成为全网最早报道DeepSeek的商业媒体 并对CEO梁文锋进行2次独家专访[3] - 36氪2024年共报道10000+企业融资动态 是初创企业发布融资报道的首发阵地和投资机构信息库[2] 服务功能与操作流程 - 用户通过36氪APP首页底部寻求报道页面 根据智能机器人小氪引导填写信息即可快速生成报道[4] - 生成报道后进入人工审核阶段 通过审核稿件发布在36氪自助报道栏目 依托主站流量提供曝光[4] - 小氪具备行业认知能力 能根据企业类型自动匹配问题知识库 进行结构化提问深挖价值内核[6] - 系统自动交叉比对企业融资数据专利信息市场研报 确保内容真实可信且精确完善[6] 服务覆盖企业类型与价值 - 帮助初创公司低成本生成投资人青睐的商业叙事 解决酒香巷子深问题[3] - 协助传统企业用AI写作翻译晦涩技术成果 跨越大众认知鸿沟[3] - 支持区域品牌打破地域限制 一键生成面向全国的推广内容[3] - 服务覆盖已获数千万融资优质项目和个人运营淘宝小店 实现高效曝光[3] 平台定位与战略意义 - 36氪始终肩负创业者与投资人之间桥梁的责任 通过内容输出行业活动投融资对接服务成为创新企业价值发现者[7] - 此次合作借助AI技术重塑商业报道逻辑 更高效为早期项目提供发声渠道[7] - 36氪不仅是中国科技创新浪潮见证者 更是参与者和推动者 陪伴科技企业共同成长进步[7]
腾讯突发重磅!大降价
21世纪经济报道· 2025-02-27 20:58
腾讯混元TurboS发布 - 腾讯正式发布新一代基座模型混元TurboS,采用Hybrid-Mamba-Transformer融合架构,有效降低传统Transformer结构的计算复杂度和KV-Cache缓存占用 [1][4] - 该架构结合Mamba高效处理长序列能力和Transformer捕捉复杂上下文的优势,是工业界首次将Mamba架构无损应用于超大型MoE模型 [5][6] - 混元TurboS将作为旗舰模型,为推理、长文、代码等衍生模型提供基础能力 [7] 模型性能对比 - 在MMLU测试中得分为89.5,高于GPT4o-0806的88.7和Claude-3.5 Sonnet-1022的88.3 [7] - 在中文能力测试C-Eval和CMMLU中分别获得90.9和90.8的高分,显著优于其他主流模型 [7] - 数学能力表现突出,MATH测试得分89.7,AIME2024测试得分43.3,均领先竞品 [7] 商业化进展 - 混元TurboS已在腾讯云官网正式上线,开发者和企业用户可通过API调用,定价为输入0.8元/百万tokens,输出2元/百万tokens,价格较前代大幅下降 [8] - 腾讯元宝将逐步灰度上线混元TurboS,目前提供一周免费试用 [9] - 此前基于TurboS开发的混元T1模型已上线腾讯元宝,引入长思维链、检索增强等技术 [8] 腾讯AI战略调整 - DeepSeek的出现促使腾讯AI落地进程大幅提速,从保守转向激进 [11][12] - 腾讯云快速上线DeepSeek-R1大模型,腾讯元宝同时支持混元和DeepSeek两大模型 [11] - 目前腾讯旗下已有十余款产品接入DeepSeek,横跨不同事业群 [13] 腾讯元宝市场表现 - 腾讯元宝在苹果商店中国区免费APP下载排行榜升至第二,超越豆包 [15] - 自2月13日起一周内进行多次重大更新,包括让DeepSeek具备理解图片的能力 [16][19] - 腾讯股价一度涨至522港元,创2021年8月以来新高 [21]