DeepSeek

搜索文档
速递|大模型价格战再升级,DeepSeek降价最高达75%
Z Finance· 2025-02-27 19:36
DeepSeek API价格调整 - 公司宣布自2月26日起每天00:30至08:30大幅下调API调用价格 R1和V3模型在此时间段内价格分别降低75%和50% [1] - 公司将这一时段称为"非高峰时段" 但实际覆盖欧美白天时段 [1] - 此次价格折扣是公司最新动作 震动了国内外人工智能行业 [1] 公司产品战略 - 公司正在加速推出下一代产品 继1月份R1模型后将有新动作 [1] - 开源理念和低价策略在去年五月首次引发国内AI模型价格战 当时发布V2模型 [1] - 自AI助手上月发布以来 已促使OpenAI降低价格 Google的Gemini推出折扣访问层级 [1] 行业影响 - 公司低成本AI模型上个月引发全球股市大规模抛售 [1] - 价格调整策略持续影响行业竞争格局 迫使主要竞争对手跟进降价 [1]
DeepSeek开源打碎了谁的饭碗
虎嗅APP· 2025-02-27 18:17
DeepSeek开源的影响 - DeepSeek开源后,中腰部AI公司和本土芯片公司受益显著,53AI创始人杨芳贤表示存量客户中一半以上将基座模型切换到DeepSeek,客户多为中大型民营企业 [1] - AI应用创业热度提升,芯片公司合作需求在春节后环比增长两倍 [1] - 大模型"六小虎"商业模式受到冲击,面临开源与不开源的两难选择 [1][2] DeepSeek开源的具体行动 - DeepSeek宣布"开源周"计划,已开源4个代码库(FlashMLA、DeepEP、Deep GEMM、Optimized Parallelism Strategies),涉及大模型推理、MoE模型和FP8计算性能优化 [3][7] - 开源代码优化算法,将GPU算力"榨取"到极致,降低中小开发者构建高性能模型的成本 [7] - DeepSeek相关人员低调出席全球开发者先锋大会(GDC)闭门会,时间点与"开源周"吻合 [3][10] 行业受益者分析 - 芯片公司如燧原、沐曦、天数、智芯、摩尔线程、壁仞等可更多介入训练和推理业务 [7] - 基础层硬件公司和一体机厂商受益,冯博比喻"谁不给DeepSeek配一体机,就相当于孩子上大学不给配电脑" [7] - AI中间层公司(如53AI)和应用层公司需求增长,客户询问接入DeepSeek已成为标配 [7][8] DeepSeek的战略意图 - DeepSeek可能对标安卓生态,杨芳贤认为"OpenAI可能是'IOS',而DeepSeek就是'安卓'" [4][10] - 开源计划助长行业开源风气,迫使部分厂商跟进开源,如百度宣布即将开源文心大模型 [3][10] - DeepSeek官方API服务仍由自建服务器支持,商业化问题可能成为下一挑战 [10] 国际市场反应 - DeepSeek开源后,美股七大科技巨头市值蒸发约1.4万亿美元,英伟达股价收跌2.8% [5] - 黄仁勋表示DeepSeek会加速AI采用,但后期训练和推理仍需大量计算资源 [5] - 行业人士认为国产芯片(如昇腾)可支持推理算力需求,DeepSeek并不缺资源 [5]
任意Prompt就能给大模型实时排名!竞技场新玩法,还能自动找最佳AI来作答
量子位· 2025-02-27 17:37
大模型实时排名新方法 - 竞技场推出Prompt-to-leaderboard(P2L)功能,通过输入任意Prompt实时生成大模型排名,精准匹配最适合的模型[1][2] - 排名依据为P2L Score,例如算数Prompt"137124x12312"中03-mini-high得分1228排名第一[5] - 针对不同性质Prompt(如无限制内容、编程任务),排名结果差异显著:无审查限制模型在"Be inappropriate"类Prompt中排名飙升[7][9] 中文及非传统Prompt测试 - 在中文弱智吧Prompt测试中,Grok-3(xAI)以1320分居首,DeepSeek-R1(1284分)和Gemini 2.0(1282分)紧随其后[13] - 典型中文Prompt如"不孕不育会遗传吗"、"午餐肉晚上吃"等,排名前三模型稳定为Grok-3、DeepSeek-R1和Gemini系列[13][15] - 编程类任务中,Grok-3和Gemini 2.0表现突出,如"创建3D地球代码"任务Grok-3得分1189排名第二[9][20] 技术实现与实验效果 - P2L采用Bradley-Terry模型,通过训练LLM输出系数向量预测人类偏好,解决全局排行榜无法反映特定任务表现的问题[26][27] - 实验显示P2L Router在2025年1月Chatbot Arena测试中超越Gemini-exp-1206模型25分,预测准确率显著提升[35] - 方法通过线性规划优化Router策略,聚合排行榜时利用Tower属性分解胜率,计算效率提高[33][34] 平台功能扩展 - 提供P2L Explorer栏目,支持按编程、数学等细分领域查看子类别排行榜[18][19] - 用户可查看单个模型能力图谱(如DeepSeek V3的亮区/暗区分别代表擅长/薄弱领域)[21] - P2L Router对话功能自动选择最佳模型应答,例如输入Prompt后即时调用Grok-3或Gemini等[22][23]
火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持
量子位· 2025-02-27 17:37
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek火爆出圈,各大第三方紧赶慢赶纷纷接入,已经成为现象级议题。 但当话题最热点过去,回归到实际落地这个关键上,新的问题正在进入到一线从业者的视野之中—— 所谓"AI一体机",简单来说,就是把人工智能所需的硬件和软件"打包"在一个设备里,让用户无需繁琐的安装、配置,就能直接使用的一种"AI 专用终端"。 以火山引擎AI一体机-DeepSeek版为例,通过支持DeepSeek R1/V3全系列模型,以及火山引擎自家HiAgent智能体平台、大模型防火墙和 轻量模型训练平台,实现了对模型部署、管理、推理、微调、蒸馏以及AI应用开发的全链路能力覆盖。 怎样才能简单、高效用好DeepSeek? 核心在于,对于企业用户,尤其是更多来自传统行业的企业而言,在自身业务中引入推理模型,不是简简单单接个API的事,要想用得好,还 得结合本地数据、业务场景。 这也就意味着几方面的困难,包括但不限于,算力基础设施的建设和管理、支持大规模在线业务的性能优化以及数据的安全合规问题…… 就在本周,DeepSeek官方也开始围绕AI Infra,连续开源内部秘籍,对于模型从业 ...
Nvidia signals strong AI chip demand despite DeepSeek threat
Sky News· 2025-02-27 17:17
公司情况 - 英伟达旗舰芯片在大型人工智能支出者中需求未降 尽管面临中国竞争对手DeepSeek低成本挑战 [1] - 英伟达预计Blackwell销售额将继续增长 最新财报超市场预期 [1] - 英伟达预测第一季度营收约430亿美元 过去三个月营收393亿美元 环比增长12% 同比增长78% [1] - 一个月前英伟达股价受挫 因DeepSeek低成本芯片聊天机器人成美国苹果应用商店最受欢迎免费应用 其市值一日蒸发近6000亿美元 [2] - 英伟达创始人黄仁勋称已大规模生产Blackwell 首季销售额达数十亿美元 [3] - 黄仁勋表示Blackwell需求惊人 推理人工智能推动其发展 [4] 行业情况 - 市场分析师认为微软、亚马逊等科技巨头对英伟达芯片需求强劲 因其营收指引稳健 且主要来自数据中心 [3] - 哈格里夫斯·兰斯当股票研究主管称人工智能领域长期投资理由充分 如Meta有2000亿美元数据中心投资 [5] - 分析师预计基于英伟达今日财报会调高全年数据 其约30倍的远期市盈率估值不算过高 [6]
AI chip giant Nvidia reports blockbuster revenue
TechXplore· 2025-02-27 17:15
公司业绩 - 公司财年结束时营收达1305亿美元创新高 受数据中心人工智能芯片需求推动 [2] - 第四季度营收393亿美元 净收入220亿美元 [2] - 本财季预计营收430亿美元 超分析师预期 [4] 产品情况 - 公司成功提高新的Blackwell处理器大规模生产能力 首季销售额达数十亿美元 [1][3] - 公司高端GPU受科技巨头热捧 [7] 市场影响 - 公司股价盘后上涨超2% 业绩缓解投资者担忧 [4] - 尽管有市场担忧 公司仍主导AI领域 [5] 行业竞争 - 中国DeepSeek推出R1聊天机器人 称成本低且性能可媲美美国顶级AI产品 [6] - 低成本选项或削弱公司业务 [7] 政策风险 - 公司高端芯片对中国出口受限 [7] - 政策有效性因DeepSeek技术被广泛采用受质疑 [8] 生产风险 - 公司严重依赖台积电生产GPU 面临地缘政治风险 [8]
科研人员容错免责来了
投资界· 2025-02-27 15:06
以下文章来源于解码LP ,作者吴琼 解码LP . 投资界(PEdaily.cn)旗下,专注募资动态 宽容失败。 作者 I 吴琼 报道 I 投资界-解码LP 投资界-解码LP获悉,近日,海南省科学技术厅发布最新征集调查通知,针对《海南省科 技创新容错免责实施办法(试行)》(简称《实施办法》)征求意见。 其中对满足容错免责的情形予以界定,并创新性提出企业及青年科研人员的"首次免 责"。 眼下全国各地掀起容错探索潮,海南此举也指向同一个目标——鼓励创新,宽容失败。 海南尝试 首提青年科研人员"首次免责" 时间回到20 24年底,海南省发布《进一步强化企业科技创新主体地位改革若干措施》 (简称《若干措施》),针对企业在科技创新决策中的参与度不够、研发投入占比不 高、企业牵头承担科研项目比例较低、企业在"产学研"合作中作用发挥不够、企业创新 服务支撑力度不足等科技创新存在的突出问题,支持企业科技创新发展所需。 该《若干措施》主要提出了七个方面2 8条改革措施。在健全符合创新规律的监管制度方 面,针对性提出建立支持企业创新的容错免责制度、建立政府投资基金尽职免责制度等 创新举措,并将尽快推动出台具体配套措施。 这一次,针 ...
速递|阿里通义万相Wan2.1,向全球免费开放AI视频生成模型
Z Potentials· 2025-02-27 12:09
阿里巴巴开源AI模型 - 阿里巴巴开源其Wan2.1系列中的四个模型,这是该公司基础AI模型的最新版本,能够根据文本和图像输入生成图像和视频 [2] - 开源模型与OpenAI等创建的专有模型形成对比 [2] - 阿里巴巴于2月26日周三表示,已将其视频生成人工智能模型免费开放使用,加剧了与OpenAI等竞争对手的竞争 [2] 开源模型获取渠道 - Wan2.1系列模型将通过阿里云的Model Scope和Hugging Face提供 [4] - 全球的学术界、研究人员和商业机构均可访问这些开源模型 [4] 市场反应 - 阿里巴巴在香港上市的股票收盘上涨近5% [5] - 阿里巴巴的股票今年表现强劲,其香港上市股票截至2025年已上涨66% [7] 开源AI技术趋势 - 自DeepSeek在1月震动全球市场以来,开源AI技术备受瞩目 [5] - DeepSeek声称其人工智能模型的训练成本仅为领先AI玩家的一小部分,且使用的是较不先进的Nvidia芯片 [5] - 中国企业尤其积极推动开源模型的发展,阿里巴巴和DeepSeek的模型如今跻身全球最受欢迎之列 [6] - 阿里巴巴于2023年8月发布了其首个开源模型 [6] 开源模式讨论 - 开源与OpenAI等创建的专有模型不同,不会为公司带来收入 [6] - 开源技术有多种目的,包括推动创新和围绕产品构建社区 [6] - 目前围绕AI模型是否会商品化的问题正展开激烈讨论 [6]
刚刚!DeepSeek,硬核发布!
券商中国· 2025-02-27 11:35
DeepSeek开源动态 - 开源周第三天宣布Optimized Parallelity Strategies,旨在提高计算效率、减少资源浪费并最大化系统性能,通过任务分配、资源协调和通信优化实现高效并行执行 [2][3] - 开源周第四天再度发布优化并行策略,包括DualPipe、专家并行负载均衡器(EPLB)及性能分析数据,需根据任务类型、数据规模和硬件环境灵活选择 [5] - 此前开源的DeepEP在20分钟内获得超1000个GitHub Star,该库为MoE模型提供Expert Parallelism通信基础,支持FP8低精度计算并优化非对称带宽转发场景 [5] - 连续开源FlashMLA(Hopper GPU高效译码内核)、DeepGEMM(支持稠密/MoE模型的FP8计算库)等工具,强化AI模型训练与推理支持 [9] 英伟达技术突破 - 开源首个Blackwell架构优化的DeepSeek-R1-FP4模型,推理速度达21,088 token/秒(较H100提升25倍),每token成本降低20倍 [7][8] - FP4量化技术将Transformer线性算子权重压缩至4位,显存需求减少1.6倍,在MMLU基准测试中达到FP8模型99.8%性能 [7][8] - 结合TensorRT-LLM部署,需8颗B200 GPU实现张量并行,供应商可提供每百万token 0.25美元的低成本服务 [8] 商业策略调整 - 北京时间每日00:30-08:30下调API价格,DeepSeek-V3降至原价50%,DeepSeek-R1低至25%(降幅75%),鼓励夜间资源利用 [6]
中金:从规模经济看DeepSeek对创新发展的启示
中金点睛· 2025-02-27 09:46
核心观点 - DeepSeek的出现打破了AI大模型研发需要巨额资金和技术积累的固有认知,由一家中国金融领域的初创企业开发出性能卓越的开源大模型[1][4][5] - DeepSeek的成功在于通过算法优化提升算力的边际产出,以技术进步突破规模定律的约束,这背后体现了中国在数字基础设施和人才规模方面的优势[1][8][11] - AI发展同时受规模定律和规模效应影响,规模定律带来后发优势,规模效应带来先发优势,中美在AI领域各有比较优势[15][16][22] - DeepSeek选择开源模式有利于构建更大规模的创新生态,加速AI应用层的渗透,发挥中国在应用端的规模优势[24][26][28] - 金融与科技存在天然联系,金融领域的创新本就是数字科技创新的一部分,金融科技与科技金融需要协同发展[36][38][39] AI经济学:规模定律与规模效应 - 规模定律指在给定算法框架下,增加数据、参数、算力投入可提升AI性能但边际收益递减,规模效应指规模扩大带来单位成本下降和效率提升[8][9][10] - DeepSeek通过算法优化提升算力边际产出,以技术进步突破规模定律约束,在算法框架改善下AI性能可呈现规模报酬递增[11][12][14] - 算法创新依赖于规模经济构建的创新生态,包括企业内部规模经济和上下游协同的外部规模经济[14] - 中国在数字基础设施和人才规模方面的优势为算法创新提供了支撑,体现大国规模经济效应[1][14][15] AI经济学:后发优势与先发优势 - 规模定律隐含后发优势,落后者要素投入边际产出更高,有利于差距收敛;规模效应隐含先发优势,规模报酬递增强化领先者地位[15][16][22] - 中美AI发展指数显示两国在研发端和应用端均具规模优势,美国研发端略强,中国应用端略强[16] - 中美发展路径分化:美国侧重算力优势,中国侧重算法优化和人才规模,2022年中国培养的AI优秀人才占比已达47%[18][19][21] - 美国限制算力出口可能促使中国更聚焦算法优化,强化比较优势,算法技术进步是AI发展的核心驱动力[19][22] 开源促进外部规模经济 - DeepSeek开源模式降低应用层商业壁垒,有利于加速"人工智能+"进程,2025年1月其APP在157个国家和地区下载排名第一[24][26] - 开源系统更依赖外部规模经济,闭源系统更依赖内部规模经济,如Android用户数近iOS三倍但开发者收入更低[25][28] - AI应用层潜在市场规模是算力层和模型层总和的两倍,开源加速渗透可释放大国规模优势,促进经济增长[27][28] - 开源将规模经济收益更多分配给生态伙伴,实现创新社会正外部性,弱化技术进步的贫富分化效果[28] 创新发展模式 - 科技创新与产业创新需要融合发展,中国需摆脱重供给轻需求、重资产轻人才的路径依赖[31][32] - 大市场需求优势是产业创新根本驱动力,如《黑神话悟空》《哪吒之魔童闹海》等成功案例[32] - 大企业擅长渐进式创新,小企业更具颠覆式创新活力,CVC模式可实现两者优势互补[33][34] - 知识产权保护与个人破产制度对激励人才创新创业至关重要[34] 金融与科技关系 - 金融活动尤其是资本市场关键在解决信息不对称,金融领域创新本就是数字科技创新的一部分[36][39] - 量化基金等金融科技是科技工具在金融领域的重要应用场景,AI大模型要素也是其竞争力所在[38] - 资本市场通过外部规模经济支持创新生态,与多样化创新生态更契合,大国资本市场更具优势[37] - 需平衡金融科技监管与包容"动物精神",重点防范不当行为而非限制超额收益本身[39]