DeepSeek API

搜索文档
DeepSeek 重磅发布!
证券时报· 2025-08-21 23:05
产品升级 - 公司正式发布DeepSeek-V3 1版本 包含混合推理架构 支持思考模式与非思考模式自由切换[1][2][4] - 模型在多项搜索评测指标上取得较大提升 在复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上性能大幅领先R1-0528[3] - 新模型采用UE8M0 FP8 Scale参数精度 并对分词器及chat template进行较大调整 与V3版本存在明显差异[3] 技术特性 - API同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文均扩展至128K[3] - API Beta接口支持strict模式Function Calling 确保输出Function满足schema定义[3] - 通过Post-Training优化 新模型在工具使用与智能体任务中表现有较大提升 思考效率相比R1-0528更高[4] 市场反应 - DeepSeek概念股每日互动尾盘直线拉升[3]
DeepSeek,重磅发布!
证券时报网· 2025-08-21 18:35
产品升级 - 公司正式发布DeepSeek-V3 1版本 包含混合推理架构 支持思考模式与非思考模式自由切换 [1][2] - 新模型思考效率显著提升 相比DeepSeek-R1-0528能在更短时间内给出答案 [2] - 通过Post-Training优化 新模型在工具使用与智能体任务中的表现有较大提升 [2] 技术规格 - 模型采用UE8M0FP8Scale参数精度 并对分词器及chat template进行较大调整 与DeepSeek-V3存在明显差异 [3] - API同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文扩展至128K [2] - API Beta接口支持strict模式Function Calling 确保输出Function满足schema定义 [2] 性能表现 - 在多项搜索评测指标上取得较大提升 包括需要多步推理的复杂搜索测试browsecomp与多学科专家级难题测试HLE [2] - DeepSeek-V3 1性能大幅领先R1-0528版本 [2] 市场反应 - DeepSeek概念股每日互动300766尾盘直线拉升 [3]
DeepSeek-V3.1发布:更高效思考、更强Agent能力、更长上下文
生物世界· 2025-08-21 16:00
混合推理架构 - 引入混合推理架构 支持深度思考模式和非思考模式自由切换[2][3] - 深度思考模式适用于数学计算和复杂逻辑分析等深度推理任务 推理效率更高[3] - 非思考模式适用于日常对话和信息查询等轻量级任务 响应更迅速[4] Agent能力提升 - 通过Post-Training优化大幅提升工具使用和智能体任务表现[6] - 编程智能体在代码修复和命令行终端任务中表现优于前代模型 所需轮数更少效率更高[6] - 搜索智能体在多步推理搜索和多学科专家级难题测试中性能大幅领先DeepSeek-R1-0528[7] - SWE-bench指标达到66.0 较DeepSeek-V3-0324的45.4提升45%[7] - Terminal-Bench指标达到31.3 较DeepSeek-V3-0324的13.3提升135%[7] - Browsecomp指标达到30.0 较DeepSeek-R1-0528的8.9提升237%[8] - Browsecomp中文指标达到49.2 较DeepSeek-R1-0528的35.7提升38%[8] 思考效率优化 - 采用思维链压缩训练 输出Token减少20%-50%的情况下任务表现仍与DeepSeek-R1-0528持平[9] - 实现更快的响应速度和更低的API调用成本[9] API升级 - 上下文扩展至128K 处理长文档能力增强[10][12] - 新增strict模式Function Calling 确保函数调用符合Schema定义[12] - 支持Anthropic API格式 可接入Claude Code框架[12] 模型开源与定价 - Base模型和后训练模型已在Hugging Face和魔搭平台开源[11] - 使用UE8M0 FP8 Scale参数精度 分词器和chat template有较大调整[11] - API价格自2025年9月6日起执行新版价格表并取消夜间时段优惠[11]
DeepSeek-V3.1正式发布,上下文均扩展为128K
第一财经· 2025-08-21 15:19
模型升级与技术特性 - 官方App与网页端模型同步升级为DeepSeek-V3 1版本 包含混合推理架构 同时支持思考模式与非思考模式 [1] - 思考效率显著提升 相比DeepSeek-R1-0528 DeepSeek-V3 1-Think能在更短时间内给出答案 [1] - 通过Post-Training优化增强Agent能力 在工具使用与智能体任务中表现有较大提升 [1] 产品功能与接口更新 - 用户可通过深度思考按钮实现思考模式与非思考模式的自由切换 [1] - API同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文扩展至128K [1] - API Beta接口支持strict模式Function Calling 确保输出Function满足schema定义 [1] - 新增对Anthropic API格式支持 可接入Claude Code框架 [1] 价格政策调整 - 北京时间2025年9月6日凌晨起执行新版API价格表 同时取消夜间时段优惠 [2] - 9月6日前所有API服务仍按原价格政策计费 [4]
潞晨科技官宣停用DeepSeek背后:创始人受指责,投资人很无奈
创业邦· 2025-03-04 11:02
核心观点 - 潞晨科技暂停DeepSeek API服务主要由于成本过高,难以实现盈利 [2][6] - DeepSeek公布的理论成本利润率545%建立在超负荷使用条件下,实际运营需5倍冗余资源 [3] - 中小MaaS厂商面临技术壁垒被打破和商业模式颠覆的挑战 [10] 行业动态 - 国内已有数百家企业接入DeepSeek,覆盖多个热门领域和政府机构 [8] - DeepSeek开源代码库导致第三方MaaS厂商技术优势消失,行业格局重塑 [10] 成本分析 - DeepSeek R1模型每日输出1000亿token时,月机器成本达4.5亿元,亏损4亿元 [5] - 稳定服务需储备数倍于实际使用的冗余算力资源,大幅推高运营成本 [9] - 大型云厂商可通过资金优势承担短期亏损,中小厂商难以跟进 [9] 技术争议 - DeepSeek论文显示的558万美元训练成本仅为单次实验,实际开发需数十次 [4] - 产品稳定性存在问题,经常出现掉线情况 [4] - 第三方厂商难以复现官方宣称的成本效率 [6] 商业模式 - MaaS行业普遍亏损,主要收入来自定制开发和私有化合作 [6] - DeepSeek成本持续降低压缩第三方厂商盈利空间 [9] - 技术开源使中小厂商失去差异化竞争能力 [10]
突发!潞晨科技宣布将暂停DeepSeek API服务,时间在一周后
证券时报· 2025-03-02 07:43
潞晨科技停止DeepSeek API服务 - 潞晨科技宣布一周后停止提供DeepSeek API服务 未用完余额将全额退款 [2] - 此前华为计算公众号发文称DeepSeek-R1系列模型因性能和低成本引发全球关注 潞晨科技与昇腾联合发布基于昇腾算力的DeepSeek-R1推理API及云镜像服务 [2] DeepSeek-R1模型成本与定价争议 - 潞晨科技CEO尤洋表示满血版DeepSeek-R1每百万token定价16元 每日输出1000亿token可使接入企业月收入达4800万元 [2] - 完成1000亿token输出需约4000台H800机器 月机器成本达4.5亿元 可能导致企业月亏损4亿元 [2] - DeepSeek披露理论成本利润率545% 在GPU租赁成本2美元/小时情况下 日总成本87072美元 日总收入562027美元 [6] 公司背景与业务发展 - 潞晨科技核心团队来自加州大学伯克利分校 斯坦福大学 清华大学 北京大学等知名高校 [6] - 主营业务包括分布式软件系统 大规模人工智能平台 企业级云计算解决方案 [6] - 开发开源低成本AI大模型开发系统Colossal-AI 旨在最大化AI训练效率同时最小化训练成本 [7] - Video Ocean和潞晨云累计服务用户超10万 付费客户2476家 包括4家世界500强和10家上市公司 [7] - 2024年营收7700万元人民币 预计2025年达1.5亿元 2026年增至3亿元 [7]
DeepSeek宣布:活动正式收官
21世纪经济报道· 2025-02-28 16:46
开源周活动总结 - 国内AI明星企业深度求索(DeepSeek)在2月24日至28日举办了为期五天的"开源周"活动 [1][3] - 活动期间共发布了五个开源项目,涵盖计算、通信和存储等多个技术领域 [3] - 中信证券研报指出,此次开源活动有望进一步催化AI+主题,带动行业应用发展和算力需求增长 [7] 开源项目详情 - 2月24日:开源FlashMLA代码库,针对Hopper GPU优化的高效MLA解码内核,已投入生产 [4] - 2月25日:开放DeepEP通信库,支持MoE模型训练和推理的全对全通信,兼容FP8低精度运算 [4] - 2月26日:开源DeepGEMM库,专为FP8通用矩阵乘法设计,支持普通和MoE分组的GEMM [5] - 2月27日:一次性开源DualPipe工具、EPLB负载均衡器及性能分析数据集 [5] - 2月28日:开源3FS数据访问助推器 [6] API价格调整 - 2月25日恢复API充值功能,同时进行价格结构性调整 [8][9] - deepseek-chat(V3模型):输入tokens 2元/百万,输出tokens 8元/百万 [9] - deepseek-reasoner(R1模型):输入tokens 4元/百万,输出tokens 16元/百万 [9] - 2月26日推出错峰优惠策略 [10] - 每日00:30-08:30优惠时段 [10] - V3模型价格降至50%,R1模型降至25% [10]
速递|大模型价格战再升级,DeepSeek降价最高达75%
Z Finance· 2025-02-27 19:36
DeepSeek API价格调整 - 公司宣布自2月26日起每天00:30至08:30大幅下调API调用价格 R1和V3模型在此时间段内价格分别降低75%和50% [1] - 公司将这一时段称为"非高峰时段" 但实际覆盖欧美白天时段 [1] - 此次价格折扣是公司最新动作 震动了国内外人工智能行业 [1] 公司产品战略 - 公司正在加速推出下一代产品 继1月份R1模型后将有新动作 [1] - 开源理念和低价策略在去年五月首次引发国内AI模型价格战 当时发布V2模型 [1] - 自AI助手上月发布以来 已促使OpenAI降低价格 Google的Gemini推出折扣访问层级 [1] 行业影响 - 公司低成本AI模型上个月引发全球股市大规模抛售 [1] - 价格调整策略持续影响行业竞争格局 迫使主要竞争对手跟进降价 [1]
特斯拉市值跌破1万亿美元!百度斥资21亿美元收购YY直播业务!微信测试版支持电脑上收红包!DeepSeek重新开放API充值!
新浪财经· 2025-02-26 08:47
特斯拉股价大跌 - 特斯拉股价单日大跌超8% 市值蒸发892亿美元(约合人民币6468亿元) 总市值跌破1万亿美元关口 [2][3][4] - 美股科技股普跌 英伟达、谷歌跌超2% 微软、Meta跌超1% 加密货币及半导体板块领跌 嘉楠科技跌超16% Strategy跌超11% [4] - 特斯拉中国推出城市道路Autopilot功能更新 新增驾驶室摄像头监测 但需额外支付6.4万元购买FSD服务 官方将名称从"完全自动驾驶能力"改为"智能辅助驾驶功能" [4][5] 百度收购YY直播 - 百度以21亿美元收购欢聚集团YY直播业务 此前托管账户16亿美元(约116亿元人民币)已退还 资金拟投入云及AI基础设施 [7][8] 微信功能更新 - 微信Windows 4.0.2测试版支持PC端收取红包 数据与手机端同步 但暂不支持PC端发送红包 [9][10][11] DeepSeek技术动态 - DeepSeek重新开放API充值 R1模型百万tokens输入价格1-4元 输出16元 V3模型输入0.5-2元 输出8元 [12][13][15] - 发布开源EP通信库DeepEP 支持MoE模型训练 具备高效all-to-all通信及NVLink/RDMA特性 [16] 中概股表现 - 纳斯达克中国金龙指数涨0.58% 理想汽车涨逾13% 小鹏汽车涨超5% 阿里巴巴、哔哩哔哩涨近4% [4]