Workflow
DeepSeek
icon
搜索文档
Amazon is reportedly developing its own AI ‘reasoning' model
TechCrunch· 2025-03-05 03:27
文章核心观点 - 亚马逊计划入局AI“推理”模型游戏,正开发具备先进“推理”能力的AI模型 [1] 亚马逊AI模型开发情况 - 公司正开发具备先进“推理”能力的AI模型,或于6月以Nova品牌推出 [1] - 公司目标为新模型采用“混合”推理架构,可在单一系统内提供快速答案和更复杂的深度思考 [2] - 公司希望Nova推理模型比竞争对手更具价格效益,但面临挑战,因DeepSeek以低价模型著称 [3] 推理模型特点 - 推理模型采用循序渐进、更周全的方式回答查询,能提高在数学和科学等领域的可靠性 [2]
国内第一波官宣弃用DeepSeek的公司出现了
虎嗅APP· 2025-03-04 21:32
核心观点 - 潞晨科技宣布暂停DeepSeek API服务,主要原因是成本过高,无法与官方成本竞争 [4][5][9] - DeepSeek公布的理论成本利润率545%是在极端负载条件下实现的,实际运营中需要5倍冗余资源,导致第三方MaaS厂商难以盈利 [6][8] - DeepSeek的开源策略正在打破第三方MaaS厂商的技术壁垒,颠覆行业商业模式 [10] 行业分析 - DeepSeek已接入数百家企业,覆盖多个热门领域和政府机构,行业影响力显著 [10] - 大型云厂商如阿里云、腾讯云因资金和算力资源充足,能够承受短期亏损并通过用户聚集实现变现,而中小MaaS厂商面临生存压力 [10] - DeepSeek的开源代码库导致第三方MaaS厂商技术优势消失,行业竞争格局被重塑 [10] 公司决策 - 潞晨科技创始人尤洋认为DeepSeek的实际训练成本远高于传言,测算满血版DeepSeek R1每月机器成本达4.5亿,亏损4亿 [8] - 尤洋指出DeepSeek产品稳定性存在问题,经常掉线,且训练成本被低估,开发大模型需几十次实验 [7] - 潞晨科技内部解释暂停服务为"业务调整",但投资人和内部人士均确认核心原因是成本过高 [9] 成本问题 - 第三方MaaS厂商需储备数倍于实际使用量的冗余算力资源以保障服务稳定性,这部分闲置资源构成主要成本 [10] - DeepSeek官方成本持续下降,压缩第三方MaaS厂商盈利空间,使其难以维持服务 [10] - MaaS行业整体处于亏损状态,主要收入来源为定制开发和私有化合作,而非API服务 [9]
“实习生也月入过万”,这一行业严重缺人
盐财经· 2025-03-04 18:45
AI行业人才争夺现状 - 互联网大厂正以最大能量挖掘AI领域顶尖人才 包括与AI论文作者单独见面[1] - AI To C业务开启大规模招聘 阿里巴巴开放数百个岗位 腾讯元宝同时开启热招[2] - 行业高薪成为普遍现象 近三分之一AI技术岗位年薪超过50万元[5] 薪资水平与涨幅 - 超级独角兽DeepSeek提供年薪至少50万元岗位 深度学习研究员最高年薪超176万元[4] - AGI实习生日薪达500-1000元 可实现月入上万[4] - AI岗位跳槽薪资涨幅达30% 显著高于其他计算机相关行业[10] - 算法工程师 深度学习 机器学习岗位中31-38%年薪超过50万元[13] 人才供需状况 - AI技术人才紧缺指数达3.24 处于高度供不应求状态[20] - 2030年中国熟练AI专员需求将达600万 但供应量仅200万 存在400万缺口[18] - 企业招聘面临痛点 400名应聘者中仅1人符合大模型算法工程师要求[23] - 阿里巴巴春招3000个实习生岗位中近50%与AI相关 部分部门占比超80%[19] 人才要求与培养 - AI算法岗要求高学历背景和论文成果 注重基础能力与系统性思维[23] - 企业急需既懂AI技术又能理解业务场景的复合型人才[25] - 理工科学生通过自我驱动学习进入行业 数学系学生因算法优势适合AI领域[24] - 高校人才培养与产业需求存在差距 AI种子难以快速满足企业需求[25] 行业前景与挑战 - 2026年三分之二云应用将使用AI 八成企业需要AI熟练工[18] - AI创业公司出现人员调整 AI六小龙中5家去年下半年进行人员优化[29] - 大厂采用内部赛马机制 在文本 图文 视频等方向存在资源竞争[30] - 尽管存在泡沫 但社会关注与大厂入局形成势能 推动技术落地[31]
明日9时开幕!首场新闻发布会涉及DeepSeek,民营经济促进法,政府债务等议题 | 聚焦两会
清华金融评论· 2025-03-04 18:36
民营经济促进法 - 民营经济促进法草案已由国务院提请全国人大常委会初次审议并再次审议 [3] - 草案首次将坚持"两个毫不动摇"、促进"两个健康"写入法律 [3] - 草案将党中央关于促进民营经济发展的重大方针政策上升为法律规范 [3] - 草案保证各种所有制经济依法平等使用生产要素、公平参与市场竞争、同等受到法律保护 [3] 中美经贸关系 - 中美贸易额建交46年来增长200多倍 [5] - 中美双向投资存量约2500亿美元 [5] - 美方单边加征关税违反世贸组织规则并干扰全球产业链供应链安全稳定 [5] - 中美合则两利斗则俱伤一个稳定健康可持续发展的中美关系符合两国利益和国际社会期待 [5][6] 立法工作进展 - 全国人大常委会一年来审议法律案39件通过24件 [8] - 通过的法律包括制定6件修改14件作出有关法律问题和重大问题决定4件 [8] 人工智能领域发展 - DeepSeek公司取得的重大进展代表中国公司在人工智能领域的崛起 [10] - DeepSeek坚持开放开源技术路线推动人工智能技术在全球普遍应用 [10] - 中国政府高度重视人工智能技术发展和风险防范提出《全球人工智能治理倡议》 [10] 中国经济前景 - 中国经济基础稳优势多韧性强潜能大长期向好的支撑条件和基本趋势没有变 [12] 政府债务管理 - 2024年2万亿元置换债券额度已全部发行完毕大部分地区已完成置换 [13] - 2025年2万亿元置换债券发行相关工作已经启动 [13] - 全国人大常委会将加强政府债务管理情况监督特别是存量隐性债务置换的跟踪监督 [13]
涉及DeepSeek、中美经贸、民营经济等!这场发布会信息量很大!
21世纪经济报道· 2025-03-04 14:51
人大会议议程与工作重点 - 十四届全国人大三次会议会期7天,议程包括审议政府工作报告等6个报告及代表法修正草案议案[2][3] - 人大将围绕发展全过程人民民主,坚持完善运行人民代表大会制度,为中国式现代化提供制度保障[4][5] - 2024年立法工作取得显著进展,全年审议法律案39件,通过24件(含制定6件、修改14件、决定4件)[7][8] 科技创新与产业发展 - DeepSeek等中国AI公司通过开放开源路线推动全球技术应用,体现中国科技创新的包容性[9][10] - 民营经济促进法草案已进行两次审议,首次将"两个毫不动摇"写入法律,推动平等市场竞争环境[11][12] - 粤港澳大湾区建设持续推进,"硬联通""软联通""心联通"水平显著提升[27][28] 国际经济关系 - 中美建交46年来贸易额增长200多倍,双向投资存量达2500亿美元,经贸关系本质是互利共赢[13][14] - 中欧是相互成就的伙伴,2025年将迎来建交50周年,双方无根本利害冲突[19][20] - 中国与全球南方国家经济联系紧密,过去20年全球南方对世界经济增长贡献率达80%[29][30] 财政与国防管理 - 2024年2万亿元置换债券额度已全部发行完毕,2025年置换工作已启动,人大将加强债务监督[21][22] - 中国国防费连续9年保持个位数增长,占GDP比重维持在1.5%以下,低于世界平均水平[25][26] 对外交往 - 全国人大与190个国家议会保持联系,建立26个对外交流机制和143个双边友好小组[23][24]
速递|Anthropic完成E轮融资,筹集了35亿美元,估值615亿美元
Z Potentials· 2025-03-04 13:33
新一轮融资将推动 Anthropic 与 OpenAI 的竞争,后者目前正在洽谈一笔估值高达 3000 亿美元的交易。 这两笔交易都凸显了硅谷投资者对向领先的 AI 公 司投入大笔资金的持续热情,尽管最近出现了像中国的 DeepSeek 这样的公司,声称能以更低的成本开发类似技术。 图片来源: Anthropic 根据彭博社消息, OpenAI 的竞争对手 Anthropic 已正式完成一笔以 615 亿美元估值筹集 35 亿美元的交易。 该公司向彭博社透露——这巩固了其作为全球最大初创公司之一的地位。据悉,该公司今年迄今已将年化收入提高了 30% 。 更高的估值,包括新筹集的资金,正值 Anthropic 业务快速增长之际。据一位知情人士透露,去年年底,该公司的年收入运行率约为 10 亿美元。 Anthropic 这家以名为 Claude 的聊天机器人而闻名的大型语言模型制造商。最新一轮融资,由 Lightspeed Venture Partners 领投,其贡献了 10 亿美元。 根据 Anthropic 的声明,参与 E 轮融资的其他投资者包括 General Catalyst 、 Jane Stree ...
2025生成式人工智能薪酬报告
锐仕方达人才科技集团· 2025-03-04 13:18
报告行业投资评级 - 报告未明确给出行业投资评级 [1][5] 报告核心观点 - 生成式人工智能产业呈现高速发展态势 中国人工智能核心产业规模接近6000亿元 相关企业超过4500家 [17][20] - 产业人才供需失衡迹象明显 预计到2030年中国AI专业人才缺口达400万人 [34] - 一线城市仍是人才需求及薪酬水平黄金区域 北京在算法和模型层产业具有领先优势 [39][50] - 不同规模企业薪酬表现差异显著 千人以下规模企业在应用层薪酬更具吸引力 [36][48][59] 生成式人工智能产业概况 - 产业定义:基于深度学习的技术 能生成文本、图像、视频等内容 [16] - 发展里程碑:2022年ChatGPT发布 2024年DeepSeek模型引发全球关注 [14][17] - 产业链结构:分为基础层(算力、数据)、算法和模型层、应用层(AIGC+垂直领域) [18][19] - 产业规模:2024年中国人工智能核心产业规模接近6000亿元 预计2035年达17295亿元 [20][22] - 政策支持:国家层面出台多项规划 地方政策侧重资金补贴、场景开放和人才引进 [23][24][26] 人才趋势洞察 - 基础层:1000-5000人规模企业中总监级年收入达720,037元 一线城市招聘薪酬北京领先达27,397元/月 [36][39][42] - 算法和模型层:5000-10000人规模企业总监年收入731,263元 北京地区招聘量三年超40万人次 [48][50][52] - 应用层:100-500人规模企业总监年收入758,134元 北京深圳招聘需求最为活跃 [59][62][65] - 应届生薪酬:重点院校硕士在基础层起薪25,400元/月 应用层起薪普遍低于上中游 [44][56][67][69] 典型企业分析 - 浪潮信息:算法研究员月薪45-75k 主要聚焦算力领域算法岗位 [78][79] - 东方国信:图像识别算法架构师月薪15-30k 以机器学习领域为代表 [80][86][87] - 阿里巴巴:达摩院高性能算子开发专家月薪上限80k AI芯片相关岗位预算优势明显 [89][93][95] 数据统计说明 - 数据来源:国家统计局、企业年报及公开媒体数据 [7] - 统计术语:包含分位值、同比/环比增长率等标准统计指标 [8] - 职级体系:涵盖副总至操作工等9个职级 明确定义与范围 [9][10][11]
潞晨科技官宣停用DeepSeek背后:创始人受指责,投资人很无奈
创业邦· 2025-03-04 11:02
核心观点 - 潞晨科技暂停DeepSeek API服务主要由于成本过高,难以实现盈利 [2][6] - DeepSeek公布的理论成本利润率545%建立在超负荷使用条件下,实际运营需5倍冗余资源 [3] - 中小MaaS厂商面临技术壁垒被打破和商业模式颠覆的挑战 [10] 行业动态 - 国内已有数百家企业接入DeepSeek,覆盖多个热门领域和政府机构 [8] - DeepSeek开源代码库导致第三方MaaS厂商技术优势消失,行业格局重塑 [10] 成本分析 - DeepSeek R1模型每日输出1000亿token时,月机器成本达4.5亿元,亏损4亿元 [5] - 稳定服务需储备数倍于实际使用的冗余算力资源,大幅推高运营成本 [9] - 大型云厂商可通过资金优势承担短期亏损,中小厂商难以跟进 [9] 技术争议 - DeepSeek论文显示的558万美元训练成本仅为单次实验,实际开发需数十次 [4] - 产品稳定性存在问题,经常出现掉线情况 [4] - 第三方厂商难以复现官方宣称的成本效率 [6] 商业模式 - MaaS行业普遍亏损,主要收入来自定制开发和私有化合作 [6] - DeepSeek成本持续降低压缩第三方厂商盈利空间 [9] - 技术开源使中小厂商失去差异化竞争能力 [10]
一天吃透一条产业链:DeepSeek产业链
数说者· 2025-03-04 07:47
核心观点 - DeepSeek是一家以极低成本实现高性能AI模型研发的公司 其训练成本仅为竞品的1/10 通过算法优化和开源策略成为AI界的"价格屠夫" [8][11][13] - 公司核心技术优势体现在采用混合专家模型(MoE)和高效训练方法 以557.6万美元成本训练出6710亿参数模型 性能比肩GPT-4o和Claude 3.5 [8][48] - 母公司幻方量化背景提供算力基础 创始团队年轻化且具备技术基因 坚持"普惠开放"理念推动技术革新 [45][47][48] 产业链分析 上游产业链 - 全球算力规模达910EFLOPS 其中智能算力从2021年113EFLOPS增长至2023年335EFLOPS 增速领先 [16] - AI芯片市场2023年规模652亿元 预计2026年达1611亿元 2024年上半年中国加速芯片市场规模超90万张 GPU占80%份额 [22][25] - AI服务器全球市场2023年突破500亿美元 增幅95.8% 中国市场规模从2020年149亿元增长至2023年692亿元 [28] - 云计算市场2023年规模6165亿元 同比增长35.5% 六大云服务商占据71.5%市场份额 [34] 中游产业链 - 全球AI市场2023年收入5381亿美元 同比增长18.5% 预计2026年达9000亿美元 [37] - 2024年Q1全球AI领域完成1779笔融资 总额216亿美元 [38] - 中国现有240多个大模型 头部产品包括文心一言/豆包/Kimi等 DeepSeek定位对标OpenAI o1和Claude 3.5 [41] 技术实现方式 - 采用数据优化和算法创新 通过20%核心数据训练实现80%性能提升 突破传统算力依赖模式 [13] - 训练与推理环节分离 参数量升级影响训练算力 推理算力取决于应用场景数据吞吐量 [20] 公司背景 - 团队规模139人 以名校年轻人才为主 创始人梁文锋为浙江大学信息与电子工程学系硕士 [45] - 母公司幻方量化曾管理超1000亿资金 2017年实现投资策略AI化 投入超10亿元建设"萤火虫"超级计算机 [47] - 2024年主动缩减资管规模至300亿以下 战略重心转向AI研发 2024年5月推出DeepSeek-V2引发行业价格战 [47] 产品与市场策略 - 定价策略极具颠覆性:DeepSeek-V2每百万tokens输入1元/输出2元 相当GPT-4 Turbo成本的1% [47] - 2024年12月发布DeepSeek-V3模型 采用6710亿参数MoE架构 总训练成本557.6万美元 不足GPT-4的1/10 [8][48] - 坚持开源路线 代码完全公开 技术透明度与低成本优势形成双重竞争力 [11][48]
Singapore probes final destination of possible Nvidia chip servers
TechXplore· 2025-03-03 21:30
文章核心观点 新加坡调查可能含英伟达芯片服务器的最终去向,该事件与中国人工智能公司DeepSeek有关,美国正打击向中国出口先进半导体 [1][2][3] 分组1:事件背景 - 美国打击向中国出口先进半导体以保持技术竞争优势 [2] - 1月DeepSeek发布R1聊天机器人,震动全球科技市场,称其工具能以较低成本达到美国顶级人工智能产品的性能 [6] 分组2:事件详情 - 新加坡媒体将当地一起欺诈案与英伟达芯片运往中国人工智能公司DeepSeek一事关联 [1][4] - 可能含英伟达芯片的服务器从美国运往新加坡后到了马来西亚,但最终目的地不明 [2][4][5] - 新加坡内政兼律政部长称调查三名上周因虚假陈述被控欺诈的男子时发现芯片运输路线 [3] - 服务器由美国公司戴尔和Super Micro供应给新加坡公司 [4] - 新加坡评估服务器最终目的地可能存在虚假陈述,并向美国和马来西亚索要更多信息 [5] - 部长称评估服务器可能含英伟达芯片 [5] 分组3:调查情况 - 彭博社1月底报道美国官员调查DeepSeek是否通过新加坡第三方购买先进英伟达半导体以规避华盛顿限制 [3]