DeepSeek

搜索文档
DeepSeek悄悄干了一件事,产品人需要注意了……
混沌学园· 2025-03-25 18:45
DeepSeek-V3-0324模型发布 - 最新模型DeepSeek-V3-0324总体积达6850亿参数 [1] - 模型已取得MIT许可证 可自由商用 [1] - 测试证实可在消费级硬件上运行 [1] AI行业发展趋势 - AI快速迭代将加速产品进化 [1] - AI不是产品附加功能 而是重构商业逻辑的操作系统 [1] AI产品开发关键问题 - 如何在大模型基座上打造AI产品 [1] - 如何用AI助力完成消费者待办任务 [1] - 如何让AI挖掘用户需求与场景 [1] - 如何抓住智能算力红利 [1] - 如何让AI融入工作流解决痛点 [1] 行业专家资源 - 任鑫为混沌创新领教/云九资本合伙人/Al炼金术主理人 产品课获数十万学员追更 [1] - 李恩临为混沌创新领教/MBA导师/人大特聘教授 指导过200+创业项目 [1]
数秦科技俞学劢:分布式可信数据空间为数字金融与产业升级破局
财富在线· 2025-03-25 18:05
数秦科技俞学劢:分布式可信数据空间为数字金融 与产业升级破局 3月21日,2025未来数商大会在杭州未来科技城学术交流中心举行。大会重点聚焦场景,深入解读数据 要素热点话题,分享数据要素应用的实践经验,搭建开放合作平台,吸引近千名专业观众参与。会上, 数秦科技 CEO 俞学劢受邀发表了题为《分布式可信数据空间——建立信任与价值的链接》的演讲。他 围绕当下数字金融的困境与机遇,深入剖析了分布式可信数据空间的创新实践及深远意义,为行业发展 提供了新思路。 数字金融困局:虚拟资产乱象与传统金融难题并存 俞学劢开场便以虚拟资产市场的疯狂现象为引,2021 年 4 月 15 日,马斯克一条推特配图让狗狗币 24 小时涨 2.5 倍,这种无上限的虚拟资产因名人背书一路飙升。这样的现象在2025年也屡见不鲜,这些毫 无实际价值的虚拟资产疯狂攀升,随后又相继崩盘,97% 的 meme 币不到一年归零。 虚拟资产市场投机盛行,新入场者渴望以小搏大,导致市场空心化。与此同时,传统金融机构虽然也推 出了数字货币 ETF,但仍缺乏新资金流入,流动性枯竭。 俞学劢表示,在传统金融领域,中小微企业融资难题长期存在。从 2017 年到 2 ...
李开复:DeepSeek让中美AI差距缩小至只剩三个月
搜狐财经· 2025-03-25 17:30
中美AI技术差距 - 中国在AI发展方面与美国的差距已从6-9个月缩小至3个月 [3] - DeepSeek等公司通过优化芯片利用和算法应用实现技术突破 [3] - 中国在基础设施软件工程领域已处于领先地位 [3] 中国企业技术创新 - 美国半导体制裁促使中国企业在受限条件下开发自主算法 [3] - DeepSeek采用新型强化学习方式理清思维链 [3] - 模型具备向用户展示推理过程的能力 该技术最早由OpenAI开发但未发布 [3] 行业竞争格局 - 当前市场由财力雄厚的科技巨头主导 [3] - 开源替代方案正在快速发展 [3] - 投资专有模型需要勇气 [3] 零一万物业务发展 - 公司专注于实用型AI应用和基础模型部署软件解决方案 [4] - 推出一站式AI工作平台万知 帮助企业部署AI技术 [4] - 2023年收入达1500万美元 预计2025年将实现数倍增长 [4]
诺安基金邓心怡:中国科技发展正处“战略赶超”与“自主创新”并行阶段
央视网· 2025-03-25 14:50
中国科技发展现状 - 中国科技正处于战略赶超与自主创新并行的关键阶段 [4] - 全产业链在半导体设备 GPU芯片 工业软件与操作系统等核心领域加速自主可控突破 [4] - 政策与市场双轮驱动 政策引导和场景开放加快技术落地 民营企业积极参与前沿赛道布局 [4] AI开源生态的影响 - 开源在AI发展中扮演加速器角色 通过开放协作促进技术创新与知识共享 [2] - DeepSeek V3开放完整模型权重 部署工具链及本土化适配方案 提供从实验室到生产线的全套工具箱 [3] - 开源生态激发企业家精神 企业通过构建战略生态加速技术迭代 [3] 2025年AI产业链投资方向 - 国内市场预计2025年实现技术突破 人工智能产业链存在较大机会 [5] - 算力部署重点关注端侧与云端 随着应用场景丰富2025年端侧可能更为受益 [5] - 应用生态TO B产品部署和业绩兑现更早 TO C市场上限更大 [5] 机器人产业发展前景 - 机器人是端侧应用中最有想象力的部分 量产仍是核心痛点 [5] - 技术突破需兼顾硬件迭代与软件升级 软件迭代决定机器人泛化能力突破 [5] - 工业领域已实现人形机器人生产线应用 医疗养老等服务场景和深海消防等特种场景存在强烈需求 [5] 其他前沿技术领域 - 商业航天领域低轨卫星组网进入关键阶段 可回收火箭技术推动成本下降 手机直连卫星打开下游应用市场 [6] - 量子计算具有指数级并行计算优势 能突破经典计算机物理极限 [6] - 合成生物学与基因编辑技术及与AI融合 在生物制造医疗健康等领域展现巨大前景 [6] - 脑机接口 可控核聚变等颠覆性技术持续受到关注 [6]
博鳌报告:DeepSeek凸显美国制裁下中国的发展韧性
南方都市报· 2025-03-25 14:50
博鳌报告:DeepSeek凸显美国制裁下中国的发展韧 性 3月25日,博鳌亚洲论坛发布的一份报告测算,2025年亚洲经济增速将提升0.1个百分点至4.5%,但贸易 摩擦和地缘政治局势紧张使得亚洲经贸持续承压。 亚洲经贸承压 此次发布的《亚洲经济前景及一体化进程2025 年度报告》(下称"报告")提到,2025年亚洲经济将温 和回升。根据论坛研究院的测算,今年亚洲经济增速预计将增至4.5%,略高于2024年的4.4%。按购买 力平价计算,亚洲经济体GDP总量占世界的比重,预计将由2024年的48.1%上升至2025年的48.6%。 如果只算中国之外的东亚其他经济体,其2025年加权实际GDP 增长率将下降1.0个百分点至3.3%,除中 国之外的其他亚洲经济体2025年加权实际GDP 增长率也将下降0.3 个百分点至4.2%。报告认为,这反映 出中国经济增长对地区的贡献非常关键。 不过,贸易摩擦阴云持续笼罩。2025年1月20日,美国新一届政府宣称要对来自墨西哥和加拿大的输美 商品征收25%的关税,并对所有中国输美商品额外加征10%的关税,尽管很快宣布暂缓对墨西哥和加拿 大征税,但其引起的新一轮贸易摩擦的阴影给世 ...
DeepSeek,上新!
证券时报· 2025-03-25 12:28
DeepSeek V3-0324模型升级 核心观点 - DeepSeek发布V3-0324模型,参数规模达6850亿,较前版6710亿小幅提升,优化性能与用户体验并采用更宽松的MIT开源协议 [1][2][3] 性能优化 - 未公布基准测试但用户反馈显示在复杂代码生成、数学求解、前端设计任务表现更优,代码能力提升显著,接近Anthropic Claude3.5/3.7 Sonnet水平 [2] - 示例:单提示即可生成完整市场网站,涵盖命名、主题设计等,被评价为"击败编码领域其他模型" [2] 交互改进 - 默认关闭"深度思考"模式以提升响应速度,适合快速迭代任务,API用户无需调整代码即可兼容 [2] - 多轮对话中自然语言表达能力增强,上下文理解与人类化表达改善,减少机械式回复 [3] 开源策略 - 采用MIT开源协议,允许自由下载、修改及商业集成,较初代V3更宽松,激发开发者社区关注 [3] 市场预期 - 分析认为V3-0324或为DeepSeek-R2基础模型,虽官方辟谣R2提前发布传闻,市场仍预期其5月推出 [3]
大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
AI科技大本营· 2025-03-25 09:45
大模型技术竞赛与行业动态 - DeepSeek连续五天开源引发复现热潮,阿里巴巴通义实验室和腾讯分别推出ViDoRAG系统和混元快思考模型Turbo S,加速大模型演进 [1] - 马斯克用20万张GPU训练Grok 3超越业界标杆,验证"大力出奇迹"定律 [1] - Claude 3.7 Sonnet编码能力大升级,AI编程技术平权时代加速到来 [1] - DeepSeek论文与Kimi"撞车",稀疏注意力与线性注意力机制成为Transformer后的关键探索方向 [1] - Manus模式的"虚拟机"概念迅速走红,正在重塑大模型运行方式 [1] DeepSeek的技术突破与影响 - DeepSeek R1发布引发全球热议,首次展示模型能以类似人类方式思考,采用第一人称表达推理过程 [6][7] - DeepSeek开源周发布五大项目,涉及算力加速、通信优化和存储处理三大领域 [20][22] - DeepSeek利润率高达545%,颠覆行业对大模型MaaS盈利能力的认知 [33] - DeepSeek的技术路线侧重小粒度Expert,强调效率,相比Grok 3的"暴力美学"更为高效 [45] - DeepSeek的推理架构为搜索体验带来颠覆性变化,推动"边搜边想"的新搜索逻辑 [7] 行业竞争格局与趋势 - 行业可能出现两条发展路径:少数企业继续堆砌算力追求极致模型,大多数企业选择小模型路线 [46] - "百模大战"第一阶段暂时由DeepSeek领先,竞争可能向多模态和具身智能演进 [30][31] - 新兴公司在AI基础设施和大模型训练领域面临巨大投入挑战,难以与头部企业竞争 [27][28] - 阿里Qwen在国际市场表现不俗,但在推理方面未能取得DeepSeek级别的突破 [26] - 量化公司如九坤转型成立AI部门,在系统优化和数据处理方面具有优势 [27] 技术演进与创新方向 - Attention机制面临算法复杂度高的问题,改进方向包括稀疏化和状态空间模型(SSM) [62][63] - DeepSeek提出的NSA(Neural Sparse Attention)在减少计算量的同时提升模型效果 [65] - 合成数据成为重要方向,在多模态、具身智能等领域应用广泛,精准度超越传统数据增强 [75][77] - 长上下文支持技术变革搜索领域格局,Gemini的100万token窗口展现强大能力 [50] - 代码模型可能成为通往AGI的路径,通过持续学习和技能库扩展实现能力进化 [81][83] 应用场景与商业化 - AI编程是首个经过PMF验证的应用场景,Claude 3.7和DeepSeek在代码能力上仍有提升空间 [78][80] - AutoPilot类工具如Devin更适合"万事开头难"场景,成本低于雇佣实习生 [78] - MaaS商业模式面临上游价格和下游支付意愿的双重挑战,运营效率成为关键壁垒 [33][34] - 私有化部署需求增长但面临数据治理挑战,建议企业优先使用API进行验证 [36][39] - 2B领域数据治理和处理服务需求旺盛,国内加速推进数据要素市场建设 [36] 基础设施与工程实践 - 训练大模型成本极高,智源发起OpenSeek开源项目,已吸引100多位贡献者 [9][10] - OpenSeek处理约100亿网页数据,构建4亿条CoT数据集,计划全面开源 [11] - 系统训练层面缺乏成熟框架支持,DeepSeek公开自研五个项目提升训练效率 [12] - 行业Infra团队和人才稀缺,更多关注0到1搭建而非1到100的优化 [21] - 虚拟机技术可能走红,因工具调用需要沙盒化环境执行任务 [84]
这些国家,严控GPU
半导体行业观察· 2025-03-25 09:27
文章核心观点 马来西亚和新加坡因可能将英伟达处理器出口到第三国违反美国出口管制而受到审查,两国采取加强监管等措施,英伟达股价下跌,全面禁止其芯片出口到中国或致收入减少 [1][2][5][7] 马来西亚情况 - 马来西亚是新兴芯片制造和数据中心中心,可能将英伟达处理器出口到第三国违反美国出口管制 [1] - 在美国压力下,马来西亚政府计划加强对英伟达芯片流通监管,贸易部长表示美国要求监控每批运往该国的英伟达芯片,还组建工作组加强对数据中心监管 [2] 美国出口管制及相关调查 - 美国对向中国公司出售先进芯片实施严格出口管制,官员担心处理器通过第三国进入受限制国,正调查中国AI初创公司DeepSeek是否通过新加坡获得英伟达处理器 [3] 新加坡情况 - 2024年新加坡意外成为英伟达第二大收入来源,引发英伟达人工智能芯片销往中国猜测,该国加紧控制GPU,捣毁贩卖英伟达芯片影子网络,拘留三人 [5] - 新加坡内政部长透露戴尔服务器和超微电脑运往马来西亚,引发对马来西亚是否为最终目的地的疑问 [6] - 英伟达约18%收入来自以新加坡为付款地点的客户,但只有约1 - 2%收入来自对新加坡的发货,客户用新加坡集中开票,产品几乎运往其他地方 [4][6] 股价及收入影响 - 英伟达股价同期下跌近8%,目前已下跌14%,市值跌破3万亿美元,超微股价周一下跌11%,戴尔股价下跌约6% [6] - 瑞穗分析师警告全面禁止英伟达芯片出口到中国可能使本财年预计收入减少40亿至50亿美元,中国数据中心销售额占数据中心总收入比例仍远低于出口管制开始时的水平 [7]
DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
量子位· 2025-03-25 08:59
DeepSeek V3-0324升级核心亮点 - 官方称为"小版本升级"但实测性能提升显著,在4维空间超立方体等复杂测试中表现优异[2][3][4] - 编程能力达到Claude 3.7 Sonnet同级水平,可单句提示词生成带自适应布局与动效的完整产品着陆页[5] - 在开发者Xeophon的内部Benchmark中所有指标大幅提升,超越Sonnet 3.5成为最佳非推理模型[6][8][9] 技术能力突破 - 非推理模型展现类人思考能力:具备问题分解、自主回溯纠错机制,在"7米甘蔗过2米门"测试中通过三维空间解法突破二维思维局限[12][13][16][26][27] - 出现类似DeepSeek-R1的"啊哈时刻",解题过程中混合中英文思考并最终发现隐藏条件[16][17][21] - 保持671B参数MoE架构,权重文件总计688GB,与初代V3规模一致[29] 开发者生态与商业化 - 继续采用MIT开源协议,权重文件已火速上线HuggingFace[28] - 支持官网、官方APP(关闭深度思考模式)、HuggingFace等多渠道体验[30] - 可参与大模型竞技场PK,但投票结果需等待[31] - 社区高度关注后续R2版本进展[32] 性能基准表现 - 在Xeophon测试中编码能力(Python/Bash)三项指标(Pass@5/Average Score/5/5一致性)全面领先竞品[11] - 非推理类任务处理能力显著提升,包括数学谜题和空间几何问题[14][15][19][25]
不到24小时!今年最值得关注的AIGC企业/产品评选即将截止
量子位· 2025-03-24 15:22
文章核心观点 量子位将在第三届中国AIGC产业峰会根据过去一年AIGC企业、产品表现与反馈及对2025年技术与场景观察评选年度AIGC奖项,鼓励有潜力有佳绩的企业与产品参与,介绍两类奖项评选标准、报名方式,还公布了峰会信息 [2][3] 评选信息 奖项设置 - 2025年值得关注的AIGC企业,评选拥有最强技术、最佳产品或最具潜力团队的企业 [4] - 2025年值得关注的AIGC产品,评选拥有最创新、最硬核、最实用或最具应用潜力的产品 [7] 参选条件 - AIGC企业参选需公司主体或主营业务在中国,主营AIGC及相关或广泛应用人工智能,近一年在技术/产品、商业化或团队有出色进展 [10] - AIGC产品参选需主要功能基于AIGC能力,具备成熟技术、已投放市场且有一定用户规模,近一年有重要技术创新或功能迭代并对行业有一定影响力 [13] 评选维度 - AIGC企业从技术、产品、市场、潜力维度评选,涉及技术实力、产品创新性、市场表现、核心团队等方面 [10] - AIGC产品从产品技术力、创新力、表现力、潜力维度评选,关注技术先进性、功能创新性、用户反馈、未来发展潜力等 [13] 报名方式 - 报名截止2025年3月24日,企业可扫描二维码或通过网页端链接https://wj.qq.com/s2/17724245/52e8/报名,有疑问可联系量子位工作人员,添加微信18801103170或邮件至linyu@qbitai.com并备注「评选 - 企业 - 姓名」 [12] 结果公布 - 评选最终结果将于4月中国AIGC产业峰会上公布 [12] 峰会信息 - 第三届中国AIGC产业峰会将于4月16日在北京举办,主题为「万物皆可AI」,将邀请AI应用层、基础设施、模型层代表玩家分享生成式AI现状与趋势见解,首批嘉宾已公布 [14][15]