Workflow
Seek .(SKLTY)
icon
搜索文档
国务院国资委推动央企扩大算力有效投资 DeepSeek模型更新
新浪财经· 2026-02-12 07:57
政府政策与产业导向 - 国务院总理李强强调要全面推进人工智能科技创新、产业发展和赋能应用,以培育壮大新质生产力,推动高质量发展 [1] - 国务院国资委要求中央企业积极扩大算力有效投资,推进“算力+电力”协同发展,并强化自主创新以攻关“大模型”技术,推动人工智能规模化落地应用 [1] 人工智能与算力基础设施 - Meta计划斥资超过100亿美元在印第安纳州建设一个占地400万平方英尺的数据中心园区,预计2027年底或2028年初投入运营,将创造300个长期工作岗位并投入超1.2亿美元改善当地基础设施 [3] - 国务院国资委推动中央企业提升全链条数据治理能力,夯实人工智能产业基础底座,并加快推动开源“焕新社区”迭代升级,推进“AI+”产业共同体建设 [1] 大模型技术进展 - DeepSeek更新后支持最高1M(百万)Token的上下文长度,可一次性处理超长文本 [2] - 智谱发布新一代旗舰模型GLM-5,在Coding与Agent能力上取得开源SOTA表现,真实编程场景体感逼近Claude Opus 4.5 [2] 公司财务与运营 - 网易2025年全年营业利润为358亿元人民币,同比增长21%;全年总营收1126亿元,其中在线游戏净收入达896亿元,同比增长11%;年研发投入达177亿元 [6] - 中际旭创澄清其光模块产品由公司直接按CSP客户需求定制开发并交付,商业模式未变,不存在CSP客户绕过公司向光芯片厂下单再转单的情形 [7] 公司资本运作与投资 - 上海燧原科技股份有限公司(云端AI芯片设计)科创板IPO审核状态变更为“已问询” [5] - 新锐股份拟以不超过7亿元人民币收购PCB刀具公司慧联电子70%股权,并以不超过2800万元收购WINWIN公司70%股权以解决同业竞争及发展海外市场 [8] - 中微半导拟将IPO募投项目节余资金1亿元用于新“IPM产线项目”,并在四川资阳设立全资子公司实施该项目 [10] - 欧科亿持股5%以上股东乐清德汇拟通过集中竞价减持不超过158万股(占总股本1%) [9] 前沿科技与标准制定 - 我国完成首次载人飞船返回舱海上搜索回收任务,为后续空间站及载人登月任务积累经验 [2] - 《电动汽车用固态电池第1部分:术语和分类》国标预计于2026年7月正式发布,将明确液态、混合固液及固态电池的定义 [4] - 美国西北大学科学家开发出先进的人类脊髓损伤类器官模型,可用于测试新型再生疗法 [12] - 国际研究团队首次利用“量子电容”技术成功读取拓扑量子比特中的信息,相关成果发表于《自然》杂志 [13]
来了!DeepSeek新模型 | 附体验入口
新浪财经· 2026-02-11 21:22
模型核心能力升级 - 上下文长度大幅提升至100万token,相比之前的128K提升了约10倍,可处理如《三体》三部曲般海量的文本内容 [6][9][11] - 知识库截止日期更新至2025年5月,相较于之前的2024年7月有显著更新,可能基于全新训练的基座模型 [6][9][14] - 文件处理能力支持上传并读取图片、PDF、Word、Excel、PPT、TXT等多种格式文件中的文字信息 [6] 技术性能与风格优化 - 前端与代码能力大幅提升,据开发者实测,其性能可媲美Gemini 3 Pro与K2.5等顶尖竞品 [10][12] - 语言风格更加热情、细腻和真实,旨在减少“幻觉”并提供更真诚的交流体验 [6][10][13] - 模型为纯文本模型,支持语音输入,但暂不支持多模态视觉理解 [6][14][15] 产品与市场定位 - 此次更新为DeepSeek最新版模型,是DeepSeek-V3或DeepSeek-R1之后的迭代版本 [6] - 产品目前完全免费,且公司声明没有收费计划 [6]
DeepSeek更新新模型,支持最高1M百万Token上下文长度
新浪财经· 2026-02-11 19:35
产品更新与功能发布 - DeepSeek在网页端和App端进行了版本更新,支持最高1M百万Token的上下文长度 [1][2] - 截至目前该版本仍未开放多模态能力 [1][2] - 相关媒体援引知情人士消息称,DeepSeek春节更可能推出针对V3系列模型的小幅更新 [1][2] 下一代模型规划与进展 - DeepSeek下一代旗舰模型预计将是一款万亿参数级别的基础模型 [1][2] - 因模型规模大幅跃升,训练速度明显放缓,导致发布进程有所延后 [1][2] 公司沟通与市场反馈 - 截至发稿,DeepSeek暂未回应新浪科技关于版本更新的相关问题 [2][3]
DeepSeek疑似已更新:上下文暴增至100万,知识库
观察者网· 2026-02-11 19:24
模型能力更新 - 公司疑似已更新至新版模型,手机端DeepSeek的“自我介绍”内容发生悄然变化 [1] - 更新后模型上下文处理能力达到1M(一百万tokens),可一次性处理《三体》三部曲体量的书籍 [1] - 模型知识截止时间更新至2025年5月 [1] 性能显著提升 - 与2025年12月1日发布的DeepSeek V3.2相比,当前实装模型的上下文能力从128K提升至1M,暴涨了8倍 [3] - 模型知识库“新鲜度”提升约10个月,从截止至2024年8月更新至2025年5月 [3] - 知识更新意味着模型对2024年下半年至2025年初的重要事件、技术进展和行业动态具备了认知基础 [3] 功能与发布状态 - 目前该模型依然不支持多模态功能 [3] - 此次更新疑似为静默升级,公司官方尚未进行任何正式发布和回应 [3]
DeepSeek新模型来了?
华尔街见闻· 2026-02-11 19:21
DeepSeek V4模型技术升级与市场影响 - 公司正在推进新版本模型的灰度测试 这可能是V4正式亮相前的终极灰度版[1] - 新版本模型上下文长度从128K扩展至1M 接近提升10倍 知识库更新至2025年5月[1] - 新版本在复杂任务处理能力上已对齐Gemini 3 Pro及K2.5等主流闭源模型[2] - 内部初步测试显示 V4在编程任务中的表现已超越Anthropic Claude及OpenAI GPT系列同代模型[2] V4模型核心技术架构创新 - V4预计将引入mHC与Engram两项创新技术 从算法与工程层面突破算力芯片与内存瓶颈[2] - mHC全称为“流形约束超连接” 旨在解决Transformer模型在层数极深时信息流动的瓶颈和训练不稳定的问题[3][4] - Engram是一个“条件记忆”模块 设计理念是将“记忆”与“计算”解耦 静态知识被专门存储在可置于廉价DRAM的稀疏内存表中[6] - mHC技术通过改善训练稳定性和收敛效率 对冲国产芯片在互联带宽与计算密度上的代际差距[8] - Engram架构致力于重构内存调度机制 在HBM供应受限的背景下 以更高效的存取策略突破显存容量与带宽制约[8] V4模型对行业成本与竞争格局的影响 - 此次发布的关键意义在于进一步压缩训练与推理成本 为全球大语言模型及AI应用企业缓解资本开支压力提供可行路径[2] - 成本端的优化将有效激发下游应用需求 进而催生新一轮AI基础设施建设周期[8] - 在2024年底 DeepSeek的两个模型曾占据OpenRouter上开源模型Token使用量的一半以上[9] - 到2025年下半年 随着更多玩家加入 其市场份额已显著下降 市场从“一家独大”走向了“群雄割据”[11] 对下游应用与软件行业的潜在机遇 - 更强大、更高效的V4将催生更强大的AI智能体 AI智能体正从“对话工具”转型为能处理复杂任务的“AI助手”[12] - 能执行多任务的智能体需要更频繁地与底层大模型交互 将消耗更多Token 进而推高算力需求[12] - 模型效能的提升为领先的软件公司创造了价值 需要关注那些能率先利用新一代大模型能力打造出颠覆性AI原生应用或智能体的软件公司[12]
DeepSeek更新新模型 可一次性处理超长文本
新浪财经· 2026-02-11 19:13
产品更新与性能提升 - DeepSeek在网页端和APP端进行了版本更新,将支持的上下文长度提升至最高1M(百万)Token [1] - 此次更新相比去年8月发布的DeepSeekV3.1版本支持的128K上下文长度,实现了大幅跃升 [1] - 实测表明,模型可一次性处理超长文本,例如能成功识别并处理超过24万个token的《简爱》小说文档内容 [1][2] 未来产品路线图 - 此次更新被认为是针对V3系列模型的一次小幅更新 [1][2] - DeepSeek的下一代旗舰模型预计将是一款万亿参数级别的基础模型,是公司未来的重点产品 [1][2] - 由于模型规模大幅跃升,训练速度明显放缓,导致该旗舰模型的发布进程有所延后 [1][2]
DeepSeek突然测试新模型,春节大招要来了?
凤凰网· 2026-02-11 18:52
核心产品更新 - 公司对核心大模型进行了关键更新,并已开启网页及App端的灰度测试 [2] - 模型的核心上下文窗口从原有的128K大幅提升至1M(百万Token)级别 [2] - 模型的知识库截止时间已更新至2025年5月,在非联网状态下可准确输出2025年4月的新闻事件 [2] - 此次升级未包含多模态视觉理解能力,模型仍聚焦于纯文本与语音交互路径 [2][5] 性能与能力对标 - 1M上下文窗口使模型能在单次处理中完整吞吐《三体》三部曲体量的长文本 [2] - 该长上下文能力直接对标GPT-5及Gemini 3 Pro等海外旗舰产品 [2] - 新模型的语言风格被评价为“热情而细腻”,前端响应质感被认为“可媲美Claude 3.5 Sonnet” [5] 公司战略与研发动向 - 公司在保持极致推理性能的同时,对C端交互体验进行了重点优化 [5] - 公司近期进行了大规模招聘,放出了多个技术核心岗位,包括负责LLM预训练、对齐、代码数学、骨干网络及多模态等前沿探索方向的深度学习研究员 [5] - 招聘岗位还包括深度学习研发工程师、大模型全栈工程师、全栈开发工程师及核心系统研发工程师等,校招、社招、实习均开放 [5] - 此次灰度发布的版本尚未被官方正式命名,业内猜测其可能对应网传的“DeepSeek V4”或强化版V3.2系列 [5]
DeepSeek突然测试新模型,上下文已到百万级
凤凰网· 2026-02-11 18:37
核心产品更新 - 公司对DeepSeek大模型开启灰度测试,核心上下文窗口从原有的128K大幅提升至1M(百万Token)级别 [1] - 模型知识库截止时间已更新至2025年5月,在非联网状态下能准确输出2025年4月的新闻事件 [1] - 1M上下文窗口使模型能在单次处理中完整吞吐《三体》三部曲体量的长文本,能力直接对标GPT-5及Gemini 3 Pro等海外旗舰产品 [1] - 本次升级未包含多模态视觉理解能力,模型仍聚焦于纯文本与语音交互路径 [1] 用户体验与性能 - 新模型的语言风格被评价为明显趋向“热情而细腻” [1] - 模型前端响应质感被早期体验者评价为“可媲美Claude 3.5 Sonnet” [1] - 此次升级被视为公司在保持极致推理性能的同时,对C端交互体验的一次精准补课 [1] 公司发展动态 - 公司近期曾大量招聘,放出了多个技术核心岗位,包括深度学习研究员、深度学习研发工程师、大模型全栈工程师、全栈开发工程师、核心系统研发工程师等 [2] - 招聘岗位涉及LLM的多个前沿探索方向,如预训练、对齐、代码/数学、骨干网络、多模态等 [2] - 招聘范围覆盖校招、社招、实习,另有产品、设计、数据等岗位开放 [2] 行业对标与版本猜测 - 此次灰度发布的版本能力直接对标海外旗舰产品如GPT-5及Gemini 3 Pro的长上下文能力 [1] - 业内普遍猜测,该灰度测试版本可能对应此前网传的“DeepSeek V4”或强化版V3.2系列 [2]
华为云“码道”代码智能体开启公测,支持 GLM-4.7 和 DeepSeek-V3.2
新浪财经· 2026-02-11 18:32
产品发布与定位 - 华为云于2024年1月正式发布名为“码道”(CodeArts)的代码智能体产品 [1][8] - 该产品被定位为深度融合AI原生能力的智能编码产品,现已开启万人公测 [1][8] 核心功能与特性 - 产品集成了集成开发环境(IDE)、自主开发模式、代码库索引三大核心能力 [1][3][8][11] - 支持项目级代码生成、代码续写、研发知识问答、单元测试用例生成等核心功能 [2][9] - 用户输入需求后,AI能直接写出代码,旨在高效提升开发者研发效率 [3][11] 技术集成与兼容性 - 产品接入了GLM-4.7和DeepSeek-V3.2两种大模型 [1][8] - 支持JetBrains系列和Visual Studio Code两大主流IDE [1][8] 商业模式与版权 - 目前“码道”个人版已面向开发者免费开放,企业版将在后续公布 [1][8] - 公司明确表示,代码智能体输出的代码版权归属用户,产品本质是辅助工具,不具备创作自主性 [5][13]
字节要复现又一个DeepSeek时刻了?
凤凰网· 2026-02-11 18:25
文章核心观点 - 字节跳动发布新一代视频生成模型Seedance 2.0,其技术完成度与可控性引发行业震动,标志着AI视频生成从“尝鲜”迈向“工业化”,可能引发影视行业价值重估与内容生产成本结构剧变 [2][6][11] - 该模型展现出“地表最强”的生成能力,特别是在多模态理解、多镜头连贯生成与场景逻辑一致性方面取得核心跃迁,已作为实战工具被数万创作者测试,与仍处实验室阶段的Sora形成对比 [6][7][10][11] - 技术的突破迅速转化为资本市场狂热,推动A股影视传媒及“字节概念股”大涨,逻辑在于预期视频制作成本将趋近算力边际成本,为拥有IP和渠道的公司带来降本增效红利 [12] - 模型强大的低门槛高拟真能力也引发了关于虚假内容与信任危机的担忧,促使公司紧急限制真人内容生成功能,凸显了技术能力与社会责任之间的悖论 [14] 技术突破与产品表现 - **核心能力跃迁**:Seedance 2.0从仅接收文本进化为能同时理解图像、视频、音频和文本的“全能执行导演”,核心跃迁在于“可控” [7] - **多镜头连贯生成**:具备“多镜头连贯生成”能力,可一次性创作包含流畅转场和景别切换的“故事段落”,而非孤立碎片 [7] - **场景逻辑理解**:根据一张建筑正面图片,能自动生成流畅转向建筑背面且与现实几乎一致的镜头,显示出对场景的深度理解 [10] - **生成质量评价**:在人物一致性、动作设计、镜头调度、画质、运镜、剪辑衔接和音画同步方面进步明显,被评价为“当前地表最强的视频生成模型,没有之一” [6][7][10] - **现有缺陷**:文字处理不可靠,字幕及画面中的字经常出错;细节不可控,规避bug需反复尝试(“抽卡”) [6] 行业影响与市场反应 - **对影视行业的冲击**:能预见制作层面预算将被削减,如《流浪地球3》这类数亿成本的作品需进行价值重估 [2] - **改变生产逻辑**:工具能在几分钟内完成过去专业团队数天才能完成的特效镜头,视频制作成本可能趋近于算力的边际成本,引发内容领域“通货膨胀” [11][12] - **资本市场反应**:2026年2月10日,A股影视传媒板块掀起涨停潮,中文在线、光线传媒、捷成股份直接封死20cm涨停,引力传媒、掌阅科技等“字节概念股”接连二连板 [12] - **行业阶段定义**:标志着“AIGC的童年时代,结束了”,AI视频生成从“玩具”质变为“工具”,迈向了“工业化”门槛 [10][11] 发布与测试情况 - **发布方式**:2026年2月7日晚,字节跳动通过飞书文档小范围宣布“视频 Seedance 2.0 正式上线”,未正式官宣 [3] - **内测范围**:在即梦、豆包等产品中开启小范围内测,已被数万创作者疯狂测试 [2][5] - **用户生成内容**:短短三天内,社交媒体出现大量如“普通人演大片”、“2岁宝宝跳街舞”、“猫咪和周星驰同框”等用户生成作品 [5] - **使用门槛**:目前需开通即梦正式会员才能有限次使用 [10] 引发的挑战与监管应对 - **真实性风险**:模型能低成本生成高拟真视频,引发对虚假内容泛滥和现实虚拟边界模糊的担忧 [14] - **平台紧急限制**:因获得远超预期的关注,为保障创作环境,字节跳动于2月9日晚进行紧急优化,Web端和小云雀平台已暂不支持输入真人图片或视频作为主体参考 [14] - **行业规范预期**:有从业者预测,未来行业规定可能会要求对AI生成作品进行标注,以防滥用 [6]