Workflow
MODEL1
icon
搜索文档
DeepSeek不发V4,六小龙不敢过年
36氪· 2026-02-12 08:26
文章核心观点 - DeepSeek在2026年初频繁发布技术更新,其新一代模型轮廓已初步成型,箭在弦上 [1] - 公司坚持“少花钱办大事”的极致性价比路线,通过架构创新(如Engram)而非堆砌算力来提升模型能效 [3][4] - 公司面临来自谷歌Gemini 3和OpenAI GPT-5等闭源巨头的巨大技术竞争压力,必须加快迭代以维持开源生态的护城河 [7][8][10] - 公司强大的开源生态和低成本策略对国内AI“六小龙”等同行造成巨大压力,并改变了行业竞争格局 [11][12] - 互联网大厂(字节、阿里、腾讯)正通过巨额投入和流量逻辑冲击AI入口,进一步挤压了“六小龙”的生存空间 [13] - DeepSeek即将发布的新模型(V4或R2)不仅关乎技术自证,更是一场开源生态主导权的保卫战,其影响充满不确定性 [13][14] DeepSeek的技术策略与进展 - 2026年1月中旬开源了名为Engram的“条件记忆”架构,旨在将模型记忆与计算分离,以降低错误并节省算力 [1][3] - 1月27日发布并开源了新一代文档理解模型DeepSeek-OCR 2 [1] - 技术社区对传闻中的“MODEL1”有两种猜想:追求极致效率的轻量级模型,或专门处理超长序列的“长序列专家” [3] - 公司独创了针对英伟达Hopper架构GPU深度优化的软件工具FlashMLA,是实现低成本、高性能的关键技术之一 [6] - 在没有全新模型时,公司通过即时推出V3.1、V3.2等改款产品并分享MoE架构等技术细节来保持市场存在感 [8] DeepSeek的生态与市场地位 - 公司的核心命门在于维护开源生态的护城河,而非C端用户数量 [8] - C端市场对公司而言更像是“技术展示厅”和“RLHF数据采集器” [8] - 其开源模型DeepSeek-V3和R1在HuggingFace累计下载量超千万次,迅速积累了庞大的开发者生态 [4] - 根据OpenRouter统计,DeepSeek-V3和R1的Token吞吐量一度占据所有开源Token的一半以上 [8] - 全球AI极客、实验室和创业公司在进行模型“蒸馏”、“微调”时,常将DeepSeek列为第一梯队选择,形成了隐形的技术定价权 [8][9] - 然而,闭源模型(如GPT、Gemini)仍占据市场主流,比例约为70% [9] 面临的竞争压力 - 谷歌Gemini 3 Pro在数学竞赛MathArena中得分高达23.4%,而包括GPT-5.1在内的其他大模型仅在1%上下挣扎 [7] - Gemini 3在编程能力基准测试Live Code Bench的Elo得分超过2400分,在工具调用和终端操作测试中名列第一 [7] - Gemini能通过Agent模式调动用户谷歌设备中的数据,形成生态协同 [7] - OpenAI与谷歌的激烈竞争直接拉升了整个闭源生态的技术上限,对DeepSeek构成威胁 [8] - 公司必须保持迭代速度,防止其开源模型能力与GPT-5、Gemini 3等最新闭源模型拉开代差,导致开发者流失 [7] 对国内AI行业的影响 - DeepSeek在2025年初月活登顶国产AIGC App,改变了国产大模型的叙事逻辑,加速了AI在大众生活中的渗透 [11] - 其崛起让腾讯、阿里、字节等传统互联网大厂意识到“AI即入口” [11] - 公司极致性价比的开源策略给国内同行带来了“窒息感” [11] - 其新模型迟迟未发,意外地为以智谱、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物为代表的“六小龙”提供了约半年的喘息与融资窗口 [2][12] - 在此期间,月之暗面于2025年12月完成5亿美元C轮融资;智谱与MiniMax在2026年1月登陆港交所;阶跃星辰近期宣布完成50亿元B+轮融资 [12] - 互联网大厂在2026年春节发起流量大战:字节将火山引擎送上春晚;阿里拿下多个卫视春晚独家总冠;腾讯拿出10亿元为元宝App铺路 [13] - 大厂的流量逻辑与DeepSeek可能发布的新模型产生叠加效应,进一步挤压“六小龙”空间,迫使其转向垂直赛道深耕 [13]
太空基建不断加速,持续看好商业航天和卫星产业链
国投证券· 2026-01-26 16:53
报告行业投资评级 - 行业投资评级为“领先大市-A”,并维持该评级 [4] 报告核心观点 - 太空基建不断加速,持续看好商业航天和卫星产业链 [1] - 航天与卫星技术的重要性不断凸显,随着太空基础设施建设的加速,相关产业链将长期受益 [2] - 太空基建是全球共振的产业趋势,全球主要大国和区域对该新兴领域的投入都在持续加码 [1][11] 行业动态与事件总结 - 2026年1月23日,2026国际商业航天展在北京亦庄举办,众多前沿产品首次亮相 [1][11] - 蓝箭航天展出朱雀二号改进型和朱雀三号可重复使用火箭模型 [1][11] - 星河动力展示了“智神星”中型液体火箭和“谷神星”系列固体火箭 [1][11] - 银河航天发布了采用柔性太阳翼的平板堆叠卫星“灵犀03”和可直连手机的“翼阵合一”卫星模型 [1][11] - 中科星图展示其数字地球平台等航天应用方案 [1][11] - 1月23日,北京市经信局等部门印发《北京市促进商业卫星遥感数据资源开发利用若干措施(2026-2030年)》,支持多源卫星大数据平台建设 [1][11] - 1月21日,蓝色起源宣布将部署由5,408颗低轨卫星组成的“TeraWave”卫星通信网络,定位服务数据中心、政府和大型企业用户 [1][11] - 1月19日,长征十二号火箭成功将卫星互联网低轨19组卫星送入预定轨道 [1][11] - 1月16日,星河动力通过谷神星一号S火箭(海上发射)成功将4颗物联网卫星送入近地轨道,使天启星座卫星总数达41颗 [1][11] - 1月12日,欧洲卫星运营商Eutelsat宣布向空客公司追加订购340颗OneWeb低轨宽带卫星,加上2024年底订购的100颗,新增总计达440颗,计划自2026年底开始交付 [1][11] - 上个月底,中国在国际电信联盟(ITU)集中申请了20.3万颗低中轨卫星的频率和轨道资源,涵盖14个卫星星座 [1][11] - 12月下旬,印度ISRO的LVM3运载火箭成功将美国AST SpaceMobile公司的BlueBird-6送入近地轨道,该卫星将展开约223平方米的天线阵列 [1][11] 投资建议与关注方向 - 建议关注太空基建中的增量方向:太空算力、3D打印、终端直连、星间互联 [2][12] - 建议关注低轨卫星中具备价值量提升的环节:阵列天线、T/R组件、基带载荷等 [2][12] - 建议关注测试和仿真厂商:信道仿真、星座模拟、瞬态仿真、热真空试验、射频与微波器件测试等 [2][12] - 建议关注涉足卫星和太空资产的测控与管理、安全、应用等厂商 [2][12] - 报告关注的具体公司包括:【星图测控】、【坤恒顺维】、【金橙子】、【中科星图】、【霍莱沃】、【索辰科技】、【信科移动】、【盛邦安全】等 [2][12] 市场行情回顾 - 本周(报告期)上证综指上涨0.84%,深证成指上涨1.11%,创业板指下跌0.34%,沪深300下跌0.62% [13] - 本周计算机板块相对上证综指跑输1.3%,板块表现相对较弱 [13] - 本周计算机(中信)指数下跌0.46%,年初至今上涨12.57% [14] - 本周卫星互联网指数上涨2.90%,年初至今上涨13.67% [14] - 本周计算机行业指数在中信30个行业指数中排名第26,在TMT四大行业(电子、通信、计算机、传媒)中排名第3 [16] - 本周计算机个股周涨幅前十中,ST立方上涨95.52%,海联讯上涨28.76%,星环科技-U上涨26.08% [19] - 本周计算机个股周跌幅前十中,品高股份下跌16.19%,石基信息下跌11.92%,锐捷网络下跌11.67% [19] 行业其他重要新闻 - 1月16日,量子计算公司SEEQC宣布拟通过合并上市,估值约为10亿美元 [20] - 1月20日,智谱AI开源轻量模型GLM-4.7-Flash并开放免费API [20] - 1月20日,MiniMax发布Agent 2.0智能体平台,定义为AI原生工作新范式 [21] - DeepSeek新模型MODEL1架构曝光,预计2026年2月中旬发布 [22] - “货币桥”业务加速落地,自2024年6月试运营至2025年底,累计处理跨境支付业务4868笔,交易金额折合人民币约4778亿元,其中数字人民币交易额占比约96% [22][23] - 1月21日,工信部透露中国6G研发迈入新阶段,已完成第一阶段技术试验,储备超300项关键技术,并已启动第二阶段试验,2030年有望实现商用 [23] - 英伟达正以NVQLink和CUDA-Q定义量子加速超算,致力于成为整合量子硬件与经典算力的核心平台 [24]
人工智能周报(26年第4周):MiniMax Agent 2.0正式发布,百度文心5.0上线-20260126
国信证券· 2026-01-26 11:18
报告行业投资评级 - 行业评级:优于大市 [1][4] 报告核心观点 - 伴随大模型在多模态、长文本、推理能力等方面的成熟,2026年有望迎来更多成熟Agent产品的涌现,推理侧需求的增加将带动上游云计算厂商的收入持续增长 [2][25] - 国内互联网巨头在AI资本支出方面的投入落后海外约一年,伴随后续大模型能力逐步提升和建设供给的释放,AI对于巨头主业的赋能将持续显现 [2][25] - 2026年第三季度预计为互联网巨头外卖大战的投入峰值,第四季度预计将环比看到阿里巴巴、美团和京东三家外卖亏损有所收窄 [2][25] - 建议聚焦AI主线选股,推荐阿里巴巴、腾讯控股 [2][25] 人工智能动态:公司动态 - 字节跳动旗下AI Agent平台“扣子”2.0版本正式上线,核心升级在于引入Agent Skills和Agent Plan概念,新增技能商店,允许用户设立长期目标由AI自主执行 [17] - 安克创新与飞书联合发布“AI录音豆”硬件产品,直径23.2毫米,重量10克,支持8小时连续录音,配合充电舱综合录音时间可达32小时 [17] - MiniMax的AI原生工作台Agent 2.0上线,以Desktop App和Expert Agents为核心组件,分别注重执行力和对业务场景的理解 [19] - 美国AI初创公司Humans&获得4.8亿美元种子轮融资,估值达44.8亿美元,参与方包括英伟达、亚马逊创始人贝索斯、谷歌风投等 [19] - 特斯拉人形机器人Optimus计划于2027年底前向公众出售,量产版定价将低至2万美元(约合14.5万元人民币) [20] - 谷歌Gemini与美国教育机构The Princeton Review合作,上线免费SAT完整模拟考试功能 [20] - xAI在其多模态创作工具Grok Imagine中推出10秒视频生成功能,将之前的5秒生成时长翻倍 [21] 人工智能动态:底层技术 - 智谱AI发布并开源轻量级大语言模型GLM-4.7-Flash,为总参数30B、激活参数3B的混合专家架构模型 [22] - DeepSeek新模型“MODEL1”曝光,推测可能是一个高效推理模型或针对长序列优化的专家模型 [22] - 阿里通义千问开源Qwen3-TTS系列语音生成模型,包含1.7B和0.6B两种尺寸,支持音色克隆与创造,覆盖10种主流语言 [23] - 百度发布文心大模型5.0正式版,参数规模达2.4万亿,采用原生全模态统一建模技术,在40余项权威基准测评中,其语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型 [23] - 谷歌DeepMind发布D4RT四维视觉AI模型,采用统一的“时空查询”架构,相比现有技术处理速度提升了18至300倍 [24] AI相关网站流量数据 - ChatGPT周平均访问量为373.00百万,环比增长1.16% [10] - Bing周平均访问量为787.60百万,环比增长1.25% [10] - Gemini周平均访问量为477.90百万,环比增长4.44% [10] - 通义千问周平均访问量为8.16百万,环比增长11.75% [10] - 文心一言周平均访问量为4.61百万,环比下降2.10% [10] 重点公司盈利预测及投资评级 - 腾讯控股:投资评级“优于大市”,昨收盘价595.0港元,总市值5,428,115百万港元,2025年预测经调整EPS为27.60,预测PE为20.3倍 [3] - 阿里巴巴-SW:投资评级“优于大市”,昨收盘价168.5港元,总市值3,218,226百万港元,2025年预测经调整EPS为6.66,预测PE为23.8倍 [3] - 美团-W:投资评级“优于大市”,昨收盘价97.6港元,总市值596,193百万港元,2025年预测经调整EPS为-1.26,2026年预测经调整EPS为5.20 [3] - 百度集团-SW:投资评级“优于大市”,昨收盘价160.5港元,总市值441,402百万港元,2025年预测经调整EPS为7.64,预测PE为19.7倍 [3] - 快手-W:投资评级“优于大市”,昨收盘价81.3港元,总市值354,532百万港元,2025年预测经调整EPS为4.68,预测PE为16.3倍 [3]
人工智能周报(26 年第4 周):MiniMax Agent 2.0 正式发布,百度文心 5.0 上线
国信证券· 2026-01-26 10:45
行业投资评级 - 互联网行业评级为“优于大市” [4] 核心观点 - 伴随大模型在多模态、长文本、推理能力等方面成熟,2026年有望迎来更多成熟Agent产品涌现,推理侧需求增加将带动上游云计算厂商收入持续增长 [2][25] - 国内互联网巨头在AI资本支出方面的投入落后海外约一年,伴随后续大模型能力逐步提升和建设供给释放,AI对于巨头主业的赋能将持续显现 [2][25] - 2026年第三季度预计为互联网巨头外卖大战的投入峰值,第四季度预计将环比看到阿里巴巴、美团和京东三家外卖亏损有所收窄 [2][25] - 建议聚焦AI主线选股,推荐阿里巴巴、腾讯控股 [2][25] 人工智能动态:公司动态 - 字节跳动旗下AI Agent平台“扣子”发布2.0版本,核心升级在于引入Agent Skills和Agent Plan概念,新增技能商店,允许用户设立长期目标由AI自主执行 [17] - 安克创新与飞书联合发布“AI录音豆”硬件产品,直径23.2毫米,重量10克,支持8小时连续录音,配合充电舱综合录音时间可达32小时 [17][18] - MiniMax正式推出AI原生工作台Agent 2.0,以Desktop App和Expert Agents为核心组件,分别注重执行力和对业务场景的理解 [19] - 美国AI初创公司Humans&获得4.8亿美元种子轮融资,估值达44.8亿美元,参与方包括英伟达、亚马逊创始人贝索斯、谷歌风投等 [19] - 特斯拉人形机器人Optimus计划于2027年底前向公众出售,量产版定价预计低至2万美元,目前已在工厂承担基础任务 [20] - 谷歌Gemini与美国教育机构The Princeton Review合作,上线免费SAT完整模拟考试功能 [20] - xAI在其多模态创作工具Grok Imagine中推出10秒视频生成功能,较之前的5秒时长翻倍 [21] 人工智能动态:底层技术 - 智谱AI发布并开源轻量级大语言模型GLM-4.7-Flash,为总参数300亿、激活参数30亿的混合专家架构模型,定位“本地编程与智能化助手” [22] - DeepSeek新模型“MODEL1”曝光,推测可能是一个高效推理模型或针对长序列优化的专家模型 [22] - 阿里通义千问开源Qwen3-TTS系列语音生成模型,包含17亿和6亿两种参数规模,支持多语言及音色克隆 [23] - 百度推出文心大模型5.0正式版,参数规模达2.4万亿,采用原生全模态统一建模技术,在40余项权威基准测评中其语言与多模态理解能力位居全球第一梯队 [23] - 谷歌DeepMind发布D4RT四维视觉AI模型,采用统一的“时空查询”架构,处理速度相比现有技术提升18至300倍 [24] AI相关网站流量数据 - ChatGPT周平均访问量为373.00百万,环比增长1.16% [10] - Bing周平均访问量为787.60百万,环比增长1.25% [10] - Gemini周平均访问量为477.90百万,环比增长4.44% [10] - 通义千问周平均访问量为8.16百万,环比增长11.75% [10] - 文心一言周平均访问量为26.33百万,环比增长4.19% [10] 重点公司盈利预测及投资评级 - 腾讯控股:投资评级“优于大市”,昨收盘价595.0港元,总市值5,428,115百万港元,2025年预测调整后每股收益27.60港元,预测市盈率20.3倍 [3] - 阿里巴巴-SW:投资评级“优于大市”,昨收盘价168.5港元,总市值3,218,226百万港元,2025年预测调整后每股收益6.66港元,预测市盈率23.8倍 [3] - 美团-W:投资评级“优于大市”,昨收盘价97.6港元,总市值596,193百万港元,2025年预测调整后每股收益-1.26港元,2026年预测调整后每股收益5.20港元 [3] - 百度集团-SW:投资评级“优于大市”,昨收盘价160.5港元,总市值441,402百万港元,2025年预测调整后每股收益7.64港元,预测市盈率19.7倍 [3] - 快手-W:投资评级“优于大市”,昨收盘价81.3港元,总市值354,532百万港元,2025年预测调整后每股收益4.68港元,预测市盈率16.3倍 [3]
DeepSeek新模型曝光?
新华网财经· 2026-01-22 13:00
开源代码与模型动态 - DeepSeek在GitHub上更新了Flash MLA代码库,涉及的114个文件中,有数十处提到了此前未公开的"MODEL1"大模型标识符 [2] - 在部分文件中,"MODEL1"与已知的现有模型"V32"(即DeepSeek-V3.2)并列提及,行业分析认为"MODEL1"可能代表一个不同于现有架构的新模型,或许是DeepSeek还未对外发布的下一代模型(R2或者V4)[4] - 2025年2月,DeepSeek启动"开源周",计划以每日解锁的形式逐步公开5个代码库,Flash MLA为首个开源项目 [3] 技术进展与模型发布计划 - 公开资料显示,Flash MLA通过优化Hopper GPU的内存访问和计算流程,显著提高可变长度序列的处理效率,其核心设计包括动态内存分配机制和并行解码策略,可减少冗余计算并提升吞吐量,尤其适用于大语言模型的推理任务 [3] - 此前有市场消息称,DeepSeek计划在2025年2月春节前后发布新一代AI模型DeepSeek V4,但发布时间可能会视实际情况而变化 [4] - V4模型是DeepSeek 2024年12月发布的V3模型的迭代版,具备强大的编程能力,公司内部的初步测试显示,V4在编程能力上超过了目前市场上的其他顶级模型,如Anthropic的Claude和OpenAI的GPT系列 [4] 近期研究成果 - 2026年1月以来,DeepSeek动作不断,已陆续发布了两篇技术论文,分别介绍了名为"优化残差连接(mHC)"的新训练方法,以及一种受生物学启发的"AI记忆模块(Engram)" [4] - 2026年1月12日,DeepSeek在GitHub上发表新论文,文章由DeepSeek与北京大学合作完成,作者中有梁文锋署名,文章提出了条件记忆(conditional memory),并给出了实现方案Engram模块,公司称该模块不仅有助于知识检索,同时在一般推理和代码/数学领域方面取得了更大的进步 [5] 公司背景与资金支持 - 在业内看来,梁文锋旗下私募幻方量化较高的收益率,为DeepSeek的研发提供了更多支持 [5] - 公开资料显示,幻方量化2025年的收益均值达56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以73.51%收益均值登顶的灵均投资,目前,幻方量化管理规模已超700亿元 [5]
DeepSeek新模型将至?创业板人工智能ETF南方(159382)上涨2.21%,国产大模型迭代加速,2026年AI成长确定性增强
新浪财经· 2026-01-22 10:41
创业板人工智能ETF南方市场表现 - 截至2026年1月22日10:13,创业板人工智能ETF南方(159382)上涨2.21%,成交额达3496.02万元 [1] - 其跟踪的创业板人工智能指数成分股表现强劲,其中深信服上涨10.83%,万兴科技上涨4.84%,润泽科技上涨4.72%,天孚通信、蓝色光标等个股跟涨 [1] 人工智能产业发展现状与政策支持 - 根据国新办新闻发布会信息,人工智能已渗透领航级智能工厂70%以上的业务场景,沉淀了超6000个垂直领域模型 [1] - 人工智能带动了1700多项关键智能制造装备和工业软件规模化应用,推动智能制造从自动化向自主化改进 [1] - 2025年我国人工智能企业数量超过6000家,核心产业规模预计突破1.2万亿元 [1] - 人工智能应用已覆盖钢铁、有色、电力、通信等重点行业,并深入到产品研发、质量检测、客户服务等重点环节 [1] 大模型技术迭代与行业竞争 - 在DeepSeek-R1发布一周年之际,其新模型“MODEL1”的项目名在开源社区出现,DeepSeek官方在GitHub更新了提及该标识符的代码 [2] - 据国联民生证券分析,2026年全球大模型仍处于加速迭代周期,中国AI发展具备强劲竞争力 [2] - 国内方面,DeepSeek有望在春节期间发布新一代模型,同时头部科技企业资本支出持续提升,为模型能力升级提供算力支撑 [2] - 海外方面,谷歌、Meta、xAI等公司预计在上半年密集推出新一代大模型及多模态视频模型,新一轮技术竞赛将进一步推升AI整体能力边界 [2] 创业板人工智能指数与ETF构成 - 创业板人工智能ETF南方(159382)紧密跟踪创业板人工智能指数,该指数反映创业板人工智能主题相关上市公司的股价变化情况 [2] - 指数前十大权重股包括中际旭创、新易盛、天孚通信、蓝色光标、协创数据、同花顺、润和软件、北京君正、润泽科技、昆仑万维 [2] - 该ETF提供场外联接份额,A类代码为024725,C类代码为024726 [3]
DeepSeek新模型曝光;AI产业链业绩兑现丨新鲜早科技
21世纪经济报道· 2026-01-22 10:30
巨头动态与行业政策 - DeepSeek在GitHub仓库中曝光了未公开的高效推理模型架构"MODEL1",该架构在代码中被提及31次,是DeepSeek FlashMLA支持的两个主要模型架构之一,推测其内存占用比V3.2更低,或针对16K+长序列任务进行优化 [2] - 欧盟委员会公布《欧盟网络安全法》修订草案,计划在5G通信、半导体、电力系统等18个关键领域逐步淘汰所谓"高风险供应商"的组件和设备,该政策被普遍解读为针对中国高科技企业如华为 [2] - 抖音电商辟谣推出名为"抖省省"的电商产品,据知情人士透露,该新产品实为抖音本地生活服务团购到店业务的阶段性探索 [3] - 智谱AI因GLM-4.7上线后用户数高速增长导致算力资源紧张,宣布暂时限量发售GLM Coding Plan,限售后每日可销售量降至当前的20% [3] - 拼多多平台运营主体上海寻梦信息技术有限公司因未按要求报送涉税信息,被税务机关责令改正后未在规定期限内完成,被处以10万元人民币罚款 [4] - 小度智能音箱就部分设备音色调整问题发布致歉,表示相关设备已完成更新,用户可通过APP或语音指令切换回经典音色 [5][6] 公司订单与产能进展 - 腾景科技收到某客户C子公司总金额1280万美元(约8915万元人民币)的采购订单,产品为用于AI算力中心及光互联网络建设的关键元器件二维准直器阵列 [7] - 中超控股孙公司江苏精铸近期接到某火箭单位40套推力室顶盖毛坯订单,该公司已为航天科工火箭等单位提供航天火箭发动机高温合金精密铸件 [8] - 上海意优智控科技有限公司首条机器人关节自动化生产线在上海张江机器人谷投产,初步设计年产能10万台关节,后续可升级至15万台,该公司在江苏无锡和上海张江的总年产能为30万台关节 [10] 前沿技术研发与突破 - 我国6G研发已完成第一阶段技术试验,形成超过300项关键技术储备,并已启动第二阶段技术试验,同时我国5G标准必要专利声明量全球占比达42% [9] - 长电科技宣布在光电合封技术领域取得重要进展,基于XDFOI平台的硅光引擎产品已完成客户样品交付并通过测试 [11] - 上海贝岭开始批量交付车规级发动机点火IGBT专用栅极驱动芯片SAQ3100,该芯片集成了线圈电流精准调控、火花事件抑制等核心功能 [12] - 摩尔线程与硅基流动联合宣布,在MTT S5000上利用FP8低精度推理技术完成对DeepSeek V3 671B满血版大模型的深度适配,实测单卡预填充吞吐量超过4000 tokens/s,解码吞吐量超过1000 tokens/s [13][14] 资本市场与融资活动 - 先导智能港股IPO获中国证监会备案,公司拟发行不超过200,123,000股境外上市普通股并在香港联交所上市 [15] - 半导体光芯片企业瑞识科技完成数亿元人民币C轮融资,投资方包括光子强链基金、合肥产投、深创投等新老股东,该公司已累计出货VCSEL芯片超2亿颗,6英寸VCSEL晶圆量产突破1万片 [16] 企业财务业绩预告 - 摩尔线程预计2025年归属于母公司所有者的净亏损为9.50亿元至10.60亿元,亏损同比收窄,公司旗舰产品MTT S5000已实现规模量产并支持大规模集群建设,但仍处于持续研发投入期 [17] - 德明利预计2025年度归属于上市公司股东的净利润为6.50亿元至8.00亿元,比上年同期增长85.42%至128.21%,业绩增长主要受益于AI需求驱动下存储行业景气度回暖及产品毛利率提升 [18] - 天孚通信预计2025年度归属于上市公司股东的净利润为18.81亿元至21.50亿元,比上年同期增长40.00%至60.00%,增长主要得益于人工智能与数据中心建设带动高速光器件需求增长,但汇兑损失导致财务费用上升对业绩产生一定负面影响 [19]
欧盟拟推「高风险供应商」禁令,华为回应;DeepSeek新模型「MODEL1」曝光;某汽车品牌LOGO撞脸小米?网友:百分百在蹭小米丨雷峰早报
雷峰网· 2026-01-22 08:31
欧盟对华科技政策收紧 - 欧盟委员会公布《欧盟网络安全法》修订草案,计划在5G通信、半导体、电力系统、自动驾驶、医疗设备等18个关键领域逐步淘汰所谓“高风险供应商”的组件和设备,政策被视为针对中国高科技企业[4] - 该草案将2020年仅具建议性质的5G“安全工具箱”升级为具有强制约束力的法律,标志着欧盟对华技术政策正从“风险管控”转向“系统性排除”[5] - 华为回应指出,基于供应商来源国而非事实证据和技术标准进行限制,违背了欧盟公平、非歧视和比例原则等基本法律原则,也不符合WTO规则[4][5] 中国AI模型与算力发展 - DeepSeek在官方GitHub仓库更新代码,曝光名为“MODEL1”的新模型架构,该架构与DeepSeek-V3.2并驾齐驱,推测可能是一个高效推理模型或针对16K+长序列优化的专家模型[10] - MODEL1的硬件实现跨越多个GPU架构,在英伟达H100/H200和最新的B200上均有专门优化,猜测DeepSeek为适配新一代GPU专门优化了MODEL1架构[11] - 智谱因GLM-4.7上线后用户数高速增长导致算力资源紧张,将暂时限量发售GLM Coding Plan,每日可销售量降为当前的20%[33] 中国科技公司人事与组织变动 - 爱奇艺首席财务官汪骏因个人原因辞职,转为公司顾问至2026年5月31日,现任财务高级副总裁曾颖出任代理首席财务官[16] - 小鹏汽车副总裁、互联网中心负责人魏斌目前处于休假状态,此前自动驾驶负责人李力耘也因身体原因暂离一线,由刘先明接任[19] - 原开放式耳机品牌Oladance创始人李浩乾或将离开字节跳动,其在2024年随团队以约5000万美元(约3.6亿元人民币)的价格被字节收购后加入[20] 中国消费科技与内容市场动态 - 新东方官方开设“北京新东方退休俱乐部”,针对50-75岁人群推出线下体验课,价格19.9元,课程包括自媒体、手工、烘焙等,并正在筹备英语课堂[7] - 手游《愤怒的小鸟:经典归来》宣布正式回归中国市场,将由金山世游独家发行并运营,该系列全球下载量已突破50亿次[14] - 百度旗下“小度”就“超能小度”升级后默认音色变化引发用户不适发布致歉信,并已完成优化,用户可自行切换回经典音色[31][32] 中国新能源汽车行业动态 - 前腾势汽车总经理赵长江已入职奇瑞,担任智界汽车执行董事及执行副总裁,其接手的首款车型智界V9(大型MPV)发布在即[25] - 智界V9采用增程混动系统,搭载1.5T发动机和前后双电机,WLTC纯电续航提供158公里、210/223公里三种版本[26] - 长安福特2025年在华零售销量仅9.94万辆,较2024年的24.7万辆大幅腰斩,并首次跌破10万辆年度红线[28] 中国科技企业战略与市场表现 - 追觅集团成为中央广播电视总台《2026年春节联欢晚会》智能科技生态战略合作伙伴,其CEO俞浩提出目标是将追觅生态做到百万亿美金量级[22] - 快手旗下视频生成大模型可灵AI月活跃用户数突破1200万,今年1月截至目前,其App端付费用户规模较去年12月增长约350%,日均收入水平较12月日均提升约30%[34] - 截至2025年底,中国5G用户规模突破12亿户,达到12.4亿户,占移动电话用户的65.9%,建成5G基站总数达483.8万座[34][35] 国际科技巨头竞争与战略 - 特斯拉首席执行官埃隆·马斯克透露将重启超级计算机项目Dojo3,其核心使命从自动驾驶模型训练转向进军“太空人工智能计算”[37] - 英伟达创始人黄仁勋谈及最后悔的事是在公司市值仅3亿美元时出售部分股票为父母购买奔驰汽车,当前英伟达总市值为4.33万亿美元[39] - 马斯克与OpenAI CEO山姆·奥特曼在社交平台就产品安全展开交锋,马斯克呼吁远离ChatGPT,奥特曼则抨击特斯拉Autopilot已有超过50人死于相关车祸[43][44] 全球智能手机市场格局 - 2025年第四季度,vivo在印度智能手机市场以出货790万部、占据23%的市场份额保持领先,断层领先其他厂商[39][40] - 同期印度智能手机总出货量为3450万部,同比下降7%,vivo和OPPO是唯一实现双位数同比增长的品牌[40] - 供应链信息显示苹果将于今年9月发布首款折叠屏手机“iPhone Fold”,采用内外双屏设计,美国市场起售价预计1800-2500美元(约1.3万-1.8万元人民币)[41][43] 国际AI行业研发与人事 - Meta首席技术官表示,公司新成立的超级智能实验室团队本月已在内部交付了首批关键人工智能模型,显示出很大前景[48] - xAI联合创始人杨格在被诊断出患有莱姆病后将从公司离职,转为非正式顾问,这是继去年至少两位联合创始人离开后又一高层变动[45] - 特斯拉宣布其免费FSD功能转移计划将于2026年3月31日正式终止,公司正全面转向订阅制以提高FSD功能的用户使用率,目前该功能渗透率约为12%[47][48]
DeepSeek新模型曝光?“MODEL1”现身开源社区
上海证券报· 2026-01-22 05:31
DeepSeek技术进展与开源动态 - 公司于2025年2月启动“开源周”,计划以每日解锁形式逐步公开5个代码库,首个开源项目为Flash MLA [4] - Flash MLA通过优化Hopper GPU的内存访问和计算流程,显著提高可变长度序列的处理效率,其核心设计包括动态内存分配机制和并行解码策略,可减少冗余计算并提升吞吐量,尤其适用于大语言模型的推理任务 [4] 疑似新一代模型“MODEL1”的线索 - 近日,DeepSeek官方在GitHub更新FlashMLA代码,涉及的114个文件中,有数十处提到了此前未公开的“MODEL1”大模型标识符 [3] - 在某些文件中,“MODEL1”与已知的现有模型“V32”(即DeepSeek-V3.2)并列提及,行业分析认为,“MODEL1”或许代表一个不同于现有架构的新模型,可能正是公司还未对外发布的下一代模型(R2或者V4) [4] - 此前有市场消息称,公司计划在2025年2月春节前后发布新一代AI模型DeepSeek V4,该模型是2024年12月发布的V3模型的迭代版,具备强大的编程能力 [4] 近期技术研究成果 - 2026年1月以来,公司已陆续发布两篇技术论文,分别介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI记忆模块(Engram)” [5] - 1月12日,公司与北京大学合作发表新论文,提出了条件记忆(conditional memory)及其实现方案Engram模块,该模块不仅有助于知识检索,同时在一般推理和代码/数学领域方面取得了更大的进步 [5] 公司研发的资金支持背景 - 公司创始人梁文锋旗下的私募幻方量化2025年的收益均值达56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以73.51%收益均值登顶的灵均投资 [5] - 目前,幻方量化管理规模已超700亿元,其较高的收益率为DeepSeek的研发提供了更多支持 [5] 模型性能表现 - 公司内部的初步测试显示,其新一代模型V4在编程能力上超过了目前市场上的其他顶级模型,如Anthropic的Claude和OpenAI的GPT系列 [4][5]
AI进化速递 | Meta 新AI团队已交付首批人工智能模型
第一财经· 2026-01-21 20:49
行业政策与宏观进展 - 人工智能技术已深度融入制造业,在领航级智能工厂中渗透超过70%的业务场景 [1] - 中国正积极推动具身智能产业化落地,例如北京人形机器人与晓悟智能达成战略合作 [3] - OpenAI推出面向各国的教育项目,旨在全球范围内推广人工智能技术 [7] 产品与技术突破 - 上海张江首条机器人关节自动化产线投产,将为人形机器人的大规模量产提供关键支持 [2] - DeepSeek新模型“MODEL1”相关信息被曝光,表明大模型领域持续有新产品迭代 [4] - Meta公司新组建的AI团队已成功交付首批人工智能模型 [6] 市场表现与商业合作 - 人工智能应用“可灵AI”月活跃用户突破1200万,其日均收入较去年12月提升约30% [5] - 英伟达向人工智能推理初创公司Baseten投资1.5亿美元,加码AI基础设施领域 [8] - ServiceNow与OpenAI达成为期三年的战略合作,将人工智能能力融入企业工作流管理 [9]