Workflow
DeepSeek App
icon
搜索文档
阿里除夕发布千问3.5,性能媲美Gemini 3,价更低
南方都市报· 2026-02-16 18:16
阿里千问Qwen3.5模型发布 - 阿里巴巴于2月16日除夕开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型[1] - Qwen3.5-Plus版本总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型,实现了“以小胜大”[1] - 该模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练[1] 模型性能与效率突破 - 部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍[1][3] - 在常用的32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,最大提升至19倍[3] - API价格极具竞争力,每百万token低至0.8元,仅为Gemini 3 Pro的1/18[1] 技术架构与训练创新 - 模型性能跃升源于对Transformer经典架构的重大创新突破,融入了获2025 NeurIPS最佳论文的自研门控技术[3] - 结合线性注意力机制与稀疏混合专家模型架构,实现了3970亿总参数仅激活170亿的极致效率[3] - 原生多模态训练在阿里云AI基础设施上完成,混合数据训练吞吐量几近100%持平纯文本基座模型训练,大幅降低训练门槛[4] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿token时,激活内存减少约50%,训练还能提速10%[4] 多模态与视觉能力 - 千问3.5在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能[3] - 以不到40%的参数量获得了超万亿参数Qwen3-Max基座模型的顶尖性能[1] Agent智能体应用突破 - 基于顶级视觉能力,千问3.5实现了从Agent框架到Agent应用的新突破,可自主操作手机与电脑高效完成日常任务[4] - 在移动端支持更多主流APP与指令,在PC端可处理复杂的多步骤操作,如跨应用数据整理、自动化流程执行[4] - 团队构建了可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体支持扩展至百万级规模[4] 行业动态:AI大模型“春节档” - 国产大模型集体上新抢占“AI春节档”,行业竞争加剧[5] - 字节跳动于2月14日推出豆包大模型2.0系列,针对大规模生产环境进行优化[5] - MiniMax于2月13日上线并开源新一代文本模型MiniMax M2.5[5] - 字节跳动发布Seedance2.0,阿里发布Qwen-Image-2.0,DeepSeek更新至1.7.4版本,面壁智能开源MiniCPM-o 4.5模型[5]
DeepSeek新模型来了?
华尔街见闻· 2026-02-11 19:21
DeepSeek V4模型技术升级与市场影响 - 公司正在推进新版本模型的灰度测试 这可能是V4正式亮相前的终极灰度版[1] - 新版本模型上下文长度从128K扩展至1M 接近提升10倍 知识库更新至2025年5月[1] - 新版本在复杂任务处理能力上已对齐Gemini 3 Pro及K2.5等主流闭源模型[2] - 内部初步测试显示 V4在编程任务中的表现已超越Anthropic Claude及OpenAI GPT系列同代模型[2] V4模型核心技术架构创新 - V4预计将引入mHC与Engram两项创新技术 从算法与工程层面突破算力芯片与内存瓶颈[2] - mHC全称为“流形约束超连接” 旨在解决Transformer模型在层数极深时信息流动的瓶颈和训练不稳定的问题[3][4] - Engram是一个“条件记忆”模块 设计理念是将“记忆”与“计算”解耦 静态知识被专门存储在可置于廉价DRAM的稀疏内存表中[6] - mHC技术通过改善训练稳定性和收敛效率 对冲国产芯片在互联带宽与计算密度上的代际差距[8] - Engram架构致力于重构内存调度机制 在HBM供应受限的背景下 以更高效的存取策略突破显存容量与带宽制约[8] V4模型对行业成本与竞争格局的影响 - 此次发布的关键意义在于进一步压缩训练与推理成本 为全球大语言模型及AI应用企业缓解资本开支压力提供可行路径[2] - 成本端的优化将有效激发下游应用需求 进而催生新一轮AI基础设施建设周期[8] - 在2024年底 DeepSeek的两个模型曾占据OpenRouter上开源模型Token使用量的一半以上[9] - 到2025年下半年 随着更多玩家加入 其市场份额已显著下降 市场从“一家独大”走向了“群雄割据”[11] 对下游应用与软件行业的潜在机遇 - 更强大、更高效的V4将催生更强大的AI智能体 AI智能体正从“对话工具”转型为能处理复杂任务的“AI助手”[12] - 能执行多任务的智能体需要更频繁地与底层大模型交互 将消耗更多Token 进而推高算力需求[12] - 模型效能的提升为领先的软件公司创造了价值 需要关注那些能率先利用新一代大模型能力打造出颠覆性AI原生应用或智能体的软件公司[12]
意大利结束对DeepSeek调查,涉及幻觉风险信息披露
21世纪经济报道· 2026-01-06 20:15
监管调查与和解 - 意大利反垄断机构AGCM于2025年6月因公司涉嫌未就AI“幻觉”风险向用户发出警告而启动调查,并于2026年1月5日宣布结束调查 [2] - 调查以公司(杭州深度求索与北京深度求索)做出具有约束力的承诺为结案条件,承诺包含一系列改进关于幻觉风险信息披露的措施 [2] - 公司承诺使有关AI幻觉风险的信息披露变得更易获取、更透明、更易懂和更及时 [3] 公司业务与市场表现 - 公司在意大利提供两项针对非专业用户的AI服务:自2023年11月2日起可访问的DeepSeek Chat网页版,以及自2025年1月15日起全球上架的DeepSeek App [3] - DeepSeek App因意大利数据保护局的调查,于2025年1月29日从意大利地区的谷歌和苹果应用商店下架 [3] - 公司凭借模型能力、高性价比和开源策略迅速在全球爆火,2025年第三季度其中国月活用户达1.45亿,位列国内AI应用第二 [3] - 根据OpenRouter与a16z的联合研究,在2024年11月至2025年11月期间,DeepSeek以14.37万亿Token的累计调用量稳居全球开源大模型榜首 [3] 行业背景与概念 - AI“幻觉”是指AI模型根据用户输入,生成包含不准确、误导性或捏造信息的输出 [2] - 公司总部位于杭州,在意大利及其他国家没有分支机构 [3]
算力的“三维”共振
国盛证券· 2025-08-17 15:07
行业投资评级 - 增持(维持)[4] 核心观点 宏观层面 - 美联储降息预期强烈,预计9月降息50个基点,降低科技企业债务成本并刺激研发投入[1] - 降息将促进AI企业加速技术落地和市场扩张,强化长期增长逻辑[1] 中观层面 - AI应用进入盈利拐点,GPT用户数一年内翻四倍至周活跃用户超7亿,成为全球第五大网站[2] - GPT-5发布48小时内API流量翻倍,商业模式从"投入试验"转向"生态闭环"[2] - Meta计划建造全球最大数据中心集群(Hyperion目标5GW),OpenAI拟筹资数万亿美元建设数据中心[3] - 算力成为巨头竞争核心资源,"算力基建→应用变现→垂类扩张→再投资"闭环强化[4] 微观层面 - 光模块市场形成寡头格局,中际旭创、新易盛等凭借技术+客户结构领先优势卡位[7] - 液冷技术路径分化:冷板式(当前主流)向浸没式(单相→两相)演进,浸没式为最终方案[8][10] - 光通信向高速率/高带宽/低功耗升级,CPO/OIO方案提升光渗透率[7] 行业动态与技术创新 AI应用进展 - GPT-5新增自动/快速/思考三种模式,思考模式支持19.6万token上下文[31] - DeepSeek App日活突破3000万,登顶中美应用商店下载榜[34] - Anthropic Claude Sonnet 4上下文token数提升至100万,可处理数十篇长篇论文[37] 硬件与技术突破 - 苹果M4 Ultra芯片预计配备32核CPU/80核GPU,内存96GB[35] - 比利时Edgx融资230万欧元推进星载边缘AI计算机商业化,计划2026年发射[41] - 北京亦庄目标2027年实现万台具身智能机器人量产,覆盖制造/医疗/市政等场景[43] 重点公司推荐 算力基础设施 - 光模块龙头:中际旭创(2025E PE 32.33x)、新易盛(2025E PE 26.05x)[14] - 液冷厂商:英维克(本周涨38%)、东阳光[19] - 算力设备:工业富联、寒武纪、沪电股份(2025E PE 28.90x)[9][14] 其他领域 - 边缘算力:美格智能、移远通信[9] - 卫星通信:中国卫通、海格通信[9] - 数据要素:中国移动、恒为科技[12]
DeepSeek App迎来重要更新!
新浪财经· 2025-08-17 11:22
DeepSeek App功能更新 - DeepSeek App新增对话内容生成分享图功能 用户可通过分享功能将对话生成图片进行传播 [2][6] - 应用在应用商店获得5 9万个评分 平均评分为4 0分 在效率类应用中排名第4位 [3][7] - 应用年龄评级为12+ 开发者显示为杭州深度求索公司 [3][7] DeepSeek-R2大模型研发进展 - 网传DeepSeek-R2大模型将于8月15日至30日发布的消息被公司内部人士证实为不实信息 [10] - 公司CEO梁文锋对当前R2性能不满意 团队正在重点优化代码生成与多语言推理能力 [10] - DeepSeek-R2在8月内没有发布计划 因技术尚未达到可部署状态 [10]
苹果计划推出桌面机器人等AI硬件;寒武纪再辟谣丨新鲜早科技
21世纪经济报道· 2025-08-15 10:48
巨头动向与AI布局 - 苹果计划推出机器人、拟人化Siri、智能音箱及安防摄像头等AI产品 桌面机器人定位为虚拟伴侣 计划2027年上市 [2] - 淘天集团内部更名为中国电商事业群-淘天集团 与饿了么、飞猪形成平行关系 强化业务独立性与协同性 [2] - 抖音电商将打通即时零售与电商业务 复用产品及履约能力 开放小时达、次日达服务给更多商家 [3] - 谷歌未来两年向俄克拉何马州投资90亿美元 用于建设新数据中心园区及扩建现有设施 [3] 技术创新与开源框架 - 字节跳动Seed团队开源全模态PyTorch原生训练框架VeOmni 采用以模型为中心的分布式方案 将数周工程开发缩短至几天 [4] - 智元机器人推出统一世界模型平台Genie Envisioner 整合未来帧预测、策略学习与仿真评估 实现端到端推理与执行 已完成制作三明治等任务测试 [5] - DeepSeek App更新至1.3.0版本 新增对话内容生成分享图功能 支持分享至微信、微博等平台 [6][7] 半导体与硬件动态 - 英伟达否认Rubin芯片延后上市传闻 称将如期问世 Rubin采用HBM4内存和第六代NVLink 带宽达3.6TB/s [12] - 寒武纪澄清不实信息 否认预定大量载板订单及新产品送样等传闻 [13] - 南茂本季度起调涨存储封测报价5%至18% 反映基板、材料与电费成本上升 DDR5放量带动业务稳健增长 [14] - 郑州合晶12英寸大硅片二期项目计划9月底交付 投产后月产能达10万片 填补国内高端大尺寸硅片制造空白 [15] 资本运作与战略投资 - 奕斯伟材料科创板IPO过会 为首家未盈利企业申报 专注于12英寸硅片研发与生产 产品覆盖存储芯片、逻辑芯片等关键领域 [16] - 芯海科技筹划发行H股并在香港联交所上市 深化国际化战略布局 [17] - 康达新材拟以2.75亿元收购中科华微51%股权 拓展半导体集成电路领域 纳入特种集成电路设计与检测资产 [18] - 新石器获滴滴战略投资 此前完成10亿元C+轮融资 全球无人车部署量突破7500辆 预计年内成为全球首个万辆级L4无人车队 [19] 企业运营与产能扩张 - 大疆辟谣销售部门大调整传闻 称报道存在严重事实性偏差 保留追责权利 [8] - 腾讯表示不会过度依赖现有GPU资源 有足够芯片进行训练和推理 将通过软件优化提升效率 [9] - 兆威机电拟投资1亿美元在泰国新建生产基地 完善海外布局 提升国际竞争力 [10] - 均胜电子已与海外及国内机器人厂商签署合作协议 提供大小脑控制器、能源管理模块等关键零部件及软硬件解决方案 [11]
DeepSeek App 1.3.0版本正式上线:对话分享图功能成亮点
环球网资讯· 2025-08-14 17:42
产品更新 - 人工智能企业DeepSeek移动端应用完成重大更新 正式推出1.3.0版本 [1] - 更新修复已知问题并优化文本操作体验 [2] 核心功能 - 首次引入对话内容生成分享图功能 支持自定义背景模板、字体样式及布局排版 [2] - 用户可调整对话气泡颜色 添加个性化水印或品牌标识 [2] - 生成适合社交媒体传播的高清图片 [2] 应用场景 - 科技趋势探讨后生成图文并茂卡片式分享图 直接发布至微信、微博等平台 [2] - 教育场景中整理互动问答生成结构化知识图谱用于课堂展示 [2]
DeepSeek增加这项功能!寒武纪股价迈向千元大关!科创人工智能ETF(589520)场内频现溢价,买盘资金强势!
新浪基金· 2025-08-14 13:37
寒武纪股价表现 - 寒武纪股价一度上涨14%至985元 市值超3950亿元 实时成交额109亿元 位列A股成交榜第二 [1] - 科创人工智能ETF华宝(589520)早盘场内价格一度上涨1.5% 后回调至跌0.2% 实时成交额超2500万元 [1] - 该ETF近期频现溢价区间 8月13日单日吸金1785万元 近60日累计吸金8217万元 [1] AI行业动态 - DeepSeek App更新支持对话内容生成分享图功能 但公司否认DeepSeek R2将于8月发布的传言 [3] - Hugging Face趋势热榜前十名中9个为国产大模型 GLM-4.5位列第一 通义千问Qwen3第二 腾讯混元3D模型第三 [3] - DeepSeek R1虽未进入热榜前列 但以1.25万个点赞数成为最受欢迎国产大模型 [3] 国产算力芯片发展 - 机构认为算力芯片自主可控是必然趋势 英伟达芯片安全漏洞将加速国产替代进程 [3] - 长期建议关注华为昇腾 寒武纪和海光信息等国产算力芯片体系 [3] AI板块投资逻辑 - AI板块经历3-5月调整后满足再次成为主线的条件:筹码沉淀到位且长期逻辑未变 [4] - 科创人工智能ETF(589520)前十大重仓股权重67% 半导体行业占比近50% 配置覆盖AI产业链四大环节 [5] - 该ETF成份股为各细分领域龙头企业 有望受益于端侧芯片/软件AI化进程 [5]
DeepSeek App重磅更新:支持对话内容生成分享图功能
齐鲁晚报· 2025-08-14 11:33
产品功能更新 - DeepSeek App发布1.3.0版本更新 新增对话内容生成分享图功能 比截图分享更便捷 [1] 市场表现与用户增长 - DeepSeek应用于1月27日登顶苹果中国区及美国区免费App下载排行榜 在美区下载榜超越ChatGPT [3] - 日活跃用户数在1月28日首次超越豆包 并于2月1日突破3000万大关 成为史上最快达成此里程碑的应用 [3] 公司动态与市场传闻 - 市场传言称DeepSeek R2将于8月15日至30日期间发布 但公司内部人士于8月13日表示该消息不属实 [3]
DeepSeek更新!增加对话内容生成分享图功能
每日经济新闻· 2025-08-14 07:05
产品更新 - DeepSeek App更新支持对话内容生成分享图功能 [1]