Workflow
开源模型
icon
搜索文档
DeepSeek与国产芯片的“双向奔赴”
21世纪经济报道· 2025-10-01 07:14
模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型,实验性引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率 [1] - 新模型发布后,公司同步更新官方App、网页端及小程序,并全面下调API价格,降幅在50%到75%不等 [1] - V3.2-Exp版本在V3.1-Terminus基础上引入稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [7] 国产芯片生态协同 - 新模型发布后4分钟内,寒武纪率先宣布适配DeepSeek-V3.2-Exp,并开源大模型推理引擎vLLM-MLU源代码 [2] - 华为昇腾基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp的0day支持,并向开发者开源所有推理代码和算子实现 [2] - 海光信息表示其DCU已实现对DeepSeek-V3.2-Exp的无缝适配和深度调优,新模型在海光DCU上展现出优异性能 [2] 行业标准与生态建设 - 深度求索公司通过发布DeepSeek-V3.1版本,明确模型将适配下一代“UE8M0”浮点格式的国产芯片,为国产芯片发展指明方向 [6] - 业内高管认为,应由DeepSeek定义国产芯片标准,让芯片厂商跟进,而非让模型去适配芯片,DeepSeek已成为国产开源模型的标杆 [2][5] - 中国本土AI行业对DeepSeek模型的高度共识,使深度求索公司敢于先行先试,组建国产芯片生态 [7] 技术创新与工具链 - DeepSeek-V3.2-Exp采用的稀疏注意力机制,疑似基于深度求索公司今年2月发表论文中的原创机制,公司CEO梁文锋位列作者名单 [7] - 模型在兼容CUDA基础上,使用专为AI算子开发设计的编程语言TileLang进行快速原型开发,该语言由北京大学团队主导开发并于2025年1月开源 [7][8] 云计算厂商的生态参与 - 腾讯云于9月16日宣布已全面适配主流国产芯片,并积极参与开源社区建设 [8] - 阿里云在云栖大会表示推动“一云多芯”战略,验证并深度适配多家国产AI芯片,将其纳入自身算力底座 [8] - 相比英伟达用二十年建立生态,DeepSeek用了不到一年时间飞速完成初步生态追赶 [8]
DeepSeek V3.2要来了?
观察者网· 2025-09-29 17:58
公司产品发布动态 - 开源社区平台Hugging Face上出现DeepSeek-V3 2页面引发关注 [1] - DeepSeek最新一次更新在一周前的9月22日发布DeepSeek-V3 1-Terminus模型并宣布开源 [3] - 目前Hugging Face相关界面显示报错公司官方尚未对此回应 [4] 公司产品发布历史规律 - DeepSeek有在节前一天发布新版本和更新的历史 [2] - 2024年12月27日(元旦前)发布DeepSeek V3 [3] - 2025年5月28日(端午节前)发布DeepSeek-R1-0528称为端午节特别献礼 [3]
乌克兰多地遭空袭,已致4死80余伤;连锁餐饮企业监管新规出台;万达知情人士回应王健林被限高;受贿2.68亿!唐仁健一审被判死缓丨每经早参
每日经济新闻· 2025-09-29 06:03
有色金属行业政策 - 八部门印发《有色金属行业稳增长工作方案(2025—2026年)》,目标为2025-2026年行业增加值年均增长5%左右,十种有色金属产量年均增长1.5%左右 [5] - 方案提出铜、铝、锂等国内资源开发需取得积极进展,再生金属产量突破2000万吨,并提升高端产品供给能力及绿色低碳、数字化发展水平 [5] 民营经济发展 - 国家发展改革委主任郑栅洁主持召开民营企业座谈会,就“十五五”时期扩大有效投资听取意见建议 [6] - 国家发展改革委计划在扩大准入、打通堵点、强化保障等方面实施举措,加强产业、投资、财政、金融政策协同以激发民间投资活力 [6] 汽车行业动态 - 东风汽车正联手华为针对猛士品牌进行建店探索,双方合作有望形成更强战力的渠道体系 [14] - 华为智能汽车解决方案BU CEO靳玉志表示,L3级自动驾驶将在2027年规模放量,汽车产业正经历电动化、智能化到自动化的三波浪潮变革 [15] - 商务部办公厅发布关于做好2026年度汽车和摩托车出口许可申报工作的通知,线上申报系统将于2025年9月29日开通 [7] 企业融资与投资 - 星河动力航天完成D轮融资,融资总额共计24亿元,资金将用于加快可重复使用液体运载火箭及中型固体运载火箭的研制与能力建设 [22] - 万达集团及其法定代表人王健林被限制高消费,执行标的为1.86亿元,据称系下属项目公司经济纠纷导致 [18][19] 企业合作与产品发布 - 腾讯开源原生多模态生图模型“混元图像3.0”,参数规模达80B,为首个开源工业级原生多模态生图模型 [20] - 首个国产四价HPV疫苗(爱薇佳)正式获国家药监局批准上市,由国药集团中国生物所属研究所联合研发 [21] - 零跑汽车董事长朱江明回应被“限高”事件,表示已解除并称将提升团队能力 [17] 企业资本运作 - 多家公司发布资本运作相关公告,包括道生天台发行价格5.98元 [24],以及武汉控股、国星光电、博融等公司的定增、H股上市申请获接收、发行可转债等计划 [25] - 多家公司披露减持计划,包括博股份中标国家电网项目 [26],以及威腾电气、长江通信、科力尔等公司的股东拟减持信息 [26][27] - 部分公司进行收购及资产交易,如新大正拟收购嘉信立恒75.1%股权 [28],冠中生态拟收购杭州精算家股权 [29],光明乳业下属子公司处理新西兰北岛资产 [30]
宇树科技王兴兴谈机器人现状:最大挑战在哪里?为什么坚持开源?
机器人圈· 2025-09-26 17:29
人形机器人技术发展路线图 - 通信连接的创新对人形机器人发展至关重要,机器人对芯片算力和功耗控制有严苛要求[1] - 行业需要更开放的合作和共同创新以推动具身智能发展到下一阶段[1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果已远好于此前[1] - 下一阶段目标是让机器人能实时生成任何动作,预计快则2025年慢则2026年上半年实现[1] - 2026年底前目标让人形机器人在不熟悉场景中通过指令自然运作,例如自主找水,预计快则2026年慢则2027年实现[1] 机器人行业面临的技术挑战 - 在线束方面,工业机器人故障率和寿命的影响因素中60%~70%与线缆故障相关[2] - 降低线缆数量对提升机器人性能和可靠性尤为重要,团队会为降低一根电线重量花费大量时间精力[2] - 未来人形机器人形态目标是在主控大脑和四肢间仅用一根线缆连接[2] 开源模型与行业合作 - 发展相应大模型能力是让机器人实现更好通用能力的关键[3] - 公司呼吁推动开源模型发展,类似OpenAI早期将ChatGPT1~2代开源以吸引产业界共同推进[4] - 公司于9月15日官宣开源UnifoLM-WMA-0模型,专为通用机器人学习设计,核心是理解机器人与环境交互物理规律的世界模型[4] - 公司彻底开源了该模型的数据集、训练源代码、部署源代码,倡导硬件行业公司学者将能开源的内容尽量开源以加速行业发展[4] 行业宏观数据与动态 - 75家机器人上市公司2025半年报显示总营收5821亿元,盈利301亿元[4]
宇树科技王兴兴谈人形机器人最大挑战
21世纪经济报道· 2025-09-24 23:13
人形机器人发展路线图 - 通信连接创新对人形机器人发展至关重要 机器人移动性和空间限制对芯片算力和功耗控制有更严苛要求[1] - 具身智能未来需要产业更开放合作和共同创新 推动行业加速发展到下一阶段[1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果已远好于此前[1] 技术发展阶段 - 下一阶段目标是实现机器人实时生成任意动作 随便下达指令即可开始工作[1] - 快则2025年慢则2026年上半年 基本实现人形机器人任意实时生成各种动作[1] - 2026年底前目标让机器人在不熟悉场景中通过任意指令自然运作 例如在新场景自主找水交给客人[1] 行业技术挑战 - 线束是机器人行业发展重要挑战 工业机器人故障率和寿命60%-70%与线缆故障相关[2] - 降低电线重量需要花费大量时间和精力 降低线缆数量对提升机器人性能和可靠性尤其重要[2] - 未来理想形态是主控大脑和四肢之间只用一根线缆连接[2] 模型开源策略 - 发展大模型能力是实现机器人更好通用能力的关键[3] - 呼吁产业界开放合作 类似OpenAI早期开源ChatGPT1-2代推动产业发展[3] - 宇树科技9月15日开源UnifoLM-WMA-0模型 包含数据集训练源代码部署源代码[3] - 彻底开源旨在加速行业迈入下一阶段 使整个市场规模扩大[3]
宇树科技王兴兴谈人形机器人最大挑战
21世纪经济报道· 2025-09-24 23:12
人形机器人技术发展路线 - 通信连接创新对机器人发展至关重要 机器人移动性和空间限制对芯片算力和功耗控制提出严苛要求 [1] - 具身智能未来需要产业更开放合作和共同创新 以推动行业加速发展到下一阶段 [1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果已远好于此前 [1] 动作生成技术进展 - 下一阶段目标为实现机器人实时生成任意动作 通过指令即可开始工作 [1] - 预计快则2024年慢则2025年上半年可实现人形机器人任意实时生成各种动作 [1] - 2025年底前目标让机器人在陌生场景中通过指令自然运作 例如自主找水交给客人 [1] 线缆技术挑战 - 工业机器人故障率和寿命影响因素中60%-70%与线缆故障相关 [2] - 降低线缆数量对提升机器人性能和可靠性尤为重要 团队曾为降低一根电线重量投入大量精力 [2] - 未来目标为主控大脑与四肢间仅用一根线缆连接 [2] 开源模型战略 - 发展大模型能力是实现机器人通用能力的关键 [2] - 呼吁行业采取开放态度推进开源模型发展 类似OpenAI早期开源ChatGPT1-2代推动产业进步 [2] - 宇树科技于9月15日开源UnifoLM-WMA-0模型 包含数据集训练源代码和部署源代码 [3]
宇树科技王兴兴谈机器人现状:最大挑战在哪里?为什么坚持开源?
21世纪经济报道· 2025-09-24 22:13
人形机器人发展路线图 - 通信连接创新对行业发展至关重要 机器人移动性和空间限制对芯片算力和功耗控制有更严苛要求[1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果远好于此前 但按固定序列做动作仍不足够[1] - 下一阶段目标是实时生成任意动作 预计快则2024年慢则2025年上半年实现 让机器人可开始工作[1] - 2025年底前目标是在陌生场景中通过任意指令自然运作 例如自主找水递给客人 快则2025年慢则2026年实现[1] 行业技术挑战 - 线缆故障占工业机器人故障率和寿命因素的60%-70% 降低线缆数量对提升性能和可靠性尤为重要[3] - 团队为降低一根电线重量会花费大量时间精力 未来理想形态是主控大脑与四肢间仅用一根线缆连接[3] 开源合作与创新 - 呼吁产业开放合作共同创新 类似OpenAI早期开源ChatGPT1-2代推动产业发展[4] - 宇树科技9月15日开源UnifoLM-WMA-0模型 包含数据集训练源代码部署源代码 专为通用机器人学习设计[4] - 硬件行业公司和学者应开放开源以加速行业进入下一阶段 市场蛋糕将大幅扩大[4] 相关ETF数据 - 食品饮料ETF(515170)近五日跌2.84% 市盈率20.37倍 份额87.0亿份增2700.0万份 资金净流入147.6万元 估值分位19.42%[7] - 游戏ETF(159869)近五日跌1.25% 市盈率45.91倍 份额58.5亿份增1.0亿份 资金净流入1.2亿元 估值分位67.86%[7] - 科创半导体ETF(588170)近五日涨18.18% 份额8.1亿份增400.0万份 资金净流出1.2亿元[7] - 云计算50ETF(516630)近五日涨1.94% 市盈率123.26倍 份额3.6亿份增600.0万份 资金净流出6.3万元 估值分位91.53%[8]
吴泳铭的两个新判断,和加倍激进投入的阿里云
36氪· 2025-09-24 21:11
阿里云AI战略与愿景 - 公司提出超级人工智能(ASI)发展目标,超越AGI成为新方向 [4] - 公司CEO吴泳铭定义大模型为下一代操作系统,将吞噬软件并允许自然语言创造无限应用 [3] - 超级AI云被定义为下一代计算机,公司目标建立全球智能算力网络 [3] 技术产品发布 - 推出七款新模型包括旗舰模型Qwen3-Max(预训练数据36T tokens/超万亿参数)、Qwen3-Next(80B参数/仅激活3B)、Qwen3-VL(视觉编程能力)、Qwen3-Coder(代码生成)、Qwen3-Omni(多模态)、Wan2.5-preview(文生视频)和通义百聆(语音合成) [6] - Qwen3-Next训练成本较密集模型下降超90% [6] - 旗舰模型Qwen3-Max在LMArena排行榜位列全球前三 [9] 开源生态与市场地位 - 通义大模型全球下载量突破6亿次,衍生模型超17万个 [10] - 公司为国内开源最激进巨头,模型生态建设获实际回报 [9] - 中国AI云市场2025年上半年规模达223亿元,公司占比35.8%位列第一 [12] 基础设施与投入计划 - 宣布3800亿AI基础设施建设三年计划 [3] - 全球数据中心能耗规模到2032年较2022年提升10倍 [3] - 阿里云季度收入同比大涨26%,AI相关收入连续8季度三位数增长 [12] 行业竞争与发展趋势 - 全球AI累计投入预计超4万亿美元(未来五年) [13] - 行业进入Agent应用爆发阶段,公司百炼平台模型日均调用量增长15倍 [12] - 技术路线分歧减少,竞争重点转向系统级能力 [13][14]
阿里一口气发了N款新模型,让我们向源神致敬。
数字生命卡兹克· 2025-09-24 13:28
阿里云栖大会AI模型发布概览 - 阿里在云栖大会上密集发布多个AI模型 涵盖文本、视觉、音频、视频全模态领域 展示其全面的AI技术布局 [1][68] - 发布会期间公司股价出现显著上涨 反映市场对此次技术发布的积极态度 [1][2] Qwen3-Max模型性能 - Qwen3-Max为万亿参数MoE模型 使用36万亿tokens预训练 支持100万token上下文 直接对标GPT-5和Claude Opus 4等顶尖模型 [3][6][8] - 在LMArena全球权威模型对战平台排名前三 评分1430分 超越GPT-5-Chat的1430分 [4][5] - Instruct版本在专业测试集表现卓越:AIME2025领先 LiveCodeBench v6泛化能力突出 τ²-Bench以74.8分超越Claude Opus 4 SWE-Bench获69.6分居世界第一梯队 [9][11] - Thinking版本在AIME 25和HMMT数学推理竞赛获满分100分 与GPT-5 Pro持平 目前尚未开放体验 [13][15] Wan2.5视频生成突破 - 支持1080P分辨率和10秒时长生成 新增"音画同出"能力 可上传图片+音频直接生成带角色音频的视频 [23][25][27] - 解决音色一致性问题 支持音频驱动 显著增强数字人和人物表演能力 为AI短剧提供技术基础 [32] - 已上线通义万相平台供用户体验 [28] Qwen3-VL视觉语言模型 - 支持256K token上下文 可扩展至100万token(约2小时视频) 今日凌晨已开源 [33][34] - 235B-A22B版本在多项评测超越Gemini2.5 Pro 具备视觉Agent能力 可理解按钮和调用工具完成PC/手机端任务 [37][40] - 在复杂表格推理测试中一次性正确解析包含31省市8年经济数据的多维表格 [42][43] Qwen3-Omni全模态模型 - 端到端支持文本、图像、音频、视频输入 支持119种文本语言交互和19种语音理解语言 [48] - 语音对话延迟仅211毫秒 集成function call和MCP工具调用能力 [49][50] 其他模型技术亮点 - Qwen3-Coder-Plus提升推理速度并增强代码安全性 [54] - Qwen3-Next采用80B参数仅激活3B 性能媲美235B模型 训练成本降超90% 长文本推理吞吐量提升10倍 [54] - 通义百聆语音模型家族包含Fun-ASR(支持10+种语言实时处理)和Fun-CosyVoice(百种预制音色) [55][57][58] - 实时多模态翻译Qwen3-LiveTranslate-Flas延迟仅3秒 安全审核模型Qwen3Guard支持RL奖励建模 [59][60] 战略意义与行业影响 - 阿里通过此次发布会构建从底层模型到上层应用的全模态AI生态 展现其技术储备和产业化能力 [65][68] - 大规模开源行为旨在推动AI生态繁荣 强化行业影响力 [63][67]
谈超级人工智能之路,吴泳铭称阿里目标是打造AI时代的操作系统
第一财经· 2025-09-24 11:29
AI发展路径与阶段 - AI将经历三个阶段最终成长为超级人工智能:智能涌现阶段AI学习人 自主行动阶段AI辅助人 自我迭代阶段AI超越人[1] - 行业认为AGI具备人类通用认知能力已是确定性事件 AI的行业渗透率将超过历史上所有技术[1] - 跨越到自我迭代阶段需要两个要素:AI连接几乎物理世界所有场景和数据 模型通过与真实世界持续交互实现自我学习与智能升级[1] 大模型的未来角色 - 大模型将是下一代操作系统 在未来物理世界与数字世界交互中扮演核心地位[2] - 各行各业所有用户都将通过大模型相关工具执行任务 自然语言可能成为AI时代的编程语言[2] - 公司坚持开源路线打造AI时代操作系统 未来开源模型创造价值和渗透场景将远超大语言模型[2] AI计算范式变革 - 算力正从CPU为核心计算加速转向GPU为核心、大模型驱动的AI计算[2] - 新计算范式需要更稠密算力 更高效网络 更大集群规模 依赖超大规模基础设施和全栈基础积累[2] - 未来全世界可能只存在5到6个超级云计算平台[2] 公司战略与投入 - 公司通过通义千问开源生态建设 全栈AI能力建设 三年投入3800亿用于云和AI基础设施[2] - 对比2022年生成式AI元年 到2032年公司全球数据中心能耗规模将提升十倍[2] - 公司相信以饱和式投入能够推动超级人工智能时代到来[2] 行业数据趋势 - 公司观察到token消耗量每两三个月翻一番[1]