Workflow
开源大模型
icon
搜索文档
黄仁勋评价DeepSeek和通义千问:都是世界顶尖开源大模型
中国证券报· 2025-07-18 05:03
人工智能技术发展 - 人工智能技术从2012年到2017年在计算机视觉、语音识别、语言理解能力方面快速进步并超越人类能力,如今从感知型升级为生成式人工智能 [1] - 人工智能技术未来发展趋势是向物理世界渗透,当前处于推理型人工智能浪潮,下一个浪潮将是物理型人工智能,应用于机器人等物理机械中 [1] - 人工智能技术会为科学发展带来重大影响,帮助理解蛋白质、化学物质、细胞乃至生命的意义,进而研发新药物并延长人类寿命 [2] 中国人工智能生态 - 中国研究者发表的人工智能论文数量世界第一,在开源方面表现突出,DeepSeek和通义千问是世界顶尖的开源大模型 [1][2] - 开源大模型助力形成中国人工智能生态并推动全球其他地区生态构建,医疗公司、金融机构、机器人公司等可利用这些模型并根据需求调整 [1][2] - 中国有数百个项目运用英伟达Omniverse平台模拟数字孪生,用于设计和优化工厂和仓储系统,许多机器人在该平台虚拟世界训练以便与人类安全协作 [3] 芯片技术发展 - 未来硅基技术将在晶体管结构、封装技术、硅光技术三方面迭代,晶体管向三维发展,下一代将是"全环绕栅极"晶体管 [2] - 芯片领域从单芯片发展到堆叠芯片、多芯片,封装技术越来越先进,硅光子技术将有较大创新空间 [2] - 英伟达技术路线图已覆盖接近10年未来规划,公司预计至少需忙碌20年 [2][3] 中国市场重要性 - 中国市场对英伟达非常重要,是世界上最大市场之一,具有活力和独特性 [1][3] - 英伟达恢复H20芯片在中国销售并推出面向中国市场的新GPU,产品应用于供应链数字化管理、具身智能大模型训练等领域 [3] - 英伟达不将自身视为芯片公司而是"AI基础设施"或"计算平台"供应商,机器人技术将为公司带来万亿美元级别增长机会 [3]
K2开源大模型,会是Kimi的DeepSeek时刻吗?
虎嗅· 2025-07-14 11:20
中国AI开源模型发展 - MoonShot最新开源大模型K2总参数规模达到万亿级别(1T),是目前开源模型中最大的,激活参数320亿 [2] - K2在基准测试SWE Bench Verified(编程)、Tau2(智能体)中仅次于Claude 4 Opus,在AceBench(工具调用)中仅次于GPT-4.1 [2] - K2官方API服务与DeepSeek的R1相当,但最大支持上下文长度(128K)高于R1(64K) [2] - K2发布后成为HuggingFace上热度第一的开源模型,新兴云厂商NovitaAI与Parasail已将其托管上线 [4] - Perplexity首席执行官Aravind Srinivas在内部测试后决定尽快对K2展开后训练 [4] 中国AI公司竞争格局 - 中国本土AI公司竞争激烈,MiniMax与MoonShot相互竞争,先后发布多款开源模型 [5] - MoonShot已披露融资总额约15亿美元,远低于硅谷同行 [6] - MoonShot比DeepSeek更早推动"执行"以更低成本落地,冲击AI应用的消费市场和企业市场 [7] - K2兼容OpenAI和Anthropic的API格式,凭借更高性价比可能赢得硅谷AI应用开发者市场 [7] MoonShot技术创新 - K2架构采用更少注意力头、更多专家,提高长上下文效率和每个token处理效率 [8] - MoonShot自研MuonClip优化器计算效率是AdamW优化器的2倍 [8] - MoonShot在MuonClip优化器中融入自研QK-Clip技术解决MaxLogit爆炸问题 [10][11] - MoonShot重视底层创新,曾提出MoBA(混合块注意力)架构 [11] MoonShot产品布局 - MoonShot拥有形式推理模式Kimina-Prover-72B、编程模型Kimi-Dev-72B、深度研究智能体Kimi-Researcher等多款产品 [12] - K2的智能体能力得益于大量Agentic合成数据和通用强化学习手段 [12] - MoonShot团队具有文艺特质,公司名来源于平克·弗洛伊德的专辑 [13]
中国信通院“开源大模型+”软件创新应用典型案例入围结果公布
环球网资讯· 2025-07-10 11:19
论坛及案例公布 - 全球数字经济大会—云智算安全论坛暨第三届"SecGo论坛"在京召开 [1] - "开源大模型+"软件创新应用典型案例(2025年第一季)入围名单正式公布 [1] 典型案例征集背景 - 以DeepSeek为代表的开源大模型在各行业展现出巨大应用潜力 [4] - 企业积极将开源大模型接入业务流程以实现技术创新和业务升级 [4] - 中国信息通信研究院开展案例征集活动以推动行业交流与创新 [4] 典型案例征集详情 - 活动收到全国百余个案例 覆盖云计算 金融 政务 医疗 通信 安全 工业 教育 能源 交通等行业 [5] - 经多轮评审最终评选出68个入围案例 包括26个精选创新案例和42个创新案例 [5] - 2025年下半年将开启第二季案例征集 结果计划在云和软件安全相关活动上发布 [5]
【财闻联播】柬埔寨宣布与美国达成关税协议!“网红医生”被点名,国家卫健委紧急提醒
券商中国· 2025-07-05 18:55
宏观动态 - 国家卫健委将加大互联网健康科普乱象整治力度 指出部分"网红医生"存在违规导医导诊、直播带货、夸大治疗效果等行为 强调患者需线下首诊后才能通过合规互联网医院复诊 [1] - 中国足协球员自荐系统上线4个月注册人数达25487人 其中6813人提交基础信息 1055人完成技术数据上传并启动自荐流程 [2] - 全国猪肉批发价周环比上涨1.7%至20.58元/公斤 周均价环比上涨0.7%至20.38元/公斤 供应缩量推动价格涨幅扩大 [3] - 柬埔寨与美国达成关税协议 成为继越南后第二个与特朗普政府达成协议的东南亚国家 具体税率等细节尚未公布 [4][5][6] 金融机构 - 顺德农商行撤回深交所IPO申请 上市进程终止 成为年内第二家主动撤回申请的中小银行 [7] 市场数据 - 欧股主要指数多数下跌 德国DAX指数跌0.42% 法国CAC指数跌0.77% 欧洲斯托克50指数跌0.98% 英国富时100指数微涨0.01% [8] - 美股因独立日假期休市一日 [9] 公司动态 - 上海乐高乐园正式开园 包含主题乐园和酒店 西侧预留拓展用地 未来5-10年规划已在制定中 7-8月推出餐饮半价促销 [10] - 3C认证充电宝销量激增 部分商家库存告急 电商平台已全面下架无认证产品 机场加强3C标识查验 [11] - 北京建工集团主要领导变更 路刚接任党委书记兼董事长 樊军卸任 [12] - 华为诺亚方舟实验室声明盘古Pro MoE开源模型为自主开发 基础组件代码遵循开源许可要求并标注版权声明 [13][14]
盘古团队声明:严格遵循开源许可证的要求
快讯· 2025-07-05 17:38
盘古团队开源声明 - 盘古Pro MoE开源模型基于昇腾硬件平台开发训练 并非基于其他厂商模型增量训练 [1] - 模型部分基础组件代码参考业界开源实践 涉及其他开源大模型的代码 [1] - 团队强调严格遵循开源许可证要求 在代码文件中清晰标注版权声明 [1] 技术开发背景 - 模型开发依托昇腾硬件平台 体现国产化技术路线 [1] - 采用混合专家架构(MoE)设计 属于当前大模型前沿技术方向 [1] 知识产权管理 - 开源代码引用部分明确标注来源 符合许可证合规要求 [1] - 声明未提及具体引用比例或组件数量 仅强调合规性 [1]
盘古团队最新声明:严格遵循开源要求
第一财经· 2025-07-05 17:26
华为盘古Pro MoE开源模型声明 - 盘古Pro MoE开源模型基于昇腾硬件平台独立开发训练 并非其他厂商模型的增量训练产物 [1] - 模型部分基础组件代码实现参考业界开源实践 涉及其他开源大模型的部分代码 但严格遵循开源许可证要求 [1] - 开源代码文件中已清晰标注版权声明 符合开源社区通行做法及协作精神 [1]
智谱再获10亿融资,推出会看“苏超”的开源新模型
观察者网· 2025-07-03 18:30
核心观点 - 智谱发布新一代通用视觉语言模型GLM-4.1V-Thinking,突破多模态推理能力,并在多项评测中超越更大参数模型 [1][7][10] - 公司获得10亿元战略融资,联合上海国资打造"算电模"一体化基础设施,建设万卡集群 [3][5] - 大模型商业化加速,API调用量同比增长30倍,价格大幅下调80%-90% [12][14] - Agent平台和智能硬件成为商业化落地重点方向 [15][18][19] 技术突破 - GLM-4.1V-Thinking支持图像/视频/文档输入,引入思维链推理机制和课程采样强化学习策略 [7] - 轻量版GLM-4.1V-9B-Thinking在28项评测中23项领先10B级模型,18项持平72B的Qwen-2.5-VL [7][8] - 模型实现动态视频理解能力,可完成足球解说、GUI操作等复杂任务 [9][10] - 90亿参数模型性能超越GPT-4o,接近720亿参数的Qwen-2.5-VL [10] 资本与生态 - 年内完成5轮融资,最新10亿元融资由浦东创投和张江集团联合投资 [3][5] - 与上海仪电、浦发集团共建"算电模"设施,利用绿电直连支撑万卡集群 [5] - "模力社区"已聚集近70家垂类大模型企业,25家完成安全备案 [3] 商业化进展 - API日均Token调用量同比增30倍,消耗金额增52% [12] - GLM-4-Plus等API价格降幅达90%,推动应用普及 [14] - 推出Agent聚合平台"应用空间",启动数亿元专项扶持计划 [1][15] - 教育、医疗、企服等领域Agent落地周期有望提前 [17] 行业趋势 - 上海将发展AGI作为战略任务,重点突破算力、语料、基础模型 [6] - AI向自主智能体演进,可能催生全新商业模式 [17] - 端侧算力提升推动AI能力嵌入汽车、眼镜等智能硬件 [18][19]
平安好医生入选首批"开源大模型+"创新应用典型案例 医疗AI场景化落地
格隆汇· 2025-07-03 15:33
行业动态 - 中国信通院在"全球数字经济大会-云智算安全论坛"上公布2025年"开源大模型+"软件创新应用典型案例并进行首季授牌仪式 [1] - 医疗AI正逐渐成为卫生健康事业高质量发展和"健康中国"建设的重要战略组成部分 [5] 公司荣誉 - 平安好医生的两项医疗AI产品"平安芯医"和"安主任"入选信通院首批"开源大模型+"软件创新应用典型案例"精选案例" [1] - 这两款产品通过了中国信通院"开源大模型集成应用能力质效评估",获得权威机构专业认可 [3] 产品技术 - "平安芯医"依托TOP级名医网络,提供24小时在线医疗服务,包括健康咨询、报告解读、MDT多学科会诊等服务 [3] - "安主任"专注于解决用户五大就医难题,提供7*24小时线上线下闭环服务 [3] - 产品基于五大医疗数据库和"平安医博通"医疗大模型,每年完成数万例专业标注与案例优化 [3] 发展战略 - 公司构建了"7+N+1"医疗AI产品矩阵,打造全场景、全周期、全生态的医疗服务 [5] - 作为平安集团医疗养老生态圈旗舰,公司持续提升医疗健康养老服务质量 [5] - 公司以技术探索和创新为导向,实现"省心、省时、又省钱"的用户价值目标 [5]
华为、百度同日宣布大动作:开源!
第一财经· 2025-06-30 20:16
开源战略转变 - 百度开源文心大模型4.5系列10款模型,包括47B、3B MoE模型和0.3B稠密型模型,实现预训练权重和推理代码完全开源 [1] - 华为开源盘古70亿参数稠密模型、盘古Pro MoE 720亿参数模型及昇腾模型推理技术 [1] - 百度从闭源转向开源,李彦宏此前认为闭源模型更适合商业化竞争,但受DeepSeek等开源模型冲击后调整策略 [4] - 华为内部曾对开源存在争议,最终选择开源以展示昇腾算力能力并消除外界质疑 [5] 技术性能与优势 - 文心4.5系列采用多模态异构模型结构,提升多模态理解能力,在视觉常识、推理等评测中优于OpenAI o1 [5][6] - 文心4.5-21B-A3B-Base文本模型效果与同量级Qwen3相当 [6] - 盘古Pro MoE 720亿参数模型通过动态激活专家网络设计实现"以小打大",性能接近千亿级模型 [6] - 华为70亿参数稠密模型适合智能客服等场景,720亿参数MoE模型适合复杂任务 [6] 行业竞争格局 - 阿里已开源200多款模型,通义千问Qwen衍生模型超13万,全球下载量超3亿,HuggingFace占比超30% [7] - 腾讯混元开源Hunyuan-A13B MoE模型和3D生成模型 [1] - 开源成为推动AI技术进步的重要力量,DeepSeek和阿里已验证其有效性 [1] 商业价值与生态建设 - 开源可降低开发者门槛,推动AI在千行百业的应用,同时通过云服务、API等实现商业闭环 [10] - 百度华为开源意味着模型成本已大幅降低,李彦宏称大模型推理成本年降90% [10] - 华为开源旨在推动昇腾生态战略,加速AI行业应用 [10] - 阿里云CTO认为开源社区是AI产业创新的重要驱动力 [9] 挑战与未来方向 - 开源可能导致二次开发产品与公司内部业务竞争,需持续技术优化保持优势 [11] - To B项目成功关键仍是产品能力、交付能力和客户需求理解,开源非决定性因素 [12] - 百度聚焦应用落地,华为通过开源追赶英伟达CUDA生态 [11] - 行业对英伟达依赖或转向多元化选择,涉及训练和推理全链条能力重构 [11]
IP经济概念股反复活跃,文娱传媒ETF(516190)全天强势
每日经济新闻· 2025-06-12 14:14
市场表现 - A股6月12日低开高走 上证指数午盘涨0.07% 深证成指涨0.05% 创业板指涨0.5% 北证50跌0.38% 科创50跌0.12% 半日成交7937.5亿元 [1] - 算力产业链走强 IP经济概念股反复活跃 文娱传媒ETF(516190)全天强势涨超1% 成分股奥飞娱乐、千里科技涨逾5% [1] IP经济与文娱传媒 - 国泰君安研报指出中国IP消费处于发展期 商业模式多样化 具备IP商品快速开发能力与IP运营能力的公司有望受益IP流量加持 [1] - 文娱传媒ETF(516190)跟踪中证文娱传媒指数 覆盖游戏、广告、影视动漫、旅游、数字出版等新兴板块 主板成分占比70% 创业板占比30% 兼具业绩稳定性和高成长潜力 [2] - 文娱传媒板块在政策支持、技术创新、文化出海推动下展现显著投资价值 [2] 市场趋势与流动性 - 华安证券认为海外扰动缓和 市场积极因素累积 但成长科技板块上涨空间受限且存在下跌压力 [1] - 小微盘股票表现突出 新消费景气赛道和创新药行情中走势显著强于大中盘股票 预计在万亿成交量及流动性充裕环境下仍具投资机会 [1] AI与文化主题 - 传媒板块明线为AI应用起势 暗线为文化自信(如哪吒IP) 需兼顾锐度与配置 [1] - 2023年是闭源通用大模型爆发年 预计将成为中国开源大模型爆发及应用格局重塑之年 [1]