Workflow
开源大模型
icon
搜索文档
盘古团队最新声明:严格遵循开源要求
第一财经· 2025-07-05 17:26
华为盘古Pro MoE开源模型声明 - 盘古Pro MoE开源模型基于昇腾硬件平台独立开发训练 并非其他厂商模型的增量训练产物 [1] - 模型部分基础组件代码实现参考业界开源实践 涉及其他开源大模型的部分代码 但严格遵循开源许可证要求 [1] - 开源代码文件中已清晰标注版权声明 符合开源社区通行做法及协作精神 [1]
智谱再获10亿融资,推出会看“苏超”的开源新模型
观察者网· 2025-07-03 18:30
核心观点 - 智谱发布新一代通用视觉语言模型GLM-4.1V-Thinking,突破多模态推理能力,并在多项评测中超越更大参数模型 [1][7][10] - 公司获得10亿元战略融资,联合上海国资打造"算电模"一体化基础设施,建设万卡集群 [3][5] - 大模型商业化加速,API调用量同比增长30倍,价格大幅下调80%-90% [12][14] - Agent平台和智能硬件成为商业化落地重点方向 [15][18][19] 技术突破 - GLM-4.1V-Thinking支持图像/视频/文档输入,引入思维链推理机制和课程采样强化学习策略 [7] - 轻量版GLM-4.1V-9B-Thinking在28项评测中23项领先10B级模型,18项持平72B的Qwen-2.5-VL [7][8] - 模型实现动态视频理解能力,可完成足球解说、GUI操作等复杂任务 [9][10] - 90亿参数模型性能超越GPT-4o,接近720亿参数的Qwen-2.5-VL [10] 资本与生态 - 年内完成5轮融资,最新10亿元融资由浦东创投和张江集团联合投资 [3][5] - 与上海仪电、浦发集团共建"算电模"设施,利用绿电直连支撑万卡集群 [5] - "模力社区"已聚集近70家垂类大模型企业,25家完成安全备案 [3] 商业化进展 - API日均Token调用量同比增30倍,消耗金额增52% [12] - GLM-4-Plus等API价格降幅达90%,推动应用普及 [14] - 推出Agent聚合平台"应用空间",启动数亿元专项扶持计划 [1][15] - 教育、医疗、企服等领域Agent落地周期有望提前 [17] 行业趋势 - 上海将发展AGI作为战略任务,重点突破算力、语料、基础模型 [6] - AI向自主智能体演进,可能催生全新商业模式 [17] - 端侧算力提升推动AI能力嵌入汽车、眼镜等智能硬件 [18][19]
平安好医生入选首批"开源大模型+"创新应用典型案例 医疗AI场景化落地
格隆汇· 2025-07-03 15:33
行业动态 - 中国信通院在"全球数字经济大会-云智算安全论坛"上公布2025年"开源大模型+"软件创新应用典型案例并进行首季授牌仪式 [1] - 医疗AI正逐渐成为卫生健康事业高质量发展和"健康中国"建设的重要战略组成部分 [5] 公司荣誉 - 平安好医生的两项医疗AI产品"平安芯医"和"安主任"入选信通院首批"开源大模型+"软件创新应用典型案例"精选案例" [1] - 这两款产品通过了中国信通院"开源大模型集成应用能力质效评估",获得权威机构专业认可 [3] 产品技术 - "平安芯医"依托TOP级名医网络,提供24小时在线医疗服务,包括健康咨询、报告解读、MDT多学科会诊等服务 [3] - "安主任"专注于解决用户五大就医难题,提供7*24小时线上线下闭环服务 [3] - 产品基于五大医疗数据库和"平安医博通"医疗大模型,每年完成数万例专业标注与案例优化 [3] 发展战略 - 公司构建了"7+N+1"医疗AI产品矩阵,打造全场景、全周期、全生态的医疗服务 [5] - 作为平安集团医疗养老生态圈旗舰,公司持续提升医疗健康养老服务质量 [5] - 公司以技术探索和创新为导向,实现"省心、省时、又省钱"的用户价值目标 [5]
华为、百度同日宣布大动作:开源!
第一财经· 2025-06-30 20:16
开源战略转变 - 百度开源文心大模型4.5系列10款模型,包括47B、3B MoE模型和0.3B稠密型模型,实现预训练权重和推理代码完全开源 [1] - 华为开源盘古70亿参数稠密模型、盘古Pro MoE 720亿参数模型及昇腾模型推理技术 [1] - 百度从闭源转向开源,李彦宏此前认为闭源模型更适合商业化竞争,但受DeepSeek等开源模型冲击后调整策略 [4] - 华为内部曾对开源存在争议,最终选择开源以展示昇腾算力能力并消除外界质疑 [5] 技术性能与优势 - 文心4.5系列采用多模态异构模型结构,提升多模态理解能力,在视觉常识、推理等评测中优于OpenAI o1 [5][6] - 文心4.5-21B-A3B-Base文本模型效果与同量级Qwen3相当 [6] - 盘古Pro MoE 720亿参数模型通过动态激活专家网络设计实现"以小打大",性能接近千亿级模型 [6] - 华为70亿参数稠密模型适合智能客服等场景,720亿参数MoE模型适合复杂任务 [6] 行业竞争格局 - 阿里已开源200多款模型,通义千问Qwen衍生模型超13万,全球下载量超3亿,HuggingFace占比超30% [7] - 腾讯混元开源Hunyuan-A13B MoE模型和3D生成模型 [1] - 开源成为推动AI技术进步的重要力量,DeepSeek和阿里已验证其有效性 [1] 商业价值与生态建设 - 开源可降低开发者门槛,推动AI在千行百业的应用,同时通过云服务、API等实现商业闭环 [10] - 百度华为开源意味着模型成本已大幅降低,李彦宏称大模型推理成本年降90% [10] - 华为开源旨在推动昇腾生态战略,加速AI行业应用 [10] - 阿里云CTO认为开源社区是AI产业创新的重要驱动力 [9] 挑战与未来方向 - 开源可能导致二次开发产品与公司内部业务竞争,需持续技术优化保持优势 [11] - To B项目成功关键仍是产品能力、交付能力和客户需求理解,开源非决定性因素 [12] - 百度聚焦应用落地,华为通过开源追赶英伟达CUDA生态 [11] - 行业对英伟达依赖或转向多元化选择,涉及训练和推理全链条能力重构 [11]
IP经济概念股反复活跃,文娱传媒ETF(516190)全天强势
每日经济新闻· 2025-06-12 14:14
市场表现 - A股6月12日低开高走 上证指数午盘涨0.07% 深证成指涨0.05% 创业板指涨0.5% 北证50跌0.38% 科创50跌0.12% 半日成交7937.5亿元 [1] - 算力产业链走强 IP经济概念股反复活跃 文娱传媒ETF(516190)全天强势涨超1% 成分股奥飞娱乐、千里科技涨逾5% [1] IP经济与文娱传媒 - 国泰君安研报指出中国IP消费处于发展期 商业模式多样化 具备IP商品快速开发能力与IP运营能力的公司有望受益IP流量加持 [1] - 文娱传媒ETF(516190)跟踪中证文娱传媒指数 覆盖游戏、广告、影视动漫、旅游、数字出版等新兴板块 主板成分占比70% 创业板占比30% 兼具业绩稳定性和高成长潜力 [2] - 文娱传媒板块在政策支持、技术创新、文化出海推动下展现显著投资价值 [2] 市场趋势与流动性 - 华安证券认为海外扰动缓和 市场积极因素累积 但成长科技板块上涨空间受限且存在下跌压力 [1] - 小微盘股票表现突出 新消费景气赛道和创新药行情中走势显著强于大中盘股票 预计在万亿成交量及流动性充裕环境下仍具投资机会 [1] AI与文化主题 - 传媒板块明线为AI应用起势 暗线为文化自信(如哪吒IP) 需兼顾锐度与配置 [1] - 2023年是闭源通用大模型爆发年 预计将成为中国开源大模型爆发及应用格局重塑之年 [1]
砸千亿重金、挖28岁华裔天才CEO、高薪聘谷歌OpenAI员工,传Meta正重组AI研发体系
36氪· 2025-06-12 07:33
Meta成立超级智能实验室 - Meta将成立专注于开发超越人类智力的"超级智能"AI系统的新实验室 [1] - 邀请Scale AI创始人兼CEO、28岁华裔天才亚历山大·王加入该实验室 [1] - 公司同意以148亿美元收购Scale AI 49%股份 [1] Meta高薪挖角AI人才 - 向OpenAI、谷歌等企业的数十名顶尖研究员提供百万至千万美元级待遇方案 [3][4] - 部分人员已同意加入Meta [3] - 公司AI团队由生成式AI小组和基础AI研究实验室两部分组成 [4] Scale AI业务表现 - Scale AI 2023年营收达8.7亿美元,预计2024年销售额翻倍至20亿美元以上 [3] - 公司成立于2016年,主要向微软、OpenAI等提供数据标注解决方案 [3] - 创始人亚历山大·王19岁辍学创立Scale AI,2022年公司估值超百亿美元 [3] Meta AI模型发展 - 2023年发布Llama模型和Meta AI聊天机器人,应用于旗下多个产品 [5] - 2024年推出Llama 4 Scout和Llama 4 Maverick两个新版本 [5] - 新模型在多项基准测试中表现优于或相当于OpenAI、谷歌同类产品 [7] AI行业竞争格局 - 微软向OpenAI投资超130亿美元,亚马逊向Anthropic投资80亿美元 [9] - 谷歌斥资超25亿美元从Character.AI等创企聘请人才和授权技术 [9] - Meta面临监管风险,美国联邦贸易委员会正对其收购行为提起诉讼 [9] Meta战略调整 - 公司此前AI战略过于分散,导致在ChatGPT引爆市场后陷入被动 [10] - 挖角亚历山大·王旨在弥补技术差距,重塑竞争优势 [10] - 公司内部存在研发效率低下、人才流失严重等问题 [10]
阿里千问3全球下载量破千万,《波斯王子Rogue》8月上线涨价至98元
搜狐财经· 2025-06-10 19:13
北京市时尚消费升级 - 北京市商务局等4部门印发《北京市扩大时尚消费专项行动方案》,提出打造全球首发中心,支持商圈商街商场改造提升 [1] - 鼓励商业运营主体吸引全球优质品牌在京设立首店、旗舰店、创新概念店,培育本土时尚定制品牌 [1] - 支持时尚品牌在京设立研发设计中心和地区总部 [1] 长三角外贸发展 - 前4个月长三角区域进出口总值5.29万亿元,规模创历史同期新高 [3] - 跨境电商、市场采购等贸易新业态蓬勃发展,船舶、机床等高端装备出口势头良好 [3] 福耀科技大学招生调整 - 2025年本科招生计划由100人缩减至50人,师生配比优化至6:1 [4] - 招生专业涵盖材料科学与工程、智能制造、车辆工程等优势学科 [4] - 校方表示此举旨在集中资源,确保学生获得更充分的学术指导与实践机会 [4] - 校长王树国强调教育本质是唤醒潜能,6:1师生配比将深度参与学生成长 [6] 阿里通义千问3开源表现 - 开源首月全球累计下载量突破1250万,成为近期最受欢迎的开源模型 [6] - 0.6B、8B、30B和32B四种尺寸模型在Hugging Face等平台下载量均突破百万 [6] - 千问系列衍生模型数量超13万个,稳居全球第一 [6] 河南首富变更 - 泡泡玛特创始人王宁身家203亿美元,超越牧原股份秦英林(163亿美元)成为河南新首富 [7] - 泡泡玛特市值3288亿港元(约3012亿元),王宁持股48.73%,持股市值约1467亿元 [7] OpenAI收入增长 - 年度经常性收入(ARR)突破100亿美元,较去年同期55亿美元增长近翻倍 [9] - 收入增长主要来自ChatGPT订阅服务、企业级API调用及开发者生态系统扩张 [9] - 通过向微软、Salesforce等科技巨头提供AI模型授权拓宽收入来源 [9] 游戏行业动态 - 育碧《波斯王子Rogue》8月正式上线,国区价格由78元涨至98元 [10] - 卡普空官宣《生化危机:安魂曲》2026年2月27日登陆PC、PS5和Xbox平台 [13] - 育碧《纪元117:罗马和平》2025年11月14日发售,国区标准版298元起 [15] AI行业合作与投资 - 亚马逊采用DeepSeek、阿里通义千问等开源大模型进行人形机器人操控 [12] - Meta洽谈投资Scale AI,估值或超100亿美元,有望创私营企业融资纪录 [17]
阿里云领投硅基流动A轮融资 半年融资两轮背后:开源大模型崛起带来业务爆发式增长
每日经济新闻· 2025-06-09 20:35
融资动态 - 硅基流动完成数亿元人民币A轮融资 由阿里云领投 老股东创新工场等机构超额跟投 华兴资本担任独家财务顾问 [1] - 2024年2月公司刚完成数亿元pre-A轮融资 自2023年1月5000万元天使轮以来 一年半内累计完成4轮融资 美团曾作为战略股东引入 [3] 业务发展 - 公司业务爆发式增长 主要受益于阿里通义千问Qwen、DeepSeek等开源大模型崛起及AI推理算力需求激增 [1] - SiliconCloud平台上线华为云昇腾算力版DeepSeek R1/V3模型 实现国产芯片部署路径突破 解决春节期间DeepSeek全球服务器宕机问题 [3] - 平台已集成上百款主流开源大模型 包括Qwen3、DeepSeek-R1/V3等 总用户突破600万 企业客户数千家 日均Token生成量达千亿级 [3] 产品技术 - 推出API服务、专属实例、软件订阅及大模型一体机等多元解决方案 覆盖大语言模型、文生图、视频生成等领域 [4] - DeepSeek-R1-0528采用强化学习驱动 解决模型重复性和可读性问题 通过冷启动数据优化推理性能 定价16元/百万Tokens [2] - 通义千问Qwen3系列包含30B/32B参数模型 支持思考模式与非思考模式切换 Qwen2.5-VL-32B为多模态模型 擅长物体识别与图像分析 [2] 市场战略 - 定位AI基础设施提供商 目标降低开发者AI应用门槛 实现"Token自由" 重点服务企业级客户(to B) [3][4] - 已服务互联网、金融、制造、文娱等行业头部客户 未来将持续深耕AI基础设施技术创新 [4] - 本轮融资资金将用于加大研发投入 拓展海内外市场 [1]
最早接住DeepSeek流量的硅基流动,新获阿里领投数亿元融资|36氪独家
36氪· 2025-06-09 18:47
融资与战略合作 - 硅基流动完成由阿里云领投的数亿元人民币融资 老股东创新工场等超额跟投 华兴资本担任独家财务顾问 [3] - 阿里云在AI硬件基础设施领域计划投资3800亿元人民币 创中国民企该领域最大规模投资纪录 [3] - 融资将用于人才招募 产品研发及国内外市场拓展 未来与阿里巴巴通义千问生态协作 并在算力 市场扩展等方面合作 [3] - 公司2024年底完成华创资本领投的亿元人民币Pre-A轮融资 耀途资本等超额跟投 [3] 核心业务与技术押注 - 公司为最快承接DeepSeek流量的To D与To B AI云服务产品 访问量一度超越To C应用 [5][6] - 作为唯一支持DeepSeek的第三方MaaS平台 公司适配DeepSeek-R1&V3具有先发优势 [6] - 早期押注开源模型 尤其聚焦编程能力突出的DeepSeek [7] - 另一战略押注为国产芯片 与华为昇腾合作实现DeepSeek模型高效部署 [8] - 公司是唯一用国产芯片提供大规模DeepSeek API服务的供应商 国产芯片在推理场景性价比显著 [9][10] 运营数据与行业竞争 - 总用户数超600万 企业用户数千家 日均Token生成量上千亿 [12] - DeepSeek开源策略扩大行业规模但加剧下游MaaS服务商竞争 [13] - MaaS商业模式需解决技术 运营 供应链 获客等难题 公司同步拓展海外市场 [14] - 公司优势包括算力中立 模型中立 场景中立 [15] 创始人背景与商业策略 - 创始人袁进辉曾发明全球最快主题模型训练算法LightLDA 连续创业经历包括一流科技和光年之外 [16][17] - 当前创业更注重商业化 团队从实验室形态转向成熟商业组织 [18] - 成功归因于开源大模型 AI推理服务 国产芯片适配等正确选择及团队执行力 [18]
2025年第18期(总899期):开源大模型DeepSeek实现三个“首
搜狐财经· 2025-06-07 16:35
DeepSeek:全球开源AI大模型的新标杆 - AI大模型开源需满足代码完整、模型参数公开、训练数据透明三大核心标准,较传统软件开源更复杂 [1][13] - 多数大模型厂商走纯闭源或"半开源"路线,如OpenAI的GPT-4、Meta的Llama 3仅部分开源且附带商用限制 [1][13] - DeepSeek以全栈开源和宽松协议树立新典范:开放代码、权重、文档下载,公开GPRO训练算法等技术细节,采用无商用限制的MIT许可 [1][14] DeepSeek的三大突破性"首次" 技术路径革新 - DeepSeek-R1通过纯强化学习(RL)训练证明"小而美"路径的可行性,打破依赖"Scaling Law"的"唯资源论"定式 [2][17] - 推理成本与定价显著低于国际主流模型,为资源有限的国家提供低成本高效能技术方案 [2][17] 应用爆发 - 应用程序18天下载量达1600万次,日活突破3000万的速度创行业纪录 [3][18] - 引发《自然》期刊等国际媒体高度关注,被视为非美国公司践行开源初心的标杆 [3][18] 生态重构 - 吸引全球软硬件厂商适配,构建"模型—芯片—系统"一体化生态:国内十余家芯片厂商、华为/荣耀等手机厂商完成接入,美国AMD、亚马逊、Apple等企业开展合作 [4][20] - 美国红杉资本设立2亿美元专项基金用于投资DeepSeek技术生态项目 [20] 推动AI普惠化平权化的发展建议 技术协同创新 - 依托GitHub、Hugging Face等开源平台,鼓励企业与科研机构基于DeepSeek等开源成果开展二次开发 [5][21] 行业应用落地 - 推动开源大模型与各行业场景结合,发展垂类模型并构建高质量数据集 [6][21] 全民素养培育 - 通过线上平台开展大模型通识教育,推动企业与高校合作建设开发平台 [7][22] 结语 - DeepSeek的"低成本、高性能、全开放"特性重塑行业竞争格局,为全球AI普惠化、平权化提供可行路径 [8][12]