Workflow
开源大模型
icon
搜索文档
传媒行业周观察(20250811-20250815):看好游戏、IP、AI、影视等景气度方向
华创证券· 2025-08-18 13:47
行业投资评级 - 传媒行业投资评级为"推荐",预期未来3-6个月内行业指数涨幅超过基准指数5%以上 [3][44] 核心观点 - 传媒板块明线为AI应用起势,暗线为内容输出带来的文化自信,需锐度和配置并重 [6] - 看好2025年成为中国开源大模型爆发及应用格局重塑之年,分三步推进:公有云价值重塑→平台型企业赋能→C端场景落地 [6] - 港股科技主线对产业催化敏感,建议关注腾讯、阿里、快手、哔哩哔哩等标的 [6] 细分领域分析 游戏 - 高频数据向上+中报预期良好,关注暑期结束后DAU及流水持续性 [6] - iOS畅销榜显示腾讯系《和平精英》《王者荣耀》稳居前三,网易《梦幻西游》处中上位置 [15] - 新游《无畏契约:源能行动》《盗墓笔记:启程》即将上线 [17] IP - 长期看好大麦娱乐(2B转授权业务增速+2C渠道扩张)和创源股份(IP文创从0到1落地) [6] 影视 - 剧集政策边际宽松,"新21条"或优化集数、题材等限制,利好芒果超媒、华策影视等 [6] - 2025年电影票房恢复至2019年同期的85%,观影人次恢复76% [20][23] - 上周票房TOP3影片为《浪浪山小妖怪》(2.22亿元)、《南京照相馆》(2.17亿元)、《东极岛》(0.86亿元) [26] AI应用 - 重点关注Deepseek R2上线及财报季表现,推荐快手(25年PE<15x)、阜博集团(AI收入预期差)等 [6] - 华为发布AI推理技术UCM,计划2025年9月开源 [31] - 苹果拟推出机器人、智能安防摄像头等AI产品,预计2027年推出虚拟伴侣机器人 [31] 市场表现 - 上周传媒(申万)指数上涨1.00%,跑输沪深300指数1.37个百分点,位列行业第17位 [7][9] - 个股涨幅前三:吉视传媒(+45.19%)、北纬科技(+41.12%)、游族网络(+19.88%) [10][12] - 港股恒生科技指数上涨1.52%,东方甄选(+39.61%)、阅文集团(+21.57%)领涨 [13][18] 公司动态 - 网易2Q25收入279亿元(同比+9%),Non-GAAP净利润95亿元(同比+22%) [32] - 腾讯2Q25收入1845亿元(同比+15%),经调整净利润631亿元(同比+10%) [33] - 阅文集团25H1调整后净利润5.1亿元(同比-28%),剔除新丽后同比+36% [34]
全球AI大模型迭代提速!中国开源生态爆发
Wind万得· 2025-08-13 06:37
全球AI技术迭代加速 - 8月以来全球AI领域技术迭代显著加快 OpenAI Google DeepMind 百度等中外科技企业相继发布或更新大模型产品 推动行业进入创新密集期 [1] - OpenAI推出GPT-5 包含推理增强版 多模态版及企业定制版三个版本 编程场景性能显著提升 代码生成能力突出 网页端向个人用户免费开放 API调用价格下调 [3] - 百度计划8月底前推出新一代AI推理大模型 旨在强化复杂任务处理能力 Google DeepMind发布"Genie3"模型 具备生成动态3D世界及模拟物理现象能力 但在可操作性与多智能体交互方面存在局限 [3] 中国开源大模型崛起 - 中国企业在开源大模型赛道表现突出 全球市场影响力持续提升 产业生态构建与商业化落地展现强劲潜力 [1] - 腾讯开源"混元3D世界模型1.0" 阿里密集发布四款开源模型 最新开源模型在国际评测平台位列全球第三 京东将"言犀"升级为"JoyAI" 新体系涵盖全尺寸模型 支持多模态功能 [3] - HuggingFace榜单显示 全球排名前十的开源大模型中 中国企业占据九席 智谱GLM-4.5位列第一 阿里系列模型占五席 腾讯 月之暗面相关模型上榜 [4] 中美AI发展策略差异 - 中国大模型企业多选择开源路径 通过开放技术吸引全球开发者构建应用生态 美国科技公司倾向闭源模式 如OpenAI从早期开源转向闭源运营 以巩固技术领先优势 [6] - 开源模式面临"微调内卷"现象 模型更新集中于参数调优 底层架构创新不足 开发者面临模型版本频繁更迭 接口变更等兼容性难题 [6] - 开源模型的"组合效应"可能导致技术壁垒弱化 业内呼吁推动统一API接口标准 加大原创性基础研究投入 [6] AI商业化与行业影响 - AI应用差异化发展打开增量空间 快手聚焦视频与图像生成 阿里深耕电商流量运营 腾讯探索广告与游戏业务应用 显著提升商业化变现效率 [7] - 大模型应用个人用户注册总数超31亿 API调用用户总数超1.59亿 下一代大模型临近 Agent及多模态方向有望持续受益 推理需求扩容将带动算力需求增长 [7] - AI技术推动互联网行业估值体系重构 相关主题ETF或迎来发展机遇 2025年AI大模型行业呈现技术迭代加速 开源生态崛起 商业化路径多元特征 [7]
超越OpenAI医疗能力,百川发布开源大模型Baichuan-M2
凤凰网· 2025-08-11 15:32
公司产品发布 - 百川智能正式发布开源医疗增强大模型Baichuan-M2 [1] - 该模型尺寸为32B,属于较小尺寸 [1] 产品性能表现 - Baichuan-M2性能反超OpenAI最新开源模型gpt-oss120b [1] - 模型性能力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型 [1] 产品技术特点与成本优势 - 针对医疗领域用户隐私考虑,支持模型私有化部署需求 [1] - 对模型进行了极致轻量化,量化后精度接近无损 [1] - 量化模型可在RTX4090上实现单卡部署 [1] - 相比DeepSeek-R1 H20的双节点部署方式,成本降低了57倍 [1]
反超OpenAI,百川宣布开源医疗大模型发布
新浪科技· 2025-08-11 13:25
模型性能表现 - 百川智能发布的开源医疗增强大模型Baichuan-M2在HealthBench评测中获得60.1分,超越OpenAI最新开源模型gpt-oss120b的57.6分 [1] - 该模型以32B的较小尺寸在评测中超越包括Qwen3-235B、Deepseek R1、Kimi K2在内的其他开源大模型 [1] 部署成本与效率 - 公司对Baichuan-M2进行了极致轻量化,量化后模型精度接近无损,可在RTX4090上实现单卡部署 [4] - 与DeepSeek-R1 H20需要双节点部署的方式相比,Baichuan-M2的部署成本降低了57倍 [4] - 针对急诊、门诊等对交互速度要求高的场景,基于Eagle-3架构优化的MTP版本在单用户场景下实现了74.9%的token速度提升 [4] 硬件适配与市场应用 - 模型针对国产主流芯片进行了专门的开发和适配,使多数医疗机构能够利用现有硬件条件实现快速部署 [4]
现在就等梁文锋了
投资界· 2025-08-10 15:45
硅谷AI圈最新动态 - OpenAI时隔6年首次推出开放权重大语言模型gpt-oss-120b和gpt-oss-20b,采用Transformer架构和MoE设计,参数规模分别为1170亿和210亿[13] - gpt-oss-120b在核心推理基准测试中性能接近OpenAI o4-mini,可在单张80GB GPU上运行;gpt-oss-20b性能接近o3-mini,支持16GB内存端侧运行[13] - 模型采用分组多查询注意力机制(组大小8)和旋转位置编码(RoPE),原生支持128k上下文[13] - 在RTX5090上运行20B版本,输出速度达160-180tokens/秒[21] - 性能测试显示在远小于DeepSeek R1和Qwen 3的体量下,接近中国开源模型性能[23] 谷歌Genie 3突破 - 谷歌发布文生虚拟世界模型Genie 3,可生成720p清晰度24FPS流畅度的动态交互世界[28] - 模型能实时响应用户指令生成不同内容,要求精准处理物理交互逻辑[29] - 技术突破可能对VR、游戏和文生视频赛道产生深远影响[29] - 目前仍处于官方演示阶段,未开放普通用户试用[29] - 相比前代产品,Genie 3在分辨率、交互时长等方面有显著提升[31] Anthropic专注AI编程 - Anthropic更新顶级大模型Claude Opus 4.1,AI编程能力上限提升2%[34] - 在SWE-bench测试中达到74.5%准确率,领先OpenAI和Gemini同类产品[35] - 终端编程测试(Terminal-Bench)表现达43.3%,显著优于竞品[35] - 公司选择集中资源提升编程能力,保持在大模型商业化赛道的竞争力[38] 华人科技人才贡献 - OpenAI gpt-oss系列核心团队成员包括北大校友任泓宇,曾任职苹果、微软等公司[42] - 上海交大校友Wang Xin参与模型后训练工作[44] - 谷歌Genie 3团队有上海交大本科、哈佛博士Emma Wang参与,优化后实现24fps流畅度和亚秒级延迟[46]
三位90后,估值700亿
投资界· 2025-08-10 15:45
AI创业潮 - AI神话仍在继续,Mistral AI正在进行新一轮10亿美元融资,估值将达到100亿美元(约合人民币700亿元),成立两年估值翻了近50倍 [2] - 公司由三位90后学霸创立,他们从巴黎顶尖学府毕业投身AI大厂后创业,成立一个月就凭借7页PPT融资1亿美元,刷新欧洲种子轮纪录 [2] - 今年初DeepSeek全球爆红,成为Mistral梦寐以求的理想模样,这一轮由90后们带队的AI大战刚刚拉开帷幕 [2] Mistral AI创始团队 - 三位创始人Arthur Mensch、Guillaume Lample、Timothée Lacroix均为90后,拥有巴黎顶尖高校背景和谷歌DeepMind、Meta AI实验室工作经验 [4] - 2023年三位创始人意识到AI革命机遇,回到巴黎创立Mistral AI,意为"法国吹来的强风" [6] - 创始人表示目标是未来10年处于领先地位,法国总统马克龙多次亲自站台称赞其为"新一代欧洲初创企业与美国科技巨头竞争的典范" [6] Mistral AI发展历程 - 2023年9月发布首个开源大模型Mistral 7B,仅73亿参数规模却在多个基准测试优于Llama 2 [6] - 与封闭的OpenAI和Anthropic不同,公司坚持开源策略 [6] - 2024年发布聊天机器人Le Chat和首款推理模型Magistral,试图正面叫阵DeepSeek [7] - 目前发力商业化,与英伟达等巨头合作,年收入有望首次超过1亿美元且最近一年增长数倍 [8] 融资历程 - 成立一个月完成1.13亿美元种子轮融资,创欧洲纪录,估值2.6亿美元 [10] - 2023年底完成4.15亿美元A轮融资,估值20亿美元 [11] - 2024年2月获微软1630万美元投资,6月完成6.4亿美元B轮融资,估值60亿美元 [12] - 目前正洽谈10亿美元融资,估值或达100亿美元 [12] 投资人阵容 - 早期投资人包括光速创投、Index Ventures、德高集团等知名机构及法国富豪 [10] - A轮由a16z领投,Salesforce、法国巴黎银行等参与 [11] - B轮由General Catalyst领投,英伟达、三星、Salesforce等参投 [12] - 最新潜在投资人MGX由阿布扎比主权基金穆巴达拉和G42组建 [12] 行业竞争格局 - AI开源战场竞争激烈,OpenAI时隔六年首次发布最新开源模型 [7] - 腾讯、智谱AI、阿里巴巴、月之暗面等密集推出新一代开源大模型 [7] - Mistral被质疑测试结果回避与最新版通义千问和DeepSeek直接对比 [7] 90后AI创业者崛起 - AI搜索公司Perplexity估值180亿美元,较去年增长近20倍,由三位90后创立 [15] - Genesis AI完成1.05亿美元种子轮融资,创硅谷具身智能行业纪录 [15] - AnySphere估值90亿美元,由四位麻省理工年轻面孔创立 [15] - 国内90后创业者如宇树科技王兴兴、月之暗面杨植麟等崭露头角 [16] - 这批创业者大多拥有世界顶级大学理工科背景,具有全球视野和技术信仰 [16]
安联锐视:前端IPC或后端NVR可以接入通义千问、DeepSeek等开源大模型
每日经济新闻· 2025-08-06 21:27
公司AI技术合作 - 公司前端IPC或后端NVR可接入通义千问、DeepSeek等开源大模型 [2] - 正与广州潜在空间科技合作开发对接火山视觉大模型的产品 [2] - 先期推广AI巡店等应用场景 [2] 子公司业务布局 - 参股子公司浙江安兴宇联机器人开发的智能体主要用于政府部门 [2] - 智能产品涉及AI大模型合作与行业赋能应用 [2]
欢迎OpenAI重返开源大模型赛道,谈一谈我关注的一些要点
36氪· 2025-08-06 15:55
文章核心观点 - OpenAI于2025年8月5日发布两款开源大模型GPT-OSS 120B和GPT-OSS-20B,这是公司自2019年11月以来首次发布开源模型,标志着其重返开源赛道[1] - 公司此次开源主要是为了满足企业客户对数据本地化部署、定制化微调和成本控制的需求,以争夺被竞争对手占据的市场[3][4] - 本次开源在技术层面影响有限,因其未披露最新技术、完整训练细节和核心语料库,属于“开放权重”而非完全开源,但证实了外界对其技术路线的猜测大部分正确[5][6][8] 行业竞争格局 - 在OpenAI开源前,全球主流AI开发商中仅OpenAI和Anthropic未发布新版开源模型,而谷歌、Meta、Mistral、阿里巴巴等均已有开源产品[2] - 2025年成为“开源之年”,百度、OpenAI、Meta、阿里巴巴等纷纷发布或加速开源模型,仅Anthropic和字节跳动未提供开源版本[4][5] - 开源策略有助于模型快速普及和生态构建,如DeepSeek因开源迅速获得政企客户,LLaMA在欧美深受大企业欢迎[4] 开源模型的商业动因 - 开源模型支持本地化部署,客户可将数据存储在本地硬件,保障国家或商业机密安全[3] - 客户可基于行业需求对开源模型进行微调,尤其适合医疗、金融等敏感或复杂场景[3] - 本地运行开源模型可能比购买闭源模型使用权更经济,例如GPT-OSS-20B可运行于笔记本电脑[3] 技术细节与性能 - GPT-OSS 120B和20B的参数规模分别为1200亿和200亿,训练数据截止于2024年6月,性能与GPT-4o3相当[6] - 模型采用混合专家架构,120B版本每层有128个专家,20B版本每层有32个专家,每次激活4个专家[6] - 思维链架构在后训练阶段实现,并采用CoT RL技术,但未压制“大模型幻觉”,导致深度推理模式幻觉率较高[6][7] - 训练算力基于英伟达H100 GPU,120B版本消耗210万H100小时,若训练45天需1944张H100,未使用最新Blackwell架构[9][10] 开源内容的局限性 - OpenAI未公布训练用的脚手架模型、Reward模型、预训练语料库及独家工具,因此属于“开放权重”而非完全开源[8] - 技术白皮书仅确认了外界已有猜测,未透露核心独门技术,对行业技术进步的直接影响有限[5][7] - 公司更先进的模型如GPT-4(参数1.37万亿)仍闭源,算力资源可能优先用于GPT-4.5/GPT-5训练[10]
OpenAI重返开源大模型赛道,谈一谈我关注的一些要点
虎嗅· 2025-08-06 15:03
开源大模型发布 - OpenAI于2025年8月5日发布两款开源大模型GPT-OSS 120B和GPT-OSS-20B 用户可通过Hugging Face平台下载并修改定制或商业应用 主流云平台包括亚马逊AWS和微软Azure已提供基于这两款模型的服务 这是OpenAI自2019年11月以来首次发布开源大模型[1] 历史背景与行业对比 - OpenAI名称原意为"开放"和"开源" 但自2019年初起偏离开源轨道 2019年2月以安全问题为由拒绝公布GPT-2全部参数权重 仅公布7.74亿参数部分模型 同年11月才公布全部15亿参数 后续GPT-3、GPT-3.5及GPT-4系列均未公布参数权重或技术白皮书[1] - 截至发布时 OpenAI与Anthropic是全球AI大模型基础研发第一集团中仅有的两家未发布新版开源模型的开发者[2] - 竞争对手普遍采用开源策略 谷歌2024年起维持开源Gemma系列与闭源Gemini系列并行 Meta的LLaMA系列是主流开源模型精神源头 法国Mistral首版模型即开源 马斯克Grok成立之初即开源 阿里巴巴Qwen成为衍生版本最多的开源模型之一 DeepSeek依靠开源获得巨大影响力[2] 开源动机与客户价值 - 开源模型支持本地部署 客户数据可完全存储在本地 最大限度保护国家机密和商业机密的数据安全[3] - 客户可基于自身需求对开源模型进行微调 尤其契合医疗、金融等复杂或敏感行业的特定应用场景[4] - 预算有限客户在本地硬件运行大模型可能比购买闭源模型使用权更经济 GPT-OSS-20B甚至可运行于笔记本电脑[5] - 本地部署需客户自行负责信息安全和技术维护 但许多大型行业客户仍偏好开源模型 LLaMA系列在欧美深受大企业欢迎 DeepSeek因开源特性快速覆盖国内政企客户[6] - OpenAI重返开源战场部分受LLaMA、DeepSeek、Qwen及Grok等开源模型刺激 但商业角度决策不可避免 因部分企业及政府部门永远不可能将关键数据上传第三方平台[6] 行业格局变化 - 2025年成为"开源之年" 国内百度与国外OpenAI均发布开源模型 Meta发布最新开源版本 阿里加快开源版本发布速度[7] - 全球主流大模型开发商中仅Anthropic和字节跳动未发布开源版本 字节跳动豆包大模型尚无开源计划 且技术不属于全球第一集团 开源与否对技术进步影响有限[7] 技术细节与性能 - GPT-OSS两个版本训练数据截止2024年6月 训练完成于2024年8月 性能大致与四个月前发布的GPT-4o3及o3 mini可比[8] - GPT-OSS-120B表现优于DeepSeek和Qwen最新版本 但仅证明OpenAI相对竞争对手仍有数月领先优势 未提供新信息[8] - GPT-OSS采用混合专家架构 GPT-OSS 120B每层128个专家 20B每层32个专家 每个路径激活4个最擅长专家[9] - 模型在标准文本基础上训练 思维链架构于后训练阶段实现 与竞争对手一致[10][11] - 后训练阶段采用CoT RL技术 使用外部API及RAG Agents 基本证实外界猜测[12] - OpenAI未在后训练阶段压制大模型幻觉 因会降低CoT透明度 GPT-OSS深度推理模式幻觉率较高[13] - 公布技术路线大部分已被外界猜测或争辩 技术细节如后训练具体手段或带来有限启发[14] 开源局限性 - GPT-OSS仅为"开放权重"模型 非完整开源 公布内容仅包括参数权重、34页技术白皮书及少量选择性信息[14] - 缺失关键复刻环节 包括训练中使用的脚手架模型 语料质量检测 清洗模型 人类价值观对齐Reward模型等[14] - 未公布预训练阶段语料库 Meta曾部分公布LLaMA语料但OpenAI未披露[15] - 训练过程使用的独家工具即便披露名称也无法模仿[16] - 商业公司几乎不可能发布全面开源模型 因开源目的为满足客户需求及培育生态 而非方便抄袭[16] 算力与训练细节 - GPT-OSS基于英伟达H100 GPU训练 120B版本消耗210万H100小时 20B版本消耗35万H100小时[17] - 以30天训练时间推算需2917张H100 以45天推算需1944张 训练数据截止2024年6月且完成于7月底或8月初 训练时间不太可能明显超过45天[17] - 模型未使用最新Blackwell系列GPU 也未使用万卡集群或更大规模集群[17] - GPT-4参数规模达1.37万亿 是GPT-OSS十倍以上 算力需求远超GPT-OSS 宝贵B100/200 GPU可能完全用于GPT-4.5及GPT-5训练[17] - GPT-OSS可能是OpenAI最后几个用Hopper架构GPU训练的模型之一 GPT-4.5后模型可能完全基于Blackwell训练 退役H100将转而承担推理任务[18] - 深度推理模型普及推动推理需求爆发 全球算力仍需增长3-4倍以满足训练及推理需求[18]
狂揽70亿挑战DeepSeek,AI创企被曝新融资,被英伟达押宝,团队大牛云集
36氪· 2025-08-05 16:12
融资与估值 - 美国Agent创企Reflection AI正洽谈筹集超10亿美元(折合人民币约71.8亿元)资金,用于开发开源大模型,已筹集到大部分金额 [2] - 今年3月公司获得1.3亿美元(折合人民币约9.3亿元)风险投资,红杉资本、CRV、英伟达风险投资部门NVentures等参投 [3] - 公司最新估值为5.45亿美元(折合人民币约39.1亿元),10亿美元融资完成后的估值尚未明确 [3] 创始团队与背景 - 创始团队由前谷歌DeepMind两位研究科学家约安尼斯·安东诺格洛和米沙·拉斯金于2024年创办 [2] - 安东诺格洛在谷歌DeepMind任职12年,曾参与AlphaGo、AlphaZero、MuZero及谷歌Gemini模型开发 [5] - 拉斯金是前谷歌Gemini核心负责人,领导谷歌强化学习和大型语言模型方向 [7] - 团队成员来自谷歌DeepMind、OpenAI和Anthropic,研究领域涵盖大型语言模型、强化学习和Agent [9] 业务布局与产品 - 公司目标构建超智能自主系统,专注自主编程以推动超级智能发展 [4] - 首款编程Agent Asimov已发布,可读取、编写、测试和部署代码,已从企业获得少量收入 [2] - Asimov可分析企业数据生成代码,已集成至金融服务、科技等领域的工作流程 [11] - 红杉资本称Asimov帮助开发者提升10倍工作效率,开发者青睐度高于Cursor Ask、Cloude Code [12] 开源模型战略 - 公司计划拓展开源AI模型开发,瞄准中国企业需求激增的市场机会 [16] - 开源模型成本更低、灵活性更高,可针对特定业务流程微调 [16] - 目前LMArena榜单前30开源模型无美国开发者产品,多为中国模型如阿里通义、DeepSeek、Kimi K2 [16] - 创始人计划将公司打造为美国领先的开源AI模型提供商 [18] 行业动态 - 开源模型热潮催化美国AI公司加快布局,OpenAI计划今夏发布开源模型 [16] - Meta正招聘人才改进模型,可能转向闭源模型开发 [16] - 模型训练成本高昂,OpenAI预计今年投入超70亿美元,2026年达170亿美元 [19]