开源大模型

搜索文档
砸千亿重金、挖28岁华裔天才CEO、高薪聘谷歌OpenAI员工,传Meta正重组AI研发体系
36氪· 2025-06-12 07:33
Meta成立超级智能实验室 - Meta将成立专注于开发超越人类智力的"超级智能"AI系统的新实验室 [1] - 邀请Scale AI创始人兼CEO、28岁华裔天才亚历山大·王加入该实验室 [1] - 公司同意以148亿美元收购Scale AI 49%股份 [1] Meta高薪挖角AI人才 - 向OpenAI、谷歌等企业的数十名顶尖研究员提供百万至千万美元级待遇方案 [3][4] - 部分人员已同意加入Meta [3] - 公司AI团队由生成式AI小组和基础AI研究实验室两部分组成 [4] Scale AI业务表现 - Scale AI 2023年营收达8.7亿美元,预计2024年销售额翻倍至20亿美元以上 [3] - 公司成立于2016年,主要向微软、OpenAI等提供数据标注解决方案 [3] - 创始人亚历山大·王19岁辍学创立Scale AI,2022年公司估值超百亿美元 [3] Meta AI模型发展 - 2023年发布Llama模型和Meta AI聊天机器人,应用于旗下多个产品 [5] - 2024年推出Llama 4 Scout和Llama 4 Maverick两个新版本 [5] - 新模型在多项基准测试中表现优于或相当于OpenAI、谷歌同类产品 [7] AI行业竞争格局 - 微软向OpenAI投资超130亿美元,亚马逊向Anthropic投资80亿美元 [9] - 谷歌斥资超25亿美元从Character.AI等创企聘请人才和授权技术 [9] - Meta面临监管风险,美国联邦贸易委员会正对其收购行为提起诉讼 [9] Meta战略调整 - 公司此前AI战略过于分散,导致在ChatGPT引爆市场后陷入被动 [10] - 挖角亚历山大·王旨在弥补技术差距,重塑竞争优势 [10] - 公司内部存在研发效率低下、人才流失严重等问题 [10]
阿里千问3全球下载量破千万,《波斯王子Rogue》8月上线涨价至98元
搜狐财经· 2025-06-10 19:13
北京市时尚消费升级 - 北京市商务局等4部门印发《北京市扩大时尚消费专项行动方案》,提出打造全球首发中心,支持商圈商街商场改造提升 [1] - 鼓励商业运营主体吸引全球优质品牌在京设立首店、旗舰店、创新概念店,培育本土时尚定制品牌 [1] - 支持时尚品牌在京设立研发设计中心和地区总部 [1] 长三角外贸发展 - 前4个月长三角区域进出口总值5.29万亿元,规模创历史同期新高 [3] - 跨境电商、市场采购等贸易新业态蓬勃发展,船舶、机床等高端装备出口势头良好 [3] 福耀科技大学招生调整 - 2025年本科招生计划由100人缩减至50人,师生配比优化至6:1 [4] - 招生专业涵盖材料科学与工程、智能制造、车辆工程等优势学科 [4] - 校方表示此举旨在集中资源,确保学生获得更充分的学术指导与实践机会 [4] - 校长王树国强调教育本质是唤醒潜能,6:1师生配比将深度参与学生成长 [6] 阿里通义千问3开源表现 - 开源首月全球累计下载量突破1250万,成为近期最受欢迎的开源模型 [6] - 0.6B、8B、30B和32B四种尺寸模型在Hugging Face等平台下载量均突破百万 [6] - 千问系列衍生模型数量超13万个,稳居全球第一 [6] 河南首富变更 - 泡泡玛特创始人王宁身家203亿美元,超越牧原股份秦英林(163亿美元)成为河南新首富 [7] - 泡泡玛特市值3288亿港元(约3012亿元),王宁持股48.73%,持股市值约1467亿元 [7] OpenAI收入增长 - 年度经常性收入(ARR)突破100亿美元,较去年同期55亿美元增长近翻倍 [9] - 收入增长主要来自ChatGPT订阅服务、企业级API调用及开发者生态系统扩张 [9] - 通过向微软、Salesforce等科技巨头提供AI模型授权拓宽收入来源 [9] 游戏行业动态 - 育碧《波斯王子Rogue》8月正式上线,国区价格由78元涨至98元 [10] - 卡普空官宣《生化危机:安魂曲》2026年2月27日登陆PC、PS5和Xbox平台 [13] - 育碧《纪元117:罗马和平》2025年11月14日发售,国区标准版298元起 [15] AI行业合作与投资 - 亚马逊采用DeepSeek、阿里通义千问等开源大模型进行人形机器人操控 [12] - Meta洽谈投资Scale AI,估值或超100亿美元,有望创私营企业融资纪录 [17]
阿里云领投硅基流动A轮融资 半年融资两轮背后:开源大模型崛起带来业务爆发式增长
每日经济新闻· 2025-06-09 20:35
融资动态 - 硅基流动完成数亿元人民币A轮融资 由阿里云领投 老股东创新工场等机构超额跟投 华兴资本担任独家财务顾问 [1] - 2024年2月公司刚完成数亿元pre-A轮融资 自2023年1月5000万元天使轮以来 一年半内累计完成4轮融资 美团曾作为战略股东引入 [3] 业务发展 - 公司业务爆发式增长 主要受益于阿里通义千问Qwen、DeepSeek等开源大模型崛起及AI推理算力需求激增 [1] - SiliconCloud平台上线华为云昇腾算力版DeepSeek R1/V3模型 实现国产芯片部署路径突破 解决春节期间DeepSeek全球服务器宕机问题 [3] - 平台已集成上百款主流开源大模型 包括Qwen3、DeepSeek-R1/V3等 总用户突破600万 企业客户数千家 日均Token生成量达千亿级 [3] 产品技术 - 推出API服务、专属实例、软件订阅及大模型一体机等多元解决方案 覆盖大语言模型、文生图、视频生成等领域 [4] - DeepSeek-R1-0528采用强化学习驱动 解决模型重复性和可读性问题 通过冷启动数据优化推理性能 定价16元/百万Tokens [2] - 通义千问Qwen3系列包含30B/32B参数模型 支持思考模式与非思考模式切换 Qwen2.5-VL-32B为多模态模型 擅长物体识别与图像分析 [2] 市场战略 - 定位AI基础设施提供商 目标降低开发者AI应用门槛 实现"Token自由" 重点服务企业级客户(to B) [3][4] - 已服务互联网、金融、制造、文娱等行业头部客户 未来将持续深耕AI基础设施技术创新 [4] - 本轮融资资金将用于加大研发投入 拓展海内外市场 [1]
最早接住DeepSeek流量的硅基流动,新获阿里领投数亿元融资|36氪独家
36氪· 2025-06-09 18:47
融资与战略合作 - 硅基流动完成由阿里云领投的数亿元人民币融资 老股东创新工场等超额跟投 华兴资本担任独家财务顾问 [3] - 阿里云在AI硬件基础设施领域计划投资3800亿元人民币 创中国民企该领域最大规模投资纪录 [3] - 融资将用于人才招募 产品研发及国内外市场拓展 未来与阿里巴巴通义千问生态协作 并在算力 市场扩展等方面合作 [3] - 公司2024年底完成华创资本领投的亿元人民币Pre-A轮融资 耀途资本等超额跟投 [3] 核心业务与技术押注 - 公司为最快承接DeepSeek流量的To D与To B AI云服务产品 访问量一度超越To C应用 [5][6] - 作为唯一支持DeepSeek的第三方MaaS平台 公司适配DeepSeek-R1&V3具有先发优势 [6] - 早期押注开源模型 尤其聚焦编程能力突出的DeepSeek [7] - 另一战略押注为国产芯片 与华为昇腾合作实现DeepSeek模型高效部署 [8] - 公司是唯一用国产芯片提供大规模DeepSeek API服务的供应商 国产芯片在推理场景性价比显著 [9][10] 运营数据与行业竞争 - 总用户数超600万 企业用户数千家 日均Token生成量上千亿 [12] - DeepSeek开源策略扩大行业规模但加剧下游MaaS服务商竞争 [13] - MaaS商业模式需解决技术 运营 供应链 获客等难题 公司同步拓展海外市场 [14] - 公司优势包括算力中立 模型中立 场景中立 [15] 创始人背景与商业策略 - 创始人袁进辉曾发明全球最快主题模型训练算法LightLDA 连续创业经历包括一流科技和光年之外 [16][17] - 当前创业更注重商业化 团队从实验室形态转向成熟商业组织 [18] - 成功归因于开源大模型 AI推理服务 国产芯片适配等正确选择及团队执行力 [18]
2025年第18期(总899期):开源大模型DeepSeek实现三个“首
搜狐财经· 2025-06-07 16:35
DeepSeek:全球开源AI大模型的新标杆 - AI大模型开源需满足代码完整、模型参数公开、训练数据透明三大核心标准,较传统软件开源更复杂 [1][13] - 多数大模型厂商走纯闭源或"半开源"路线,如OpenAI的GPT-4、Meta的Llama 3仅部分开源且附带商用限制 [1][13] - DeepSeek以全栈开源和宽松协议树立新典范:开放代码、权重、文档下载,公开GPRO训练算法等技术细节,采用无商用限制的MIT许可 [1][14] DeepSeek的三大突破性"首次" 技术路径革新 - DeepSeek-R1通过纯强化学习(RL)训练证明"小而美"路径的可行性,打破依赖"Scaling Law"的"唯资源论"定式 [2][17] - 推理成本与定价显著低于国际主流模型,为资源有限的国家提供低成本高效能技术方案 [2][17] 应用爆发 - 应用程序18天下载量达1600万次,日活突破3000万的速度创行业纪录 [3][18] - 引发《自然》期刊等国际媒体高度关注,被视为非美国公司践行开源初心的标杆 [3][18] 生态重构 - 吸引全球软硬件厂商适配,构建"模型—芯片—系统"一体化生态:国内十余家芯片厂商、华为/荣耀等手机厂商完成接入,美国AMD、亚马逊、Apple等企业开展合作 [4][20] - 美国红杉资本设立2亿美元专项基金用于投资DeepSeek技术生态项目 [20] 推动AI普惠化平权化的发展建议 技术协同创新 - 依托GitHub、Hugging Face等开源平台,鼓励企业与科研机构基于DeepSeek等开源成果开展二次开发 [5][21] 行业应用落地 - 推动开源大模型与各行业场景结合,发展垂类模型并构建高质量数据集 [6][21] 全民素养培育 - 通过线上平台开展大模型通识教育,推动企业与高校合作建设开发平台 [7][22] 结语 - DeepSeek的"低成本、高性能、全开放"特性重塑行业竞争格局,为全球AI普惠化、平权化提供可行路径 [8][12]
明线为AI应用起势,暗线为文化自信,游戏板块反弹上攻趋势显著,聚焦游戏板块布局机会
每日经济新闻· 2025-06-03 11:11
游戏板块表现 - 游戏ETF(159869)早盘涨近4%,近5个交易日有4个交易日获资金净流入,显示资金持续青睐 [1] - 游戏板块复苏回暖趋势强劲,行业景气度提升 [1] 版号发放情况 - 5月国家新闻出版署发放144个游戏版号(国产130个+进口14个),刷新近两年单月发放纪录 [1] - 3月版号发放同样创近期新高,显示政策端持续宽松 [1] 市场规模与增长 - 2025年4月中国游戏市场规模达273.51亿元,同比增长21.93%,其中移动游戏同比增28.41% [1] - 游戏出海收入同比增长9.62%,《王者荣耀》《原神》等长线产品及《Last War》等出海产品为主要驱动力 [1] - 2024年全球游戏产业收入1877亿美元,中国占比超30%,自研游戏收入占比超80% [2] 行业趋势与投资方向 - IP潮玩被列为新消费核心赛道,现场演出&IP衍生属于高景气度领域,预计保持快速增长 [2] - 传媒板块明线为AI应用起势,暗线为文化自信,2023年闭源大模型爆发后,2024年或成中国开源大模型爆发年 [2] - 游戏板块调整后核心资产进入配置窗口,产业端重点关注游戏出海催化 [2] 相关ETF布局 - 游戏ETF(159869)聚焦A股IP游戏产业龙头 [2] - 文娱传媒ETF(516190)均衡覆盖营销、影视、文旅、IP潮玩等领域 [2]
传媒行业周观察(20250526-20250530)
华创证券· 2025-06-03 08:25
报告行业投资评级 - 推荐(维持)[1] 报告的核心观点 - 当下传媒板块明线为AI应用起势,暗线为哪吒带来的文化自信,需锐度和配置并重;看好2025年成为中国开源大模型的爆发及应用格局重塑之年,分三步发展,第一步公有云价值重塑+产业重回增长,第二步有平台有用户有场景但缺大模型能力赋能或此前未下定决心的公司,第三步C端场景不断落地 [5] - 端午假期北京玩心展火热,持续看好IP潮玩赛道长线景气度,看好多元品类驱动的行业增长机会 [5] - 互联网核心资产建议逢低布局,长期看好美团,关注阿里、腾讯、快手等 [5] - 游戏关注产品周期驱动和AI布局深入两条逻辑 [5] - 出版是优质配置方向,看好教育出版红利属性+积极布局AI教育等新业态 [5] - 端午档大盘边际好转,当前暑期档预期弱,关注暑期档催化 [5] 根据相关目录分别进行总结 上周市场表现回顾 - 上周传媒(申万)指数整体上涨1.74%,同期沪深300指数整体下跌1.08%,板块跑赢沪深300指数2.82%,位列所有板块第6位;元隆雅图、时代出版等领涨,值得买、梦网科技等领跌;港股互联网科技板块众安在线、快手 - W等领涨,金山软件、比亚迪电子等领跌 [5][8][9][12] - 游戏市场腾讯系产品在2025年5月24日至2025年5月30日游戏iOS畅销排行中上榜较多居领先位置,网易系紧随其后,其他厂商部分产品排名靠前,新游方面网易《冰汽时代:最后的家园》等多款游戏有上线或测试计划 [16][17] - 电影市场截至5月30日,2025年电影大盘票房(不含服务费)245.45亿元,观影总人次5.88亿人,票房大盘已恢复约98%,观影人次已恢复约86%;5月26日 - 5月30日整体票房11235.5万元(不含服务费),观影人次317万人,平均票价35元;上周院线上映电影TOP5为《碟中谍8:最终清算》等,五部影片票房及占比各有不同;2025.6.2 - 2025.6.8待上映重点影片有《疾速追杀:芭蕾杀姬》等 [19][22][26][28] 行业重要新闻与重点公司公告 - 行业重要新闻:《王者荣耀》登顶2025年4月全球手游收入榜;泡泡玛特暂停Labubu在英国销售;快手可灵AI上线2.1系列模型;HYBE将所持SM娱乐股份全部出售给腾讯音乐娱乐,交易金额约12.9亿元 [31][32] - 公司公告:美团发布2025年一季度财报,营收超预期,经调整净利润总额增长;快手发布2025年第一季度财报,总营业收入增长,用户数据表现良好;金山软件发布2025年第一季度业绩,收益同比增长;拼多多发布2025年一季度业绩,营收同比增长 [33][34][35][36] 重点公司估值 - 展示了A股重点传媒公司如神州泰岳、三七互娱等的股价、总市值、PE、EPS、营收、归母净利润等估值情况 [38] - 展示了港股重点互联网公司如腾讯控股、美团 - W等的股价、总市值、PE、PS、Non - GAAP净利润、营收等估值情况 [39]
“开源大模型之城”,为何是杭州?
搜狐财经· 2025-05-30 15:09
杭州开源大模型发展概况 - 杭州市政府将DeepSeek、通义千问等大模型写入2025年工作报告,定位杭州为"开源大模型之城" [1] - 杭州包揽HuggingFace开源大模型榜单前三名(阿里通义千问、DeepSeek、群核科技),成为全球唯一拥有3个顶级开源模型的城市 [3] - 开源模式推动AI产业变革:通义千问2023年8月国内首个开源,阿里累计开源200多款模型,衍生模型超10万;群核科技从发布到上榜仅10天 [4] 核心企业竞争力分析 - 阿里通义千问:定位"全能型选手",构建全球最大开源模型族群,提出"让天下没有难做的AI应用"理念 [4][5] - DeepSeek:以开源+低成本颠覆行业,改写硅谷闭源垄断模式,推动全球AI产业格局变化 [3][4] - 群核科技:空间智能领域细分龙头,在空间理解模型领域占据领先优势 [4] 产业生态构建要素 **人才储备** - 杭州AI人才储备全国第二,形成"浙大系+阿里系"双轨体系:浙大最早研究AI的高校之一,阿里培养10万量级数字人才 [10] - 之江实验室(浙大+阿里+省政府共建)聚焦AI领域,促成校企协同创新 [10] **算力基建** - "1+N"公共算力网络使企业单位算力成本降40%,2023年推出"算力券"制度 [6] - 杭州人工智能计算中心整合"硬件-软件-算法-应用"全链条,构建产学研生态圈 [11] **资本支持** - 过去五年杭州AI领域融资超1200亿元(全国第二),国有资本直投仅12%但有效撬动社会资本 [12] - 资本结构多元:国有资本+产业资本(阿里战投/蚂蚁)+硬科技基金(银杏谷/元璟)+民间资本 [12] 城市发展模式创新 - 政策创新:早期出台"创新免责条款",监管灵活开明,考核机制包容决策失误 [5] - 场景开放:城市大脑形成"123N"体系(1个智能中枢+2大数智产品+3步骤+N行业模型),企业存活率68%(高于全国23个百分点) [7] - 组织协同:建立"龙头企业+隐形冠军+初创企业"共生网络,产业联盟实现动态资源配置 [8]
早报|特朗普称哈佛大学国际生比例最高15%;泡泡玛特回应Labubu品控问题;苹果计划全面重命名操作系统;荣耀回应机器人业务
虎嗅APP· 2025-05-29 07:55
热点追踪 - 美国总统特朗普要求哈佛大学公开外国学生名单并提议将国际生比例上限设为15%,当前比例为31% [2] - 美国政府近期采取多项措施限制哈佛大学,包括取消其国际学生招生资质、暂停联邦资金及加强签证审查 [2] 中美经贸合作 - 中国副总理何立峰会见摩根士丹利联席总裁,强调中国开放政策将为全球经济增长提供动力,欢迎美资机构深化合作 [3] - 外交部重申中美经贸关系互利共赢,指出美国企业订单激增及航运需求旺盛反映双边市场潜力 [4] 消费品与文娱 - 泡泡玛特Labubu系列产品因品控问题遭消费者投诉,包括歪头、掉漆等缺陷,公司回应称属正常工艺现象 [5][6] - 抖音专项治理体育领域网暴,清理针对运动员陈芋汐的不友善言论 [7] 大公司动态 - 滴滴企业版成为3M中国首家出行服务商,已服务超3000家外企,过去12个月外企用车单量同比增长39%,节省成本8800万元 [8] - DeepSeek开源R1大模型新版本,测试显示性能接近OpenAI最新o3模型 [9] - 苹果计划将操作系统命名改为年份制(如"iOS 26"),以统一品牌标识 [10][11] - 英伟达Q1营收441亿美元(同比+69%),净利润187.8亿美元(同比+26%),数据中心收入391亿美元(同比+73%) [13] 汽车行业 - 德国宝马、奔驰、大众正与美国商务部谈判,拟通过增加在美投资换取关税豁免 [14] 医药健康 - 国家医保局核查全国23997家定点药店,发现9563名药师存在"挂证"违规行为 [15][16] - 复星医药与九源基因达成合作,获得司美格鲁肽等产品在中东、非洲及部分东盟国家的独家商业化权益 [17] 科技与创新 - 荣耀CEO李健宣布进军机器人赛道,展示跑步速度达4m/s的机器人产品 [12] 国际事务 - 特朗普称美伊核协议或于未来几周达成,并提议带检查人员赴伊朗 [18] - 俄外长称俄乌第二轮谈判筹备中,双方此前已就战俘交换达成共识 [19][20] - 以色列总理内塔尼亚胡宣布哈马斯加沙指挥官辛瓦尔死亡 [21][22] - 韩国总统选举启动"事前投票",民调显示李在明以49.2%支持率领跑 [23]
78%主创跳槽,Llama 14名作者只剩3人,Meta最强开源模型团队大溃散引争议
36氪· 2025-05-27 20:19
AI 人才争夺战愈演愈烈,就算是顶级大厂,如果没有"护城河",也留不住人。 据外媒 Business Insider 最新消息,曾在开源大模型圈子里一度领跑的 Meta,如今正面临严重的人才流失。在 Llama 模型最初的 14 位核心作者 中,已有 11 位离职。有的自立门户,有的跳槽去了竞争对手。 这波"出走潮"也让外界再次把目光投向 Meta。毕竟他们曾豪赌元宇宙,四年"烧掉"450 亿美元,却被直指至今几乎未见显著成效。现在 AI 项目 也出问题了,不少人开始质疑:Meta 还行不行?为什么留不住顶尖 AI 人才?它的创新能力,还能支撑它在这场 AI 竞赛中跑多远? Llama 论文的 14 位作者,已有 11 人离开 Meta 回头看 2023 年那篇引发轰动的 Llama 论文,共署名 14 位研究者。短短两年,Meta 只留下了其中三位:研究科学家 Hugo Touvron、研究工程师 Xavier Martinet 和项目负责人 Faisal Azhar。 论文地址:https://arxiv.org/pdf/2302.13971 其他 11 人,大多已经离开,分散到了全球多家科技公司,有的还 ...