开源
搜索文档
魔搭社区2周年:7万模型、1600万开发者如何成为创新中心
环球网· 2025-07-01 13:50
公司发展 - 魔搭社区成立两年半已托管超7万个开源模型 服务全球1600万开发者 [1][2] - 模型数量从早期100+增长200倍至7万+ 用户数量从100万扩展至1600万(增长16倍) 覆盖36个国家 [5] - 贡献机构超500家 包括谷歌 英伟达 腾讯 DeepSeek等头部企业及中科院等科研机构 [3][5] 商业模式 - 采用开放中立非营利原则 不干预模型上传 与Hugging Face模式类似但发展更快 [3][5] - 推出"模型即服务"(MaaS)模式 提供全链路开发支持 覆盖LLM 对话 文生图等4000+工具 [6] - 整合VUM Ollama等推理工具链 联合云厂商提供免费Notebook算力降低企业部署成本 [6] 行业影响 - 70%创新应用来自开发者二次创作 包括工作流Agent搭建 垂直场景工具开发等 [8] - 推出开发者勋章计划 提供免费GPU算力等资源激励创新 [8] - 与中科院 之江实验室共建生态 推出跨学科工具链推动AI渗透基础科学领域 [8] 技术布局 - 同步优化云端和端侧工具链 阿里千问开源时专门推出小尺寸版本适配终端场景 [6] - 2023年首发文本生成视频开源模型 2024年上线AIGC创作者专区 2025年推出MCP广场连接应用生态 [8] - 多模态模型理解能力提升 已实现化学模型理解物理论文等跨学科应用 [8] 生态定位 - 深度捆绑"工具链+社区+产业对接"模式 避免巨头割据并降低创新门槛 [9] - 成为国内外模型团队首选首发阵地 DeepSeek 阶跃星辰等重磅成果选择魔搭首发 [5][7] - 平台促进模型贡献者与使用者双向奔赴 激发模型应用无限可能 [7]
华为又开源了个大的:超大规模MoE推理秘籍
量子位· 2025-07-01 13:30
华为Omni-Infer开源项目 - 华为开源超大规模MoE模型推理框架Omni-Infer,提供架构、技术和代码全套解决方案 [2] - 项目定位为"加速套件+最佳实践",支持昇腾推理集群快速部署 [8] - 包含推理框架和推理加速套件两大核心组件,与vLLM等主流框架解耦且独立安装 [12][17] 技术特性 - 支持PD分离部署方案,针对QPM进行系统级优化,分享商用硬件使用方法论 [3] - 兼容vLLM/SGLang等主流框架,降低用户版本维护成本 [16][18] - 优化MoE模型支持,具备EP144/EP288配置能力及动态专家放置功能 [24] - 预集成CANN/Torch-NPU依赖包,通过Docker镜像开箱即用 [21] 生态合作 - 北京智源研究院FlagScale框架已接入Omni-Infer [5] - 上海人工智能实验室DeepLink计划协同拓展生态 [6] - OpenI启智社区将共建算力网开源生态 [7] - 采用两级社区治理机制(PMC+SIG),主动适配国内AI开源项目 [27] 部署方案 - 当前仅支持CloudMatrix384推理卡及Linux/Python 3.9-3.11环境 [25] - 提供4机2P1D自动化部署框架,实现任务调度与负载均衡 [22][24] - 优化注意力机制,提升LLM/MLLM/MoE模型性能与扩展性 [24] 开源进展 - 兑现技术报告承诺,开源DeepSeek V3/R1部署关键技术 [9][27] - 开放社区治理文档,参与OpenInfra基金会Meetup活动 [27][28] - 代码托管覆盖Gitee/GitHub/OpenI/GitLink多平台 [29]
魔搭开始在AI应用中挑大梁
华尔街见闻· 2025-07-01 12:25
魔搭社区发展概况 - 魔搭社区已成为中国最大的AI开源社区,汇聚超500家贡献机构,托管开源模型数量超7万个,较成立初期增长超200倍 [2][3] - 用户数量从2023年4月的100万扩展至1600万,增长约16倍 [2] - 社区定位为开放、中立、非营利组织,旨在推动AI技术普惠化 [3] 生态建设与技术创新 - 2023年8月阿里云开源通义千问模型Qwen-7B,开启通义千问开源进程 [5] - 2024年推出AIGC专区,覆盖图片、视频创作及模型训练服务 [5] - 2025年引入DeepSeek系列模型、阶跃星辰Step-Video-T2V视频生成模型等首发项目 [5] - MCP广场上线后发布超4000个服务,支持开发者调用超1亿次 [6] 开发者支持体系 - 推出全链路服务支持模型体验、下载、调优、训练、推理及部署,覆盖LLM、多模态等多元领域 [6] - 启动开发者勋章激励计划,提供免费GPU算力及AIGC专区高阶训练券等奖励 [6] - 未来计划扩展勋章激励至代码搭子、布道搭子等贡献群体,并覆盖社区活跃行为 [7] 行业趋势与战略方向 - 开源被视作大模型创新的核心驱动力,模型作为生产元素通过开源加速产业普及 [4] - 端侧模型与云端协同被视为重要发展方向,社区将重点支持手机、汽车等终端场景 [10][11] - 强调模型需解决实际问题,开发者二次创新(微调、产品化)是填补基础模型与应用间Gap的关键 [16] 竞争与合作生态 - 国内头部厂商如华为、腾讯、DeepSeek等加速拥抱开源,魔搭社区承担技术连接开发者桥梁角色 [14] - 社区坚持开放中立原则,不干预开发者自然选择,所有贡献者获同等支持 [13][14] - 中国开发者社区快速成长得益于技术追求精神与日新月异的AI创新环境 [15][16]
AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”
AI前线· 2025-06-29 14:09
全球AI投资与竞争格局 - 全球科技巨头在AI基础设施上的投资达3250亿美元,采取"先烧钱、后吃肉"战略推动大模型技术发展 [1] - 中国企业如昆仑万维在多个AI领域实现反超,业务覆盖全球100多个国家,布局涵盖音乐社交、浏览器、AI音乐等前瞻性领域 [1] - AI竞技焦点正从模型能力转向场景落地和市场份额抢占,行业进入应用深化阶段 [2] 昆仑万维业务表现与战略 - 2025年Q1总营收17.6亿元,同比增长46%,94%收入来自海外市场 [2] - AI音乐业务年化流水1200万美元,单月突破100万美元,短剧平台Dramawave年化收入达1.2亿美元 [2] - 采取多点并进策略,布局AI大模型、搜索、游戏、音乐、视频、社交六大方向,通过市场反馈动态调整资源分配 [14][16] - 研发投入占比显著,2023年营收56亿中研发达15亿,支撑多方向探索能力 [17] AI技术演进与行业影响 - AI从信息化迈向智能化,具备处理非重复性工作的能力,对基础科学和应用科学均产生催化作用 [5][6][8] - 视频生成技术当前局限在5-8秒片段,但预计1-2年内可实现1-3分钟完整视频生成,短剧和广告将成为最先落地场景 [35][36] - 行业人才结构将发生分化:顶尖从业者效率提升10倍,新人成长周期从2-3年缩短至2-3个月,中间层面临最大冲击 [8][9] 中国企业全球化优势 - 中国AI领域形成"中美双强"格局,论文作者中中国学者占比达80%,工程师年培养量370-390万全球第一 [20][22][24] - 出海成功三要素:选择T0-T1高价值市场、深度本地化运营、产品差异化创新 [26][27] - 管理层一线调研至关重要,如在非洲开拓时通过实地测试发现QUIC协议可显著提升3G/4G混合环境成功率 [29][30] 开源生态与商业化 - 开源模式两大价值:满足长尾需求形成社区粘性、低成本获取高质量销售线索 [45][46] - 大模型开源面临训练成本高企的挑战,但随着算法优化和硬件成本下降将逐步平民化 [47][48] - 当前开源痛点在于算法研究与产品化脱节,需强化用户需求导向,参考Stable Diffusion生态成功案例 [50][51] 技术人才发展建议 - 技术人员需培养产品思维和商业思维,理解用户需求和商业模式才能突破职业天花板 [53] - 终身学习是应对AI变革的核心能力,需建立系统化学习方式对抗信息碎片化影响 [54][56] - 行业不存在"终极一战",技术持续演进,关键保持适应变化的敏捷性 [55]
爷青回!微软用 Rust 复活 34 年前神器,Linux 用户笑疯了
程序员的那些事· 2025-06-26 08:36
微软复刻经典编辑器Edit 产品发布与市场反响 - 公司推出基于Rust开发的开源跨平台文本编辑器Edit,支持Windows/macOS/Linux系统,复刻1991年MS-DOS 5.0的经典编辑器[1] - 产品在GitHub开源后获1万Star,Linux用户可通过snap包安装,Rust编译的二进制文件仅250KB[5][6] - 开发者社区评价总体积极,独立AI研究员实测认为其体验优于Vim和nano,跨平台特性引发怀旧热潮[4][5] 技术演进与产品特性 - 原版MS-DOS编辑器取代了反人类的EDLIN,首次引入全屏界面、鼠标支持和下拉菜单,成为命令行向图形界面过渡的标志[2] - 新版Edit保留轻量化设计(250KB),新增Unicode支持、正则表达式和千兆级文件处理能力,远超原版300KB文件限制[7] - 开发动机源于64位Windows系统缺乏默认CLI编辑器,而32位系统原集成MS-DOS编辑器[4] 历史意义与行业启示 - 1991年MS-DOS编辑器通过引导QBasic实现代码复用,体现公司早期资源优化策略[6] - 34年后相同设计理念仍适用,反映文本编辑核心需求未变,在AI编程时代可能引发对简单工具的重新关注[7][8] - 产品实现从DOS到Linux的技术传承,突破历史对立(公司曾称Linux为"毒瘤"),展现开放生态转变[1][6]
圆桌讨论:AI应用趋势的破界对话丨WAVES新浪潮2025
36氪· 2025-06-18 10:58
中国创投新纪元 - 中国创投市场处于周期筑底转折点与结构性转型深化期 政策主导、国资与资本高度集中的新生态要求顺应趋势灵活调整 [1] - 36氪WAVES新浪潮2025大会聚焦AI技术革新、全球化浪潮与价值重估 汇聚创投领域顶级投资人及科技商业领袖 [1] AI应用趋势圆桌讨论 企业介绍 - **戴盟机器人**:聚焦机器人灵巧操作能力 通过视触觉传感器DM-Tac W、五指灵巧手DM-Hand1及数据采集系统DM-EXton实现"感知-操作-学习"全链路贯通 [4][5][6] - **Zadig**:开源云原生DevOps平台 将AI落地至奶茶、新能源车等生活场景后端系统 [6] - **葱花投研**:专注REITs领域AI投研 通过AI提升传统金融数据提取与量化分析效率 [7] - **AMD**:覆盖云边端全场景算力 联合生态伙伴推动AI处理器创新 [8] - **ChatExcel**:北大团队开发的AI表格处理工具 国内首款通过聊天交互处理Excel数据的原生智能体产品 [8] 技术趋势判断 - **硬件层**:AMD观察到AIPC从DEMO到成熟应用的快速迭代 终端侧模型参数从7B跃升至235B 芯片厂商与应用方呈现双向奔赴态势 [10] - **软件层**:企业级AI落地仍具挑战 需聚焦数据所在场景而非创造新需求 如Zadig通过DeepSeek大模型提升DevOps精准度与效率 [11][12] - **商业化验证**:ChatExcel经历C端免费到B端付费转型 用户需求明确为准确性(100%)、处理多样性及数据安全 [13] - **垂类应用**:葱花投研在REITs领域需解决传统行业数据化难题 依赖AI中间层工具快速迭代提升投研能力 [14][15] - **具身智能**:戴盟机器人强调阶段性落地价值 工业场景如药品分拣、金属打磨已实现80%-90%替代 需从结构化向通用化场景延伸 [16][18][19][20][21] 商业化路径 - **场景选择**:Zadig提出"热启动"策略 基于现有业务数据嵌入AI杠杆 非技术出身的葱花投研通过行业Know-How先行验证B端付费逻辑 [22][25][26] - **生态协同**:AMD建立应用创新联盟 整合推理引擎、算法优化等中间层伙伴 通过海外资源助力商业化拓展 [28][29] - **团队定位**:ChatExcel强调速度与战略定力 需直面大厂竞争并聚焦真实付费需求 商业化核心是"活下去"而非理想化产品 [30] 外部支持需求 - **资源类**:创业团队亟需资金、人才与增长支持(ChatExcel) 低成本的ToB试验田与快速决策合作方(Zadig) [31][34][35] - **技术类**:垂类应用需要更成熟的中间层工具支持(葱花投研) AI人才稀缺成为行业瓶颈(戴盟机器人) [32][36]
“开源”如何支持浙江数字经济?乌镇这场会议给出关键答案
搜狐财经· 2025-06-16 06:18
开源鸿蒙生态发展现状 - 开源鸿蒙已完成100+款芯片适配,推出300+款应用,代码量超1.3亿行,贡献者规模接近万名 [1][5] - 覆盖教育、金融、交通、政务、医疗、航空等多个行业,消费电子领域鸿蒙电脑、Pura X、nova系列等设备均搭载HarmonyOS 5 [13] - 成为智能终端领域发展速度最快的开源操作系统之一,开机画面显示"Powered by OpenHarmony"标识 [13] 浙江开源生态战略布局 - 浙江将开源视为软件产业高质量发展的关键动力,与鸿蒙万物智联生态理念高度契合 [2][8] - 计划建立高水平开源社区,攻坚标杆性创新项目,依托大模型培育具身智能产业链 [17] - 推动产学研协同创新,高校拟开设开源技术课程或联合企业建立实验室加强人才培养 [17] 技术应用与产业赋能 - 开源鸿蒙作为统一技术底座,构建"千行百业+千家万户"共享生态体系 [12] - 蚂蚁数科通过mPaas平台实现移动应用快速鸿蒙适配,提升用户体验 [13] - 智慧政务、交通、金融、医疗等领域企业已开展鸿蒙生态实践,展现数字化转型成效 [13][14] 全球开源竞争力 - 全球最大AI开源社区HuggingFace趋势榜单前三名(DeepSeek-V3-0324、群核SpatialLM、通义千问Qwen2.5)均来自浙江,超越英伟达、谷歌 [8] - 华为将加大开源鸿蒙投入,与浙江企业共建生态,为国家开源建设提供示范 [14] - 浙江目标打造融合民营经济基因与开源价值观的全球数字文明"东方样本" [19]
SGLang 推理引擎的技术要点与部署实践|AICon 北京站前瞻
AI前线· 2025-06-13 14:42
SGLang 开源推理引擎发展现状 - 截至2025年6月 GitHub Stars达15K 月均下载量突破10万次 [1] - 已被xAI Microsoft Azure NVIDIA AMD LinkedIn 美团等行业巨头采用 [1] - 成为DeepSeek R1官方推荐推理引擎 并实现首个完全开源的大规模专家并行部署方案 [1] 核心技术优势 - 采用PD分离架构控制尾延迟 推测解码提升Token生成速度 KV缓存落盘优化显存 [2] - 实现RadixAttention Overlap Scheduling等高效架构设计 复现PD分离 大规模EP等前沿技术 [3] - 支持离线批处理最大化GPU利用率 线上推理优先保障Token生成速度的差异化部署策略 [4] 并行部署技术挑战 - 专家并行实现中面临通讯与Prefill/Decode传输KV缓存的时间重叠问题 [4] - 网卡资源争抢 CPU负载过大 Python GIL锁释放不及时等工程挑战突出 [4] 社区生态建设 - 开源模式吸引广泛参与 技术分享增强社区认同感 [5] - 超过100k显卡规模的工业部署经验反哺技术演进 [5] 关键技术解析 - PD分离使Decode延迟均匀稳定 允许采用不同并行策略提升资源利用率 [6] - 推测解码通过隐藏层信息一次预测多个Token 显著提升Decode速度 [6] - KV缓存落盘将历史上下文存储至大容量设备 避免重复Prefill计算 [6] 部署实践洞察 - 参数配置调试是影响上线效率的关键环节 需精细化优化而非依赖"开箱即用" [7] - 模型规模持续扩大背景下 多GPU与高效并行策略是实现高性价比部署的必经之路 [7] 行业活动预告 - AICon全球人工智能开发与应用大会将深入解析大模型推理关键技术 [2][7] - 聚焦AI Agent构建 多模态应用 大模型推理优化等前沿议题 [7]
“变色龙”芯片赛道蓄势待发国产厂商加紧追赶
证券时报· 2025-06-11 03:23
FPGA行业动态 - AMD庆祝首款商用FPGA问世40周年 [1] - 中科芯磁完成数千万元战略投资 [1] - 紫光同创拟开启IPO [1] - 英特尔以44.6亿美元出售Altera 51%股份 [1] - Altera新战略方向指向AI驱动的高增长市场 [1] FPGA技术特点 - 具备"现场可编程"和"可重构性"优势 [2] - 具有并行处理能力强、延迟小、开发周期短等核心优势 [2] - 高并行架构赋予高实时性和高带宽特性 [3] - 可根据特定应用需求进行定制化开发 [3] - 相比ASIC开发周期更短,Time to market更快 [3] - 在8K视频处理中可实现3300万像素/帧的并行处理 [3] 市场规模与增长 - 全球FPGA市场规模2025年预计达111.4亿美元,2030年187.6亿美元,CAGR 10.98% [4] - 2023-2030年全球CAGR预计10.8%,2030年达233.4亿美元 [4] - 中国FPGA市场规模2024年预计249.9亿元,同比增长19.78% [4] - 2025年中国市场规模预计突破332.2亿元,2025-2030年CAGR 22.5% [4] 行业格局 - 国际市场由Xilinx和Altera主导,份额超70% [5] - 国内主要厂商包括紫光同创、安路科技、复旦微电等 [5] - FPGA契合AI、边缘计算、机器人技术等高增长领域需求 [5] - Altera新战略聚焦边缘计算和机器人技术等新兴市场 [5] - 复旦微电将丰富FPGA产品系列满足AI和数字通信需求 [5] - 安路科技已推出多款高性能FPGA产品,探索新兴领域应用 [6] 行业挑战 - FPGA面临性能、功耗及成本挑战 [7] - 设计和制造工艺复杂导致单价较高 [7] - 运行功耗较高,限制在移动终端等领域的应用 [7] - 开发工具和软件生态系统不够完善 [7] - 国内厂商在超大容量FPGA芯片、EDA软件、高端应用方面存在差距 [8] 开源趋势 - RISC-V开源架构降低芯片设计门槛和成本 [9][10] - RISC-V硬核与FPGA结合架构显现优势 [10] - Zero ASIC发布全球首个100%开源eFPGA IP产品Platypus [10] - 开源可降低开发成本但面临安全挑战 [11]
对话 PyTorch 掌门人 Matt White:AI 应用应该做到“润物细无声”
AI科技大本营· 2025-06-09 18:41
AI开源生态现状 - 开源AI形成自我加速的良性循环,但"开放"定义权争夺战已悄然打响[1] - 部分机构通过限制性许可证进行"Open-washing",享受开源声誉红利却不给予实际自由[3] - 传统软件许可证难以适应AI模型复杂性,需专门为开放模型/数据/权重设计的新型许可证[6][7] 行业标准化进程 - PyTorch基金会推出"模型开放框架"(MOF)分级标准和OpenMDW许可证,明确开放定义[4] - Linux基金会作为中立第三方推动协议标准化,降低厂商锁定风险[9][10] - 70%-80% PyTorch文档流量来自中国,反映其在该市场的广泛采用基础[6] 技术发展趋势 - 具身智能领域需机器人操作系统、行为模型等工具支持,PyTorch成为主流训练框架[10] - AI智能体架构创新加速,开源社区需建立通用接口协议构建技术底座[8][9] - 生成式AI工具需保持human-in-the-loop模式,避免完全自动化导致的幻觉问题[12] 企业战略动态 - Meta、谷歌、微软等竞争对手在PyTorch基金会实现开源协作,共同提升框架性能[8][9] - Adobe等公司通过隐形AI集成实现技术价值,降低用户学习成本[12] - 中国DeepSeek-R1与海外Llama 4等开源模型推动开放定义演进[6] 人才与教育 - AI时代教育者需率先掌握人机协作技能,平衡工具使用与核心能力培养[13] - PyTorch启动大使计划培育区域社区,通过20分钟短演讲展示多元创新项目[11] - 认证培训项目需应对氛围编码、智能体系统等新兴技能需求[13] 行业风险警示 - 数字内容真实性危机迫近,合成媒体以假乱真威胁信息生态[15] - 技术滥用导致假消息泛滥,需建立C2PA等数字水印验证机制[15] - 监管需平衡创新空间与风险防控,过度限制将阻碍行业发展[14]