开源社区
搜索文档
从“内卷”到“竞合”:大模型时代,开源社区能否带领国产OS“场景突围”?
格隆汇· 2025-11-18 20:23
AI对计算体系的重构 - AI正在对传统计算体系发起彻底重构,操作系统面临重新定义[2] - 操作系统从PC/云计算时代的资源管理者转变为AI时代的算力“传动装置”[2][5] - 行业选择操作系统的标准不再是“优势品牌”,老牌厂商面临颠覆可能性[4] AI操作系统的核心特征 - 对上需支撑大模型及智能体的复杂应用,涉及记忆能力、工具使用能力和思考链[4] - 对下需管理多元异构算力与超节点,包括GPU、DPU、CPU及各种AI芯片的混合体[4] - 操作系统核心价值转变为高效智能地组织和调度异构资源,直接决定AI应用门槛与广度[5] 国产操作系统的现状分析 - 国产OS在全局性上与国际顶级系统仍有差距,缺乏统一生态的“交互界面”[6] - 国产系统被迫在多元异构环境中求生,在支持国产多元化算力方面积累独特经验[6] - 过去五年从100家伙伴发展到1000家,装机量突破千万,完成从替代到可用的转变[2][7] 国产操作系统的竞争优势 - 场景复杂度优势:并行处理互联网规模、企业业务、政务安全、金融稳定、AI增长等多重需求[6] - 开源社区优势:开源让多厂商在相同底座上协同创新,社区与商业组织共同推动发展[7] - 产业互补性优势:国内产业链互补性强,开源社区能聚合芯片、服务器、云平台共同需求[7] 国产操作系统的发展路径 - 成立“智算联盟”吸纳沐曦、寒武纪等AI算力公司,解决使能、可靠性、产品化等工程难题[7] - 需要“百花齐放”的竞合模式,多个社区并行发展而非低水平内卷竞争[8][10] - 以通义Qwen、DeepSeek等开源大模型为共同场景,向上服务模型,向下服务多元异构算力[10] AI时代的行业展望 - 系统从稳定器转变为被模型、算力、算法牵引不断前移的动态组件[11] - 国产系统突围不能依赖过去路径或单一推进方式,而需在冲突合作中共同演进[11][12] - 当计算范式重写时,基础软件体系有机会抓住重置窗口,成为重构参与者而非旁观者[12]
大模型优秀大脑齐聚硬核开源聚会,SGLang社区举办国内首次Meetup
机器之心· 2025-10-28 14:29
SGLang技术特性与架构 - 开源高性能大语言模型和视觉语言模型推理引擎,起源于RadixAttention,由非营利组织LMSYS孵化[7] - 核心特性包括快速后端Runtime(支持RadixAttention前缀缓存、连续批处理、推测性解码等)、广泛模型支持(兼容多数Hugging Face模型和OpenAI API)、广泛硬件支持(NVIDIA/AMD GPU、Intel Xeon CPU、Google TPU、华为昇腾NPU等)以及灵活的前端语言[14] - 在行业内得到广泛采用,全球范围内为超过30万块GPU提供支持[14] SGLang近期技术进展与路线图 - 技术进展包括KV Cache分层缓存、Piecewise CUDA Graph、Spec Decoding的重叠调度等,实现不同程度的效率和兼容性优化[21] - 未来路线图聚焦于对广泛企业的支持、对各类软硬件的拓展兼容和稳定性[22] - 量化方案近期实现了FP4量化支持,W4AFP8达成实现,未来路线图聚焦扩展应用范围、提升灵活性并引入新型数据格式[34][35] 产学研合作与生态整合 - 清华大学与SGLang合作推进Mooncake高性能分布式KV Cache存储解决方案及KTransformers集成,实现从CPU/GPU混合推理到LoRA微调的全流程开源生态扩展[25][27] - SGLang与趋境科技合作进行HiCache技术整合,通过多层次缓存管理与层页混合内存布局提升多GPU场景内存利用率与推理吞吐性能[25][26] - Slime项目构建公司与开源社区共建共赢的训练生态,实现技术与社区双向循环成长,目标成为世界最好的后训练框架[51] 行业应用实践案例 - 百度搜索架构部在文心4.5模型大规模部署中采用SGLang,应用于LLM推理、蒸馏和RL训练,并进行了特定模型优化、小卡优化和调度优化[41] - 腾讯微信搜一搜业务在LLM应用中采用SGLang实现高吞吐量与低延迟推理,优化首字速度TTFT和生成速度TPOT指标[44] - 华为通过SGLang实现DeepSeek V3.2在NPU上的适配优化,采用MQA+稀疏注意力方案在长序列推理中显著提升性能与资源利用率[47] 社区发展态势 - SGLang在北京举办国内首场Meetup,吸引来自知名公司、学校或组织的社区贡献者、开发者和学者参与,显现旺盛社区活力和发展潜能[4][8] - Meetup活动涵盖技术架构演进与应用实践分享,形成高密度硬核开源社区思想碰撞[10][11] - Specforge开源投机采样模型训练框架已应用于美团、英伟达、Google、蚂蚁等企业大模型优化,与SGLang完全结合开箱即用[57]
今日暴论:Deepseek-OCR干翻了所有架构
自动驾驶之心· 2025-10-27 08:03
技术突破 - DeepSeek发布新模型DeepSeek-OCR,其核心创新在于使用图像作为AI的“记忆载体”,而非传统的文字token [3][6][7] - 该技术可将大量文字信息转化为一张图片进行存储,实现极高的信息压缩比,仅需原本十分之一的token即可存储几乎相同的文字信息 [1][12][40] - 在文档理解任务测试中,DeepSeek-OCR仅用100个视觉token就超越了需要256个token的GOT-OCR 2.0模型,用不到800个视觉token就超越了平均需要6000+ token的MinerU 2.0模型 [13][14] 性能优势 - 模型支持多种分辨率和压缩模式以适应不同复杂度的文档,例如仅需64个视觉token表示简单PPT,最多400个视觉token处理文字密集内容,并支持动态调整的Gundam模式 [18][19][20] - 使用图像记忆后,模型能将token数量压缩至原本的十分之一,同时性能损失极小,在压缩10倍时准确率可达原模型的96.5%,即使压缩20倍准确率仍能保持约60% [40][41] - 该技术能显著降低模型计算量,因为对话长度增加一倍会导致计算量增加四倍,而视觉token的运用能有效控制成本 [36][37][38] 数据处理能力 - DeepSeek-OCR不仅能识别文字,还能自动提取并转换复杂信息,例如将论文中的柱状图识别为Excel格式,将有机化合物分子结构图片转化为SMILES格式 [22][24] - 模型会同时记忆图片本身及其位置信息,以及图片附近的文字内容,从而捕获过去被忽略的二维信息 [26][27][32] - 该模型具备高效的数据采集能力,在一张A100显卡上一天可处理20万页以上的训练数据,有望将现有数据重新识别一遍以补充高质量训练数据集 [28][29][35] 技术生态与影响 - DeepSeek-OCR是一个开源项目,其训练数据整合了华为的Wukong数据集,生成样本时借助了百度的PaddleOCR,图像特征提取使用了Meta的SAM,视觉语义理解整合了OpenAI的CLIP模型 [51][53] - 该技术引入了一种类似人类遗忘机制的信息存储方式,近期重要信息以高清晰度存储,而早期不重要信息可压缩存储,这可能增强模型的上下文处理能力 [43][45][47] - 这项突破有望解决行业面临的高质量训练数据短缺问题,因为许多过去未被采集的二维信息(如论文图表)现在可以被有效利用 [32][33][35]
DeepSeek开源的新模型,有点邪门
创业邦· 2025-10-25 18:14
技术突破与核心优势 - 推出新型模型DeepSeek-OCR,其核心创新在于使用图像作为AI的“记忆载体”,颠覆了过去大模型仅依赖文字token处理信息的传统方式[9] - 新模型实现了极高的信息压缩效率,仅用原本十分之一的token数量就能存储几乎相同的文字信息,在测试中仅用100个视觉token就超越了需要256个token的GOT-OCR 2.0模型,用不到800个视觉token就超越了平均需要6000+ token的MinerU 2.0模型[11] - 模型支持多种分辨率和压缩模式以适应不同复杂度文档,从仅需64个视觉token的Tiny模式到支持动态调整的Gundam模式,实现了应记就记、分清轻重缓急的记忆策略[14] 性能表现与效率提升 - 在文档理解任务中,DeepSeek-OCR用仅1/10的token数量就能达到原模型96.5%的准确率,即使压缩20倍,模型准确率仍能保持六成左右[26][27] - 采用图像记忆方式后,大模型运行更省资源,有效解决了长上下文对话中计算量呈平方级增长的问题,将对话长度增加一倍带来的计算量从增加四倍优化到更可控的水平[24] 应用扩展与数据价值 - 新模型能够识别并转换多种复杂格式信息,可将论文中的柱状图自动识别为Excel格式保存,将有机化合物的分子结构图片转化为标准的SMILES格式存储[15][17] - 该技术解决了大模型训练数据短缺的行业难题,能够从二维信息中采集过去无法获取的数据,如论文中的图表和插图信息,在一张A100上一天可采集20万页以上的训练数据[18][22][24] 技术特点与创新理念 - 模型通过不同清晰度存储图像的方式模拟了人类遗忘信息的渐进过程,最近的聊天记录可用高清晰度格式存储,而早年不重要的记录则可压缩保存,这一理念可能增强大模型的上下文能力[28][30][31] - 该研究是开源社区集体成果的整合,训练数据使用了华为的Wukong数据集,生成样本文字借助了百度的PaddleOCR,图像特征提取核心组件采用Meta开源的SAM,视觉语义理解整合了OpenAI的CLIP模型[32]
《2025年全球创新指数报告》发布,中国首次跻身全球前十——中国创新向世界展现新图景
人民日报· 2025-10-01 09:53
全球创新排名与整体表现 - 中国在《2025年全球创新指数报告》中排名提升至全球第10位,首次跻身全球前十,自2013年以来累计上升25位 [1] - 中国在创新投入方面的排名位列全球第19位,较去年提升4位;创新产出排名则位居全球第5位,上升2位 [3] 研发投入与创新基础 - 2024年中国全社会研究与试验发展经费总量超过3.6万亿元,比上年增长8.3%,基础研究投入实现较快增长 [2] - 中国拥有全球规模最大的研发人员队伍,全球百强科技创新集群数量达到26个、占比全球第一,高新技术企业超过46万家 [2] - 多家龙头企业在研发投入与风险投资方面已跻身世界前列,企业供资研发总支出占比等相关细分指标排名全球第二 [2][3] 知识产权与创新产出 - 中国在单位国内生产总值本国人工业品外观设计专利申请量、实用新型专利申请量、商标申请量,创意产品出口额在贸易总额中的占比等相关细分指标均排名全球第一 [2] - 中国在单位国内生产总值本国人发明专利申请量、产业集群发展情况等相关细分指标方面排名全球第二 [2] - 中国在专利申请量等方面连续多年保持全球第一,民用领域如无人机、移动摄像设备等产品的研发转化周期已从过去的数年大幅缩短至数月甚至数周 [3] 人工智能与前沿技术进展 - 人工智能技术显著提高了研发复用率和迭代效率,企业纷纷将人工智能纳入核心战略轨道 [3] - 中国人工智能企业深度求索以显著低于西方同行的成本成功研发出前沿大模型,中国已推出超1500个大模型,其中多数为开源 [7] - 中国在AI硬件领域也展现出强劲势头,为人工智能自主发展提供了坚实支撑 [7] 国际合作与技术输出 - 中国积极推动人工智能技术成果“出海”,例如在巴基斯坦的Kisan360应用、巴西的中国电网大模型、迪拜图书馆的中国机器人以及南非铁路的华为光视联通系统 [4] - 中国提出《“人工智能+”国际合作倡议》和《人工智能能力建设普惠计划》,为各国加速智能化转型提供助力 [4] - 中国正积极扩大开源社区与联合实验室建设,深入参与国际标准制定与评测体系,推动跨境科研数据在合规框架内有序流动 [6] 重点行业发展动态 - 中国工业机器人制造商埃夫特智能机器人股份有限公司在Automatica2025展会上展示了智能喷涂工作站、智能焊接工作站等多款产品 [7] - 中国生物技术领域经历结构性转变,去年进入研发阶段的创新药物数量激增至1250多种,规模已达世界先进水平 [7] - 博世集团董事会主席指出中国已从制造型国家转变为创新型国家,中国正在成为全球智能出行的创新策源地 [8]
从被动修复到主动免疫,探寻汽车软件故障的智慧处方
中国汽车报网· 2025-09-22 17:18
行业挑战与监管背景 - 工信部要求车企清晰界定智能驾驶功能边界并制定安全响应措施,严禁夸大宣传 [2] - 智能汽车软件代码量超过10亿行,远超Windows 10约1亿行的规模,复杂程度成倍增长,潜藏更高风险 [2] - 2024年平台接收新能源汽车软件问题投诉举报3.5万件,占新能源汽车投诉举报总量的2成以上 [4] - 消费者投诉焦点包括智能辅助系统失灵、中控黑屏、未经同意的单方面“锁电”等 [4] 技术架构与开发流程创新 - 行业共识是采用模块化架构降低耦合度,开发软硬分离、分层解耦的新模型 [5] - 汽车开放系统架构将软件划分为应用层、中间件层、基础软件层,各司其职又紧密协作 [5] - 将安全设计嵌入软件开发全流程,例如特斯拉FSD系统每个功能模块配备独立安全监控单元,实现故障隔离 [6] - 采用模型驱动开发可大幅提升软件集成阶段测试故障发现率,缩短测试周期 [5] - 部分车企在辅助驾驶软件中增加“热备份”容错设计,冗余控制器可在200米内迅速接管控制 [6] 人才培养与组织转型 - 行业亟需培养能运用大模型进行高安全等级车载代码编写、验证、测试的复合型人才 [7][8] - 部分高校与企业探索联合培养模式,开设汽车软件人才培训班,注重实践与理论深度融合 [9] - 企业需向敏捷组织架构转型,组建跨职能敏捷团队以提升对用户反馈的响应速度和软件开发迭代效率 [10] - 构建人才生态共享机制,如通过共建联合实验室和“旋转门”计划促进软件工程师在车企与生态伙伴间的双向流动 [10] 开源生态与行业协作 - 开源社区可降低重复开发成本,有车企采用开源社区智能座舱基础框架后,开发周期从2年缩短至1年 [11] - 通过开源工具链共享推动汽车软件标准化建设,统一技术标准以提升软件质量和兼容性 [11] - 建立行业级软件漏洞库实现安全威胁信息实时共享,例如特斯拉牵头的安全联盟将重大漏洞修复周期从30天缩短至7天 [12] - 鼓励互联网企业参与车载软件生态开发,鼓励云服务商开放基础云服务以促进更多增值服务订阅 [13] 未来技术演进方向 - 随着中央计算平台上车,汽车软件架构将向“硬件标准化+软件个性化”方向演进,降低软件耦合风险 [14] - 通过软硬件融合方式保障高等级系统安全与冗余,软件故障的出现和恢复可通过大模型和智能体进行重新设计 [14] - 在大模型基础软件上开发自修复和自进化等高级功能,利用生成式AI自动生成高质量代码框架,提升开发效率和代码质量 [15] - AI机器学习技术可通过学习历史测试数据智能生成测试用例,提升软件可靠性和稳定性 [15]
腾讯云:全面适配主流国产芯片
财联社· 2025-09-16 11:02
腾讯云技术战略 - 腾讯云已全面适配主流国产芯片 [1] - 公司积极参与和回馈开源社区 [1] - 软硬件协同全栈优化为长期战略投入方向 [2] 算力服务能力 - 通过异构计算平台软件能力整合不同类型芯片 [2] - 对外提供高性价比AI算力服务 [2]
外滩大会观察:中国“小虎队”勾勒科技新图景
环球网· 2025-09-11 18:23
中国年轻科技创业者群体特征 - 平均年龄不足30岁 被称为"科创小虎队" 涵盖1985-2000年出生人群[1] - 具备四重核心基因:技术直觉如母语 跨维度思考锐度 产业落地紧迫感 全球技术应用视野[11] - 通过外滩大会等平台集结 参与四十余场论坛 三大技术赛事 一场创投活动[14] 前沿技术突破 - 中国科学院团队实现403秒放电实验突破 专注FRC可控核聚变技术研发与商业化[2] - 电子科技大学研发SlicerDMRI平台 将核磁共振成像时间从90分钟压缩至8分钟[2] - 中国传媒大学开发"白杨智鉴"音视频鉴伪平台 在AI安全赛道获得季军[3] 人工智能领域创新 - DeepWisdom开发全自动AI中台 支持图像 音频 视频 文本 表格五种模态AI设计与生产[9] - 清华大学与蚂蚁研究院合作推出AReaL开源强化学习系统 专为大规模推理模型打造[5] - IDEA研究院开源AI辅助编程工具auto-coder系列 获GitCode2024年度十大开源项目[8] 开源社区贡献 - CAMEL和OWL项目获GitHub超万星标 推动智能体从聊天工具向自主系统蜕变[6] - Deepseek开源R1模型引发全球技术开源关注中国[9] - 开源社区参与规模近2万人 其中00后占比超过一半 最年轻参赛者为初中生[1] 产业应用落地 - 宇树科技以四足机器人技术为核心 推动机器人从实验室走向现实应用场景[3] - Pokee.ai打造一站式通用Agent平台 基于强化学习模型改变企业工作流[10] - 汗青工作室AI歌手Yuri单曲全网播放量突破700万次 与国际一线品牌达成合作[10] 学术研究影响 - 加州大学圣地亚哥分校教授论文被引用近8万次 领导开发全球首个大规模3D数据集ShapeNet[5] - 电子科技大学教授被ExpertScape评为弥散磁共振领域全球Top1%专家[2] - 开源社区CAMEL-AI核心贡献者提出"通用Agent存在规模定律"[6]
亚马逊AWS删用户10年数据陷争议 内部人士称是管理员误操作
犀牛财经· 2025-08-11 15:56
事件概述 - AWS因账户管理问题删除资深开发者长达十年的账户及全部数据 包括关键测试数据 逾20个Rubygem项目代码 多年教学内容和未发布书稿等重要资源 [2] - 开发者指控AWS在身份验证流程中存在操作不当 提交清晰有效的身份证明与账单后仍以"文档无法读取"为由拒绝 并在5天后直接删除账户 [2] 账户删除原因争议 - AWS官方将账户删除归咎于第三方支付人问题 支付人因FTX崩盘失联导致每月约200美元测试费用验证失败 [2] - 开发者反驳AWS拒绝切换回其原本绑定并长期启用的信用卡 违反常理处理流程 未遵循90天数据保留期承诺 [3] - 内部人士透露真实原因为AWS管理员脚本错误 因Ruby与Java语法差异在对休眠账户进行概念验证时误删活跃账户 [3] 行业影响与客户反应 - 受影响开发者在开源社区具有重要地位 其管理客户每月AWS支出超40万美元 [3] - 多个客户已同意迁移至其他云平台 开发者正开发免费AWS迁移工具帮助个人开发者及中小团队导出数据与架构配置 [3]
GitHub 第 10 亿个仓库封神了!官方祝贺认证,全球程序员笑翻:就爱这野路子!
程序员的那些事· 2025-06-16 10:30
GitHub发展里程碑 - GitHub成立于2008年2月29日,运营至今已17年,长期被戏称为全球最大同性交友平台[1] - 平台近期迎来第10亿个代码仓库,标志性项目名为"shit",由用户AasishPokhrel创建[4][6] - 官方员工Jonathan Hoyt(任职12年)在Issues中发帖确认该仓库里程碑地位[7][8] 第10亿仓库事件分析 - "shit"仓库内容为空,但凭借直白命名和特殊意义迅速引爆网络,32小时内获得1800个Star(后续增至2800个)[6][11] - 社区反应热烈:X平台用户调侃其"完美开场",留言区出现大量 表情刷屏[11] - 现象级传播体现开源社区特性:无README文件、无代码、无技术问题,完全依赖社区互动形成热度[11] 平台生态观察 - 事件反映GitHub作为开发者社区的活跃度,单个空仓库能引发全球程序员集体互动[11] - 官方主动参与庆祝,显示对社区文化的包容态度[7] - 里程碑数据印证平台规模:代码仓库总量突破10亿个[4]