开源

搜索文档
DeepSeek小版本大升级,新R1模型代码能力媲美OpenAI o3
第一财经· 2025-05-29 11:04
模型升级与性能表现 - DeepSeek-R1-0528模型完成小版本试升级并在HuggingFace开源平台发布,但官方未更新模型卡及公告 [1] - 海外开发者测试发现该版本代码能力提升显著,在Live CodeBench平台性能接近OpenAI的o3-high模型 [1] - 在代码测试排名中,DeepSeek-R1-0528以Pass@1 73.1、Easy-Pass@1 98.7、Medium-Pass 85.2位列第四,优于Grok-3-Mini和Claude-3系列模型 [3][4] - 开发者实测显示新模型在32K上下文内的文本召回效果优于旧版R1,但60K上下文表现下降 [7] 开发者反馈与横向对比 - 开发者认为新模型写作任务改进明显,输出更自然且减少"量子力学元素"等异常内容 [7] - AI博主测试显示新模型在橙色小球撞击模拟中,漫反射和撞击效果优于Claude-4-Sonnet [5] - 部分开发者认为个案测试不具代表性,需等待评测榜单和长期口碑验证 [7] - Claude-4系列因测试速率限制未参与榜单排名,但其公认编程能力未被纳入直接比较 [5] 版本迭代策略与行业观察 - 公司延续低调更新风格,类似3月发布的DeepSeek-V3-0324也未高调宣传,该版本曾通过强化学习技术提升推理任务表现 [7] - 业内猜测公司可能仅通过调整训练数据实现能力提升,因此不定义为大版本升级,而其他厂商的版本号迭代或为营销需求 [8] - 开发者期待下一代R2模型能显著提升上下文长度和多模态能力,以满足生产需求 [8]
Llama论文作者“出逃”,14人团队仅剩3人,法国独角兽Mistral成最大赢家
36氪· 2025-05-27 16:57
Meta AI人才流失与Mistral崛起 核心观点 - Meta开源大模型Llama的核心团队大规模流失,14位论文作者中仅剩3人留任,多数加入巴黎AI初创公司Mistral或Anthropic、DeepMind等竞争对手 [3][4][6][9] - Mistral由Meta前研究员创立,已吸收一整支前Meta团队,其模型Mixtral和Tiny Mistral在评测中表现优异,成为Meta直接竞争对手 [8][14][15] - Meta开源战略与公司实际发展脱节,Llama系列迭代速度落后于DeepSeek等新势力,且缺乏具备多步推理能力的升级版本 [10][11][12] 人才流动路径 Meta人才迁徙 - Llama架构奠基者Guillaume Lample和Timothée Lacroix于2023年初离职创立Mistral,后续Marie-Anne Lachaux等多名核心成员陆续加入 [6][8] - 离职研究员平均任职超5年,流向包括Anthropic、微软AI等一线机构及Kyutai等二线研究组织,形成系统性认知重构 [9] - FAIR实验室领导层变更,原负责人Joelle Pineau离职,团队方向从"开放共享"转向"应用效率",加速人才流失 [13] 行业竞争格局变化 Meta的战略困境 - Llama 2曾为HuggingFace最受欢迎模型,但Llama 3/4迭代缓慢,未推出类似GPT-4 Turbo的推理增强版本 [11] - 内部最大模型Behemoth发布推迟,团队对性能与方向存在分歧,产品节奏落后于竞争对手 [12] - 开源策略虽获得开发者好评,但公司资源投入与技术创新速度不匹配 [10][11] Mistral的快速扩张 - 创立1个月即获1亿美元种子轮融资,估值达60亿美元,推出Pixtral、Medium 3等多模型家族 [17][19] - 产品覆盖多模态、STEM编程及边缘部署,近期扩展至阿拉伯语等非英语市场 [17] - 商业化面临挑战:营收仅千万美元级别,主力模型未完全开源,用户生态仍以欧洲为主 [19] 技术路线演变 开源模式对比 - Meta通过Llama开放权重推动开源浪潮,但后续进展乏力;Mistral早期采用Apache 2.0协议,商业化后转向"两轨制"策略 [10][19] - Mistral模型设计强调参数规模与效果平衡,更贴合实际部署需求,形成差异化竞争力 [14][17] - 行业转向多步推理和工具整合能力,Meta在该领域明显落后于OpenAI和Google [11][12]
Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具
36氪· 2025-05-26 18:38
Java 30年发展历程 - Java诞生30周年,凭借"一次编写、随处运行"理念彻底改变软件开发领域 [1] - 最初名为"Oak",由James Gosling在Sun Microsystems设计开发,后转向万维网平台 [2] - 语法类似C/C++,通过JVM实现跨平台运行,虽存在兼容性问题但仍快速流行 [2] - 长期位居编程语言前十,2024年Stack Overflow调查显示领先于C/C++/C,TIOBE指数排名第四 [3] - 在企业级系统广泛应用,30年历史建立可靠性信任 [4] Java技术演进 - 持续演进功能特性如lambda表达式(JDK 8)和类型推断改进 [9][17] - 现代JVM垃圾收集机制从10-20秒暂停优化至毫秒级,内存管理效率超越C语言 [18] - 与云环境高度契合,在多核处理器应用和内存管理方面表现优异 [10] - 生态系统中开源Apache许可项目NetBeans IDE获得Gosling高度评价 [14] Java之父James Gosling - 出身贫寒但展现早期技术天赋,通过非常规方式自学编程 [5][6] - 职业生涯始于IBM研究院,后在Sun Microsystems创造Java [7] - 对甲骨文收购后Java发展给出"B+"评价,超出最初悲观预期 [20] - 退休前主导AWS Greengrass物联网框架开发,延续技术理念 [15] 行业趋势观点 - 批评AI浪潮是"骗局",认为"高级统计方法"更准确描述当前技术 [13][16] - 指出风险投资者"只关心成功获利"而非开发有用技术 [16] - 驳斥AI减少工程师需求说法,称编程仍是必备技能 [19] - 质疑"低代码/无代码"趋势,认为仅适用于特定领域 [13] Java成功因素 - 聚焦实际问题而非追逐潮流,专注帮助工程师解决现实需求 [20] - 坚持向下兼容性,提升开发者生产力 [20] - 庞大社区和生态系统支撑持续发展 [21] - 设计理念平衡创新与谨慎,避免添加不合适功能 [9]
开源鸿蒙代码规模已超1.3亿行;智元机器人完成新一轮融资|数智早参
每日经济新闻· 2025-05-26 07:01
开源鸿蒙发展现状 - 开源鸿蒙5.1 Release版本正式发布,代码规模超1.3亿行,贡献者达8600多位 [1] - 超过1100款软硬件产品通过兼容性测评,覆盖金融、交通、教育、医疗、航天等多个行业 [1] - 开源生态模式打破技术垄断壁垒,推动全社会共同参与操作系统创新 [1] 智元机器人融资动态 - 智元机器人完成新一轮融资,新增股东包括京东科技和上海具身智创基金 [2] - 上海具身智创基金由上海国有资本投资有限公司联合浦东新区发起设立,聚焦具身智能产业链投资 [2] - 该基金首笔投资投向智元机器人,体现对具身智能产业的战略布局 [2] 英伟达对华芯片供应调整 - 英伟达将为中国市场推出基于Blackwell架构的AI芯片,售价6500-8000美元,大幅低于H20芯片 [3] - 新芯片预计6月量产,规格和工艺可能简化以降低售价 [3] - 中国半导体产业面临外部压力与市场需求双重驱动,需加强技术创新和产业链完善 [3]
开源,脑机接口行业才能“全面开花”
科技日报· 2025-05-22 07:59
DeepSeek的开源,让整个人工智能行业不再苦于"大规模训练对GPU资源的依赖",AI可用性变得触手可 及。 鸿蒙的开源,在操作系统"双强争霸"的格局中,开出"第三条路",构建出更为丰富的软件生态。 人类基因组数据的开放共享,让生命科学整体进入分子时代,催生了无数基因技术,带来了医学健康领 域的重大革新。 初步的开源助力我国研发团队对脑电信号的识别能力不断增强。在今年初的国际消费类电子产品展览会 (CES)上,我国无创脑机接口团队与机器人团队合作的脑控机器人已经可以完成倒立、旋转等一连串 舞蹈动作。 但这些还远远不够。在采访中,记者了解到,受限于基础数据的有效挖掘和积累,当前脑机接口能做的 事情还很少。 开源正是打开"未来之门"的金钥匙。开源不仅可以吸引全球研究者一起开发代码,加速技术进步,还可 以有效整合资源,逐渐形成人脑数据的完整"拼图"。 为此,多位专家呼吁,相关部门在推出脑机接口培育政策的同时,营造开源共享生态,建议由政府、科 研机构或行业组织牵头,搭建脑机接口与人工智能一体化开源平台,统一技术标准,整合数据、算法及 软硬件资源,有效规避各地及研究团队的重复建设,加速技术创新与产业协同发展。 (文章 ...
突发!微软半夜宣布 VS Code 变成开源 AI 编辑器。网友:太晚了
程序员的那些事· 2025-05-20 12:06
AI编程工具市场现状 - AI编程工具热度持续上升,Cursor和Trae等基于VS Code的工具受到关注 [1] - Cursor表现突出,2023年1月上线至2024年1月已积累36万付费用户,年化经常性收入突破3亿美元 [1] - VS Code宣布将转型为「开源AI编辑器」,计划进行重大更新 [1] VS Code的战略转型 - VS Code作为GitHub顶级开源项目,凭借开放性和社区协作优势积累大量用户 [3] - 公司决定将AI功能作为核心,坚持「开放、协作、社区驱动」的传统发展路径 [3] - 具体措施包括:开源GitHub Copilot Chat扩展代码(MIT许可证)、整合AI组件至核心、开放提示测试基础设施 [4] VS Code选择开源的五大动因 - 大语言模型技术趋同,独家提示策略失去竞争优势 [5] - AI交互设计已成行业标准,开源UI元素可加速社区优化 [5] - 现有开源AI工具生态存在调试困难,源码开放将降低扩展开发门槛 [5] - 数据隐私敏感性增强,开源可提升透明度获取用户信任 [5] - 开源社区能更有效应对AI工具面临的安全威胁 [5] 行业竞争与用户反馈 - 部分用户认为VS Code的AI转型是对Cursor等竞品的直接回应 [5] - 社区意见分化:有开发者赞赏其开放策略符合现代开发精神,也有用户认为转型时机已晚 [5][6] - 存在小众需求:部分用户提议fork版本去除AI功能,回归纯粹代码编辑器定位 [6] 产品发展路线图 - 短期计划:未来几周内完成Copilot Chat代码开源与核心功能整合 [4] - 长期目标:在性能、扩展性和界面美观度保持优势的同时深化AI能力 [4] - 采用透明化运营:公开迭代计划、持续更新FAQ并积极收集社区反馈 [4]
WSL、Copilot皆重磅开源,深夜炸场的微软给我们带来了哪些惊喜?
AI科技大本营· 2025-05-20 09:02
微软Build 2025大会核心观点 - AI与开源成为微软两大战略方向,贯穿全场发布内容[2][5] - 公司定位当前技术浪潮为"平台变革中局",类比1990年代Web技术或2000年代云计算移动互联网的崛起阶段[5] - 开发者生态规模显著:Visual Studio用户超1500万,GitHub开发者达1.5亿,GitHub Copilot用户突破1500万[6] - 推出多项AI代理技术升级,从编程助手演进为协作开发伙伴[11][13][15] - 操作系统层面深度整合AI能力,Windows AI Foundry开放内部工具链[39][42] - 首次将适用于Linux的Windows子系统(WSL)完全开源[44][46][48] 开发者工具升级 - Visual Studio支持.NET 10并引入实时预览功能,更新节奏调整为每月稳定版[10] - VS Code发布第100个开源版本,新增多窗口支持与暂存区管理[10] - GitHub Copilot扩展功能开源并集成至VS Code核心代码库[10] - 推出完整版Coding Agent,可接收GitHub Issue任务并自动执行代码重构[13][14] - Copilot新增版本迁移能力,支持Java 8至21或.NET Framework至9的自动化升级[15] - 发布Azure SRE Agent实现故障自动排查与修复建议生成[15] AI代理生态系统 - 推出Microsoft 365 Copilot Tuning,支持企业低代码定制专属AI助手[26] - Azure AI Foundry新增Model Router实现多模型自动选择[36] - Foundry Agent Service正式发布,支持多代理协同处理复杂流程[36] - 引入跨平台多代理编排能力,兼容AWS/Google Cloud及本地部署[36] - 新增Foundry Observability功能,提供智能体全链路监控与日志追踪[37] 操作系统与开源 - Windows AI Foundry开放内部开发工具,支持CPU/GPU/NPU异构计算[39] - 内置Phi-Silica小语言模型,可通过LoRA适配器快速微调[42] - Windows原生支持MCP协议,实现系统服务与AI应用的安全互通[43] - WSL开源代码库已在GitHub发布,获得19.5k星标关注[45] - WSL架构演进实现与Windows系统解耦,社区可直接贡献代码[48][49] 数据与基础设施 - SQL Server 2025预览版内置可扩展AI功能,与Azure/Fabric深度集成[55] - Cosmos DB与Azure Databricks直接接入Foundry智能体平台[55] - Fabric平台整合Cosmos DB,统一管理结构化与非结构化数据[56] - 推出Power BI Copilot,支持自然语言交互与跨报表分析[57] - Azure部署NVIDIA GB200芯片集群,单系统处理能力达86.5万tokens/秒[59] - 推出Foundry Local服务实现AI能力离线部署与敏感数据本地处理[63] 前沿技术探索 - 开源NLWeb项目,通过MCP标准实现网站与AI聊天机器人快速对接[52][53] - 发布Microsoft Discovery平台,运用Graph RAG引擎加速科研发现[65] - 科学智能体展示实际成效:200小时发现新型冷却剂材料[66] - 与xAI合作在Azure上线Grok 3模型,采用物理学方法论优化推理[33][34] - 黄仁勋透露Azure GB200超级计算机性能较Hopper架构提升40倍[60][61]
Windows子系统、Copilot皆重磅开源,深夜炸场的微软给我们带来了哪些惊喜?
36氪· 2025-05-20 08:11
微软Build 2025大会核心观点 - AI成为公司最重要的战略方向,同时"开源"成为贯穿全场的关键词[1] - 公司推出多项技术创新,从产品体验到底层工具全面升级[3] - 开发者工具生态持续壮大,Visual Studio用户超1500万,GitHub开发者达1.5亿,GitHub Copilot用户突破1500万[4] 开发者工具升级 - Visual Studio支持.NET 10、实时预览和跨平台调试器,更新节奏调整为每月发布稳定版[6] - VS Code发布第100个开源版本,新增多窗口支持并开源Copilot扩展核心功能[6] - GitHub Copilot新增版本迁移能力,可自动处理Java 8至21或.NET Framework至9的升级[8] - 推出Azure SRE Agent实现自动化运维闭环,首次推出完整意义上的Coding Agent[8] AI代理与协作 - Coding Agent支持通过GitHub Issue分配任务,具备虚拟机启动、代码克隆和环境配置能力[10] - 借助Model Context Protocol可接入外部数据,视觉模型支持理解GitHub Issue中的图片[11] - Copilot Enterprise和Pro Plus用户可体验Coding Agent功能,与OpenAI Codex Agent形成生态[13] - OpenAI CEO认为编码代理是编程方式最具变革意义的进步,未来可实现更复杂任务委托[15] 企业级AI定制 - 推出Microsoft 365 Copilot Tuning,支持企业根据自身数据定制智能体[17] - 定制流程简化,企业只需配置基础环境即可快速启动,数据保留在服务边界内确保安全[18] - 未来业务应用可能以"多智能体工作流"形式重新定义,实现自动化协同[19] Azure AI Foundry创新 - 扩充模型库,新增xAI的Grok 3和Black Forest Labs Flux Pro 1.1[22] - 推出Model Router自动选择最优模型,实现真正多模型支持[25] - Foundry Agent Service正式发布,支持用少量代码构建协同工作的多AI智能体[25] - 新增多代理编排功能,支持跨平台协同和复杂业务场景[25] - 引入新一代可观察性功能,提供全链路监控和详细执行追踪[26] Windows AI生态 - 推出Windows AI Foundry计划,开放内部AI开发工具和平台[28] - Foundry Local支持本地运行优化模型,Phi-Silica小语言模型将内嵌Windows[30] - Windows原生支持MCP协议,内置多个MCP服务并通过安全审查[31] - WSL完全开源,社区可直接贡献代码推动跨平台开发[32][35] 数据与基础设施 - SQL Server 2025预览版提供内置AI功能,与Azure和Fabric无缝集成[40] - 整合Cosmos DB和Databricks进Foundry平台,增强智能体记忆能力[40] - Fabric平台整合结构化和非结构化数据管理,推出AI驱动型ETL工具[41] - Azure上线NVIDIA GB200芯片集群,单系统每秒处理86.5万tokens[42] - 基于Arm架构的Cobalt处理器已在Teams和Defender等产品中应用[45] 科学发现平台 - 推出Microsoft Discovery平台,利用Agentic AI改变科研流程[47] - Graph RAG知识引擎可理解复杂科学知识结构,加速研究发现[47] - 已在内部研究中展示潜力,200小时内发现新型冷却剂[48] - 科学智能体具备深度推理、假设生成和模拟运行能力[50]
车企“开源”,构建开放新生态
人民日报海外版· 2025-05-15 10:41
车企开源操作系统战略 - 多家汽车厂商近期发布自研车用操作系统开源战略,包括理想汽车开源理想星环OS、吉利汽车与阶跃星辰联合开源两款大模型、东风汽车发布行业最大端到端自动驾驶开源数据集 [2] - 上海国际车展期间全球首个开源智能驾驶操作系统和首个量产级安全车控操作系统新版本上线 [2] 开源驱动因素 - 汽车属性从"交通工具"向"智能终端"转变,新一代车用操作系统成为连接硬件算力与AI算法的"神经中枢",是推动智能化的关键动力 [3] - 闭源系统存在技术标准不一致、更新速度慢问题,开源可建立平台统一、软硬解耦、开放高效的新生态,避免重复研发 [3] - 开源平台能汇聚行业技术力量,优化创新要素配置,减少企业技术局限和试错成本,加速技术迭代 [3] 开源技术优势 - 理想星环OS实现"软硬解耦",最快4周完成芯片适配(比传统方案节省5个月),摆脱对单一芯片供应商依赖 [4] - 自研虚拟化技术降低性能损耗和存储资源使用量,帮助车企节省生产研发成本 [4] - 理想自研系统通过全局资源调度将自动紧急制动响应速度提升1倍,稳定性提高5倍,制动距离缩短7米 [4] 行业生态影响 - 开源推动芯片厂商、软件开发者、车企形成开放联盟,为中国汽车芯片开辟技术通路,增强智能化标准制定话语权 [4] - 开放生态构建有利于提升汽车产品性能,消费者可获得更优驾驶体验和更实惠售价 [4] - 智能汽车"下半场"需行业共生共荣,开放技术底座将更好推动创新发展 [5]
AI周报 | xAI新一轮融资后估值有望超1200亿美元;OpenAI重组计划生变
第一财经资讯· 2025-05-11 09:39
xAI融资动态 - xAI正洽谈新一轮融资 估值可能达到1200亿美元 潜在融资规模200亿美元[1] - 若融资完成 将成为史上第二大初创公司融资 仅次于OpenAI的400亿美元融资[1] OpenAI公司治理调整 - OpenAI撤回营利实体重组计划 非营利组织保持控制权 营利实体将转型为公益公司(PBC)[2] - 新架构下投资者持有普通股且增值不受限 旨在提升未来融资能力[2] 技术合作与开源进展 - 腾讯优化DeepSeek的DeepEP通信框架 RoCE网络性能提升100% IB网络提升30%[3] - 腾讯混元开源多模态视频生成工具HunyuanCustom 主体一致性优于现有开源方案[8] 行业竞争格局变化 - 苹果计划在Safari引入AI搜索选项 谷歌母公司Alphabet股价单日跌7% 市值蒸发1500亿美元[4] - AI编程工具Cursor开发商Anysphere完成9亿美元融资 估值达90亿美元 较去年12月增长246%[5][6] 高管变动与人才战略 - OpenAI任命Instacart CEO菲吉·西莫为应用主管 强化商业化能力[7] 人形机器人技术迭代 - 逐际动力发布31自由度人形机器人CL-3 云深处推出四足机器人M20[9] - 行业持续优化运动性能 8月将举办世界人形机器人运动会[9]