AI开源

搜索文档
从2025世界人工智能大会看AI投资
新浪基金· 2025-08-06 14:33
2025世界人工智能大会亮点 - AI产品集中亮相 规模创历届之最 包括3000余项前沿展品 涵盖40余款大模型 50余款AI终端产品 60余款智能机器人及100余款"全球首发""中国首秀"新品 [2] - AI人才汇聚 邀请图灵奖 诺贝尔奖得主 中外院士及国际顶尖实验室代表 讨论AI基础设施 科学智能等议题 中国AI研究人员数量从2015年不足万人增至2024年5.2万人 年复合增长率28.7% 中美合计占全球AI研究人员57.7% [3] - 新增"创投孵化"板块 组织200余个初创项目路演 百余家投资机构对接 政策层面出台《加快构建科技金融体制》支持中小AI企业融资 [5] AI产业未来趋势 - 开源生态加速发展 大会发布《国际人工智能开源合作倡议》 中国初创公司深度求索推出开源大模型DeepSeek-R1 开源模式重构全球AI治理话语权 [5][6] - 科创板人工智能ETF(588930)等指数产品成为投资工具 跟踪科创AI指数(950180.CSI)覆盖30家科创板AI产业链龙头企业 [8] 行业数据与增长 - 中国AI研究人员数量年复合增长率达28.7% 2024年规模达5.2万人 [3] - 科创板人工智能ETF跟踪指数精选30家新兴AI龙头公司 覆盖产业链上中下游 [8]
中国AI开源16强,最新出炉
36氪· 2025-08-04 11:28
大语言模型榜单表现 - 阿里Qwen3-235B-A22B-Instruct-2507位列Chatbot Arena大语言模型总榜第三 [1] - 月之暗面Kimi-K2-0711-preview与深度求索DeepSeek-R1-0528并列总榜第五 [1] - 开源模型首次超越Claude 4、GPT-4.1等闭源模型 [1] - 编程榜单中深度求索Deepseek-R1-0528与阿里Qwen3-Coder并列第一 [3][4] - 月之暗面Kimi-K2-Instruct位列编程榜第七 [4] 中国AI开源生态动态 - 7月中国AI社区共开源31个模型、1个框架、1个数据集 [8] - 参与机构包括16家企业/高校:阿里(9个)、月之暗面(2个)、智谱(2个)、阶跃星辰(1个)、字节跳动(2个)等 [8][16] - 阿里成为最活跃开源方,7月连续发布Qwen3系列、Wan2 2视频模型等18个模型 [18][19] - 腾讯HunyuanWorld-1实现图像生成3D功能 [11] - 蚂蚁集团推出金融专用数据集Agentar-DeepFinance-100K [14] 多模态模型进展 - 字节跳动Seedream-3位列文生图榜第五 [2] - 字节跳动Seededit-3 0、BAGEL、阶跃星辰Step1X-Edit分列图像编辑榜第五/七/八 [2] - 多模态新模型涌现:GLM-4 1V-Thinking(图文→文本)、Wan2 2(图文→视频)、Skywork-UniPic(跨模态转换)等 [5] - 阶跃星辰Step3支持图文→文本转换 [5] 技术趋势亮点 - 轻量化模型SmallThinker可在1GB内存设备运行 [7] - Agentic编程成为主流方向,阿里Qwen3-Coder支持完整工具调用 [9] - 领域专用模型集中发布:科学计算(S1-Base)、金融(Agentar)、机器翻译(Qwen3 MT)等 [9][16] - Hugging Face趋势榜TOP100中中国团队占8席,阿里4个模型进入前十 [15][17]
挖人上瘾的Meta又被员工吐嘈:不帮忙宣传项目,开源只会越来越糟
机器之心· 2025-08-01 09:30
Meta AI战略与资源投入 - 公司CEO马克・扎克伯格公开信提出「AI系统自我改进」概念并强调「谨慎选择开源内容」[1] - 为追赶AI顶级研究阵地,公司投入逾140亿美元重注Scale AI并组建Meta Superintelligence Labs (MSL),以百万至上亿美元签约金吸引OpenAI、DeepMind等团队人才[2] 内部管理问题与组织文化 - 研究科学家朱泽园披露内部审批流程低效:申请官方账号转发研究项目耗时近一年,且触达量不足个人推文10%[5] - 前员工Tijmen Blankevoort公开批评内部文化失调现象,朱泽园证实该批评「基本属实」并暗示存在更严重未披露问题[9] - 内部资源分配矛盾突出:Physics of Language Models项目未获公司层面支持,研究者需自行争取GPU资源[18][20] 开源策略争议与研究成果 - 朱泽园发布Physics of Language Models第一阶段代码,包含42k GPU小时预训练的8B基础模型全量数据与权重,仅用10%训练资源即超越Llama3-8B[11] - 开源效果引发质疑:项目关注度低迷使研究者反思「完全开源的必要性」,行业意见两极分化(Hugging Face CEO支持开源 vs 部分从业者认为特定场景下开源效率低)[12][14][16] - 公司开源政策存在矛盾:虽公开宣称减少开源,但同期批准Physics of Language Models、MetaCLIP2、VGGT等项目以Apache 2.0协议发布[21] 研究推广机制缺陷 - FAIR研究团队缺乏统一成果推广体系,依赖研究者个人社交账号宣传且未提供X Premium+等推广支持[18] - 法务流程严重拖累研究效率:公共数据集使用批准耗时超两月,模型权重发布需与法务部门反复沟通,协议审批耗时超一周[20] 行业人才动态 - AI从业者普遍存在职业焦虑,朱泽园建议主动把握跳槽时机,并透露自身离职意向(暂因项目优先级延迟)[8] - 公司外部对Meta边缘化研究项目的兴趣高于内部,暗示人才流失风险[6][8]
一周三连发,这开源“劳模”为何只有阿里做得?
凤凰网财经· 2025-07-26 17:58
阿里开源模型技术突破 - 阿里通义千问在四天内连续发布三款重磅模型:千问3非思考模型、Qwen3-Coder编程模型、千问3推理模型 [1] - 千问3非思考模型性能大幅提升,获基础模型领域冠军,被权威机构评为"全球最智能的非思考基础模型" [1] - Qwen3-Coder在代码能力及Agent调用能力方面超越GPT4.1和Claude4等闭源模型,登顶HuggingFace模型总榜冠军 [1] - 千问3推理模型在7项核心能力上可比肩Gemini-2.5 pro等顶尖闭源模型,创下全球开源模型最佳性能表现 [2] 开源战略与市场影响 - 阿里开源行为在全球巨头构筑技术壁垒的背景下显得格外突出 [4] - Qwen3-Coder开源免费可商用,API价格仅为同级对手的三分之一到二分之一 [5] - 阿里已开源300余款模型,衍生社区模型超14万个,超越Meta的Llama系列成为全球第一大开源模型家族 [8] - 开源策略迅速引爆硅谷,获得推特创始人、风投机构及HuggingFace高管的高度评价 [6][7] 全栈AI能力支撑 - 阿里是中国唯一具备软硬一体垂直整合能力的全栈AI公司 [10] - 底层基建:拥有自研飞天操作系统及强大数据中心,提升算力效率降低训练成本 [11] - 模型研发:通义实验室汇聚顶尖AI人才,产出覆盖全尺寸、全模态、多场景的模型矩阵 [11] - 应用场景:庞大商业生态为AI提供丰富试验田,覆盖C端和B端亿级用户应用 [11] 商业战略与未来布局 - 采用"开源模型+云"双轨战略,通过开源吸引开发者,引导用户使用阿里云服务 [13] - 过去七个季度阿里云AI相关收入持续三位数增长,云计算业务增速回升至18% [14] - 未来三年将投入超过3800亿元建设云和AI硬件基础设施,创中国民企投资纪录 [14] - 战略目标是通过开源引爆开发者生态,赋能千行百业实现AI普惠化 [13] 行业竞争格局 - 阿里开源行为旨在推倒闭源模型构筑的技术壁垒,将AI定价权交还市场 [5][8] - 开源模型性能已可比肩顶尖闭源产品,改变行业竞争格局 [1][2] - 全球AI竞争进入深水区,流量玩法红利消退,技术实力和战略耐心成为关键 [16]
7万个模型、1600万开发者,魔搭已建成中国最大AI开源社区
量子位· 2025-06-30 17:50
魔搭社区发展现状 - 魔搭社区已成为中国最大AI开源社区,支持开发者体验、下载、调优、训练、推理、部署模型,覆盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域[2][3] - 开源模型数量已超7万个,较初期增长超200倍,提供4000+MCP服务和调试工具,用户数扩展至1600万(较2023年4月增长约16倍),汇聚超500家贡献机构[5][17] - 社区定位为开放、中立、非盈利组织,倡导共同建设生态,阿里、腾讯、DeepSeek等主流公司均为重要参与者[16][18] 技术发展方向 - "云端协同"成为模型领域重要课题,需平衡端侧(手机/电脑/机器人)的数据隐私优势与云上大规模AGI发展的互补性[7][8] - 模型能力发展从单一内容生成扩展到工具链整合,魔搭社区覆盖模型全生命周期(数据开发→模型应用→推理工具链→经验分享)[10][11][12] - 行业呈现加速发展态势,Agent、具身智能等方向仍有巨大想象空间,模型能力尚未达上限[6][9] 生态建设举措 - 推出MCP协议并建立MCP广场,提供数千款服务和开放接口,支付宝、MiniMax等MCP服务独家首发[14] - 发布开发者勋章激励计划,提供免费GPU算力及AIGC训练券等资源,未来将扩展至代码贡献、社区活跃等群体[22] - 通过开源开放降低模型使用门槛,建立反馈机制连接模型创作者与应用开发者,减少企业技术绑定顾虑[19][20] 行业价值定位 - 魔搭社区提前布局MaaS(模型即服务)理念,2022年11月即启动模型生态建设(早于ChatGPT发布)[16] - 核心目标是消除模型价值与业务需求间的落地gap,推动二次创新,搭建"技术-需求"桥梁的企业将具备下一阶段竞争力[21] - 已成为前沿模型首发平台,如2023年首个文生视频开源模型及2024年DeepSeek系列模型均选择魔搭[16]
腾讯研究院AI速递 20250626
腾讯研究院· 2025-06-25 23:06
谷歌Gemini家族新成员 - Gemini Robotics On-Device是首个能在机器人本地运行的视觉-语言-动作模型,无需网络连接,适用于延迟敏感型应用 [1] - 该模型可执行高度灵巧任务如拉开拉链、折叠衣物,展现出优于其他本地模型的泛化性能和多步骤指令处理能力 [1] - 仅需50-100个演示即可适应新任务,能跨平台泛化到不同机器人如Franka FR3和Apollo人形机器人 [1] 谷歌Imagen 4/Ultra上线AI Studio - 谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,普通版每张约4美分,Ultra版约6美分,生成速度接近实时 [2] - Imagen 4 Ultra对prompt理解更精准,能生成高质量图像,支持每次生成最多四张1024×1024的图片,测试显示能生成逼真的超现实场景 [2] - 谷歌AI Studio未来将整合MCP服务器功能和Jules SWE Agent,界面也将更新,提供更统一的工作流和复杂操作能力 [2] OpenAI开发文档协作工具 - OpenAI正在开发ChatGPT文档协作功能,使用户能在平台上共同编辑文档并进行聊天交流,直接挑战微软Office和Google Workspace [3] - 这项功能是Sam Altman将ChatGPT打造为"超级智能工作助手"战略的一部分,可能进一步扩展至文件存储等生产力功能 [3] - 预计到2030年企业订阅ChatGPT将带来约150亿美元收入,但这可能加剧与最大股东微软的竞争关系 [3] ODDY工作室AI艺术创作 - AI技术复活世界名画与艺术家走秀视频爆红,ODDY工作室创作的《名作艺术秀》将梵高、达利、蒙娜丽莎等经典艺术元素以时装秀形式呈现 [4] - 视频重现多位艺术巨匠及其作品:梵高的《星夜》、波提切利的《维纳斯诞生》、克里姆特的《吻》、达利的超现实主义等 [5] - 最后场景中梵高、达利、莫奈、达芬奇等艺术大师同台相拥谢幕,这场AI视觉盛宴完美还原艺术作品细节并引发观众情感共鸣 [5] 出门问问TicNote AI硬件 - 出门问问推出全球首款Agentic AI硬件TicNote,3mm超薄设计可磁吸手机背面,支持120+语言转写,精度达98% [6] - 搭载Shadow AI智能体,能自动总结、生成思维导图,20小时超长续航,适用会议记录、课堂笔记等多场景 [6] - 产品展现"软硬结合+AI"战略成果,将Agent技术落地实用化,为职场人提供高效AI助手 [6] Readdy.ai出海增长 - AI设计工具Readdy.ai上线4个月实现近500万美元ARR,成为增长最快的AI出海应用之一,借助短视频在TikTok等平台病毒式传播 [7] - 产品成功关键在于生成界面质量超高,平衡专业设计规范与美学表现,让用户只需简单文本描述即可获得高完成度UI设计 [7] - 背后团队是打造蓝湖和MasterGo的中国顶尖设计工具团队,专注解决"无需设计基础也能产出专业界面"的痛点 [7] Delphi数字永生项目 - AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身让用户在赛博世界"永生",已有情感导师靠此年入百万 [8] - 创始人Ladjevardian的初衷是为中风无法说话的爷爷创建"数字大脑",将其回忆录中的智慧数字化,实现数字疗愈 [8] - Delphi提供多级订阅服务,可复制用户语言风格、知识体系和表达方式,用户可对每次对话收费并获85%以上收入 [8] 阿里云Agent应用变现 - 阿里云百炼平台与支付宝合作推出"AI打赏"功能,开发者的Agent应用可直接获取用户打赏,金额转入开发者个人支付宝账户 [10] - 开发者只需两步即可配置打赏功能:开启"支付宝AI收"功能并为Agent完成"赞赏卡片"配置,平台随机生成10元以内打赏金额 [10] - 百炼平台已有超10万开发者创建了30多万个Agent,未来将支持在任意渠道发布Agent并实现变现 [10] Biomni生物医学Agent - 斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,无需预定义工作流程 [11] - Biomni由两部分组成:Biomni-E1(统一生物医学环境)和Biomni-A1(智能体架构,结合大语言模型推理与代码执行) [11] - 系统在遗传学、基因组学等领域表现出色,能分析可穿戴设备数据、处理复杂RNA数据并自主设计实验方案 [11] AI开源与应用竞争 - Linux基金会执行董事Jim Zemlin认为AI基础模型终将全面开源,真正的竞争将转向应用层 [12] - 开源模式能吸引顶尖人才共同创新,开发者参与开源的首要动机是"完成工作"而非金钱 [12] - 未来公司的竞争优势将体现在用户体验、专业服务等应用层面,而非基础模型本身 [12]
Llama核心团队「大面积跑路」:14人中11人出走,Mistral成主要去向
Founder Park· 2025-05-27 12:54
Meta AI团队人才流失 - Llama模型创始团队14名核心成员中仅剩3名在职 离职率达785% 其中5名跳槽至法国AI创企Mistral [1][2][4] - 11名离职核心研究人员平均任期超5年 多为资深专家 部分人员参与Llama3开发后离职 [8][12] - 人才流失集中在FAIR研究院 前负责人Joelle Pineau卸任 由DeepMind回归的Robert Fergus接替 [5][6] 开源模型竞争力下滑 - Llama4模型测试集表现未达预期 开发者社区反响平平 用户转向DeepSeekQwen等竞品 [1][5] - 缺乏专用推理模型 落后于GoogleOpenAI在多步骤任务处理的技术进展 [7][8] - 竞争对手Mistral由Llama前架构师创立 直接挑战Meta核心AI项目 [4][6] 战略执行问题 - 旗舰模型Behemoth因性能未达标推迟发布 内部对领导力存疑 [5] - 2023年Llama论文开创开放权重LLM先河 但当前技术领先优势已被削弱 [6][7] - AI领域投入数十亿美元仍未形成差异化产品矩阵 [1][8] 核心成员去向追踪 - 主要流向Mistral等新兴竞对 部分创立自主项目 离职时间跨度从2023年延续至2025年 [4][8][12] - 剩余3名在职者包括研究科学家Hugo Touvron工程师Xavier Martinet及技术负责人Faisal Azhar [2][12]