Workflow
开源AI
icon
搜索文档
WAIC 2025解码:中国的AI巨头真正释放了什么信号?
Counterpoint Research· 2025-08-14 09:03
更安全的AI - 深度学习教父Geoffrey Hinton首次访华并在WAIC 2025发表主题演讲 强调AI治理需中国参与 标志着全球AI安全合作进入新阶段 [3] - Hinton提出LLM与人类认知相似性理论:两者均通过模式补全生成意义 且数字智能可依托硬件替换实现"永生" [3] - 人类知识转移效率低下 而AI可实现即时精确的模型复制 能源成本降低后将超越人类认知能力 [3] - AI与人类一致性仍是未解难题 缺乏可靠方法确保超人类智能系统选择帮助人类 最坏情况下人类或沦为附属品 [3] 阿里巴巴的开源战略 - 发布三款高性能开源模型:Qwen3-235B-A22B-Instruct-2507(非推理模型超越Kimi K2)、Qwen3-235B-A22B-Thinking-2507(推理模型媲美GPT-4)、Qwen3-Coder(4800亿参数MoE编码模型) [7] - 推出无屏幕AI智能眼镜 深度集成Qwen模型 通过垂直场景建立用户黏性 成为持续AI交互的"特洛伊木马" [4][5] - 开源策略推动中国开发者生态普及 降低对海外API依赖 同时将阿里云定位为默认基础设施 采用"聚合理论"商业模式 [8] 宇树科技机器人突破 - 发布新一代人形机器人R1 重量25公斤 售价5600美元(特斯拉Optimus价格的1/5) 定位大众市场开发者和研究机构 [6] - 具备动态运动和多模态交互能力 提供即插即用API 可能催生第三方应用生态 类似早期智能手机市场 [6][9] - 中国硬件创新模式快速迭代 威胁特斯拉市场地位 若形成应用生态或抢先建立人形机器人iOS式平台 [9] 全球AI治理动向 - WAIC 2025吸引40国800余家企业 展示3000+创新成果 中国提议设立全球AI治理机构并发布13项合作框架 [2] - 欧洲、东南亚及非洲国家签署多边AI治理框架 显示中国从产业规模转向开放安全原则的基调转变 [3][4]
美媒关注:中国开源AI将主导世界?硅谷和华盛顿惊了
搜狐财经· 2025-08-14 02:35
中国AI开源模型发展现状 - 2025年1月以来中国AI领域涌现多个重要模型包括DeepSeek R1推理模型、阿里巴巴Qwen模型以及Moonshot、Zai和MiniMax等模型 [1] - 中国AI模型普遍提供免费开源版本供用户下载和修改这种模式正在推动中国AI技术在全球范围内的广泛采用 [1] - 阿里巴巴的Qwen3版本在性能评估中击败了OpenAI的gpt-oss模型 [6] 中美AI发展策略对比 - 美国试图通过发明和控制占据AI主导地位而中国则通过应用和分配来施加影响力 [1] - 中国不仅在AI领域还在操作系统、半导体架构和工程软件等领域鼓励开源研发 [5] - 中国将开源项目作为战略后备和紧急资源加以扶持以应对美国技术封锁的担忧 [5] 开源AI模型的商业应用 - 开源AI模型正被企业广泛采用因其可自由调整并部署在企业内部系统上保护敏感信息 [5] - 新加坡华侨银行利用多个开源模型开发内部工具包括谷歌Gemma、阿里巴巴Qwen和DeepSeek等 [5] - 企业倾向于选择开发者熟悉的模型以获得更好的技术支持并可随时监控和切换新模型 [5] 开源AI的技术优势 - 中国模型在理解亚洲语言和捕捉文化细微差别方面表现更出色因其使用更多中文数据进行训练 [7] - 开源方式允许用户查看代码并提出改进建议从而加速新兴技术的发展 [4] - OpenAI声称其开源模型在推理任务上优于同等规模竞争对手并以低成本提供强大性能 [7]
“中国开源AI将主导世界?硅谷和华盛顿惊了”
观察者网· 2025-08-13 20:33
中国AI开源模型发展 - 2025年开年中国AI领域进展迅速,DeepSeek R1推理模型、阿里巴巴Qwen模型、Moonshot、Zai和MiniMax等模型相继涌现[1] - 中国AI模型普遍采用开源模式,提供免费版本供用户下载和修改,推动全球范围内技术采用[1] - 中国致力于将开源AI模型打造为全球标准,引发美国企业和政策制定者震动[1] 中美AI战略对比 - 美国试图通过发明和控制占据AI主导地位,中国则通过应用和分配施加影响[1][10] - 美国AI企业重复"公共研发驱动私人商业化-建立平台垄断-全球扩张"的传统路径[10] - 中国将AI视为具有出口潜力的国家基础设施,类似高铁和5G战略,促进广泛应用和标准制定[10] 开源模型竞争优势 - 阿里巴巴Qwen3版本在人工分析公司的评估中表现优于OpenAI的gpt-oss[6] - 中国模型在理解亚洲语言和文化细微差别方面表现更出色,因使用更多中文数据训练[7] - 日本工程师案例显示,Qwen在客服聊天机器人场景中比美国模型更能理解言外之意和礼貌回复[7] 行业应用现状 - 新加坡华侨银行利用开源模型开发30种内部工具,包括Gemma总结文档、Qwen辅助编程、DeepSeek分析市场趋势[5] - 企业客户青睐开源模型因其可自由调整并部署在内部系统,保护敏感信息[5] - 中国AI企业优先考虑用户黏性而非即时收入,通过开源模型争取用户采用和公众认可[9] 技术发展动态 - OpenAI发布首款开源模型gpt-oss,回应中国开源模型的竞争压力[2] - 科技行业历史显示,赢家不总是技术最先进者,易用性和灵活性同样重要[2] - 特朗普政府AI行动计划承认开源模型可能成为全球标准,呼吁打造基于美国价值观的开源模型[2][4]
中国开源AI领跑,美国业界急推新项目组团追赶
观察者网· 2025-08-06 20:03
行业竞争格局 - 全球前15大AI模型中仅有5个为开源模型且全部由中国公司开发 [1][2] - 中国AI实验室在7月发布四个领先开源模型同期美国未发布任何模型 [2] - 美国开源AI进展缓慢自Meta4月发布Llama4后无重大开源产品发布 [5] 美国行业应对措施 - 美国业界8月4日启动ATOM计划集中资源开发开源AI模型 [1][4] - 计划要求获得1万个尖端GPU芯片投入至少1亿美元资金 [4][7] - 获得十多位业界领袖支持包括Hugging FaceCEO及OpenAI首席战略官等 [4] 技术发展瓶颈 - 美国开源AI发展面临缺乏协调和资金不足的制约 [1][5] - 顶级AI系统开发成本高昂需1万个GPU芯片对应1亿美元投入 [6][7] - 资源有限的全球AI初创企业依赖开源模型推动技术发展 [7] 市场影响与趋势 - 阿里巴巴Qwen模型因性能强大获开发者青睐尽管存在训练数据疑问 [8] - 开源技术加速互联网和云计算等科技革命发展 [1] - 美国联邦政府7月23日发布AI行动计划以保持对中国领先优势 [8]
OpenAI 推出两款开源模型,GPT-5蓄势待发!
经济观察报· 2025-08-06 14:36
开源模型发布 - OpenAI推出两款开源模型GPT-oss-120b和GPT-oss-20b,这是自2020年发布GPT-2以来首次推出开源语言模型 [2] - 两款模型采用专家混合(MoE)架构的Transformer,以减少活跃参数数量 [3] - GPT-oss-120b每个token激活5.1亿参数,总参数量为1170亿;GPT-oss-20b激活3.6亿参数,总参数量为210亿 [3] - 模型支持高达128k的上下文长度,GPT-oss-20b需要至少16GB显存,GPT-oss-120b需要至少60GB显存 [3] 性能表现 - GPT-oss-120b在核心推理基准测试中表现接近OpenAI o4-mini,在竞赛编码、通用问题求解等方面超越o3-mini [4] - GPT-oss-120b在健康相关查询和竞赛数学表现上优于o4-mini [4] - GPT-oss-20b在相同评估中达到或超过o3-mini性能,尤其在竞赛数学和健康领域表现突出 [4] 战略转变与竞争 - OpenAI此次开源模型发布是对市场趋势的回应,旨在重新融入开源生态 [5] - 谷歌DeepMind于8月4日宣布推出第三代通用世界模型Genie 3,加剧市场竞争 [5] - OpenAI与英伟达、AMD等芯片制造商合作,确保模型在各种芯片上良好运行 [5] 模型安全性与市场预期 - 两款开放模型相比o3和o4-mini更容易出现"幻觉"现象,GPT-oss-120b和GPT-oss-20b分别对49%和53%的问题产生幻觉 [6] - OpenAI在预训练期间过滤了与化学、生物、放射性等相关的有害数据 [6] - 市场普遍预期OpenAI的下一个重大更新将是推出GPT-5 [6] GPT-5预期 - GPT-5将整合GPT系列基础模型、o系列推理模型以及GPT-4o全模态模型的三方能力 [7] - GPT-5单次推理的算力消耗不会大幅增加,API价格或较GPT-4o仅小幅增长甚至维持不变 [7] - GPT-5推理性价比有望提升一倍以上,将显著改善AI应用的盈利能力 [7]
OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗
虎嗅· 2025-08-06 11:47
事件概述 - OpenAI自GPT-2后首次发布开源语言模型gpt-oss-120b和gpt-oss-20b [1] - 此举被视为在美国对开源AI落后于中国感到焦虑之际,意图扳回一局 [3] - 最大的开源社区Hugging Face创始人兼CEO称之为“王者归来” [4][5] 模型性能与对比 - **性能对标**:gpt-oss-120b性能接近OpenAI闭源模型o4-mini,gpt-oss-20b接近o3-mini [10][14][15] - **超越闭源模型**:在HealthBench医疗推理测试和数学竞赛题(AIME 2024和2025)中,gpt-oss-120b甚至超越了o4-mini、o1和GPT-4o [10][16][31] - **与DeepSeek对比**:在多项推理任务中,gpt-oss-120b与DeepSeek-V3(被认为达到o3-mini~o4-mini水平)旗鼓相当 [10] - **训练效率**:gpt-oss-120b每个token激活约5.1B参数,而DeepSeek是37B,激活参数少7倍以上,可处理约80万亿tokens(DeepSeek为14.8T,Qwen3为30T) [7][8] - **计算与成本**:gpt-oss训练算力需求比DeepSeek V3/R1低约20% [8];gpt-oss-120b训练成本约400万美元,gpt-oss-20b仅需40万美元,均低于DeepSeek [9] 技术架构与训练 - **模型架构**:基于Transformer,采用混合专家模型技术以减少激活参数量 [22];gpt-oss-120b总参数量117B,每token激活5.1B参数;gpt-oss-20b总参数量21B,每token激活3.6B参数 [22] - **注意力机制**:采用密集与局部带状稀疏注意力模式交替结构,使用分组多查询注意力机制(分组大小为8)以提升效率 [23] - **位置编码与上下文**:使用旋转位置嵌入,原生支持最长128k上下文长度 [24] - **训练数据**:使用以英语为主的纯文本数据集,重点覆盖STEM、编程及通识知识 [25] - **分词器**:使用o200k_harmony分词器,是o4-mini和GPT-4o所用分词器的超集,已一同开源 [25] - **训练过程**:后训练过程类似于o4-mini,包括监督微调和高算力强化学习阶段,目标是使模型符合OpenAI模型规范并掌握思维链推理和工具使用能力 [27][28] 功能与部署特性 - **工具使用与推理**:在工具使用、少样本函数调用、思维链推理方面表现出色,兼容OpenAI的Responses API,专为智能体工作流设计 [13][16][17] - **推理强度**:支持低、中、高三种推理强度等级,开发者可在system message中设置以权衡延迟与性能 [29] - **部署优化**:gpt-oss-120b可在一张80 GB GPU上高效运行;gpt-oss-20b可在仅有16GB内存的边缘设备上运行,适合端侧部署和本地推理 [14][15] - **许可证**:采用灵活的Apache 2.0许可证发布 [13] 安全与生态 - **安全标准**:进行了全面的安全训练和评估,使用了对抗性微调版本并在Preparedness Framework下评估,内部安全基准测试表现与前沿模型相当 [18][19] - **安全倡议**:发起总奖金50万美元的红队挑战,邀请全球发现新的安全问题,挑战后将发布总结报告并开源评估数据集 [45][46][47] - **合作伙伴**:与AI Sweden、Orange、Snowflake等早期合作伙伴共同探索模型在真实世界中的应用,如本地部署和特定数据集微调 [20] - **生态优势**:OpenAI认为gpt-oss在全球的开源生态中占据优势 [12] 战略意义与行业影响 - **行业标杆**:在该参数量级上,模型在推理能力与安全性方面实现突破,为行业设立新标杆 [41] - **降低门槛**:为个人开发者、大型企业、政府及资源受限的行业和组织提供了在自有基础设施上运行并定制AI的工具,降低了AI应用门槛 [13][21][43] - **中美竞争**:发布被视为回应中国开源模型(如DeepSeek-R1、K2、GLM-4.5、Step-3、Qwen3更新版本)密集发布后的行动,旨在保住美国在开源AI的优势 [2][3][39][44] - **互补战略**:开放模型与OpenAI API托管模型相辅相成,为开发者提供更广泛的工具选择,旨在加速前沿研究、激发创新并推动更安全透明的AI应用 [21][42]
早报 | 免费学前教育要来了;“跑楼小孩”被叫停;浙大一青年博导被曝坠楼身亡;名古屋希望与友好城市南京恢复交流
虎嗅APP· 2025-08-06 08:40
学前教育政策 - 国务院明确从2025年秋季学期起免除公办幼儿园学前1年保教费 标准按地方政府批准标准执行(不含伙食费、住宿费等)[2][3] - 民办幼儿园参照同类型公办园免除水平减免保教费 高出部分可继续向家庭收取[2][3] - 财政部门将对因减免政策导致收入减少的幼儿园给予补助 标准综合考虑在园儿童人数及生均收费水平[2] 大公司动态 - 奇瑞内部要求精简会议30% 董事长尹同跃强调周末不开大会 领导需减少会议时间并提高效率[22] - 淘宝将整合阿里系资源推出大会员体系 88VIP权益升级 含盒马90天免费X会员权益(门店88折、每日免运费等)[23] - 深铁集团年内第八次向万科提供借款 本次金额不超16.81亿元 未明确披露抵质押物[24][25] - 吉利回应智驾团队整合 称极氪与研究院团队将合并至重庆千里智驾 方案仍在细化阶段[26] 科技与AI进展 - OpenAI发布开源模型GPT-OSS 称其性能与o4-mini相当 可在本地设备运行[27][28] - 谷歌DeepMind推出世界模型Genie 3 支持720p分辨率实时交互 一致性较前代提升[29] 消费品与医疗 - 贝因美否认奶粉涨价传闻 称坚守5%利润底线 所有品项未调价[27] 行业监管与社会事件 - 深圳华强北叫停未成年人"代送外卖"行为 街道约谈平台禁止相关服务[5][6][7] - 新东方文旅回应夏令营未成年人饮酒事件 称已处理涉事老师并加强管理[31][32][33][35] 国际事务 - 美国将对部分国家商务旅游签证收取最高1.5万美元保证金 分三档执行[45] - 特朗普计划对进口药品分阶段加征关税 初始税率未披露 未来或升至250%[52][53] - 以色列总理内塔尼亚胡拟全面占领加沙地带 当前已控制75%区域[56]
从分钟级到秒级的运维管理,开源是企业降本增效的最佳路径么?丨ToB产业观察
钛媒体APP· 2025-08-01 13:46
开源与闭源技术模式对比 - 开源模式能让企业更好地掌控技术并进行个性化创新 同时确保核心数据资产安全 如富国银行部署Meta的Llama 2满足金融合规要求[3] - 闭源模式存在高昂授权费 技术黑箱和厂商锁定风险 自研系统需巨额投入使中小型企业望而却步[4] - DeepSeek问世后开源声音占主导 其推理成本仅为OpenAI o1模型的1/30 但数学推理和代码生成能力达同等水平[7] 企业开源实践案例 - 中国信保通过SUSE Rancher容器平台将运维响应从分钟级降至秒级 图形化操作降低工作难度[2] - 德国FIS集团采用SUSE开源AI平台构建SAP智能解决方案 实现全链路可视化并满足欧盟GDPR合规[5] - 皓康医疗采用SUSE AI运行医学影像分析 推出的Endoseek平台使医生报告解读时间缩短50%以上[5] - IBM基于Llama 2开发AskHR系统服务28.5万名员工 营销AI工具将跨国活动部署周期从月级缩至72小时[6] - 日本CyberAgent用戴尔开源工具开发OpenCALM模型 某汽车厂商借此将缺陷识别准确率提升至99.2% 开发成本仅为闭源方案1/5[6] 开源技术优势 - 通过开源社区群智协作形成技术普惠-知识共享-商业反哺的正循环[3] - 欧洲开发者基于DeepSeek-R1两周开发出法律文书生成工具 成本较闭源方案降低90%[7] - 开源为企业提供高度可扩展的AI基础架构 能轻松增加新用例或扩展内部应用[6] 开源安全挑战 - 2024年84%代码库存在已知漏洞 48%含高风险漏洞 开源AI漏洞事件年增长超650%[9] - SUSE统计显示57%企业担忧隐私数据安全 55%关注AI驱动网络攻击 仅7%认为无安全风险[9] - Kubernetes等平台依赖大量第三方组件 对运维团队经验不足的企业构成管理难题[8] 风险应对方案 - FIS集团通过SUSE AI实现全链路可视化 风控响应速度提升300%[9] - SUSE推出AI护栏技术 满足多国合规要求 监督大模型原则性问题 实时监控防数据投毒[10] - 企业需培养熟悉开源技术的IT团队 以问题导向寻找技术落地场景 而非盲目追风[8] 市场发展前景 - IDC预测亚太地区AI和GenAI投资到2028年达1750亿美元 年复合增长率33.6%[4] - 开源市场竞争焦点除性能与价格外 安全可控可视化成为重要发展方向[9] - 开源公司与用户需持续交流 产品仅是开始 后续服务成为软件公司核心竞争力[9]
“湘超”联赛将于今年9月至12月举办|首席资讯日报
首席商业评论· 2025-08-01 11:57
湖南省足球联赛 - "湘超"联赛将于2024年9月至12月举办,分为常规赛和淘汰赛两个阶段 [3] - 常规赛采用主客场单循环赛制,14支球队共进行13轮比赛,每队主客场分配通过抽签决定 [3] - 常规赛前8名进入淘汰赛,第9至14名以常规赛成绩决定最终排名 [3] Meta战略转向 - Meta创始人扎克伯格在公开信中暗示可能放弃AI开源路线,强调将谨慎选择开源内容 [4] - 公司战略重心转向打造"个人超级智能",与去年大力倡导开源AI的态度形成鲜明对比 [4] - 此举可能使Meta加入闭源AI阵营(CLOSE AI),标志着战略方向重大调整 [4] 婚姻登记数据 - 2024年全国婚姻登记机构共4190个,其中登记机构1134个 [5] - 全年结婚登记610.6万对,结婚率4.3‰;离婚登记351.3万对,离婚率2.5‰ [5] F1车队资本运作 - 阿斯顿·马丁拉贡达拟以24亿英镑(32亿美元)估值出售F1车队少数股权 [6] - 该车队当前在积分榜排名第八(共十支),交易显示资本对F1长期商业价值的认可 [6] 企业动态 - 绿地控股澄清执行总裁陈军"失联"为不实消息,其因家庭原因请假但仍正常履职 [7] - 京东拟以每股4.60欧元现金要约收购德国CECONOMY AG,估值近22亿欧元 [8] - 贝莱德增持中金公司H股126.24万股,耗资2552.45万港元,好仓持股比例超5% [9] - 塔塔汽车将收购Iveco Group非军工业务,交易金额约38亿欧元 [12] 科技前沿 - 德国研究团队用不足3公斤的小型探测器首次实现中微子散射效应探测 [10] - 百度搜索电脑端将全面开放智能体入口,整合文心平台、第三方AI应用及自研应用 [13] 加密货币 - 美国发布报告旨在强化加密货币领导地位,目标成为"世界加密货币之都" [11] - 市场预期美联储鸽派政策或刺激比特币价格,白宫战略储备购买传闻受关注 [12]
刚刚,扎克伯克发文正式告别“默认开源”!网友:只剩中国 DeepSeek、通义和 Mistral 还在撑场面
猿大侠· 2025-07-31 12:09
Meta的AI战略转向 - 公司调整AI模型发布策略,从"默认开源"转向"选择性开源",以推动"个人超级智能"愿景[1][6] - 扎克伯格强调需谨慎管理超级智能带来的安全挑战,并慎重考虑开源内容[1][4] - 公司此前曾承诺开源Llama后续模型,但2025年表态显示开源不再是尖端模型的默认选项[2][6] 开源策略的演变 - 2024年公司立场为"开源AI对行业至关重要",2025年转变为"严谨应对风险,选择性开源"[2][6] - 公司未承诺开源所有成果,若模型能力质变且开源不负责任则保留闭源权利[4] - Llama系列此前被视作区别于OpenAI等对手的关键优势,但最新表态削弱了这一定位[1][6] 商业与竞争动态 - 公司斥资143亿美元投资Scale AI并重组AI部门为"Meta Superintelligence Labs",集中资源开发闭源模型[11][12] - 闭源策略部分源于竞争压力,公司为击败GPT-4而暂停开源模型Llama Behemoth的开发[12][13] - 主要收入依赖广告而非模型销售,此前认为开源不影响营收,但竞争落后促使策略调整[12] 技术布局与产品方向 - 新组建的超级智能团队在隔离办公区研发闭源模型,目标直指AGI[13][14] - 计划通过AR眼镜、VR头显等硬件推广"个人超级智能",强调情境感知设备的计算主导地位[14] - 发言人表示未来将并行训练开源与闭源模型,但最先进模型可能不再开源[14][15] 行业影响 - Meta态度转变导致全球开源SOTA模型主力转向中国公司如DeepSeek、通义千问和Mistral[9][10] - DeepSeek-R1的成功激励中国公司坚持开源,而Llama4失利促使Meta降低开源优先级[9] - 行业不确定性增加,闭源模式因商业控制力受竞争对手青睐,开源阵营期待中国公司填补空缺[6][9]