维基百科
搜索文档
抗争起效,AI大厂终于不再“白嫖”维基百科
36氪· 2026-01-21 20:21
行业合作模式转变 - 多家AI大厂加入维基媒体企业合作伙伴计划,付费获取维基百科的企业级数据访问权,包括亚马逊、Meta、微软、Mistral AI以及Perplexity [1] - 维基媒体基金会将根据AI厂商的特定需求,对海量文章数据进行结构化处理,使其更易于模型训练和商业用途 [3] - 来自亚马逊、微软等厂商的授权费用将直接用于支持维基媒体基金会这一非营利组织的长期运营 [3] 数据价值与获取动机 - 在AI大模型训练中,结构化数据以其清晰度、一致性和效率,成为构建可靠且可扩展模型的关键,尤其对于分类、回归和预测等任务 [4] - 结构化数据与知识图谱结合,可帮助AI大模型更准确地理解数据的上下文和语义 [7] - AI厂商的爬虫已成为维基百科的负担,AI倾向于鲸吞所有数据,导致冷门内容也被频繁访问,大量消耗带宽资源 [7][8] - AI厂商愿意付费是因为不希望维基百科倒下,当前AI模型的进化仍需依赖人类提供的大量训练数据 [8] AI行业的技术与竞争现状 - 构建AI大模型的关键技术是基于人类反馈的强化学习,需要持续向大模型投喂海量的预训练数据和高质量的指令微调数据 [10] - 探索中的“无数据自我进化”方法虽省去外部数据成本,但面临预训练算力激增和模型迭代时间更长的挑战 [12] - AI行业竞争激烈,处于“争先恐后”状态,没有厂商敢于慢工出细活,例如OpenAI在应对谷歌Gemini反扑时,仅用1个月时间就推出了GPT-5.2 [12] - 当无需外部数据的方法存在缺陷时,AI厂商不得不与拥有高质量数据的平台和解,付费获取数据比让自家员工创作内容更具性价比 [12]
告别免费抓取!维基与亚马逊、Meta等企业构建AI数据付费生态
环球网· 2026-01-16 11:13
合作事件概述 - 维基媒体基金会在其成立25周年之际,于1月15日官宣与亚马逊、元宇宙平台公司、微软、困惑AI等企业达成AI数据使用协议 [1] - 此次合作标志着科技企业将以付费方式替代网页抓取,合法获取维基百科内容用于AI模型训练 [1] - 这些合作已于过去一年陆续正式敲定,此前一直处于保密状态 [4] 合作模式与阵营 - 合作企业将通过维基媒体企业版服务,大规模整合其人类治理的知识资源 [4] - 目前合作阵营已涵盖谷歌、亿科西亚等原有伙伴,谷歌是2022年企业版服务推出时的首批合作者 [4] - 此次付费合作模式为维基媒体基金会这一非营利机构构建了可持续的收入渠道 [4] 数据价值与行业影响 - 维基百科作为全球最大的公益百科平台,涵盖300余种语言、6500万篇条目,是AI训练的核心高质量数据源 [4] - 此前企业免费抓取行为导致平台服务器负载激增,运营成本高企,而其收入主要依赖公众小额捐款 [4] - 基金会发言人强调,AI企业的长远发展离不开人类知识沉淀,付费合作是对知识生产者的尊重 [4]
维基百科运营方与微软、元宇宙平台公司达成人工智能内容训练合作协议
新浪财经· 2026-01-15 18:35
维基百科与科技巨头达成商业合作 - 维基百科于周四宣布已与微软、元宇宙平台公司、亚马逊等多家科技巨头达成合作[1][4] - 这一举措标志着该非营利机构在将科技企业对其内容的依赖转化为收入方面迈出了关键一步[1][4] 合作背景与历史 - 早在2022年维基媒体基金会就已与字母表公司旗下的谷歌达成了相关合作安排[2][5] - 过去一年间除了此前已建立合作的元宇宙平台公司和亚马逊外基金会还与人工智能初创企业Perplexity以及法国的Mistral AI等多家企业签署了合作协议[1][4] 维基百科对AI行业的重要性 - 维基百科的内容对于人工智能模型的训练至关重要其涵盖300余种语言总计6500万篇条目是科技巨头开发生成式人工智能聊天机器人及智能助手的核心训练数据来源[2][5] - 微软公司副总裁表示获取高质量可靠的信息是构想人工智能未来发展的核心出发点[3][6] 维基百科面临的挑战与商业模式转变 - 企业为开展人工智能训练大量抓取维基百科的免费内容导致这家主要依靠公众小额捐款维持运营的非营利机构面临着服务器需求激增成本随之攀升的压力[2][5] - 维基媒体基金会一直在推动其企业版服务的普及企业版服务允许科技企业付费获取内容训练权限同时基金会还会按照企业大规模训练的需求提供定制化的数据服务[2][5] 合作方的态度与行业影响 - 维基媒体企业版总裁表示维基百科是这些科技企业业务布局中的关键一环他们必须找到从资金上支持维基百科的方式[2][6] - 该总裁指出所有的科技巨头合作伙伴都切实意识到了出资支持维基百科运营的必要性[2][6] - 微软公司副总裁表示通过与维基媒体基金会合作正助力打造一个面向人工智能互联网的可持续内容生态系统让每一位内容贡献者的价值都得到重视[3][6] 维基百科的运营基础 - 维基百科的内容由全球约25万名志愿编辑共同创作和维护他们负责撰写编辑条目内容并进行事实核查[2][6] 公司管理层变动 - 路透社上月率先报道维基媒体基金会已任命前美国驻智利大使伯纳黛特・米汉为新任首席执行官该任命将于1月20日正式生效[3][6]
维基百科联合创始人:马斯克的Grokipedia受到批评,我并不感到惊讶
环球网资讯· 2025-12-20 12:27
公司动态与竞争格局 - 维基百科联合创始人吉米·威尔士对埃隆·马斯克推出的基于人工智能的百科全书Grokipedia表示质疑,认为人们可能不会信任一部“带有偏见”的百科全书 [1][2] - 威尔士试图将自己与马斯克的风格区分开来,称如果对维基百科内容不满意会发起讨论,而暗示马斯克可能会亲自修改不认同的内容 [2] - 外媒报道指出,维基百科允许人工智能机器人抓取其内容,而用户发现Grokipedia上的一些页面几乎与维基百科的条目完全相同 [2] 行业观点与产品评价 - 吉米·威尔士表示,Grokipedia所受到的很多批评并不令人意外,并从信任角度对其提出根本性质疑 [2] - 报道指出,埃隆·马斯克在多年来指责维基百科存在偏见之后推出了Grokipedia [2] - 外媒称,马斯克一贯喜欢插手公司细节并自上而下地做出领导决策,这被暗示是其产品可能产生偏见的原因之一 [2]
韦氏词典年度词定了!“Slop”直指AI垃圾,如今互联网真变味了?
搜狐财经· 2025-12-19 17:33
AI生成内容泛滥的行业现状 - 2025年韦氏词典将年度词汇定为"Slop",定义为由人工智能大量生产的低质量数字内容 [1][5] - AI内容泛滥导致互联网信息质量下降,AI生产的内容语法正确但空洞平庸,其存在的主要目的是为了欺骗算法、填充广告位并榨取用户注意力 [5][7] - 真实有效的信息被海量低质AI内容淹没,用户获取难度增加 [7] 迪士尼的战略转型与行业竞争 - 2025年11月,迪士尼与OpenAI达成战略合作,计划将Sora生成的视频引入Disney+流媒体平台 [9][10] - 迪士尼向OpenAI投资10亿美元并获得额外股权认股权证 [12] - 流媒体行业的竞争焦点已从比拼精品内容转变为争夺用户时长,迫使迪士尼采取跟进策略 [12] - 迪士尼采用AI旨在降低成本,利用AI以近乎零成本生成“足够好”的背景、空镜及宣传素材,而核心IP与主线剧情仍由人类把控以保护版权护城河 [14][16] - 公司内部成立了“技术赋能办公室”,将创意过程拆解为流水线作业以提升效率 [18] 不同平台对AI内容的分化策略 - 部分平台如维基百科、Spotify、Pinterest坚守内容真实性底线,维基百科严禁AI生成条目,Spotify需防止AI歌手泛滥影响真实音乐人生存 [20][21] - 另一类平台如短视频、资讯聚合及部分电商则彻底拥抱“Slop经济”,其算法核心指标是用户停留时长,并鼓励生产廉价、快速且能精准投喂用户偏好的AI内容 [23][26] - 用户面临两难处境:获取真实内容需付出更高成本和时间进行甄别,而轻松浏览则需面对大量低质数字内容 [26] 行业影响与趋势 - 整个流媒体行业为争夺用户注意力,默认了用户对持续内容刺激(“像素流”)的需求高于对艺术性的追求 [18] - 技术效率与商业流量正压倒内容价值与创作真诚,改变了数字内容生态 [28]
知识的繁荣与危机
36氪· 2025-11-18 16:34
网络化知识的特性 - 网络化知识具有丰富性,谷歌图书项目已扫描超过4000万本书,可能成为最大的在线人类知识体系[1] - 全球网站数量约为12亿,其中16%~17%处于活跃使用中,搜索引擎可索引网页数量近40亿[2] - 维基百科英文版免费提供超过700万个词条,而《大英百科全书》第十五版仅收入不到4万词条[2] - 维基百科是多语种的,总计包含6500万超过300种不同语言的词条,有84.6亿次年浏览量和16.9亿独立访问者[2] 知识民主化进程 - 知识门槛降低导致知识民主化,互联网通过去中心化信息传播使知识跨越地域、时间和社会阶层限制[4] - 维基百科是实时参考工具,条目可在事件发生后几小时甚至几分钟内更新,形成不断完善的知识库[4] - 印刷机是知识民主化的早期步骤,图书馆特别是公共图书馆继续在知识民主化中发挥关键作用[4] 知识过滤机制演变 - 传统知识权威如报纸、百科全书依赖过滤系统维持权威性,但现在传统权威力量减弱[6] - 新型过滤技术分为算法机制和社交机制,算法利用计算机处理能力,社交工具依赖人际关系筛选信息[7] - 算法过滤存在黑箱问题和选择权剥夺风险,社交过滤可能导致过滤气泡和极化效应[7] 网络化知识的挑战 - 网络化知识具有未决性,网络上时间越多,证据越多,但对问题达成一致变得不可能[8] - 网络辩论中存在自我中心偏误和确认偏误,导致态度极化和信念坚持等现象[10] - 信息超载和分歧永存成为社会事实,可能使人对真相产生愤世嫉俗的态度[9] 知识网络化解决方案 - 开放获取运动让学术研究成果免费向公众开放,采用开放版权许可允许合理使用和再分发[12] - 应鼓励大学将课堂视频和教材免费传到网上,科研机构应提供可访问数据集促进跨学科研究[13] - 网络依赖链接精神,APP应用模式违背网络精髓,知识通过链接得以维持和发展[15] 网络智能与教育 - 网络作为知识基础设施需要利用现存机构发展的知识,机构正更加深入地嵌入网络中[17] - 教育需要尽早开始教孩子如何使用网络,评价知识宣称,以及热爱不同观点[19] - 批判性思考技能是互联网时代的读写能力,需要更好地区分废话和证据充分的结论[19]
马斯克旗下Grokipedia被批抄袭维基百科,引入无来源错误信息
36氪· 2025-11-17 20:12
Grokipedia内容质量问题 - 非营利事实核查机构PolitiFact评估认为Grokipedia存在严重内容剽窃和事实准确性缺失问题,严重损害其作为可靠信息来源的信誉[2] - PolitiFact调查分析了885,279篇文章,发现大多数直接复制维基百科文本,并在部分条目中引入无来源支持的错误或误导性声明[2] - 抄袭检测工具Copyscape分析显示许多文章与维基百科匹配度高达96%,但Grokipedia常忽略引用列表,导致读者无法验证信息来源[3][4] Grokipedia运营机制缺陷 - 平台编辑机制缺乏透明度,注册用户可建议修改但无编辑历史显示,错误修正过程不明确[6] - 维基媒体基金会指出Grokipedia通过不透明算法选择性提取志愿者创作内容,与维基百科公开可审查的过程形成鲜明对比[3][5] - 东北大学传播研究副教授指出维基百科优势在于数千志愿者协作,而Grokipedia忽略了这一核心本质[4] Grokipedia具体错误案例 - 在"星期一"条目中完全省略维基百科的22个参考来源,仅标注内容改编自维基百科[3] - 军事理论概念"顶点"条目错误引用卡尔·冯·克劳塞维茨著作章节,该章节并未引入这一概念[4] - "诺贝尔物理学奖"条目新增无引用支持的错误声明,称物理学奖传统上是第一个颁发的奖项,而实际上生理学或医学奖率先颁发[4] 行业背景与竞争态势 - xAI公司于今年10月推出Grokipedia,本意是为维基百科打造强劲对手[2] - 埃隆·马斯克宣称Grokipedia将在广度、深度和准确性上超过维基百科几个数量级[3] - Grokipedia上线正值xAI公司与苹果和OpenAI的诉讼风波中,后者指控这些公司涉嫌压制AI竞争[6]
维基百科用弹窗暗讽马斯克Grokipedia:“我们不是机器创造的”
搜狐财经· 2025-10-30 10:58
竞争态势 - 维基百科在募捐公告中强调其由人类运营 不受意识形态影响 不属于亿万富翁 以此暗讽净资产约5000亿美元的马斯克[1] - 马斯克多次批评维基百科 并建立了自己的AI驱动在线百科全书GrokiPedia[1] - 马斯克宣称其AI驱动百科全书GrokiPedia将远超维基百科 并称这是实现xAI理解宇宙目标的必要步骤[4] 运营模式与所有权 - 维基百科指出其经过近25年发展 依然是由人类创造而非机器 属于非营利组织 而非大型科技公司或亿万富翁[4] - 维基百科的海量内容依靠志愿者撰写和维护[4] - 马斯克的GrokiPedia由xAI开发 通过Grok大语言模型生成和编辑条目[4] 产品进展 - GrokiPedia 0 1版本在本周一正式上线 宣称可访问885279篇文章[4] - 马斯克上个月在X平台上预告了GrokiPedia项目[4]
批维基百科“有偏见”,马斯克推自家AI百科
环球时报· 2025-10-30 07:05
公司产品发布 - xAI公司于10月27日推出基于AI模型Grok的竞品网站Grokipedia,版本为v0.1,未进行公开宣传 [1] - 马斯克承诺即将推出的1.0正式版将比当前版本好十倍,品质远超维基百科 [1] - 截至10月29日,Grokipedia网站已收录88.5万余篇AI生成文章,而维基百科有近800万篇人工编写的英语内容 [1] 产品定位与战略 - 马斯克将Grokipedia定位为传递真相的网站,承认无法做到完美但会持续努力 [1] - 推出该产品被视为争夺话语权的一种手段,控制书面内容是获得或维系权力的方式 [2] - 马斯克曾批评维基百科对右翼思想存有偏见并被极左分子把持,并禁止其社交平台X采用维基百科内容 [1] 市场反应与争议 - Grokipedia被指很多内容几乎是逐字照搬维基百科,并过度依赖未经审查的AI创作 [2] - 有批评称该平台代表的并非客观中立事实,而是更倾向于马斯克认可的观点 [2] - 维基媒体基金会表示维基百科将坚持由人工运营,并称人类创作的知识是AI生成内容的根基 [2]
挑战维基百科 马斯克旗下公司推出AI百科全书网站
搜狐财经· 2025-10-29 19:16
公司产品发布 - 埃隆·马斯克旗下人工智能公司xAI推出一款由人工智能驱动的百科全书网站,与维基百科展开竞争 [1] - 该网站首页设计极为简洁,仅包含标题和一个搜索框,目前为0.1版本,后续升级至1.0版本后功能将更强 [3] - 网站上线约一小时后曾出现故障,但于当晚恢复 [3] 产品内容与规模 - 马斯克的百科全书网站目前拥有超88.5万篇文章 [3] - 作为对比,英语版维基百科拥有超700万篇文章 [3] - 有用户指出,马斯克的百科全书网站上的一些条目引用了维基百科的信息 [3] 行业竞争与反应 - 马斯克曾批评维基百科存在偏见信息 [3] - 负责运营维基百科的维基媒体基金会回应称,此前曾出现过维基百科的替代品,但并未干扰其运营 [3]