Llama 1

搜索文档
「纳米香蕉」LMArena两周500万投票,引爆10倍流量,谷歌、OpenAI扎堆打擂台
36氪· 2025-09-04 18:10
LMArena平台表现 - 8月平台流量暴增10倍 月活跃用户超过300万[1][9] - 两周内吸引超过500万次总投票 其中纳米香蕉单独赢得250万+直接投票 创历史最高参与度[1][3] - 平台前身Chatbot Arena起源于2023年伯克利研究项目 采用匿名众包成对比较机制评估大模型[12] 纳米香蕉模型表现 - 8月登顶Image Edit Arena榜首 同时获得Text-to-Image榜单第一名 成为双料冠军[1][17] - 以匿名盲测方式登场 用户需在Battle功能中随机遇到该模型[17] - 实际为谷歌Gemini 2.5 Flash Image模型 在社区引发广泛猜测后由谷歌官方认领[4] 平台运营机制 - 采用Elo计分系统 通过匿名随机配对投票减少品牌光环效应[20] - 累计投票达数百万次 科技媒体频繁引用其数据[20] - 提供跨厂商模型同台竞技 包含开源和闭源模型[22] 行业影响 - 成为谷歌 OpenAI等AI大厂模型评测的核心竞技场[1][9] - 被科技公司视为AI技术风向标 厂商密切关注榜单变化[16] - 为模型厂商提供真实用户反馈报告 帮助迭代改进模型[25] 模型排名数据 - Gemini 2.5 Flash Image以1362分位居Image Edit Arena榜首[18] - 在Text-to-Image榜单中 Gemini 2.5 Flash Image以1147分领先第二名Imagen 4.0 Ultra的1135分[18] - 编码领域Claude表现最佳 创意领域Gemini位居前列[19] 平台发展方向 - 推出WebDev等基于真实使用场景的基准测试[27] - 计划扩展到更多行业 弥合技术与实用场景的鸿沟[28] - 保持数据研究流程透明 发布数据推动社区建设[29]
基模“驱虎”,阿里“吞狼”
36氪· 2025-09-04 09:50
今年7月,彭博社对阿里云创始人王坚进行了一次访谈,当时王坚还有另一重身份,之江实验室主任。 之江实验室是浙江省为基础技术研究和攻关建设的前沿阵地,2021年被纳入了国家实验室体系,作为继云计算之后的又一项进入社会议题的重要基础技 术,人工智能自然也在之江实验室研究之列。 曾经,王坚是国内最大一朵云——阿里云的缔造者,如今,王坚再次站到了人工智能技术漩涡中央,本质上是当代"工业革命",或者说是技术革命的一次 延续。 在彭博社的那场访谈中,王坚有这样一段话描述了云与AI的关系: "因为互联网的存在,我确信云计算是一项好业务,而互联网将数据聚集到一起,也让我坚信,数据会从根本上改变商业模式。 但我当时没有意识到的是,计算、数据、模型结合在一起会创造出人工智能,会再次改变我们做生意的方式,也没有想到,人工智能会成为云计算最大 的'客户'。" 当然,王坚更不会想到的是,它年之后,人工智能会在短短几天内为阿里云带来3600亿市值。 01 基模"驱虎" 2019年3月27日,2018年图灵奖名单公布,在这一届图灵奖得主中,最引人注目的是"深度学习三巨头"——杰弗里·辛顿、约书亚·本吉奥和杨立昆。 这老三位有着错综复杂的关系 ...
Meta taps former Google DeepMind director to lead its AI research lab
TechCrunch· 2025-05-09 02:39
人事变动 - Meta任命Robert Fergus担任基础人工智能研究(FAIR)实验室负责人 其此前在Google DeepMind担任研究总监近五年 更早曾在Meta担任研究科学家 [1] - Meta前AI研究副总裁Joelle Pineau于4月宣布离职 [2] FAIR实验室现状 - FAIR实验室成立于2013年 主导开发了Llama 1和Llama 2等早期AI模型 [2] - 近年面临人才流失问题 大量研究人员转投初创公司、其他企业或Meta内部新成立的GenAI团队(负责Llama 4开发) [2]