Llama 3.1 405B

搜索文档
拧巴的扎克伯格
虎嗅· 2025-04-09 07:01
出品 | 虎嗅科技组 作者 | 房晓楠 编辑 | 苗正卿 头图 | 视觉中国 无疑,这几天AI圈最大的流量都被Meta承包了。 先是4月6日,迟迟不出手的Meta终于亮相,一举扔出包括Llama 4 Scout(109B)、Llama 4 Maverick (400B)和Llama 4 Behemoth在内的Llama 4套餐,凭借"原生多模态MoE架构""性能超越DeepSeek V3""1000万token上下文"等亮点,一路高举高打。业界也是喜闻乐见,"开源之光依旧能打"等声音持续 不断,Llama 4出道即巅峰。 但没想到,紧接着负面声音层出不穷。 一方面,开发者在实际测评时发现,Llama 4的性能并没有官方宣扬的那样强大,甚至在代码、逻辑推 理方面,远不如GPT-4o、DeepSeek R1 、 Gemini 2.5 pro。 另一方面,有自称Meta内部员工的人员爆料,Llama 4存在造假嫌疑,为了"赶工期",在后训练阶段 中,将多个benchmark测试集混入训练数据,以提升基准分数。甚至,技术负责人看不过去这样的造假 行为,递交辞职报告。传闻一出,立即发酵,Meta陷入舆论风波中,各种声讨 ...