Llama 2

搜索文档
2025年AI在多个方面持续取得显著进展和突破
搜狐财经· 2025-06-23 15:19
多模态AI发展 - 多模态AI成为2025年AI领域关键趋势 能够处理和整合文本、图像、音频和视频等多种形式输入 [1] - OpenAI的GPT-4可从文本、音频和视觉输入生成文本 谷歌Gemini模型展示出色多模态能力 微软Designer应用利用多模态AI进行图形设计任务 [1] - 多模态AI在医疗保健领域可结合医疗图像和患者病史进行更准确诊断 在客户服务方面提供更直观全面支持 在内容创作上能根据单一提示生成多种媒体类型 [1] AI智能体演进 - AI智能体从简单聊天机器人向更智能、具有情境感知能力的助手转变 改变客户服务、生产力和用户交互方式 [3] - 智谱AI推出的智能体可替用户点外卖 能在无人工干预下完成跨应用程序、多步骤的真实任务 [3] - 2025年智能体将更加普及 能处理更复杂任务 为供应链经理、软件开发人员、金融分析师等提供支持 并有望革新自动驾驶领域 [3] 小语言模型(SLMs)崛起 - 2025年小语言模型(SLMs)快速发展并广泛采用 相比大型语言模型(LLMs)具有开发和实施成本低等优势 [3] - 微软Phi和Orca模型、GPT-4 o - mini、Claude 3.5 Haiku、Meta的Llama 2以及谷歌研究的更高效语言模型展示了SLMs潜力 [3] - SLMs使AI能力可应用于边缘设备和智能手机 为小型组织和研究人员提供更易获取的AI应用开发途径 并加快实时应用的推理时间 [3] AI4S推动科研变革 - 大模型引领的AI4S(AI for Science)成为推动科学研究范式变革的关键力量 [4] - 2025年多模态大模型进一步融入科学研究 帮助挖掘多维数据的复杂结构 为生物医学、气象、材料发现等基础与应用科学研究开辟新方向 [4] - 2024年诺贝尔物理学奖颁给机器学习先驱 化学奖颁给能预测蛋白质结构的AI开发者 凸显AI对推动科研的巨大贡献 [4] 具身智能发展 - 2025年被认为是"具身智能元年" 具身智能从本体扩展到具身脑 [4] - 行业格局上近百家具身初创企业可能迎来洗牌 技术路线上端到端模型不断迭代 小脑大模型的尝试有望取得突破 [4] - 商业变现方面会有更多工业场景应用具身智能 部分人形机器人迎来量产 如特斯拉的"擎天柱"有望在2025年实现小批量生产并投入使用 [4]
LeCun和世界模型V-JEPA 2:零样本机器人规划新时代!
Robot猎场备忘录· 2025-06-13 17:15
Meta AI战略调整与收购动态 - 公司计划以148亿美元收购AI数据标注企业Scale AI 49%股权,Scale AI CEO Alexandr Wang将加入Meta并领导新组建的超级智能实验室[1] - 图灵奖得主Yann LeCun领导的FAIR实验室因资源转向生成式AI产品团队而逐渐边缘化,核心技术人员接连离职[2] - FAIR实验室曾主导开源大模型Llama系列开发,但后续由生成式AI产品团队接管,目前聚焦高级机器智能(AMI)研究[2] 世界模型V-JEPA 2技术突破 - V-JEPA 2基于联合嵌入预测架构(JEPA),拥有12亿参数,专注于通过视频数据训练机器理解物理规律(如重力、碰撞)[7] - 模型实现零样本机器人规划能力,实验室测试中机器人成功抓取未见过物体,减少对特定任务训练数据的依赖[9] - 提供跨场景动作预测优化,工业场景中可模拟动作后果以提升效率与安全性[10] 具身智能领域应用前景 - 世界模型可赋能自动驾驶、机器人等自主系统,降低训练成本并加速虚拟到现实的知识迁移[16] - Meta发布三大基准测试(IntPhys 2、MVPBench、CausalVQA)评估AI对物理现象的理解能力[16] - 公司计划开发多模态JEPA模型,整合视觉、听觉和触觉信息,并探索跨时间尺度的分层学习[13] 行业竞争格局与Meta布局 - 全球仅少数企业专注世界模型研发,包括李飞飞的World Labs(融资2.3亿美元)和谷歌DeepMind的Genie项目[14] - 2025年Meta成立仿生人形机器人团队,目标打造类人任务执行能力,计划招聘100名工程师并由前Cruise CEO Marc Whitten领导[17] - 公司战略定位为机器人行业的"安卓平台",与Figure AI等企业合作提供底层AI技术[17] 科技巨头具身智能赛道动向 - 2024年四季度起,英伟达、苹果、OpenAI等国际大厂从AI赋能转向本体制造,国内蚂蚁、京东等跟进[17] - 大厂侧重"大脑"层技术突破,而非人形机器人硬件本体,目前AI能力仍是主要瓶颈[17] - 行业争议聚焦世界模型与具身智能大模型哪条路径更接近通用人工智能(AGI)[15]
Llama论文作者“出逃”,14人团队仅剩3人,法国独角兽Mistral成最大赢家
36氪· 2025-05-27 16:57
他们大多去向了 Mistral,这家总部位于巴黎的 AI 初创公司,正在用"开源速度"反攻 Meta 自己开启的战场。 Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 占据主流话语权的 2023 年,Meta 用一篇重量级论文和一组开放权重的大语言模型,意外地把 开源阵营推上主舞台。而那时,Meta 的 AI 科研团队 FAIR(Fundamental AI Research)也正处于高光时刻。 那篇震惊行业的论文:https://arxiv.org/pdf/2302.13971 但两年后,这条路线似乎走到了一个岔口。 Meta 官方尚未对"人才流失"作出正面回应,社交平台 X 上已经有一些讨论。目前,14 位在 Llama 论文中署名的研究者,目前只剩 3 位仍在 Meta。有人 形评论:Meta 打开了一条通往开源未来的路,却眼睁睁看着建路的人转身离开,另起炉灶。 2025年,Llama 的缔造者正在离开 Meta。 01 一条持续的人才迁徙线 从 LinkedIn 记录看,Llama 团队的出走并非一朝一夕,它悄然展开于 2023 年初,至 2025 年初几近完成。 ...
马斯克DOGE为何“借用”扎克伯格的Llama?
金十数据· 2025-05-23 17:42
美国著名在线杂志《连线》(Wired)查看的材料显示,DOGE隶属于人事管理局(OPM)的人员测试 并使用了Meta旗下的Llama 2模型,对联邦员工回应一封名为"岔路口"(Fork in the Road)的邮件内容进 行了分类整理。 这封邮件在2025年1月底大范围发出,向那些反对特朗普政府对联邦工作人员进行改革(包括强制重返 办公室、裁员以及效忠要求)的人,提供了"延期辞职"的选项——只需回复"resign"一词即可辞职。该 邮件的风格与马斯克2022年收购推特后向员工发送的邮件如出一辙。 WIRED获悉的文件显示,Llama模型被部署在本地运行,意味着员工数据未通过互联网传输。Meta和 OPM均未回应WIRED的置评请求。 虽然Meta首席执行官马克·扎克伯格(Mark Zuckerberg)曾与马斯克、亚马逊创始人杰夫·贝索斯(Jeff Bezos)一同出席今年1月的特朗普就职典礼,但Meta的技术被政府使用的情况鲜有公开。然而,鉴于 Llama是开源工具,政府可以在无需获得Meta明确许可的情况下自由使用它来配合马斯克的政策目标。 据外媒报道,马斯克主导的"政府效率部"(DOGE)使用了Met ...
个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署
量子位· 2025-05-15 16:37
以往类似规模的模型训练往往需要耗费大量的资源和时间,并且通常是由大型科技公司或专业研究机构凭借其雄厚的资金和算力优势来完成 的。 Psyche的出现让个人和小团体也可获取资源创建独特大规模模型。 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 打破科技巨头算力垄断 ,个人开发者联手也能训练超大规模AI模型? Nous Research宣布推出 Psyche Network ,可以将全球算力整合起来训练强大的人工智能。 Psyche是一个基于 Deepseek的V3 MLA架构 的 去中心化训练网络 ,测试网首次启动时直接对 40B参数LLM 进行预训练,可以在 单个 H/DGX 上训练,并在3090 GPU上运行。 对此,有网友表示,Nous Research有潜力成为新的前沿AI实验室。 技术突破和网络架构 DisTrO优化器 在传统AI训练中,数据需在中心服务器与分布式GPU之间高频传输,带宽不足会导致GPU利用率暴跌。 2024年Nous研发的 DisTrO 分布式训练优化器,通过 梯度压缩(仅传输关键参数更新) 和 异步更新策略 ,将跨节点通信的数据量降低 90%以上, 突破了训练过程中的带宽限 ...
Meta taps former Google DeepMind director to lead its AI research lab
TechCrunch· 2025-05-09 02:39
In Brief Meta has chosen Robert Fergus to lead its Fundamental AI Research (FAIR) lab, according to Bloomberg. Fergus had been working at Google DeepMind as a research director for nearly five years, per his LinkedIn. Prior to Google, he worked as a researcher scientist at Meta. Meta’s FAIR, which has been around since 2013, has faced challenges in recent years, according to a report from Fortune. FAIR led research on the company’s early AI models, including Llama 1 and Llama 2. However, researchers have r ...
速递|印度初创公司Ziroh Labs,推出无需高端芯片即可运行大型AI模型
Z Potentials· 2025-04-11 12:20
图片来源: Artisan 其他科技公司也曾利用 CPU 处理部分推理工作负载。 Ziroh Labs 表示其方法能带来高质量成果。这 家初创企业称其技术已通过美国芯片制造商英特尔公司和超威半导体公司的测试。 "Sun Microsystems 前首席战略官、该初创公司技术顾问威廉·拉杜切尔在线上活动中表示:"未来几 年,这将对市场产生非常深远的影响。" " 与其他国家一样,印度开发者难以负担并获取顶级英伟达芯片来构建和支持 AI 产品。 GPU 短缺可能 阻碍当地 AI 研究及部署的速度与规模。 印度理工学院马德拉斯分校主任 V ·卡玛科蒂指出:" AI 鸿沟源于只有拥有高端昂贵 GPU 资源的人才 能访问、开发和部署强大 AI 。我们正在证明,杀鸡焉用牛刀。" 印度人工智能初创公司 Ziroh Labs , 与该国顶尖技术学院的研究人员合作,设计出一套经济实惠的 系统,据称无需依赖英伟达公司等提供的高端计算芯片,即可运行大型 AI 模型。 该公司的框架名为 Kompact AI ,是与印度马德拉斯理工学院合作开发的。 Ziroh Labs 表示,该平台能让 AI 在日常计算设备的中央处理器( CPU )上 ...
泡沫即将破灭,英伟达的 AI 帝国面临最艰难的战斗
美股研究社· 2025-02-26 19:52
关键指标将是毛利率,目前毛利率已超过 70%,表明其具有定价能力。 如果利润率保持不变或扩大,则 将巩固 英伟达在 AI 领域的主导地位。然而,任何利润率的下降都表明来自 AMD MI300X 的竞争加剧, 或者超大规模企业正在转向具有成本效益的 AI 训练解决方案,例如 DeepSeek 的颠覆性模式。 英伟达每股收益 0.85 美元的预期并未完全反映公司的经营杠杆,因为增量收入会不成比例地增加收益。 从历史上看,英伟达的每股收益超出预期 3-5%,而 0.90 美元以上的预期将证实需求和定价原则仍然存 在。由于数据中心业务占公司总销售额的 75% 以上,任何超大规模需求的减弱都会阻碍人工智能引发的 反弹。然而,作为历史上最强劲的业务部分,游戏业务仍然疲软,尽管 RTX 5000 的 2025 年更新周期可 能是一个新的催化剂。 " 尽管存在危险,但英伟达的地位依然稳固。 " 作者 | Yiannis Zourmpanos 编译 | 华尔街大事件 2 月 26 日,英伟达公司( NASDAQ: NVDA ) 将公布第四季度财报,这将考验该公司在竞争日益激烈的情 况下,人工智能驱动的增长是否可持续。 尽管De ...