Workflow
Llama 3
icon
搜索文档
GPT-5能啃下多少行业硬骨头
21世纪经济报道· 2025-08-08 13:11
GPT-5技术突破 - GPT-5是融合模型,能根据问题复杂度自动调整思考深度,在速度与准确性间取得平衡[2][7] - 在数学推理(AIME 2025测试94.6%)、多模态理解(MMMU 84.2%)、医疗健康(HealthBench Hard 46.2%)等基准测试创下新高[4] - 编程能力显著提升:SWE-bench Verified测试74.9%,Aider polyglot测试88%,可生成数百行可运行代码且无需调试[4] 行业应用深化 - 医疗领域表现突出,被描述为"最准确的医疗问题解答模型",能结合患者个人情况提供细致建议[6] - 编程场景落地成熟,Meta预计明年50%代码由AI编写,微软当前20%-30%代码为AI生成[5] - 在40多种职业任务中表现优于人类专家,覆盖法律、物流、销售等高附加值领域[10] 商业化战略调整 - 年化经常性收入从6月100亿美元跃升至130亿美元,预计年底突破200亿美元[8] - 推出1美元政府服务计划,与美国国防部签署2亿美元合同,重点拓展企业及政府市场[8][9] - 当前75%收入依赖消费者订阅,企业市场份额25%落后于Anthropic(32%)[10] 市场竞争格局 - 面临谷歌Genie 3、Meta Llama 3及中国Qwen 3等竞品压力[8] - Anthropic凭借安全性占据金融/医疗市场,谷歌依靠云基础设施提供一站式方案[10] - 公司计划2026年在华盛顿设立办事处,强化政府关系[9]
一觉醒来,硅谷被他挖空了
36氪· 2025-07-18 20:41
核心观点 - Meta通过巨额资金投入和挖角顶尖人才加速AI领域布局,但"钞能力"可能面临企业文化整合和长期成效的挑战 [6][11][35] 算力基础设施 - Meta宣布建设全球首个1吉瓦能耗超级计算机机群,并筹备5吉瓦算力集群 [4] - 对比马斯克90亿美元打造的30万张英伟达B200集群(能耗200-300兆瓦),Meta算力投入规模显著更大 [5] 人才争夺战 - 一个月内从OpenAI、谷歌DeepMind和苹果挖走十几人,包括: - 前苹果基础研究团队负责人庞若鸣获2亿美元薪酬 [7] - 4名前OpenAI顶级研究员获4年3亿美元薪酬 [7] - 为部分OpenAI员工开出1亿美元签约奖金 [23] - 成立超级智能实验室,以143亿美元收购Scale AI 49%股权换取其CEO汪滔加盟 [16] - 挖角策略注重心理战,趁OpenAI放假期间快速行动 [24][26] 技术布局 - AI团队架构: - 汪滔领导基础研究、产品团队和FAIR实验室 [16] - 苏黎世"三人组"(含华人科学家翟晓华)主攻多模态大模型 [31] - 特拉皮特·班萨尔强化推理与强化学习能力 [31] - 4位华人专家提升Llama 5模型能力 [31] - 当前能力评估: - 数据与模型训练、多模态达顶级水准 [32] - 模型推理与规划、强化学习和LLM架构属第二梯队 [32] - AI安全与伦理、开发者生态与开源处于第三梯队 [32] 潜在问题 - 内部文化混乱:近2000人AI部门存在目标不清晰、恐惧文化盛行、部门割裂问题 [38][39] - 历史案例警示:迪士尼、雅虎、美林银行等大规模高薪挖角曾导致失败 [40][42] - 体育行业类比:巴黎圣日尔曼高价引进内马尔(2.22亿欧元)和梅西最终未达预期 [44]
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
量子位· 2025-06-26 11:43
核心观点 - 美国法院首次裁定AI公司可在未经作者许可情况下使用合法购买的已出版书籍训练AI 依据合理使用原则认定AI训练属于转化性使用 未取代原作市场且有利于技术创新[2][3][17] - 法院明确区分数据来源合法性 盗版书籍训练不构成合理使用 需承担侵权责任 但合法采购书籍的扫描副本可用于训练[15][16][33] - 裁决显著降低AI行业训练数据的版权风险 为LLMs发展提供法律支持 可能影响OpenAI和Meta等同类案件审理[3][32][34] 案件背景 - Anthropic被指控在2021-2022年通过盗版网站LibGen等非法下载超700万份受版权保护书籍建立数字图书馆 2023年使用子集训练Claude模型[7][8][10] - 2024年转向合法采购 雇佣前Google图书扫描项目负责人Turvey采购数百万本纸质书 但未持续跟进出版商授权沟通[11][12] - 2024年8月三位作家起诉其非法复制作品训练AI 法院最终支持合法来源数据的使用权[6][13] 法律依据 - 援引美国版权法"合理使用"原则 认定AI训练具有高度转化性 输出内容未侵犯原作且未形成市场替代[2][14] - 参考历史判例:2015年Google Books案确立数字化检索属合理使用 2022年GitHub Copilot案确认代码训练转化性[24][25][29] - 法院强调技术中立性 类比人类阅读学习过程 认为AI消化书籍信息应获同等权利[4][18] 行业影响 - 加速AI公司数据获取合规化进程 Anthropic等企业需建立正版采购渠道 避免盗版资源[11][15] - 技术解决方案受推动 GitHub Copilot已部署代码来源标注功能 防范许可证冲突[29][30] - 创作者权益保护机制待完善 需探索新型授权模式应对AI训练需求[19] 争议焦点 - 法律界对"转化性使用"标准存在分歧 部分观点认为AI大规模复制不同于人类学习[19] - 开源社区担忧商业公司滥用合理使用条款 将免费资源转化为付费服务[28][29] - 出版商面临正版采购与盗版监控的双重成本压力[12][31]
人工智能周报(25年第23周):OpenAI 公布 GPT-5 路线图,腾讯升级企业大模型知识库-20250613
国信证券· 2025-06-13 17:11
报告行业投资评级 - 优于大市 [1][4] 报告的核心观点 - 互联网一季报业绩整体稳健,电商行业竞争激烈,各平台向商家让利或在外卖即时零售领域加大投入寻找新增量;AI 方面巨头业务场景持续受益,但短期 ai agent 等方面仍需打磨;当前恒生科技指数处于震荡期,推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2][32] 相关目录总结 AI 相关网站流量数据 - 展示了 2025 年 5 月 28 日至 6 月 3 日期间部分 AI 相关网站周平均访问量、访问量环比增长和平均访问停留时间等数据,如 ChatGPT 周平均访问量 1248.00M,环比增长 -0.24% [10] 公司动态 - OpenAI 公开 GPT - 5 路线图,预计 7 月发布,还更新 ChatGPT 商业计划,新增功能并引入灵活定价机制面向商业客户开放 [17] - 谷歌测试新 AI 搜索展示方式,将 AI 生成摘要折叠,平衡生成式搜索与网页导流利益关系 [19] - Meta 开放 Llama 3 商业化接入,与 AWS 深度集成抢占企业市场 [20] - 英伟达举办 GTC 大会,重申 AI 基建主导地位,强调边缘侧推理作用,携手企业展示应用场景并加快本土化节奏 [21] - 亚马逊广告业务加码生成式 AI,推出 AI Studio 广告内容自动生成平台,试点核心市场 [22] - 腾讯云升级企业大模型知识库为智能体开发平台,接入相关模型和联网搜索,还计划推出和开源部分模型 [23] - 字节跳动旗下 Seed 团队开源统一多模态理解和生成模型 BAGEL,在多模态领域表现出色 [25] 底层技术 - 微软 Azure Foundry 新增“安全性”维度对约 1900 款模型进行内容风险量化评估,安全评分融入工具链 [26] - 谷歌更新 Gemini 2.5 Pro 预览版模型,评分上升,优化风格与结构,放宽请求限制 [27] - 智源研究院发布“悟界”系列大模型,体现 AI 发展新趋势 [28] - 阿里巴巴开源全新向量模型系列 Qwen3 - Embedding,性能较上一版本提升 40% [29] 行业政策 - 工信部研究推动人工智能产业发展和赋能新型工业化思路举措,推动大模型落地,统筹推进标准工作等 [30] - 工信部审议《工业和信息化部信息化和工业化融合 2025 年工作要点》,要求实施“人工智能 + 制造”行动 [31] - 成都市就促进人工智能产业高质量发展政策措施征求意见,涵盖多方面举措 [31] 重点事件预告 - 6 月 9 日 - 13 日举办 Apple WWDC 2025 开发者大会 [34] - 6 月 9 日 - 11 日举办 AIM - 2025 国际人工智能与机器学习大会 [34] - 6 月 11 日 - 12 日举办火山引擎原动力大会 [34] - 6 月 14 日 - 15 日举办第四届智能决策论坛 [34] 投资建议 - 推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2][32] 重点公司盈利预测及投资评级 | 公司代码 | 公司名称 | 投资评级 | 昨收盘(港元/美元) | 总市值(百万港元/美元) | EPS(2025E) | EPS(2026E) | PE(2025E) | PE(2026E) | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 0700.HK | 腾讯控股 | 优于大市 | 505.0 | 4,640,972 | 23.29 | 26.33 | 17.4 | 15.7 | | 9999.HK | 网易 - S | 优于大市 | 197.3 | 625,038 | 10.76 | 11.54 | 15.5 | 14.7 | | 3690.HK | 美团 - W | 优于大市 | 136.6 | 834,603 | 6.04 | 7.96 | 17.9 | 13.9 | | 9888.HK | 百度集团 - SW | 优于大市 | 82.1 | 225,789 | 7.83 | 8.42 | 8.8 | 8.0 | | 1024.HK | 快手 - W | 优于大市 | 51.2 | 219,726 | 4.06 | 4.96 | 10.2 | 8.7 | | 9988.HK | 阿里巴巴 - SW | 优于大市 | 113.9 | 2,174,122 | 6.89 | 7.64 | 12.5 | 11.4 | [3]
Meta makes major investment in Scale AI, takes in CEO
TechXplore· 2025-06-13 16:10
投资交易 - Meta对Scale AI进行重大投资 估值超过290亿美元 [3] - Meta投资金额超过100亿美元 同时获得Scale AI创始人兼CEO Alexandr Wang加入 [4] - Meta将持有Scale AI少数股权 具体比例未披露 [9] - 交易完成后 Uber Eats联合创始人Jason Droege将接任Scale AI CEO [9] 公司战略 - Scale AI专注于为商业、政府和实验室提供人工智能解决方案 [5] - 公司将利用新资金加速创新 加强合作伙伴关系 并向股东分配收益 [9] - Scale AI已发展到1500多名员工规模 [5] - 公司部分员工将随创始人一起加入Meta参与AI项目 [6] 技术合作 - Scale AI与Meta合作开发基于Llama 3模型的国防AI系统"Defense Llama" [7] - 该模型专门用于美国国家安全任务 包括军事行动规划和敌方弱点分析 [7] - 系统具备评估场景和回答战术问题的能力 如敌方攻击方式和有效应对措施 [8] - Scale AI承诺持续与国防部门合作 确保模型可靠性 [8] 行业动态 - Meta首席Mark Zuckerberg透露其生成式AI助手每月有10亿用户使用 [10] - 该交易发生在Meta与OpenAI、Google和微软等公司的激烈AI竞争中 [4] - Scale AI创始人表示AI发展前景无限 公司致力于连接人类价值与技术潜力 [5]
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
量子位· 2025-06-10 12:05
DeepSeek-R1性能表现 - 最新优化版R1-0528在编程榜单aider上取得60分 超过Claude 4 Sonnet的56.4分以及1月满血版R1 [1] - R1-0528满血版在aider得分71.4分 超过不开启思考的Claude 4 Opus [5] - aider榜单侧重现实软件工程任务评估 非单纯解题能力 [2] 量化技术突破 - 1.93bit量化版文件大小比8bit原始版降低70%以上 [3][9] - 最小1.66bit版本文件仅162GB 比8bit版缩减80% [9] - Unsloth工作室推出9种量化版本 涵盖1.66bit至5.5bit [7][8] - 推荐2.4bit和2.7bit版本 实现精度与体积最佳平衡 [14] 硬件适配性 - 1.78bit版本搭配64GB内存可实现每秒1token生成 [10] - 24GB显存显卡(如3090)配128GB内存可达每秒5token [11] - 建议180GB以上统一内存或显存+RAM组合以突破5token/秒 [12] Unsloth工作室技术能力 - 微调模型覆盖DeepSeek、Qwen、Phi、Mistral、Llama等主流模型 [16] - 优化后模型内存占用减少50%-80% 速度提升50%-2.2倍 [17] - GitHub仓库获4万星标 推出蒸馏版Qwen3-8B性能对标235B大模型 [16][19] 游戏场景表现 - R1-0528在Lmgame Bench六款游戏中表现突出 俄罗斯方块成绩超越o4-mini [22][25] - 糖果传奇得分548分 领先o4-mini约20分 [32] - 推箱子、2048等游戏表现较1月版本有显著提升 [28]
Meta拟重金加码AI赛道,传将斥资超百亿美元投资Scale AI
搜狐财经· 2025-06-10 01:19
Meta与Scale AI的潜在投资 - Meta正与Scale AI商讨一项可能高达或超过100亿美元的投资 这将成为公司有史以来最大的对外AI投资之一 [2] - 该交易可能跻身全球私营企业最大融资案例之一 [2] Scale AI公司背景 - Scale AI成立于2016年 总部位于美国旧金山 由华裔创业者Alexandr Wang创办并担任CEO [3] - 公司专注于为AI模型提供高质量数据标注服务 是AI模型训练的关键环节 客户包括微软 OpenAI等顶级科技公司 [3] - 公司大量数据标注工作由合同工完成 美国劳工部曾就其员工分类和薪酬问题进行调查 但近期已终止调查 [3] Scale AI财务与发展 - Scale AI在2023年实现8.7亿美元营收 预计2024年将突破20亿美元 [4] - 在2023年F轮融资中 Meta参与投资 该轮融资规模达10亿美元 公司估值达到138亿美元 [4] - 此次传闻的新一轮投资金额可能超过100亿美元 [4] 双方技术合作 - Scale AI曾基于Meta的Llama 3模型开发名为"Defense Llama"的军用AI模型 主要用于军事与国防领域 [5] - 这显示出两家公司在技术上的深度绑定 也体现了Meta AI战略的多元化布局 [5] Meta的战略考量 - Meta近年来在AI领域加大投入 试图在与谷歌 微软 OpenAI等竞争对手的竞争中抢占先机 [6] - 此次投资表明Meta寻求在数据供应链端掌握话语权 数据是训练AI模型和优化算法的核心燃料 [6] 行业影响 - 这笔潜在投资可能改写Meta的AI战略版图 并深刻影响全球AI产业格局 [7] - Scale AI作为"数据巨头"正成为各大科技巨头竞相合作的关键力量 [7]
Meta reportedly in talks to invest billions of dollars in Scale AI
TechCrunch· 2025-06-09 03:59
投资交易 - Meta正讨论对Scale AI进行数十亿美元的投资 交易金额可能超过100亿美元 这将成为Meta母公司Facebook有史以来最大的外部AI投资 也是私营公司有史以来规模最大的融资事件之一 [1] - Meta此前已参与Scale AI的10亿美元F轮融资 该轮融资对Scale AI的估值为138亿美元 [3] 公司业务 - Scale AI为微软和OpenAI等公司提供数据标注服务 帮助训练AI模型 大部分标注工作由承包商完成 [2] - 美国劳工部近期结束了对Scale AI是否错误分类和少付员工工资的调查 [2] - Scale AI基于Meta的Llama 3开发了军事用途大语言模型Defense Llama [3] 财务表现 - Scale AI去年营收为8.7亿美元 预计今年营收将达到20亿美元 [2]
2025年第18期(总899期):开源大模型DeepSeek实现三个“首
搜狐财经· 2025-06-07 16:35
DeepSeek:全球开源AI大模型的新标杆 - AI大模型开源需满足代码完整、模型参数公开、训练数据透明三大核心标准,较传统软件开源更复杂 [1][13] - 多数大模型厂商走纯闭源或"半开源"路线,如OpenAI的GPT-4、Meta的Llama 3仅部分开源且附带商用限制 [1][13] - DeepSeek以全栈开源和宽松协议树立新典范:开放代码、权重、文档下载,公开GPRO训练算法等技术细节,采用无商用限制的MIT许可 [1][14] DeepSeek的三大突破性"首次" 技术路径革新 - DeepSeek-R1通过纯强化学习(RL)训练证明"小而美"路径的可行性,打破依赖"Scaling Law"的"唯资源论"定式 [2][17] - 推理成本与定价显著低于国际主流模型,为资源有限的国家提供低成本高效能技术方案 [2][17] 应用爆发 - 应用程序18天下载量达1600万次,日活突破3000万的速度创行业纪录 [3][18] - 引发《自然》期刊等国际媒体高度关注,被视为非美国公司践行开源初心的标杆 [3][18] 生态重构 - 吸引全球软硬件厂商适配,构建"模型—芯片—系统"一体化生态:国内十余家芯片厂商、华为/荣耀等手机厂商完成接入,美国AMD、亚马逊、Apple等企业开展合作 [4][20] - 美国红杉资本设立2亿美元专项基金用于投资DeepSeek技术生态项目 [20] 推动AI普惠化平权化的发展建议 技术协同创新 - 依托GitHub、Hugging Face等开源平台,鼓励企业与科研机构基于DeepSeek等开源成果开展二次开发 [5][21] 行业应用落地 - 推动开源大模型与各行业场景结合,发展垂类模型并构建高质量数据集 [6][21] 全民素养培育 - 通过线上平台开展大模型通识教育,推动企业与高校合作建设开发平台 [7][22] 结语 - DeepSeek的"低成本、高性能、全开放"特性重塑行业竞争格局,为全球AI普惠化、平权化提供可行路径 [8][12]
最新必读,互联网女皇340页AI报告解读:AI岗位暴涨,这些职业面临最大危机
36氪· 2025-06-03 21:32
AI行业趋势 - ChatGPT仅用2个月达到1亿用户,17个月后月活增至8亿,订阅用户超2000万,年营收近40亿美元,成为商业化速度最快的AI产品[5][6] - 2024年AI相关资本支出达2120亿美元,同比增长63%,为十年内最高[6][11] - AI模型训练成本8年内暴涨2400倍,单个模型训练成本可能在2025年达10亿美元,未来或突破100亿美元[6][20] - 开源模型如DeepSeek、Qwen等在推理和编程能力上已逼近顶级闭源模型[36][37] 基础设施投资 - 苹果、英伟达、微软、Google、亚马逊、Meta等科技巨头2024年AI相关资本支出达2120亿美元[11] - 英伟达占据数据中心投资预算的25%,成为AI浪潮最大受益者[12] - 英伟达GPU推理单个Token能耗10年间下降约105000倍,有利于规模化部署[27] 技术发展 - AI在图灵测试中表现超越人类,GPT-4.5被73%测试者误认为人类[43][46] - Midjourney图像生成质量从v1到v7显著提升,达到商品级水平[50] - ElevenLabs语音克隆技术月访问量从0飙升至2000万,音色克隆+实时翻译趋近商用级别[57] 应用场景 - Waymo自动驾驶出租车在旧金山市场份额已达1/3[59] - AI相关岗位2018-2025年增长448%,传统IT岗位需求下降9%[67][69] - AI Agent成为新型数字劳动力,能执行多步骤任务如在线购物、界面导航等[72][74] 区域发展 - 美国发布超100个训练计算量超10²³ FLOPs的大语言模型,中国紧随其后不断缩小差距[40] - ChatGPT北美之外用户普及率超90%,呈现全球同步爆发特征[9]