Large language model

搜索文档
Etsy(ETSY) - 2025 Q1 - Earnings Call Presentation
2025-04-30 20:30
业绩总结 - 2025年第一季度Etsy市场总交易额(GMS)为28亿美元,同比下降8.9%[7] - 2025年第一季度合并收入为6.51亿美元,同比增长0.8%[7] - 2025年第一季度调整后EBITDA为1.71亿美元,调整后EBITDA利润率为26.3%[7] - 2025年第一季度净亏损为52,096千美元,而2024年同期净收入为63,004千美元[73] - 2025年第一季度的自由现金流为35,273千美元[80] 用户数据 - 2025年第一季度活跃买家数量为8850万,同比下降3.4%[50] - 2025年第一季度新买家数量为480万,同比下降15.4%[50] - 2025年第一季度的总交易额(GMS)每活跃买家为120美元,同比下降3.5%[50] - 2025年第一季度的应用程序GMS占总GMS的44.5%,为历史最高水平[18] 未来展望 - 预计2025年第二季度的合并GMS将以与2025年第一季度相似的速度下降[60] 财务状况 - 截至2025年3月31日,公司现金及现金等价物为649,191千美元,较2024年12月31日的811,178千美元下降约20%[72] - 2025年第一季度的运营活动提供的净现金为49,183千美元,较2024年同期的69,033千美元下降约29%[74] - 2025年第一季度的总资产为2,120,802千美元,较2024年12月31日的2,417,782千美元下降约12.3%[72] - 2025年第一季度的总负债为3,031,101千美元,较2024年12月31日的3,176,648千美元下降约4.6%[72] 运营费用 - 2025年第一季度的运营费用为481,442千美元,较2024年同期的390,731千美元增长约23.3%[73] - 2025年第一季度的资产减值费用为101,703千美元,2024年同期没有此项费用[73]
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1/o1,网友:让开源再次伟大
量子位· 2025-04-29 07:25
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 千呼万唤,Qwen3终于来了! 一口气上新8大模型,通通开源。 旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini,最大杯稠密模型也以32B参数量达到了可观水平。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIME'24 | 85.7 | 81.4 | 74.3 | 79.8 | 83.9 | 92.0 | 79.6 | | AIME'25 | 81.5 | 72.9 | 79.2 | 70.0 | 77.3 | 86.7 | 74.8 | ...
模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了
机器之心· 2025-04-28 12:32
机器之心报道 编辑:陈萍、+0 大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计 算或内存资源有限的环境中。 例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下拥有 4050 亿个参数,需要大约 810GB 的内存进行完整推理,超过了典型高端 GPU 服务器(例如, DGX A100/H100,配备 8 个 80GB GPU)的能力。因此,部署该模型需要多个节点,这使得它昂贵且难以获取。 本文,来自莱斯大学等机构的研究者提出了一种解决方案, 可以 将任何 BFloat16 模型压缩到原始大小的 70%,同时还能在任务上保持 100% 的准 确性。 论文标题: 70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float 为了应对 LLM 不断增长的模型尺寸,通常会采用量化技术,将高精度权重转换为低位表示。这显著减少了内存 ...
The Second Half:一位 OpenAI 科学家的 AI 下半场启示录
海外独角兽· 2025-04-17 14:26
AI发展阶段的划分 - AI发展已进入下半场,从单纯解决问题转向定义问题和评估模型效果 [6][7] - 上半场核心在于训练方法创新,如Transformer、AlexNet、GPT-3等模型突破 [9] - 上半场训练方法论文引用量远超benchmark论文,如Transformer引用16万次vs WMT'14的1300次 [9][11] 强化学习(RL)的突破 - RL获得泛化能力,能同时处理软件工程、创意写作、数学问题等多样化任务 [8] - RL三大要素中,先验知识(priors)重要性超过算法和环境 [13][14][15] - 语言模型pre-training为RL提供了关键先验知识,但直接应用于控制领域效果不佳 [20][21] AI有效配方 - 核心配方包含:大规模语言预训练、算力数据扩展、推理与行动理念 [12] - 语言通过agent reasoning实现泛化,如ReAct框架结合推理与行动 [25][26] - 环境设计重要性凸显,OpenAI曾开发Gym、World of Bits等标准化RL环境 [18][19] 评估方法的转变 - 传统i.i.d评估假设与现实不符,需开发考虑长期记忆和连续任务的评估方式 [30] - 自动评估假设被质疑,真实人机交互评估如Chatbot Arena更具现实意义 [28][30] - 效用问题成为关键,AI需从攻克benchmark转向创造实际经济价值 [28][30] 行业影响与趋势 - 通用配方使渐进式改进价值降低,5%专项优化可能不如30%的通用模型提升 [26][28] - 下半场将催生万亿级公司,通过智能产品化实现商业价值 [30] - 行业需重新思考问题定义,产品经理类技能将更受重视 [7][28]
为什么 AI Agent 需要自己的浏览器?
海外独角兽· 2025-04-08 19:05
编译:Xeriano 编辑:Cage 浏览器的使用者正在逐渐从人类用户转移到 AI Agent ,Agent 与互联网环境互动的底层设施也因此 正在变得越来越重要。传统浏览器无法满足 AI Agent 自动化抓取、交互和实时数据处理的需求。 Browserbase 的创始人 Paul Klein 早在 23 年底就敏锐地洞察到 AI Agent 亟需一个全新的交互载体 ——一个"为 AI 而生"的云端浏览器。这个浏览器不仅要解决现有工具的性能和部署问题,更核心的 是要利用 LLM 和 VLM 赋予浏览器理解和适应网页变化的能力,让 AI Agent 能用更接近自然语言的 方式与之交互,稳定地完成任务。 Browserbase 是一家成立一年多的 headless browser 服务提供商,以云服务的形式为 AI Agent 公司提 供 scalable、高可用性的浏览器服务。近期,Browserbase 又推出了 StageHand,一种利用 LLM 使得 开发者可以用自然语言与网页进行交互的框架,进一步拓展了其在 headless browser 领域的影响。 本文基于创始人早期备忘录进行了编译,详细阐述 ...
为什么 AI Agent 需要专属浏览器?
海外独角兽· 2025-04-08 19:05
文章核心观点 随着浏览器使用者从人类用户向 AI Agent 转移,传统浏览器无法满足 AI Agent 需求,Browser for AI 市场快速增长,公司需打造更好的 headless browser 并制定有效市场策略,同时应对风险与竞争,新兴创业公司有颠覆市场的机会 [3][5][25] 目前的浏览器无法满足 AI Agent 需求 - 互联网超 40% 流量来自 bots,AI Agent 也会通过浏览网站执行任务,但开发者构建网络数据自动化解析工具存在问题 [5] - Scraping 不简单,现代网站需模拟完整浏览器环境、实现页面交互自动化、绕过检测机制,且解析数据困难,内置工具难以构建有效 Scraping 流程 [6][8][13] - 现有的 headless browser 不 AI - native,主流的 Puppeteer 和 Playwright 存在开发体验不佳的问题,如 CSS 选择器脆弱、依赖体积大等 [20][23] Browser for AI 市场正在快速增长 - 大型语言模型依靠浏览器获取最新知识,有 RAG 和基于 Plugins/Web Agents 两种技术途径,主流 LLMs 编排框架已集成浏览器自动化功能 [26] - 浏览器对 LLMs 重要性日益明显,Scraping 和浏览器自动化市场可观,相关初创公司受财富 500 强企业关注,多个趋势将推动浏览器自动化工具普及 [27][31][34] 打造一个更好的 headless browser - 现有 headless browser 存在臃肿、部署复杂、集成方案脆弱等问题,开发者需要性能更强、可靠性更高、使用更简便的方案 [35] - 实现下一代浏览器自动化平台有三个关键创新点:打造开源、高度优化的 headless browser;用 AI 赋予浏览器“超能力”;提供全新层次接口,给开发者极致体验 [35][36][37] 如何走向市场 - 开发者工具类产品有效的分发策略包括打造一流产品、通过开源投资社区、建立值得信赖的品牌、教育并赋能开发者,产品卓越是关键 [39] - 开源是好的分发渠道,良好品牌重要,吸引开发者需互动并提供优秀文档和 SDK,自下而上策略可增强口碑传播,公司成功后有向外扩展机会 [39][40] 风险与竞争 风险 - 在已有市场成为默认选择困难,需用全新范式颠覆市场 [43] - 浏览器自动化可能与客户核心产品深度绑定,但外购更合理 [45] - LLMs 推理成本高,但长期可能下降,可将相关功能设为可选模式 [46] - 基础设施产品易商品化,需重新设计定价策略并控制单位成本 [47] - 存在滥用与法律合规风险,但 Scraping 合法且识别滥用变容易 [48] - 大公司可能开发此类产品,但浏览器与 LLMs 结合有复杂性,中小商家场景仍需浏览器自动化 [49][50] 竞争对手 - 浏览器自动化领域有 Browserless、Browse.ai、Induced.ai 等公司 [52][53][54] - Scraping APIs 公司提供 URL 接口返回非结构化数据并提供额外功能 [55] - 信息检索 APIs 公司专注特定信息搜索和检索服务,未来顶尖公司应吸取三类公司优势,最大竞争对手是自建方案的开发者 [56] 总结 - 浏览器自动化长期缺乏投资,AI 应用高度依赖该能力,市场有大量使用场景,为新兴创业公司提供颠覆机会,成功创始人需有相关背景和洞察力 [60]
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
量子位· 2025-04-03 10:12
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI承认Claude是最好的了(狗头)。 刚刚开源的新基准测试 PaperBench ,6款前沿大模型驱动智能体PK 复现AI顶会论文 ,新版Claude-3.5-Sonnet显著超越o1/r1排名第一。 与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比,PaperBench 更考验综合能力,不再是只执行单一任务 。 具体来说,智能体在评估中需要复刻来自ICML 2024的论文,任务包括理解论文、编写代码和执行实验。 最终成绩如下: Claude-3.5-Sonnet断崖式领先,第二名o1-high分数只有第一的60%,第三名DeepSeek-R1又只有第二名的一半。 此外GPT-4o超过了推理模型o3-mini-high也算一个亮点。 | 2.6 ± 0.2 | | --- | | 4.1 ± 0.1 | | 3.2 ± 0.2 | | 6.0 ± 0.3 | | 13.2 ± 0.3 | | 21.0 ± 0.8 | 除了AI之间的PK, OpenAI这次还 招募顶尖的机器学习博士对比o1 。 虽然最终结论是AI在 ...
TrendForce:英伟达已成IC设计霸主
半导体芯闻· 2025-03-17 18:42
文章核心观点 - 2024年全球前十大IC设计业者营收合计约2498亿美元,年增49%,AI热潮带动半导体产业向上,NVIDIA成产业霸主,2025年边缘AI装置将成半导体成长动能 [1] 分组1:2024年全球前十大IC设计业者营收情况 - 2024年全球前十大IC设计业者营收合计约2498亿美元,年增49% [1][5] - 前五名在2024年全球前十大IC设计业者合计营收中总计贡献逾90% [2] 分组2:各公司2024年营收及2025年展望 NVIDIA - 2024年IC设计相关营收逾1243亿美元,蝉联第一名,于前十名中占比高达50%,营收成长幅度达125%,后续GB200/GB300等产品将带动2025年AI相关营收 [1][2][5] Broadcom - 2024年半导体部门营收达306.44亿美元,年增8%,排名第三,AI芯片收入占其半导体解决方案超30%,2025年无线通讯、宽频及服务器储存业务反弹力道将更强 [2][5] AMD - 2024年营收年增14%,达257.85亿美元,排第四名,server业务成长94%,2025年将聚焦AI PC、server和HPC/AI加速器市场并与多品牌合作维持高成长动能 [3][5] Qualcomm - 2024年营收达348.57亿美元(仅计算QCT业务),年增13%,位居第二名,与ARM专利授权官司暂告一段落,2025年将聚焦AI PC等边缘运算装置拓展高端消费市场市占 [3][5] MediaTek - 2024年营收达165.19亿美元,年增19%,智慧型手机等业务有斩获,2025年5G手机市场渗透率将提至65%以上,与NVIDIA合作产品将延续成长动能 [3][5] Realtek - 2024年营收约35.3亿美元,年增16%,回升至第七名,2025年网通、车用业务是主要成长动力,Wi-Fi 7市场渗透率将提升至双位数 [4][5] Will Semiconductor - 2024年营收达30.48亿美元,年增21%,受高阶CIS出货占比提高和电动车自动驾驶应用渗透影响,CIS光学感测元件市占率增加带动营收攀高 [4][5] MPS - 2024年营收达22.07亿美元,年增21%,因PMIC打入AI server供应链,企业数据中心部门营收翻倍增长 [4][5] Marvell - 2024年营收5.637亿美元,年增2%,排名第六 [5] Novatek - 2024年营收3.200亿美元,年降10%,排名第八 [5]
研报 | 2024年全球前十大IC设计业者营收合计年增49%,英伟达囊括半数占比
TrendForce集邦· 2025-03-17 14:26
文章核心观点 - AI热潮带动半导体产业向上,2024年全球前十大IC设计业者营收合计约2498亿美元,年增49%,展望2025年边缘AI设备将成半导体成长动能,产业呈现寡占现象 [1][2] 2024年全球前十大IC设计业者营收情况 - 2024年全球前十大IC设计业者营收合计约2498亿美元,年增49% [1][2] - NVIDIA 2024年营收1243.77亿美元,年增125%,占前十名营收比达50% [2][4] - Qualcomm 2024年营收348.57亿美元,年增13%,位居第二 [2][5] - Broadcom 2024年半导体部门营收306.44亿美元,年增8%,排名第三 [2][4] - AMD 2024年营收257.85亿美元,年增14%,排第四名 [2][4] - MediaTek 2024年营收165.19亿美元,年增19%,排第五名 [2][5] - Realtek 2024年营收约35.3亿美元,年增16%,回升至第七名 [2][6] - Novatek 2024年营收32亿美元,年降10% [2] - Will Semiconductor 2024年营收30.48亿美元,年增21%,排第九名 [2][6] - MPS 2024年营收22.07亿美元,年增21%,排第十名 [2][6] 产业寡占现象 - AI依赖的高阶芯片需庞大资本和先进技术投入,厂商进入市场门槛高,造成领先者寡占情况,2024年前五名在前十合计营收中贡献逾90% [3] 各企业2025年展望 - NVIDIA后续GB200/GB300等产品将进一步带动2025年AI相关营收 [4] - Broadcom 2025年无线通讯、宽带及服务器储存业务反弹力道将更强劲 [4] - AMD 2025年将聚焦AI PC、Server和HPC/AI加速器市场,与多品牌合作维持高成长动能 [4] - Qualcomm 2025年将更聚焦于AI PC等边缘运算设备,拓展高阶消费市场市占 [5] - MediaTek 2025年在5G手机市场渗透率将提升至65%以上,高阶机种占比成长拉抬营收,与NVIDIA合作产品将延续成长动能 [5] - Realtek 2025年网通和车用业务是主要成长动力,Wi-Fi 7市场渗透率将提升至双位数 [6]
招生 | 人大信院AIM3实验室招收人工智能方向学生
量子位· 2025-03-16 13:37
文章核心观点 介绍中国人民大学AIM3实验室的相关信息,包括实验室概况、导师、科研成果、学生培养、氛围、招生计划和申请条件等,吸引有科研热情的人加入 [1][3][4][5][8][11] 实验室概况 - 隶属于中国人民大学信息学院-计算机系-感知与交互智能计算研究室,研究多模态智能计算,关注大语言模型等方向 [1] - 中国人民大学是“985工程”“211工程”重点建设大学,信息学院计算机专业是国家级特色专业建设点,在教育部第五轮学科评估中评为A,在国际计算机学科排行榜CSRankings统计中,在人工智能和数据库等领域排名位居世界前列 [2] 导师介绍 - PI金琴老师毕业于清华大学和卡内基梅隆大学,现为人大信息学院教授,在顶会顶刊发表论文百余篇,谷歌学术引用超8000次,入选人工智能全球女性学者榜单等 [3] - 青年教师王文轩老师2024年毕业于香港中文大学,研究方向为人工智能大模型,博士期间发表顶会论文二十余篇,指导本科生经验丰富 [3] 科研成果 - 近三年在人工智能顶会上发表论文五十余篇,课题组成员多次进行学术报告 [4] - 积极参与国际权威比赛并获诸多奖项,如蝉联CVPR 2018 - 2020 ActivityNet视频描述挑战赛冠军等 [4] 学生培养 - 组内学生成果突出,近三年7人次获国家奖学金,2人次获百度奖学金 [5] - 毕业生去向良好,主要前往知名科研院所继续科研或互联网大厂从事算法研究 [5] 实验室氛围 - 研究氛围好,学生可自主选课题,经费充足,显卡资源丰富,提供设备支持研究 [5] - 与头部互联网企业和海外院校保持合作,学生可前往实习访问 [5] - 导师重视学生成长,定期组织运动和团建,成员自主设计实验室周边 [6] 招生计划 - 2026年可招收并指导博士生2名、学硕3名、专硕3名、访问生若干,可联系金琴老师或王文轩老师 [8] 申请条件 - 双一流或同等水平学校学生,综合排名前20%,有科研经历优先 [11] - 对科研有热情,踏实专注有毅力,有良好自主学习能力,具备扎实英语功底和编程能力 [11]