Large language models

搜索文档
AlphaEvolve: A coding agent for scientific and algorithmic discovery
Google DeepMind· 2025-05-16 00:00
报告行业投资评级 未提及相关内容 报告的核心观点 - AlphaEvolve结合了最先进的大语言模型和自动化评估指标,在进化框架内展现出强大能力,能在数学问题上取得新发现,并对计算堆栈进行实际改进 [88] - AlphaEvolve可通过不同方式处理同一问题,且能作为测试时计算代理,增强基础大语言模型的能力,未来可考虑将其增强性能融入下一代基础模型 [89][90] 根据相关目录分别进行总结 1. 引言 - 发现新知识通常是个漫长过程,虽大语言模型和智能体的发展推动了自动化,但实现全新科学或实际发现仍具挑战 [2] - AlphaEvolve是基于进化计算和大语言模型代码生成的优化代理,专注于可自动评估的科学和工程发现问题,能进化复杂代码,超越以往系统 [3][7] - 因自动化评估指标的限制,AlphaEvolve主要聚焦于数学、计算机科学和系统优化领域 [9] 2. AlphaEvolve 2.1 任务规范 - 用户需提供自动评估生成解决方案的机制,以函数形式将解决方案映射到一组标量评估指标,且这些指标通常需最大化 [13] - 用户可通过在代码中添加特殊注释标记进化块,块内代码作为初始解决方案,其余代码构成骨架 [19][20] - AlphaEvolve可通过多种方式应用于同一问题,不同抽象级别适用于不同问题 [21][22] 2.2 提示采样 - AlphaEvolve支持多种定制和提供长上下文的提示,包括显式上下文、随机格式化、渲染评估结果和元提示进化等 [23][25] 2.3 创造性生成 - AlphaEvolve利用大语言模型的能力,消化先前解决方案信息并提出改进方案,且模型性能越好,结果越佳 [24] - 要求大语言模型以特定格式提供代码修改,短代码或需完全重写时可直接输出代码块 [29][30] - AlphaEvolve采用Gemini 2.0 Flash和Gemini 2.0 Pro的组合,平衡计算吞吐量和解决方案质量 [31] 2.4 评估 - 新解决方案通过执行用户提供的评估函数进行自动评估,支持评估级联、大语言模型生成反馈和并行化评估等机制 [32] - AlphaEvolve允许优化多个用户提供的分数,有助于提高单一目标指标的结果 [33] 2.5 进化 - AlphaEvolve在进化过程中生成的解决方案存储在进化数据库中,该数据库结合了MAP elites算法和基于岛屿的种群模型 [34] 2.6 分布式管道 - AlphaEvolve是异步计算管道,由控制器、大语言模型采样器和评估节点组成,优化吞吐量以提高计算效率 [35] 3. 结果 3.1 更快的矩阵乘法 - 矩阵乘法是计算机科学的基础操作,找到低秩张量分解可开发更快的算法,但该问题极具挑战性 [38] - AlphaEvolve能开发出优于现有方法的张量分解算法,通过评估级联和特定评估方法衡量性能,改进了14种不同矩阵乘法目标的现有技术 [39][40] 3.2 解决数学问题 - AlphaEvolve可作为强大工具探索数学问题的搜索空间,在超50个数学问题中,约75%的情况重现了已知最佳构造,约20%的情况发现了更好的构造 [42][43] - AlphaEvolve通过进化启发式搜索算法而非直接进化构造本身,实现了高效的大规模探索 [50] 3.3 优化谷歌计算生态系统 - **数据中心调度**:将在线作业调度问题建模为向量装箱问题,AlphaEvolve发现的启发式函数优于生产中的函数,平均可回收0.7%的计算资源,且具有可解释性等优势 [60][61] - **Gemini内核工程**:AlphaEvolve优化矩阵乘法操作的平铺启发式,使内核平均加速23%,减少了Gemini训练时间,加速了内核优化过程 [64][67] - **硬件电路设计**:AlphaEvolve优化TPU算术电路,减少面积和功耗,其建议以Verilog语言呈现,便于硬件工程师采用 [69][70] - **直接优化编译器生成的代码**:AlphaEvolve优化了FlashAttention内核及前后处理代码,分别加速32%和15%,展示了优化编译器生成代码的能力 [73] 4. 消融实验 - 对矩阵乘法和接吻数问题进行消融实验,结果表明进化方法和提示中的上下文对AlphaEvolve的结果有显著提升作用 [74][75] 5. 相关工作 - AlphaEvolve扩展了进化或遗传编程的研究传统,与FunSearch等系统相比,具有可进化整个代码库、多目标优化和使用前沿大语言模型等优势 [76][80] - 其他相关工作包括使用大语言模型引导进化的各种方法,但AlphaEvolve在规模、灵活性和通用性方面有所不同 [81] 6. 讨论 - AlphaEvolve结合大语言模型和自动化评估指标的进化框架具有强大能力,但主要处理可自动评估的问题,未来可与其他方法结合处理更广泛的问题 [88][92]
ACV Auctions (ACVA) FY Conference Transcript
2025-05-14 04:12
纪要涉及的公司 ACV Auctions (ACVA) 纪要提到的核心观点和论据 1. **财务表现** - 本季度业绩强劲,营收处于预期范围中段,EBITDA超预期 [5][6] - 本季度营收创纪录,同比增长25%,调整后EBITDA同比增长超200% [6] - 维持全年业绩指引,因批发汽车市场预计持平或略有波动,公司有应对杠杆且成本管理纪律性强 [7][14][15] 2. **市场份额** - 市场份额持续增长,按年度来看更能体现稳定性,季度波动并非公司或竞争对手策略变化所致 [6][10][11] 3. **网络效应** - 公司商业模式受益于网络效应,更多供应、需求和数据形成正反馈循环,推动新产品开发 [16] - 目前已能利用大量数据和模型进行价格预测,如预测未来30天汽车零售价,部分地区业务规模达300+单位时增长加快 [17][18] 4. **增长限制因素** - 公司增长的关键在于获得经销商和商业公司的信任,需提供合适产品组合和增值服务,并积累成功案例 [19] - 业务进入新阶段,可提供更广泛增值服务,但需一定比例的批发业务量来支撑 [21] 5. **产品亮点** - 预测车辆价格能力是关键产品,为多个产品提供数据支持,吸引众多公司合作,有望带来显著收益 [28][29][32] - 保证销售产品直接带来更高收入和利润率,提高车辆成交率,减少检查成本浪费,对财务有积极影响 [35][36][37] 6. **与OEM及商业合作** - 与OEM合作处于早期阶段,在欧洲有小范围合作,美国等地也在洽谈,目前每月有几百辆车通过平台交易 [50][51] - 商业业务Launchpad进展顺利,7月推出再处理评估软件第一版,Q4开设首个绿地项目,目标是全国开设40个地点覆盖80%人口,根据项目盈亏时间决定扩张速度 [57][58][59] 其他重要但是可能被忽略的内容 1. **保证销售产品风险控制** - 该产品已推出四年,逐步发展,目前占公司业务量近10% [41] - 公司能较准确预测批发价值,误差通常在100美元以内,算法可每日甚至每小时调整,保证期限短,风险可控 [42][45] 2. **保证定价产品上限** - 目前难以确定保证定价产品占总业务量的上限,主要挑战是改变经销商观念,让其接受新模式 [63][65][66] 3. **捆绑策略效果** - 类比亚马逊Prime,公司SaaS和数据服务收费虽重要,但更重要的是为经销商提供更好运营体验,获取更多数据,促进业务增长 [67][68][70]
Microsoft Moves to Protect Its Turf as OpenAI Turns Into Rival
PYMNTS.com· 2025-05-13 04:12
微软与OpenAI合作关系重新谈判 - 微软正与OpenAI重新谈判协议以保护其130亿美元投资并确保未来新技术使用权[1][2] - 谈判内容包括微软可能放弃部分股权换取2030年后持续技术访问权[9][10] - OpenAI寻求通过IPO获得更大灵活性同时保持非营利母公司结构[2][6] OpenAI商业模式演变 - 公司从非营利研究实验室转型为混合结构包含营利性公共受益公司(PBC)[6][7] - 因AI训练成本飙升放弃原有限制利润结构吸引风险投资[5][6] - 联合创始人埃隆·马斯克提起诉讼反对营利化转型但未成功[6][7] 竞争格局变化 - OpenAI推出与微软直接竞争的产品包括ChatGPT对抗Copilot企业API对抗Azure服务[11] - 公司自建数据中心并与财富500强签企业合约加剧与微软业务重叠[11] - 聘请Instacart CEO强化商业化运营方向[8] 资本市场影响 - 若IPO成功将成为大语言模型创新领域纯投资标的[3] - 公开上市将向零售投资者开放AI领军企业投资机会[3] - 微软2019年首次投资10亿美元后累计投入达130亿美元[4][5] 行业影响 - OpenAI尝试平衡营利目标与公共使命可能为科技行业设立新标准[8] - 微软通过股权让步换取长期技术访问权被视为战略明智之举[9] - 谈判关键点在于微软在重组后公司中的股权比例[9]
3 Undervalued Stocks Wall Street Is Getting Wrong
MarketBeat· 2025-05-13 00:02
市场机会 - 标普500通常能有效反映经济未来预期 但部分个股可能脱离大盘走势 提供上行机会 [1] - 当前市场波动中 存在低风险且能带来额外收益的折价机会 涉及科技、零售和工业领域 [2] 个股分析 Cleveland-Cliffs (CLF) - 股价跌至52周高点的39% 反映工业领域最坏情景已定价 [3] - 贸易关税影响消退后 新订单将直接提升公司盈利 当前无进一步下行空间 [4] - 华尔街共识目标价15.5美元 隐含121%上行空间 风险回报比显著倾向多头 [5] Wayfair (W) - 股价处于52周高点的43% 房地产周期接近底部 家居行业或迎早期反弹 [7] - Charles Schwab增持0.3% 持仓达3240万美元 显示机构信心 [8][9] - Mizuho维持"跑赢大盘"评级 目标价50美元 隐含53%上涨潜力 [10] Reddit (RDDT) - 股价跌至52周高点的47% 与财务表现脱节 [11] - 在AI大语言模型建设中发挥重要作用 平台用户生成文本被出售给科技公司 [12] - Vanguard增持11.1% 持仓达11亿美元 占公司5.6%股份 Citigroup目标价158美元 隐含46%涨幅 [13] 机构动向 - 市场关注机构持续买入的股票 包括13只被对冲基金和捐赠基金青睐的标的 [17]
Uber(UBER) - 2025 Q1 - Earnings Call Transcript
2025-05-07 21:00
财务数据和关键指标变化 - 月度活跃消费者增长14%,达到1.7亿 [5] - 出行次数增长18%,留存率创全球历史新高 [5] - 总预订量与出行次数同步增长,受移动出行业务和配送业务的推动 [6] - 第一季度调整后息税折旧摊销前利润(EBITDA)达到19亿美元,同比增长35%,自由现金流达到23亿美元 [6] - 配送业务利润率达到总预订量的3.7%,较去年同期提升70个基点 [42] - 第一季度配送业务的增量利润率为9% [44] 各条业务线数据和关键指标变化 移动出行业务 - 过去三个季度出行次数同比增长约19%,预计第二季度情况类似 [33][103] - 稀疏市场出行量占移动出行业务总量的20%,且增长速度快于核心市场 [35] 配送业务 - 杂货和零售业务在去年第四季度实现可变贡献收支平衡,第一季度开始在可变贡献层面实现增长 [43] - 会员计划拥有3000万会员,配送业务的会员渗透率超过60%,部分市场达到70%以上 [82] 各个市场数据和关键指标变化 - 美国市场竞争激烈,公司在多数运营市场中处于领先地位,配送业务的杂货和零售业务本季度加速增长,食品配送行业出现整合 [22] - 在欧洲市场,公司认为在英国通过有机增长成为外卖业务的第一名,法国是重要市场,德国市场有很大潜力 [85][86] 公司战略和发展方向和行业竞争 公司战略和发展方向 - 与Waymo在奥斯汀合作推出约100辆自动驾驶汽车,宣布五项自动驾驶合作计划,将在美国、欧洲和中东部署 [6][7] - 与OpenTable合作,整合餐饮、配送和交通服务;与达美航空的SkyMiles计划合作上线 [7] - 收购Trendy Algo,以推动在土耳其的未来增长 [7] - 利用大型语言模型改善餐厅和杂货搜索体验,与领先的大语言模型公司合作,打造无缝愉悦的用户体验 [94] 行业竞争 - 移动出行市场,美国国内有强劲竞争对手Lyft,国际上在欧洲和拉丁美洲也面临竞争;配送业务在美国市场竞争激烈 [20][21][22] - 欧洲市场有竞争对手进行无机扩张,公司更倾向于有机扩张 [86] 管理层对经营环境和未来前景的评论 - 公司在今年开局强劲,各业务板块表现良好,预计第二季度将延续强劲的营收增长和更高的盈利能力,为下半年的旺季做好准备 [5][7] - 宏观层面未观察到明显的负面信号,公司所处的餐饮、交通、杂货等行业在宏观不确定时期相对稳定 [61][63] - 自动驾驶技术发展迅速,创新令人鼓舞,预计未来十年新车将配备四级或五级自动驾驶功能 [72] 其他重要信息 - 保险成本方面,美国移动出行保险成本在今年剩余时间将是个较小的不利因素,公司通过安全技术创新、政策推动等方式降低成本 [52][53][54] - 公司在定价方面,看到与过去类似的弹性,随着保险成本压力缓解,希望继续为消费者提供合理价格 [14] 总结问答环节所有的提问和回答 问题1:移动出行业务在保持低价时的价格弹性以及奥斯汀自动驾驶汽车的利用率情况 - 价格弹性与过去类似,有短期和长期弹性,随着保险成本压力缓解,公司对定价结果满意;奥斯汀的自动驾驶汽车利用率很高,平均每辆车每天的出行次数比99%的奥斯汀司机都多,公司将继续增加车辆数量并计划在亚特兰大等地区扩展 [14][15][16] 问题2:移动出行和配送业务的竞争格局以及特定地区的竞争强度 - 全球市场竞争激烈,移动出行在美国有Lyft等竞争对手,国际上也面临竞争;配送业务在美国市场竞争激烈且行业有整合趋势;公司在多数市场处于领先地位,凭借全球布局和独特平台有竞争力 [20][21][22] 问题3:奥斯汀自动驾驶汽车与人类司机如何匹配供需以增加Uber整体业务量,以及美国移动出行业务的增长情况和郊区与城市的趋势 - 奥斯汀目前专注于确保每日服务体验,会增加车队规模,长期目标是提供可靠服务以吸引更多消费者;美国移动出行业务过去三个季度出行次数同比增长约19%,预计第二季度类似,稀疏市场增长快于核心市场 [29][30][33][35] 问题4:配送业务利润率情况,以及杂货和零售业务的利润率扩张节奏和餐厅利润率高的原因 - 配送业务利润率达到总预订量的3.7%,较去年同期提升70个基点,主要由广告和规模效应推动;杂货和零售业务有很大增长潜力,第一季度增量利润率为9%;公司会平衡盈利能力和营收增长 [42][43][44] 问题5:保险成本压力是否已过去,以及自动驾驶领域除Waymo外接近其规模的公司 - 美国移动出行保险成本在今年剩余时间将是较小的不利因素,公司通过安全技术创新、政策推动等方式降低成本;自动驾驶领域有很多有潜力的公司,如中国的WeRide、Pony、百度等,还有与公司合作的Main Mobility、VW、Momenta等 [52][53][50] 问题6:宏观因素对移动出行和配送业务的影响,以及旧金山和洛杉矶的竞争情况 - 宏观层面未观察到明显负面信号,受众增长和频率稳定,公司会调节价格上涨;旧金山和洛杉矶的竞争环境稳定,公司支持旧金山市长的发展计划 [61][62][64] 问题7: affordability举措和保险成本对移动出行利润率的影响,以及自动驾驶技术何时能实现规模化商业应用 - 公司致力于实现利润率的逐年稳步提升,但难以对下半年进行具体指引;自动驾驶技术发展迅速,创新令人鼓舞,预计未来十年新车将配备四级或五级自动驾驶功能 [69][70][72] 问题8:配送业务的affordability努力,以及欧洲市场的增长速度、竞争格局和整合情况 - 配送业务的affordability努力包括会员计划和商家资助优惠;会员计划有3000万会员,渗透率不断提高;商家资助优惠增加了商家的可见性和销售额;欧洲市场公司取得了良好成绩,在英国成为外卖业务第一名,法国和德国市场有潜力,公司更倾向于有机扩张 [81][82][85][86] 问题9:配送业务与大语言模型合作的可能性,以及稀疏市场移动出行的机会持续时间、对城市市场减速的抵消能力和利润率情况 - 公司在大语言模型应用方面处于早期实验阶段,主要关注改善用户体验,如餐厅和杂货搜索;稀疏市场移动出行有很大增长机会,目前20%的出行量来自稀疏市场且增长更快,投资成熟后利润率与其他市场相当 [93][94][97] 问题10:移动出行总预订量未来一年的减速情况,以及稀疏市场的出行频率机会与核心城市的比较 - 移动出行总预订量预计不会大幅减速,出行增长主要由受众增长驱动,后续需关注保险带来的定价机会;稀疏市场移动出行频率可能较低,但价格和利润率可能较高,配送业务在稀疏市场的频率持续增长 [103][104][108][109]
自诩无所不知的大模型,能否拯救笨手笨脚的机器人?
虎嗅· 2025-05-06 08:48
从上海到纽约,世界各地的餐厅里都能看到机器人在烹饪食物。它们会制作汉堡、印度薄饼、披萨和炒菜。它们的原理与过去50年机器人制造其他产品的 方式如出一辙:精准执行指令,一遍又一遍地重复相同的操作步骤。 但Ishika Singh想要的不是这种"流水线"式的机器人,而是真正能"做晚饭"的机器人。它应该能走进厨房,翻找冰箱和橱柜,拿出各种食材搭配组合,烹调 出美味的菜肴,然后摆好餐具。对孩子而言,这也许很简单,但没有任何机器人能做到这一点。这需要太多关于厨房的知识,更需要常识、灵活性和应变 能力,但这些能力都超出了传统机器人编程的范畴。 南加州大学计算机科学博士生Singh指出,问题的症结在于机器人学家使用的经典规划流程。"他们需要把每一个动作,以及它的前提条件和预期效果都定 义清楚,"她解释道,"这要求事先设定环境中所有可能发生的情况。"可即使经过无数次试错,编写数千行代码,这样的机器人仍无法应对程序之外的突 发状况。 一个晚餐服务机器人在制定"策略"(执行指令的行动计划)时,不仅要知道当地的饮食文化(当地所谓的"辛辣"究竟指什么),还要熟悉具体厨房环境 (电饭煲是否放在高层的架子上)、服务对象的特殊情况(Hec ...
Uxin(UXIN) - 2025 Q4 - Earnings Call Transcript
2025-04-30 21:02
Uxin Limited (UXIN) Q4 2025 Earnings Call April 30, 2025 08:00 AM ET Company Participants Jack Wang - Managing DirectorDai Kun - Founder, Chairman & CEOFeng Lin - Chief Financial Officer Conference Call Participants Fei Dai - Analyst Operator and welcome to the Yixin Fourth Quarter and Full Year twenty twenty four Earnings Conference Call. At this time, all participants are in listen only mode. A question and answer session will follow the formal presentation. As a reminder, this conference is being recorde ...
Etsy(ETSY) - 2025 Q1 - Earnings Call Presentation
2025-04-30 20:30
业绩总结 - 2025年第一季度Etsy市场总交易额(GMS)为28亿美元,同比下降8.9%[7] - 2025年第一季度合并收入为6.51亿美元,同比增长0.8%[7] - 2025年第一季度调整后EBITDA为1.71亿美元,调整后EBITDA利润率为26.3%[7] - 2025年第一季度净亏损为52,096千美元,而2024年同期净收入为63,004千美元[73] - 2025年第一季度的自由现金流为35,273千美元[80] 用户数据 - 2025年第一季度活跃买家数量为8850万,同比下降3.4%[50] - 2025年第一季度新买家数量为480万,同比下降15.4%[50] - 2025年第一季度的总交易额(GMS)每活跃买家为120美元,同比下降3.5%[50] - 2025年第一季度的应用程序GMS占总GMS的44.5%,为历史最高水平[18] 未来展望 - 预计2025年第二季度的合并GMS将以与2025年第一季度相似的速度下降[60] 财务状况 - 截至2025年3月31日,公司现金及现金等价物为649,191千美元,较2024年12月31日的811,178千美元下降约20%[72] - 2025年第一季度的运营活动提供的净现金为49,183千美元,较2024年同期的69,033千美元下降约29%[74] - 2025年第一季度的总资产为2,120,802千美元,较2024年12月31日的2,417,782千美元下降约12.3%[72] - 2025年第一季度的总负债为3,031,101千美元,较2024年12月31日的3,176,648千美元下降约4.6%[72] 运营费用 - 2025年第一季度的运营费用为481,442千美元,较2024年同期的390,731千美元增长约23.3%[73] - 2025年第一季度的资产减值费用为101,703千美元,2024年同期没有此项费用[73]
模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了
机器之心· 2025-04-28 12:32
机器之心报道 编辑:陈萍、+0 大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计 算或内存资源有限的环境中。 例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下拥有 4050 亿个参数,需要大约 810GB 的内存进行完整推理,超过了典型高端 GPU 服务器(例如, DGX A100/H100,配备 8 个 80GB GPU)的能力。因此,部署该模型需要多个节点,这使得它昂贵且难以获取。 本文,来自莱斯大学等机构的研究者提出了一种解决方案, 可以 将任何 BFloat16 模型压缩到原始大小的 70%,同时还能在任务上保持 100% 的准 确性。 论文标题: 70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float 为了应对 LLM 不断增长的模型尺寸,通常会采用量化技术,将高精度权重转换为低位表示。这显著减少了内存 ...