算法优化
搜索文档
甘肃高校学子研制无人机:“算法”优化赋“智慧”
中国新闻网· 2025-11-20 09:04
日 三星星星星星星 R B 12 11 ax H T 香港 雪南 ell ( Real The pl 10 " 1" 10 p P @ .. A 足 arti r p THE WE 12 24 年 chinanews.com.cn - 12 · (THE G 10 ... 2017年 chinanews.com.cn ----- 9 1204 一 = = | e- o o CHITATIONS COLLECT . 02 4 - n - and weeks and any and the was and 中润细 chinanews.com.cn ヤ川組 low 1 1 - 4 I ters e 30000 anne e 2011 anis 240 HEI Gr chinanews.comen 1 11 线 来源 作者 注册 2018-08-20 来源:2018年08月08:00 来源:2017-01-20 前景美食有机视频新闻资讯录用条件资讯 11 18 在线体育在线体育在线体育在线体育 6 10 is 4 在线路线上最新闻网 12 2017 11:52 11 11 2017 11:50 10 11 11:00 ...
AI五小时发现MoE新算法,比人类算法快5倍,成本狂降26%
36氪· 2025-10-24 21:03
AI驱动的算法研究 - 加州大学伯克利分校研究团队提出AI驱动的系统研究方法ADRS,通过“生成—评估—改进”的迭代循环实现算法持续优化[1] - 基于开源框架OpenEvolve的案例研究表明,AI发现的算法显著优于人类设计算法,实现高达5倍的运行效率提升或26%的成本降低[2] 算法性能提升案例 - 在遥测修复任务中,AI算法比已发布解决方案的计数器修复得分提高9%,置信校准得分提高30%,耗时8小时且成本低于10美元[3] - 专家并行负载均衡器算法在保持相同平衡度的同时,运行时间比内部实现快2倍,耗时5小时且成本低于10美元[3] - 全局模型放置算法比已发布解决方案成本降低18.5%,仅需40分钟且成本低于85美元[3] - 在多区域spot实例调度中,AI算法比单区域基线成本降低26%,耗时1小时且成本低于22美元[3] 专家并行负载均衡技术 - 大型语言模型采用混合专家架构时面临关键性能挑战,即如何在各专家间实现负载均衡,避免某些专家“热点化”导致计算瓶颈[4] - 专家并行负载均衡器算法通过动态调整专家在GPU间的分布,追求最小化负载不均衡和最小化运行时间两个核心目标[6] 算法优化过程 - 研究团队使用OpenEvolve搜索EPLB算法,优化目标包含最大化负载均衡因子和降低算法运行时间的双重维度[8] - 实验采用80% Gemini 2.5 Flash与20% Gemini 2.5 Flash Lite混合配置,进化过程以开源贪心算法作为初始程序,设置300次迭代上限,完整流程耗时约五小时且成本低于10美元[8] 创新算法设计 - OpenEvolve生成的新算法发现巧妙启发式方法,通过对专家索引张量进行重塑与转置,利用PyTorch高速张量操作以“之字形”交错分配专家[10][12] - 该算法在保持与其他基线相当负载平衡因子的同时,将运行时间缩短至仅3.7毫秒,较内部参考实现性能提升达5倍[12] 相关研究进展 - Nature报道类似研究,Oh及其同事开发能发现新型强化学习算法的元学习算法,该算法在多项陌生任务中表现超越人类设计的强化学习算法[18][20][22]
AI智能编程新框架,节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大
量子位· 2025-10-17 17:45
文章核心观点 - 大语言模型在代码生成方面表现出色,但在需要持续迭代和性能调优的机器学习工程场景中仍存在差距 [1] - AutoMLGen框架通过融合通用大模型推理与领域知识,实现了AI智能体从"代码生成"到"算法优化"的能力转变 [3][4] - 该框架在MLE-Bench基准测试中以12小时计算预算实现36.4%平均奖牌率和18.7%金牌率,性能优于现有方法 [4][21] AutoMLGen框架设计 - 框架由领域知识库、蒙特卡洛图搜索和细粒度算子库三大模块组成,构建经验指引→智能探索→方案精修的自进化闭环 [10] - 领域知识库覆盖模型层、数据层与策略层,为智能体提供经验启发,有效缓解冷启动问题 [11][12] - 蒙特卡洛图搜索通过分支—节点动态融合打破传统MCTS的孤立局限,实现轨迹复用和跨分支聚合 [4][13] - 细粒度算子库定义了解法之间的演化方式,为图搜索提供通用的演化逻辑 [17] 技术创新亮点 - MCGS图搜索具备四种核心机制:主扩展、分支内演化、跨分支参考和多分支聚合 [14][16] - 框架实现了从"线性树"到"图式网络"的跃迁,让智能体具备跨分支学习与多解融合能力 [14] - 系统能在动态试探与自我修正中实现经验迁移,使智能体从"新手"进化为"专家型AI" [12][18] 性能表现 - 在MLE-Bench测试中仅用标准时长一半的计算预算(12小时),达到36.4%平均奖牌率和18.7%金牌率 [4][21] - 在MLE-Bench-Lite测试中以62.1%的奖牌率领先现有方法,体现出一致的性能与出色泛化能力 [22][23] - 消融实验显示各模块在性能提升中均发挥关键作用,知识库提供方向指引,演化机制实现反思与修正 [24] - 框架在不同基础模型上展现优异适配性,更强的基模型带来更高上限 [25] 案例分析与应用前景 - 典型案例展示系统从问题理解到方案实现的全过程,具备自主进化能力 [28] - 性能曲线快速收敛并持续上升,始终高于基线,展现动态优化与稳健成长能力 [27] - 该技术标志着智能体在复杂工程与算法设计任务中的能力演进,为AI向更高层次智能化奠定基础 [31] - 理念可向算法发现、科研自动化、工程设计等更广泛智能系统范式扩展 [31]
美团:全面取消!
深圳商报· 2025-08-28 18:42
算法优化与考核机制改革 - 公司将于2025年年底前全面取消众包骑手超时罚款 采用正向激励替代扣款模式[1] - 超时免罚考核机制已在全国22个城市试行 2024年12月始于泉州试点"安准卡"系统 通过超时扣分准时加分方式运作[1] - 试点范围从2025年3月南宁 新乡 南昌扩展至7月杭州 武汉等一线城市 观测显示广西江西等地骑手体验显著提升[1] 配送效率提升措施 - 公司在150个城市的24700余个社区推行"骑手友好社区"改造 月均服务骑手超68万人 通过扫码通行优化末端配送效率[2] - 针对地址不准问题推出三大智能算法措施:骑手用户位置共享 智能引导选择推荐地址 推荐填写精准地址 减少信息不对称[2] - 小区通行效率改善后骑手反馈地址问题 促使2025年起试点产品端解决方案 增强用户骑手双端提醒机制[2] 劳动保障与安全机制 - 公司实施防疲劳措施:骑手跑单满8小时弹窗提醒(日均触发率18%) 满12小时强制下线(触发率0.28%)[2] - 该机制采用弹窗提醒与强制下线结合方式 上线后帮助骑手平衡工作强度 后续将针对高单量骑手升级策略[2] - 强制下线骑手次日可正常接单 目前收到骑手和专家改进意见 将持续优化收入与健康平衡方案[2] 算法透明化与公众沟通 - 公司通过官网算法公开专区及微信公众号专栏 以图文形式向骑手和公众公示算法运作机制[3] - 采用定向访谈和调研问卷方式持续征集外部算法建议 及时推动算法系统改进优化[3]
心智观察所:说芯片无需担忧,任正非战略思想有什么技术底气
观察者网· 2025-06-10 15:02
核心观点 - 华为通过系统级创新策略弥补单芯片制程差距 包括集群计算 算法优化和Chiplet技术应用 实现算力竞争力 [1][3][7] - 公司依托人才长期投入和开放生态协作 构建底层技术核心竞争力 [9][10] 技术战略 - 采用"叠加和集群"方法连接多芯片协同工作 昇腾910B芯片通过自研CCE通信协议构建高效集群 支持盘古大模型训练 [3] - 谷歌TPU v4集群案例证明并行任务领域可通过规模效应弥补单芯片性能差距 成功训练5400亿参数PaLM模型 [3] - 运用"用数学补物理"理念 通过稀疏计算 模型量化和剪枝技术降低硬件依赖 MindSpore框架使AI训练计算需求降低30%以上 [4] - Chiplet技术将大芯片拆解为多功能芯粒 采用异构集成和先进封装实现系统级性能突破 规避单一制程限制 [7][8] 应用案例 - 天津港无人化码头部署数百块昇腾芯片组成计算集群 实时处理海量传感器数据指挥无人设备 [4] - AMD采用模块化设计和Chiplet技术实现逆袭 2020年EPYC处理器占据全球服务器市场约15%份额 [5] 研发投入 - 过去十年研发投入超过1.2万亿元 拥有约11.4万名研发人员 [9] - 通过"天才少年"计划 高校合作和实战培养机制汇聚顶尖人才 深度参与芯片架构设计 [10] 生态建设 - 开放战略整合全球资源 昇腾芯片与PyTorch等主流框架兼容 Atlas平台实现软硬件深度协同 [4] - 在高速SerDes 先进封装互连设计 信号完整性仿真等底层技术领域持续投入 [8] 技术挑战 - 集群计算存在能耗 成本和通信瓶颈问题 [10] - 单线程性能要求高的科学计算场景中集群优势受限 [10]
“复刻”幻方量化打造Deepseek 量化私募基金念空在大模型底层技术研发取得突破
经济观察报· 2025-06-03 19:17
大模型技术研发趋势 - 全球大模型研发公司在语义理解和多模态领域的竞争升级,中国DeepSeek R1模型和美国Anthropic的"克劳德4"系列推出新模型[2] - 量化私募基金加入大模型底层技术研发,念空科技与上海交大合作提出SASR训练框架,在GSM8K任务中1.5B模型准确率超80%,KK逻辑推理任务准确率比GPT-4o高9个百分点[2][6] - 当前大模型训练框架主要围绕监督微调(SFT)和强化学习(RL),优化两者比重是提升模型性能的关键挑战[3] 训练框架创新与算法优化 - 念空科技SASR框架通过动态平衡SFT与RL,实现不增加数据量情况下的性能提升,在预热阶段建立基础推理能力,后续自主切换训练模式[10][11] - 新框架在GSM8K、MATH和KK数据集实验中性能优于单独SFT/RL及简单混合方法,参数量低但综合能力突出[12] - 产学研结合成为技术突破关键路径,高校提供算法理论,量化机构补充算力与工程能力[6][12] 量化投资领域的应用突破 - 新训练框架下的大模型市场预测准确率达传统量化模型的80%,且两者相关性低于50%,可能产生协同效应[6][16] - 传统AI量化模型基于统计驱动,新框架推动逻辑驱动的模型构建思路,减少过拟合与欠拟合问题[16][17] - 念空科技成立AllMind公司专注LLM底层算法,计划将训练框架扩展至金融以外的垂直领域[11][15] 行业竞争格局与挑战 - 量化私募纷纷设立AI Lab投入大模型研发,但通用大模型赛道面临高资金门槛和市场格局固化挑战[9] - 算法优化成为差异化竞争焦点,2023年ChatGPT依赖SFT,Deepseek崛起凸显RL价值,当前主流采用SFT+RL混合模式[9] - 金融领域外的垂直行业应用存在数据规模和工程能力等新挑战,需进一步优化算法适配性[15][17]
“复刻”幻方量化打造Deepseek 量化私募基金念空在大模型底层技术研发取得突破
经济观察网· 2025-06-03 14:57
全球大模型技术竞争升级 - 中国深度求索公司完成DeepSeek R1模型小版本升级,显著提升思维深度与推理能力 [2] - 美国Anthropic推出Claude 4系列两款新模型,提升编程、推理和智能体应用标准 [2] - 量化私募基金加入技术竞争,念空科技与上海交大合作开发SASR训练框架 [2] 新型训练框架技术突破 - SASR框架在1.5B参数规模下实现GSM8K任务80%准确率,接近GPT-4o水平 [2] - 在KK逻辑推理任务中准确率超越GPT-4o约9个百分点 [2] - 采用自适应混合训练框架,动态平衡监督微调(SFT)与强化学习(RL) [8][9] 量化投资领域应用成果 - 新框架下大模型预测准确率达传统量化模型80%,相关性低于50% [4][13] - 实现逻辑驱动的新型量化模型构建,与传统统计驱动模型形成互补 [13] - 有望产生1+1>2的效果,提升整体投资策略成效 [4] 产学研协同发展模式 - 高校提供算法理论基础,量化机构贡献工程能力和算力资源 [5][11] - 念空科技成立AllMind公司专注大模型底层算法研究 [9][11] - 通过GSM8K、MATH和KK数据集验证框架优越性 [9] 垂直领域拓展计划 - 优先强化金融场景应用,后续向新材料、医药等领域输出技术 [12] - 需解决金融模型过拟合与欠拟合平衡问题 [14] - 互联网行业面临更大规模数据训练挑战 [14] 行业发展趋势 - 参数量不再是决定性因素,算法优化成为性能突破关键 [10] - 量化私募纷纷设立AI Lab投入大模型底层技术研发 [6] - 训练框架创新提升同等资源下的模型训练效果 [10]
THPX信号源:使用量化信号提升XAUBTC黄金投资效率
搜狐财经· 2025-05-16 17:15
THPX信号源的工作原理 - THPX信号源通过量化信号提升XAUBTC黄金投资效率 涉及信号生成过程 数据处理机制和算法优化方法 [2] - 信号生成过程采用先进算法实时分析市场数据 并持续优化模型以提高预测精确度 [3] - 数据处理机制通过实时监控 数据清理和深度解析确保输入数据可靠性 最终生成精准投资信号 [4] - 算法优化方法结合机器学习和深度学习 动态调整参数以适应市场变化 [5] 量化信号在黄金投资中的优势 - 量化信号显著提高投资决策效率 通过自动化算法快速分析大量市场数据 [10] - 量化信号有效减少投资风险 通过历史数据和市场趋势分析预测波动 规避市场陷阱 [11] XAUBTC市场趋势分析 - XAUBTC历史价格走势显示黄金与比特币存在价格互动模式 需分析长期趋势捕捉市场动向 [13] - 市场波动受经济政策 市场情绪和全球事件影响 需持续关注以做出明智决策 [14] - 技术指标如均线 相对强弱指数和布林带可有效识别市场拐点和突破机会 [15] - 交易策略优化需考虑风险管理和持仓周期调整 以降低损失并提高收益 [16] THPX信号优化投资决策 - THPX信号通过复杂算法和数据分析技术识别市场机会 降低风险并提高收益 [18] - 量化信号参数需根据市场波动性灵活调整 通过测试提高决策准确性 [19] - 优化决策策略需结合历史数据和当前市场趋势 在不同情境下测试有效性 [20] - 风险管理与收益分析通过量化信号提供精确数据支持 实现理智决策 [21] 数据分析与算法优化在THPX中的应用 - 数据分析技术借助机器学习和大数据分析识别市场模式 提高预测准确性 [23] - 算法优化策略通过迭代调整模型参数 提升交易策略精准度和稳定性 [25] - 信号源效率提升通过减少噪声干扰和快速响应市场变化 把握关键机会 [26] 风险管理与收益提升策略 - 风险评估方法利用历史数据模型预测潜在风险 结合市场动向全面评估 [28] - 投资组合优化通过资产配置多样性和量化信号识别最佳配置时机 [29] - 止损策略设计需考虑市场波动性和动态调整止损点 保护投资资金 [30] - 收益最大化技巧结合市场趋势分析和智能算法 持续监控调整投资组合 [31] THPX信号源的未来发展与潜力 - 市场应用扩展体现在实时数据分析与动态预测能力 优化投资策略 [33] - 技术创新趋势聚焦算法优化和机器学习应用 提高信号准确性 [34] - 投资者信心增强源于信号源可靠稳定性 使用量和长期前景乐观 [35] 常见问题解答 - THPX信号源提供强大量化分析能力 实时捕捉市场波动并集成多数据源 [37] - THPX信号源适合初学者通过逐步学习和实践掌握量化投资技能 [38] 文章结论 - THPX信号源通过实时数据分析和先进算法提升投资精确性和效率 [39] - 未来技术创新和市场扩展将继续为投资者提供支持并优化策略 [39]