算法设计 - 财报，业绩电话会，研报，新闻

算法设计

搜索文档

快排算法之父Tony Hoare去世，从古典学文科生出身到图灵奖得主，他的人生比算法更传奇

量子位· 2026-03-11 09:18

快速排序算法 - 快速排序是世界上使用最广泛的排序算法之一，被写进了几乎所有主流编程语言的标准库，如C、Java、Python [2][3] - 该算法由托尼·霍尔于1959年在莫斯科学习期间构思，旨在解决机器翻译项目中俄语单词排序的效率问题 [5][6][8] - 算法核心思路是“分而治之”，选择一个基准元素，将小于它的元素移到左边，大于它的移到右边，然后递归处理左右两部分 [13] - 其平均时间复杂度为O(n log n)，是原地排序算法，仅需O(log n)的辅助空间，且对现代计算机缓存机制友好，实际运行速度快 [19][20][21] - 霍尔用一下午时间完善算法细节，并在一场与同事关于希尔排序速度的赌局中获胜，赢下六便士 [14][18] 霍尔的其他学术贡献 - 于1969年提出霍尔逻辑，这是一套用于验证程序正确性的形式化系统，为软件可靠性和安全性研究奠定了理论基础 [28] - 于1978年提出通信顺序进程模型，该模型专门用于描述并发系统中多个进程间的交互行为，并直接影响了Go语言中goroutine与channel的并发设计 [30][31] - 于1969年发表论文《计算机编程的公理基础》，提出了“霍尔三元组”概念，使程序的正确性可在开发过程中同步构造，成为编程理论领域最具影响力的论文之一 [61][62] - 其1961年用Algol 60语言实现的快速排序代码于1962年发表在《计算机杂志》上，成为其第三篇学术论文 [25] 空引用及其影响 - 霍尔于1965年在设计ALGOL W语言时引入了空引用概念，初衷是为了方便表示变量“没有值”，且实现成本极低 [41][42] - 此设计被后来的Java、C、C++等主流编程语言大量采纳 [43] - 霍尔在2009年的一次公开演讲中反思，称其为“十亿美元的错误”，指出它导致了无数的错误、漏洞、系统崩溃，在过去四十年可能造成了十亿美元的损失 [45] 霍尔的职业生涯与荣誉 - 霍尔最初在牛津大学学习古典学和哲学，后因在军队学习俄语，得以在莫斯科国立大学学习机器翻译 [50][51] - 1960年，他加入英国Elliott Brothers公司，领导团队完成了ALGOL 60编程语言的首个商用编译器开发，并成为公司首席科学家 [60] - 1968年转入学术界，先后在贝尔法斯特女王大学和牛津大学担任计算机科学教授，并在牛津领导编程研究小组长达22年 [60] - 1999年从牛津退休后，加入微软剑桥研究院担任高级研究员 [68] - 他于1980年因“对程序设计语言的定义和设计的根本性贡献”获得图灵奖 [35] - 他还曾获得京都奖、IEEE约翰·冯·诺依曼奖章，并被英国女王伊丽莎白二世册封为爵士 [74]

向“愤怒诱饵”说不：构建清朗数智空间的治理之道

中国新闻网· 2026-02-10 17:23

文章核心观点 - 数智技术重塑社会互动与信息传播生态的同时催生了以“愤怒诱饵”为代表的新型社会风险该现象已成为全球性议题其背后存在清晰的利益逻辑和产业链需要技术设计公众意识与制度保障协同推进以遏制其蔓延推动技术向善发展 [1][2][6] “愤怒诱饵”的制造者与产业链 - 制造者主要分为两类一类是旨在获取广告收益与传播声量的数字原生媒体它们在标题与内容中更频繁地植入煽动性表达 [2] - 另一类是意图影响舆论激化对立以服务于特定议程的特定团体或政治行动者例如多国网络“喷子” [2] - 生成式人工智能技术带来了范式转变能够实现低成本规模化生产“愤怒诱饵”内容可能重塑整个灰色产业的运作模式 [2] 算法在“愤怒诱饵”传播中的作用 - 算法本身是技术工具其社会效应关键取决于设计目标与价值导向若一味追求点击与停留则易助推“愤怒诱饵” 若纳入内容质量等多重维度则能抑制此类信息 [3] - 数据显示算法作用具有双重性国外主流平台中约8%至10%的推荐属于“不良”信息但约四分之一的算法推荐实际发挥着保护用户引导积极互动的正向作用 [3] - 核心问题在于设计导向应警惕被单一流量逻辑主导的算法设计通过完善优化框架算法可从扩散器转化为治理助力 [3] 平台遏制“愤怒诱饵”的治理策略 - 平台方需推动治理逻辑从追求“流量效率”向承担“生态责任”转变国内外一些平台在治理违规账号鼓励优质原创等方面的探索已展现初步努力 [4] - 平台可将社会责任转化为算法实践提升算法对煽动性虚假性等有害内容的识别与处置能力从事前预警与事中干预环节阻断传播链条 [4] - 算法优化目标应超越用户参与度转向对内容质量情绪健康与社会价值等多元指标的综合考量通过对“愤怒诱饵”类内容适当限流对促进理性对话的信息给予更多展示机会来引导公众讨论 [4][5] - 短视频平台可结合大模型技术从内容创作用户评论等多维度开展综合治理若算法预估内容存在激化社会矛盾的风险将对相关内容赋负分处理以降低其推荐权重 [4] - 通过引入“信息提示”等功能在用户接触或转发内容时提供风险提醒有助于公众建立初步的辨别意识 [4] 多方协同的治理框架 - 平台的责任实践离不开用户与社会的共同参与公众媒介素养与批判性思维的提升是抵御情绪操纵的基础 [6] - 监管部门需建立相适应的制度框架唯有技术设计公众意识与制度保障协同推进才能营造更加清朗理性健康的社会环境 [6]

仅用提示词工程摘下IMO金牌！清华校友强强联手新发现，学术界不靠砸钱也能比肩大厂

量子位· 2025-08-02 13:23

核心观点 - 两位清华校友通过设计自我迭代验证流程和提示词优化，使Gemini 2.5 Pro在IMO题目解答中达到金牌水平 [1][4][6] - 基础大模型已具备解决复杂数学推理问题的能力，但需要特定提示词和迭代验证才能充分发挥潜力 [6][7][9] - 该方法突破了单次生成中有限推理预算和初始答案错误的局限性，将LLM潜在能力转化为严谨数学证明 [24] 技术方法 - 采用通用提示词+迭代验证流程，包括初始解决方案生成、自我改进、验证解决方案、审查错误报告、纠正改进解决方案和最终接受/拒绝解决方案六个步骤 [16][17] - 使用Gemini 2.5 Pro作为求解器和验证器，分别采用差异化提示词设计 [16][18] - 验证器模拟IMO评分专家，将问题分为关键错误和论证缺口两类，通过多次迭代降低误判影响 [19][20] - 实验选择IMO 2025题目以避免训练数据污染，设置温度值0.1减少随机错误 [20] 实验结果 - Gemini 2.5 Pro在IMO 6道题目中完成5道，其中前两道题目生成有提示和无提示两种解决方案 [23] - 未解决的第六题因验证器未能区分求解器输出的假阳性答案细节 [24][40] - 使用提示后模型一次独立实验即可解决题目，未使用时思维发散且可能需要多次实验 [39] - 不同题目需要的tokens数在300k到5000k之间，计算时间最快10分钟/题 [38] 模型对比 - Gemini 2.5 Pro在IMO测试中准确率31.55%，成本$431.97，显著高于其他模型 [9] - 对比模型表现：o3(high)准确率16.67%，o4-mini(high)14.29%，Grok 4 11.90%，DeepSeek-R1-0528 6.85% [9] - 研究人员预计使用Grok 4、OpenAI-o系列或多智能体系统可能产生更强数学能力 [25] 研究团队 - 黄溢辰：加州大学伯克利分校物理学博士，曾任职微软AI研究员，研究方向包括量子物理学和机器学习 [28][31] - 杨林：加州大学洛杉矶分校副教授，研究重点为强化学习、机器学习和优化理论，曾获亚马逊教授奖等荣誉 [33][35] - 团队证明学术界利用有限资源也能做出与大厂同等重要的成果 [36][43]

DeepMind推出“编程大师”：自动设计优化算法，成功破解数学难题

36氪· 2025-05-15 17:30

核心观点 - 谷歌DeepMind推出编程AI Agent AlphaEvolve 具备独立创造全新计算机算法能力并直接应用于谷歌庞大计算基础设施中 [1] - 该系统融合大型语言模型与进化算法策略实现算法自动测试优化与迭代升级 [3] - 已在谷歌数据中心芯片设计及人工智能训练系统等领域完成部署显著提升运行效率并破解数学难题 [4] 技术架构与运行机制 - 融合Gemini Flash和Gemini Pro语言模型针对现有代码提出修改建议自动化评估器测试并打分最成功算法指引下一轮进化 [8] - 专注于具有明确评估器问题对任何提出解决方案或代码片段自动验证有效性并衡量质量建立快速可靠反馈循环提升系统性能 [8] - 专门针对搁浅资源问题设计即因内存等某一资源耗尽而无法充分利用剩余CPU等资源的机器生成代码简洁明了工程师可轻松理解调试部署 [8] 实际应用成效 - 在谷歌内部运行超过一年开发算法集成到Borg集群管理系统使全球算力利用率提升0.7% [7] - 改进用于训练Gemini模型的矩阵乘法内核操作速度提升23% 整体训练时间缩短1% [7] - 优化谷歌硬件设计消除张量处理单元中关键算术电路冗余位成果将应用于下一代芯片设计 [7] 数学与科学突破 - 设计基于梯度优化程序发现多种新矩阵乘法算法其中一项突破打破1969年以来未被超越数学记录 [10] - 在4×4矩阵计算中发现算法首次超越斯特雷森算法优化14种矩阵乘法算法 [11] - 解决亲吻数问题找到593个球体配置方案打破此前592个球体记录在75%开放性问题中达到现有技术水平 20%案例取得更优成果 [14]