算法设计
搜索文档
快排算法之父Tony Hoare去世,从古典学文科生出身到图灵奖得主,他的人生比算法更传奇
量子位· 2026-03-11 09:18
快速排序算法 - 快速排序是世界上使用最广泛的排序算法之一,被写进了几乎所有主流编程语言的标准库,如C、Java、Python [2][3] - 该算法由托尼·霍尔于1959年在莫斯科学习期间构思,旨在解决机器翻译项目中俄语单词排序的效率问题 [5][6][8] - 算法核心思路是“分而治之”,选择一个基准元素,将小于它的元素移到左边,大于它的移到右边,然后递归处理左右两部分 [13] - 其平均时间复杂度为O(n log n),是原地排序算法,仅需O(log n)的辅助空间,且对现代计算机缓存机制友好,实际运行速度快 [19][20][21] - 霍尔用一下午时间完善算法细节,并在一场与同事关于希尔排序速度的赌局中获胜,赢下六便士 [14][18] 霍尔的其他学术贡献 - 于1969年提出霍尔逻辑,这是一套用于验证程序正确性的形式化系统,为软件可靠性和安全性研究奠定了理论基础 [28] - 于1978年提出通信顺序进程模型,该模型专门用于描述并发系统中多个进程间的交互行为,并直接影响了Go语言中goroutine与channel的并发设计 [30][31] - 于1969年发表论文《计算机编程的公理基础》,提出了“霍尔三元组”概念,使程序的正确性可在开发过程中同步构造,成为编程理论领域最具影响力的论文之一 [61][62] - 其1961年用Algol 60语言实现的快速排序代码于1962年发表在《计算机杂志》上,成为其第三篇学术论文 [25] 空引用及其影响 - 霍尔于1965年在设计ALGOL W语言时引入了空引用概念,初衷是为了方便表示变量“没有值”,且实现成本极低 [41][42] - 此设计被后来的Java、C、C++等主流编程语言大量采纳 [43] - 霍尔在2009年的一次公开演讲中反思,称其为“十亿美元的错误”,指出它导致了无数的错误、漏洞、系统崩溃,在过去四十年可能造成了十亿美元的损失 [45] 霍尔的职业生涯与荣誉 - 霍尔最初在牛津大学学习古典学和哲学,后因在军队学习俄语,得以在莫斯科国立大学学习机器翻译 [50][51] - 1960年,他加入英国Elliott Brothers公司,领导团队完成了ALGOL 60编程语言的首个商用编译器开发,并成为公司首席科学家 [60] - 1968年转入学术界,先后在贝尔法斯特女王大学和牛津大学担任计算机科学教授,并在牛津领导编程研究小组长达22年 [60] - 1999年从牛津退休后,加入微软剑桥研究院担任高级研究员 [68] - 他于1980年因“对程序设计语言的定义和设计的根本性贡献”获得图灵奖 [35] - 他还曾获得京都奖、IEEE约翰·冯·诺依曼奖章,并被英国女王伊丽莎白二世册封为爵士 [74]
向“愤怒诱饵”说不:构建清朗数智空间的治理之道
中国新闻网· 2026-02-10 17:23
文章核心观点 - 数智技术重塑社会互动与信息传播生态的同时 催生了以“愤怒诱饵”为代表的新型社会风险 该现象已成为全球性议题 其背后存在清晰的利益逻辑和产业链 需要技术设计 公众意识与制度保障协同推进以遏制其蔓延 推动技术向善发展 [1][2][6] “愤怒诱饵”的制造者与产业链 - 制造者主要分为两类 一类是旨在获取广告收益与传播声量的数字原生媒体 它们在标题与内容中更频繁地植入煽动性表达 [2] - 另一类是意图影响舆论 激化对立以服务于特定议程的特定团体或政治行动者 例如多国网络“喷子” [2] - 生成式人工智能技术带来了范式转变 能够实现低成本 规模化生产“愤怒诱饵”内容 可能重塑整个灰色产业的运作模式 [2] 算法在“愤怒诱饵”传播中的作用 - 算法本身是技术工具 其社会效应关键取决于设计目标与价值导向 若一味追求点击与停留则易助推“愤怒诱饵” 若纳入内容质量等多重维度则能抑制此类信息 [3] - 数据显示算法作用具有双重性 国外主流平台中约8%至10%的推荐属于“不良”信息 但约四分之一的算法推荐实际发挥着保护用户 引导积极互动的正向作用 [3] - 核心问题在于设计导向 应警惕被单一流量逻辑主导的算法设计 通过完善优化框架 算法可从扩散器转化为治理助力 [3] 平台遏制“愤怒诱饵”的治理策略 - 平台方需推动治理逻辑从追求“流量效率”向承担“生态责任”转变 国内外一些平台在治理违规账号 鼓励优质原创等方面的探索已展现初步努力 [4] - 平台可将社会责任转化为算法实践 提升算法对煽动性 虚假性等有害内容的识别与处置能力 从事前预警与事中干预环节阻断传播链条 [4] - 算法优化目标应超越用户参与度 转向对内容质量 情绪健康与社会价值等多元指标的综合考量 通过对“愤怒诱饵”类内容适当限流 对促进理性对话的信息给予更多展示机会来引导公众讨论 [4][5] - 短视频平台可结合大模型技术从内容创作 用户评论等多维度开展综合治理 若算法预估内容存在激化社会矛盾的风险 将对相关内容赋负分处理以降低其推荐权重 [4] - 通过引入“信息提示”等功能 在用户接触或转发内容时提供风险提醒 有助于公众建立初步的辨别意识 [4] 多方协同的治理框架 - 平台的责任实践离不开用户与社会的共同参与 公众媒介素养与批判性思维的提升是抵御情绪操纵的基础 [6] - 监管部门需建立相适应的制度框架 唯有技术设计 公众意识与制度保障协同推进 才能营造更加清朗 理性 健康的社会环境 [6]
仅用提示词工程摘下IMO金牌!清华校友强强联手新发现,学术界不靠砸钱也能比肩大厂
量子位· 2025-08-02 13:23
核心观点 - 两位清华校友通过设计自我迭代验证流程和提示词优化,使Gemini 2.5 Pro在IMO题目解答中达到金牌水平 [1][4][6] - 基础大模型已具备解决复杂数学推理问题的能力,但需要特定提示词和迭代验证才能充分发挥潜力 [6][7][9] - 该方法突破了单次生成中有限推理预算和初始答案错误的局限性,将LLM潜在能力转化为严谨数学证明 [24] 技术方法 - 采用通用提示词+迭代验证流程,包括初始解决方案生成、自我改进、验证解决方案、审查错误报告、纠正改进解决方案和最终接受/拒绝解决方案六个步骤 [16][17] - 使用Gemini 2.5 Pro作为求解器和验证器,分别采用差异化提示词设计 [16][18] - 验证器模拟IMO评分专家,将问题分为关键错误和论证缺口两类,通过多次迭代降低误判影响 [19][20] - 实验选择IMO 2025题目以避免训练数据污染,设置温度值0.1减少随机错误 [20] 实验结果 - Gemini 2.5 Pro在IMO 6道题目中完成5道,其中前两道题目生成有提示和无提示两种解决方案 [23] - 未解决的第六题因验证器未能区分求解器输出的假阳性答案细节 [24][40] - 使用提示后模型一次独立实验即可解决题目,未使用时思维发散且可能需要多次实验 [39] - 不同题目需要的tokens数在300k到5000k之间,计算时间最快10分钟/题 [38] 模型对比 - Gemini 2.5 Pro在IMO测试中准确率31.55%,成本$431.97,显著高于其他模型 [9] - 对比模型表现:o3(high)准确率16.67%,o4-mini(high)14.29%,Grok 4 11.90%,DeepSeek-R1-0528 6.85% [9] - 研究人员预计使用Grok 4、OpenAI-o系列或多智能体系统可能产生更强数学能力 [25] 研究团队 - 黄溢辰:加州大学伯克利分校物理学博士,曾任职微软AI研究员,研究方向包括量子物理学和机器学习 [28][31] - 杨林:加州大学洛杉矶分校副教授,研究重点为强化学习、机器学习和优化理论,曾获亚马逊教授奖等荣誉 [33][35] - 团队证明学术界利用有限资源也能做出与大厂同等重要的成果 [36][43]
DeepMind推出“编程大师”:自动设计优化算法,成功破解数学难题
36氪· 2025-05-15 17:30
核心观点 - 谷歌DeepMind推出编程AI Agent AlphaEvolve 具备独立创造全新计算机算法能力 并直接应用于谷歌庞大计算基础设施中 [1] - 该系统融合大型语言模型与进化算法策略 实现算法自动测试 优化与迭代升级 [3] - 已在谷歌数据中心 芯片设计及人工智能训练系统等领域完成部署 显著提升运行效率并破解数学难题 [4] 技术架构与运行机制 - 融合Gemini Flash和Gemini Pro语言模型 针对现有代码提出修改建议 自动化评估器测试并打分 最成功算法指引下一轮进化 [8] - 专注于具有明确评估器问题 对任何提出解决方案或代码片段自动验证有效性并衡量质量 建立快速可靠反馈循环提升系统性能 [8] - 专门针对搁浅资源问题设计 即因内存等某一资源耗尽而无法充分利用剩余CPU等资源的机器 生成代码简洁明了 工程师可轻松理解调试部署 [8] 实际应用成效 - 在谷歌内部运行超过一年 开发算法集成到Borg集群管理系统 使全球算力利用率提升0.7% [7] - 改进用于训练Gemini模型的矩阵乘法内核 操作速度提升23% 整体训练时间缩短1% [7] - 优化谷歌硬件设计 消除张量处理单元中关键算术电路冗余位 成果将应用于下一代芯片设计 [7] 数学与科学突破 - 设计基于梯度优化程序 发现多种新矩阵乘法算法 其中一项突破打破1969年以来未被超越数学记录 [10] - 在4×4矩阵计算中发现算法首次超越斯特雷森算法 优化14种矩阵乘法算法 [11] - 解决亲吻数问题 找到593个球体配置方案 打破此前592个球体记录 在75%开放性问题中达到现有技术水平 20%案例取得更优成果 [14]