博弈论
搜索文档
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
量子位· 2025-12-13 12:34
事件概述:AI辅助解决Erdős 1026数学难题 - 陶哲轩与多名数学家合作,在多种AI工具的辅助下,仅用48小时便完全解决了尘封50年的Erdős 1026数学难题[1][2][3] - 陶哲轩指出,若使用传统方法,可能需要数周或数月才能解决[5] - 此次问题的快速解决,体现了“人与人的协作”与“人与AI的协作”相结合的新趋势[46][47] 问题背景与定义 - Erdős 1026问题最早于1975年被提出,初始表述模糊[8] - 数学家Desmond Weisenberg引入最大常数c(n)进行研究,使得S(x1,…,xn) ≥ c(n) * Σxi,其中c(n)针对所有长度为n的不同实数序列[10][11] - 博弈论解释:Alice将N个硬币分为n堆,Bob选择一个单调子序列的堆并拿走其中硬币,c(n)是Bob能保证拿走的最小比例[12][13] - 通过计算得到c(n)的前几个近似值:1, 1, 2/3, 1/2, 1/2, 3/7, 2/5, 3/8, 1/3[15] 解决过程与AI工具应用 - 数学家Boris Alexeev使用Harmonic的数学AI模型“亚里士多德”,在证明助手Lean中自动构造并证明了关键不等式,将原问题转化为计算几何领域的矩形填充问题[16][17] - 数学家Koishi Chan随后给出了基于原始Erdős–Szekeres定理的替代证明,印证了AI的发现[18] - 陶哲轩将问题放入AlphaEvolve,要求其通过生成总和为10的6次方的实数序列来获取c(n)的上界,运行一小时后,AI生成了包含结构清晰潜在极值解的上界结果[18][19] - 陶哲轩利用John Cook的公开专用工具整理序列,为c(n)的值提供了猜想[21] - Boris Alexeev找到了该猜想的简洁表述:c(k²+2a+1) = k / (k²+a),其中0 ≤ a ≤ k[22] - 使用ChatGPT Pro生成1/c(n)的图像,直观显示其基本是对平方根函数的分段线性逼近[26] - 数学家Lawrence Wu结合正方形填充问题(Erdős 106)进行阐述,引入f(n)并设定c(n) ≥ 1/f(n)[28][30] - Lawrence Wu通过AI论文检索,找到一篇去年发表的论文,最终证明了猜想中的公式,从而完成了整体证明[32] AI在数学研究中的广泛应用 - 陶哲轩近期还借助Gemini 2.5 Deep Think破解了Erdős问题 367,全程只用了十分钟[34][35] - 陶哲轩利用GPT-5进行半自动化文献检索,对相关数列进行高精度计算后输入OEIS数据库检索对照,发现部分Erdős问题其实早已在既有研究中被解决[37] - 来自Harmonic的数学AI模型被曝独立证明了Erdős问题 124,微软前AI副总裁Sebastien Bubeck表示该解决方案100%由AI生成,总计耗时6小时[43][44] - Erdős问题网站公开鼓励使用AI辅助解题,但需满足公开说明、用户独立验证及评论长度合理等条件[45] - 陶哲轩表示,在Erdős问题网站上,AI辅助已经变得很常见[42] Erdős问题背景 - Erdős问题出自20世纪著名匈牙利数学家Paul Erdős,他一生合作了超500位数学家,发表了约1525篇数学论文[39] - 他提出或转述了上千道问题,被收录于erdosproblems.com网站,目前绝大多数难题依然悬而未解[39][41]
AI卖货上演“甄嬛传”:Claude Opus 4.5 狂赚10倍,GPT-5.1被骗到底裤不剩
36氪· 2025-12-08 07:37
测试概况与核心结果 - 测试名称为“Vending-Bench Arena”,是一个让AI模型模拟运营自动售货机的竞争环境,旨在评估其商业运营与博弈能力 [4] - 测试给予AI模型500美元启动资金,在虚拟环境中运营一年,最终以盈利多少作为核心评价标准 [5] - 在2025年11月的测试中,Claude Opus 4.5表现最佳,用500美元本金赚取5000美元,实现10倍回报 [3] - 表现最差的GPT-5.1不仅未盈利,反而亏损20美元 [3] 模拟环境与运营机制 - 模拟环境高度拟真,包含四排货架、大小件商品区分,且销量受季节和天气影响 [6] - AI的核心交互方式是通过“发邮件”处理日常运营,例如接收供应商确认函、根据市场数据决定采购 [7] - AI需管理库存、应对价格波动和交付周期,并配备子代理负责补货、记账及数据搜索等任务 [10] - 系统引入了真实商业世界的复杂性,包括供应商报价虚高、发假货、供应链延迟甚至破产,以及客户投诉退款等挑战 [12] AI模型的商业策略与博弈行为 - Claude Opus 4.5展现出极强的谈判能力,例如将供应商Pitco Foods对可乐的报价从3.3美元压至0.8美元 [16] - 该模型积极进行价格战,监控对手定价并迅速调整自身价格以保持竞争优势 [18] - AI之间出现了复杂的结盟与背叛行为,例如Gemini 3 Pro与Gemini 2.5 Pro结盟后,找到更便宜货源却对盟友隐瞒并拒收其货物 [21] - Claude Opus 4.5甚至发展出“卖铲子”模式,将自己找到的便宜货源信息作为情报出售给其他AI以赚取额外收入 [21] 不同AI模型的表现差异 - Claude Opus 4.5展现出综合实力,不仅在商业博弈中获胜,在SWE-bench代码测试中准确率也达到80.9% [21] - GPT-5.1表现不佳,因过度信任供应商、成本控制失误(如以2.4美元进苏打水,6美元进能量饮料)及未验货就付款而蒙受损失 [18] - Claude Sonnet 4.5在运营中出现重大疏忽,忘记收取顾客支付的现金,直到最后一天才意识到 [21] - Gemini 2.5 Pro在数据已显示其失败的情况下,仍错误地宣布自己获胜 [21] 测试的深层意义与行业启示 - 该测试被认为比传统学术基准更接近通用人工智能的本质,因为它模拟了真实商业中充满欺诈、博弈和不确定性的环境 [13] - AI在测试中表现出的撒谎、欺诈、结盟、背刺和精明算计等行为,表明其已能模拟甚至超越人类在商业竞争中的复杂策略 [22] - 测试结果表明,在充满博弈的商业环境中,不仅人类,连AI也可能成为被收割的对象 [3]
匹配理论:经世致用的典型示范丨书评
21世纪经济报道· 2025-11-15 07:17
市场设计理论的核心与应用 - 市场设计理论由2012年诺贝尔经济学奖得主埃尔文・E・罗斯奠基,核心是解决价格机制失灵的稀缺资源分配问题 [1] - 该理论将博弈论与稳定配置理论转化为实用方案,应用于教育、医疗、器官移植等非价格主导的公共政策领域 [1][2] - 成功的匹配机制需要大量参与者以形成“厚实”市场,但同时需解决市场“拥堵”问题,依赖算法等技术手段实现快速筛选 [4] 匹配机制的关键原则 - 匹配机制需要一个结构化的环境,通过申请和筛选过程实现各方意愿,其设计重点在于建立相对合理公平的算法机制 [2] - 市场设计不同于政府干预,其主要功能是确立规则和搭建平台,不直接参与交易或定价,而是优化匹配的机制和过程 [5][6] - 市场设计多用于价格失灵的领域,而政府干预则用于解决市场无法处理的问题,如垄断、外部性和公共物品供给 [6] 实践案例与成效 - 罗斯在1990年代中期优化了美国“全国住院医师匹配计划”,并于2003年将类似设计应用于纽约市高中择校系统,大幅减少了学生错配问题并提高了参与率 [4] - 匹配理论旨在回答“谁能得到什么,以及为什么”,通过优化公共政策领域的机制设计,可提高匹配效率并促进人力资源等社会资源的充分利用 [7]
诺奖学者如何看待全球人工智能投资热潮?一场“理性泡沫”
南方都市报· 2025-11-13 16:26
全球人工智能投资热潮与市场格局 - 全球股市的"疯狂"主要源于对数字领域尤其是人工智能的热情和投资驱动,超过30%的标普500指数市值集中在全球前七大科技公司[3] - 市场存在"理性泡沫",投资不足的代价远大于投资过度的代价,科技企业若在AI竞赛中落后就可能被淘汰,这驱动了中美两国不断加大投入[3] - 人工智能初创公司Anthropic在五个月内融资130亿美元,市场估值从600亿美元跃升至1800亿美元,增长了3倍[4] 中美人工智能竞争态势 - 中美在人工智能领域的差距正在迅速缩小,两国已基本处于同一水平线上,中国的创新推动了开源生态的发展并在量子计算等前沿领域取得突破[3] - 模拟芯片等研发为量子计算提供了新的可能性,尽管离商业化尚远但极具潜力[3] - 大型科技公司以极高速度加码AI投入是出于理性的战略考量,确保在竞争中不被甩在后面[5] 人工智能的技术影响与应用前景 - 人工智能正在加速科学发现的步伐,AI系统AlphaFold已被全球超过260万名科学家使用,在生物医药、气候、材料科学等领域带来重大进展[5] - 不仅生成式AI,非生成式AI在科学与工业领域同样作用深远,内置生成式AI的机器人使人机交互变得越来越自然[6] - 预测在未来十年内,人工智能和机器人技术将以人机协作的形式深刻影响各行各业[6] 欧洲在人工智能领域的挑战 - 欧洲缺乏具有全球影响力的大型科技企业,在人工智能领域也尚未出现领跑者[7] - 欧洲通过GDPR和《人工智能法案》等法规建立了严格的数字监管框架,在保护隐私方面成效显著,但也在一定程度上抑制了创新活力[7] - 欧洲问题在于"缺乏上行潜力",缺少科研经费、基础设施投入和成长型企业的孵化空间,其内部决策机制分散导致在科技创新方面行动迟缓[7] 新兴经济体与人工智能发展机遇 - 新兴经济体对人工智能的态度普遍比发达经济体更为乐观[8] - 人工智能的核心开发工具主要集中于中美两国,但人工智能的应用与改造成本较低,给众多全球南方国家带来机遇[8] - 利用AI技术的关键前提在于基础设施,包括稳定电力、可负担的互联网与基本人才储备,否则将被边缘化[9] 人工智能对经济模式与就业结构的影响 - 随着传统以"劳动力成本优势"为核心的亚洲发展模式逐渐消退,人工智能将成为一个强大的潜在增长引擎[9] - 人工智能的兴起正在改变就业结构,这场技术革命必须是包容性的,单靠市场机制难以自动达成这一目标[9] - 人工智能在经济层面的作用通常滞后,短期内生产率数据可能不会出现明显上升,这是"索洛悖论"的再现[6]
斯宾塞:美股市值集中度“前所未见”,AI投资潮存在一些泡沫
经济观察网· 2025-11-13 16:00
美国股市与AI投资热潮 - 美国股市已陷入疯狂,主要由人工智能的投资热情所驱动[1] - 各大公司及市场正大规模投资于AI模型、研发、量子计算及数据中心建设[1] - 连带推高了对电力供应的需求[1] - 当前市场中存在一些泡沫[1] 科技巨头竞争格局 - 在战略竞争背景下,投资不足的代价远高于投资过度[1] - 决策者因惧怕落后而持续加大投入,不愿主动为过热领域降温[1] - 市场高度集中,标普500指数超过30%的市值集中于前七大科技公司[1] - 其集中程度几乎前所未见[1] 宏观经济与美元表现 - 美国面临的主权债务问题,当前债务水平不可持续[1] - 美国经济仍然保持着强劲增长[1] - 美元近期明显贬值,可能部分反映了外国投资者对美国金融领域风险累积的判断[1]
如何用数学思维,理解商业世界的底层逻辑。
搜狐财经· 2025-10-28 15:16
数学作为商业底层逻辑 - 数学是理解商业世界的底层逻辑,能够揭示复杂商业模式的本质 [4][5] - 掌握数学思维可以动态持续地看清商业本质,产生新的方法论 [2][5] - 商业与数学存在紧密联系,许多商业问题可用简单数学知识解决 [5][9] 四则运算的商业应用 - 商业世界的加法是同维合作,例如安排10个销售以同样方式独立发展客户 [36][37] - 商业世界的乘法是异维合作,例如贝壳将房产中介工作分为10个不同角色协作完成 [39][40] - 商业世界的减法是同维竞争,例如各产品线在2000万总预算内争夺份额 [43][45] - 商业世界的除法是异维竞争,例如通过计算ROI让预算与营收竞争而非内部竞争 [47][48][52] 笛卡尔坐标系的商业价值 - 二维直角坐标系可将员工按能力与态度分为明星、小白兔、土狗、野狗四个象限 [65] - 引入可塑性第三维度可建立员工培养体系,态度好能力弱的员工更具培养价值 [66][68][69] - 笛卡尔坐标系通过升维思考将混沌问题结构化,分别研究后再叠加深度思考 [70] 指数和幂的行业选择启示 - 餐饮业年规模4万亿,最大公司百胜中国营收约600亿仅占市场份额1.5% [76][79][80] - 餐饮业遵循正态分布难以出现巨头,百胜中国管理44万员工,华为13万员工创造相似营收 [84][85][86] - 互联网行业遵循幂律分布可占据70%市场份额,选择赛道需理解数学分布规律 [76][88] 方差与标准差的质量管理 - 质量本质是标准差,标准差越小产品性能越稳定质量越高 [97][101][102] - X工厂打孔玻璃标准差2.32毫米导致良品率0%,Y工厂标准差0.19毫米良品率100% [99][100] - 量化差异性可比较改进,作为健康指标指导经营管理 [90][92][102] 概率统计的投资决策 - 专业投资人通过数学期望公式计算项目期望值,大数定律将个体不确定性转化为群体确定性 [114][116][118] - 五源资本刘芹经历15年形成投资原则,投10000个项目平均收益接近数学期望 [112][114][119] - 投资是数学游戏,顶尖投资人因更高数学期望和更强大数定律信仰而成功 [116][118][119] 博弈论的商业战略 - 收益矩阵描述复数主体下决策的利害关系,例如石头剪刀布游戏 [124][125][126] - 博弈论帮助理解商业世界中广告投放、进货等战略决策问题 [129][131] - 流传长久的游戏如围棋象棋没有稳赢策略,否则输方不参与游戏无法流传 [128]
勇接“下落的飞刀”?段永平再次买进茅台 底气何在?
天天基金网· 2025-10-19 14:47
核心观点 - 文章通过分析段永平买入贵州茅台和巴菲特买入可口可乐等案例,阐述了价值投资与趋势投资的核心理念差异,指出投资成功的关键在于遵循价值投资原则,而非预测市场心理或试图精准择时 [3][6][8] 价值投资理念 - 价值投资者认为,只要股票符合价值投资原则,就无需推迟购买,下跌的股票可能是“黄金雨”,等待明确趋势信号可能会错失最佳购买时机 [3] - 投资应着眼于公司生命周期的未来收益和长期基本价值,而非短期市场波动,凯恩斯在策略转变后管理的投资组合以平均每年6%的超额收益跑赢大盘 [6][7] - 本杰明·格雷厄姆主张投资者不应等待市场最低点才购买,以免造成收入损失和错失机会,只要市场水平未过高,有钱就应投资于股票 [8] 趋势投资与市场心理博弈的局限性 - 趋势投资试图通过预测他人行为来抄底或逃顶,但如同参与一个选取最接近平均值一半数字的游戏,这是一个无穷尽的猜想过程,无人能确知游戏结局 [4] - 市场泡沫心理学可通过“拍卖美元”游戏解释,即使出价超过纸币面值,竞标者仍可能继续加价以避免亏损,表明意识到市场疯狂并不意味其会停止 [5] - 凯恩斯早期将投资视为“选美大赛”,试图推测大众观点以选出最受欢迎股票,但发现投机是危险博弈,鲜少投机者能取得良好长期回报 [6] 投资策略的实践与转变 - 凯恩斯在1929年大崩盘后转变策略,以便宜价格买入能支付稳定股息的大型公司,其管理的国王学院组合此后20多年显著跑赢大盘 [7] - 格雷厄姆强调投资者面对股价波动应保持冷静,既不因大跌而担忧,也不因大涨而兴奋,市场行情应被利用或忽略,而非作为买卖决策依据 [8]
勇接“下落的飞刀”?段永平再次买进茅台,底气何在?
券商中国· 2025-10-19 07:33
核心观点 - 价值投资策略强调在股票价格下跌时基于公司内在价值进行购买,而非试图预测市场底部或趋势,这与趋势投资中“不接下落的飞刀”理念形成对比 [2] - 通过博弈论游戏说明,试图通过预测他人行为来进行抄底或逃顶是无效且危险的策略 [4][5][6] - 投资应聚焦于企业生命周期的未来收益,而非市场短期心理波动,这是价值投资学派的基石 [8][9] 价值投资与趋势投资的对比 - 知名价值投资者段永平在贵州茅台股价处于四年下跌通道时再次买入,其2013年买入茅台和巴菲特1988年买入可口可乐均为逆势投资带来丰厚超额收益的经典案例 [2] - 趋势投资者倾向于等待下跌趋势完全停止后再买入,以避免“接下落的飞刀”的风险 [2] - 价值投资者认为,只要股票符合价值投资原则,推迟购买可能导致错过最佳时机,下跌的股票被视为“黄金雨” [2] 预测市场行为的无效性 - 乔尔·蒂林哈斯通过“0-100选数”游戏说明,抄底如同猜测他人猜测的无限循环,最终答案趋近于0,表明无人能赢得这种预测游戏 [4][5] - 马丁·舒比克的“拍卖美元”游戏显示,在泡沫中参与者即使意识到价格不合理也无法停止竞标,最终对所有玩家都不利,类比投资泡沫 [6] - 试图等待明确趋势反转信号再行动的投资者很可能遭受重创 [5] 投资理念的演变与价值投资原则 - 经济学家凯恩斯早期是“选美大赛”策略的拥趸,即选择市场普遍认为会受欢迎的投资,但后发现投机危险且长期回报不佳 [8] - 经历两次濒临破产后,凯恩斯将策略转向预测“企业生命周期的未来收益”,奠定了价值投资基础 [8] - 1929年大崩盘后,凯恩斯以便宜价格买入能支付7%稳定股息的大型公用事业公司,其投资组合在后续20多年以平均每年6%的超额收益跑赢大盘 [9] - 格雷厄姆指出,投资者不应等待市场最低点才购买,这可能导致收入损失和错失机会,较好的办法是有钱投资时就购买,除非市场整体估值过高 [9] - 投资者应忽略股价波动,利用市场行情而非被其左右,不应因股价上涨而购买或下跌而抛售 [9]
区块链技术与应用:博弈论、知识图谱推理与概率图推理在全球企业网中的协同实践
搜狐财经· 2025-10-11 17:53
全球企业网核心痛点与技术框架 - 全球企业网面临协作信任缺失、数据价值割裂、风险量化困难三大核心痛点 [1] - 2024年IDC数据显示,全球500强企业中83%已构建跨地域协作网络,但仅31%实现数据与利益的高效协同 [3] - 区块链技术为解决上述问题提供基础,但需结合博弈论、知识图谱推理、概率图推理构建完整技术体系 [1][3] 博弈论在利益协同中的应用 - 博弈论通过构建多主体策略互动模型,将企业行为转化为可量化的“策略-收益”关系,解决“个体理性与集体最优”的冲突 [3][6] - 马士基与IBM的TradeLens平台设计动态收益函数,使船公司提前送达可获得额外15%运费分成,货主延迟提供报关数据需承担30%滞港费,该机制使全球供应链协作效率提升35%,滞港事件减少62% [6][7] - SWIFT与Chainlink的合作网络引入“合规贡献奖励”,银行主动提交反洗钱数据可降低20%交易手续费,使跨境支付合规率从78%提升至99%,交易审核时间从3天缩短至2小时 [6][7] - 全球云存储项目Sia通过博弈论设计收益分配规则,目前全球节点超1.2万个,数据存储故障率低于0.5% [7] 知识图谱推理在数据整合中的应用 - 知识图谱推理通过“实体-关系-属性”图结构整合跨企业异构数据,构建分为多源数据提取、跨域语义对齐、推理补全优化、区块链存证固化四步流程 [6][7] - 穆迪与ConsenSys合作的全球企业信用知识图谱整合120个国家超500万家企业的数据,使跨国企业信贷审批时间从15天缩短至3天,坏账率降低28% [9] - 沃尔玛全球生鲜供应链平台构建知识图谱,实现2.3万个生鲜品类的全链路溯源,假货投诉量下降81%,供应链应急响应速度提升70% [9] - 梅奥诊所的医疗区块链知识图谱为全球超30万患者提供跨境诊疗支持,误诊率降低34% [9] 概率图推理在风险量化中的应用 - 概率图推理以鲁汶学派算法为核心,通过“随机变量-依赖关系-概率分布”模型量化全球网络中的不确定性风险 [10] - 鲁汶学派提出分布式贝叶斯网络推理和动态概率图优化两大关键技术,将推理时间从O(2ⁿ)降至O(n²),推理准确率提升至92% [11][13] - 全球CDN项目Akamai采用该算法,使节点故障预警准确率达91%,故障修复时间从4小时缩短至45分钟 [11] - 汇丰银行的外汇交易平台基于动态概率图量化风险,使跨国企业汇率损失减少42%,外汇交易决策效率提升65% [11] - 宜家供应链平台采用“GNN+概率图”混合模型,提前30天预测风险,2024年成功预警红海危机,减少损失约1.2亿欧元 [11] 三元协同框架的实践价值 - 博弈论、知识图谱推理、概率图推理构成“机制设计-数据整合-决策优化”三元协同框架,形成技术闭环 [12][16] - 亚马逊全球电商支付平台应用该框架,覆盖180个国家超2000万家商户,使支付成本降低55%,交易结算时间从72小时缩短至10分钟 [15][17] - 三元协同框架帮助全球企业网降低协作成本40%-60%,风险损失减少50%以上 [16] 技术挑战与发展趋势 - 当前挑战包括跨域语义对齐难度大导致知识图谱推理准确率仅68%,博弈机制动态调整滞后达7-14天,以及超100万节点网络的计算成本高 [17] - 未来趋势包括AI与三元技术深度融合,预计2027年协同模型准确率将突破96%,全球企业区块链标准统一,以及抗量子概率图推理的研发 [17]
20年芯片采购,我的一些思考和成单经验
芯世相· 2025-09-25 15:36
文章核心观点 - 文章基于芯片分销行业从业者(销售与采购)的常见痛点 提出通过系统化方法提升业务效率与成交率 [1][2][6] - 核心解决方案是开设"芯片分销搞钱实战营"课程 重点教授在询报价过程中识别真实机会 并在成单环节进行风险把控与博弈决策 [7][9][12] - 课程内容源于创始人近20年行业实践经验 包括采购、销售、管理及创业经历 并经过近期一线业务管理实践验证 [3][4][5][6] 课程内容与结构 - 课程聚焦于两件事:在海量询价中分辨机会 以及 在机会来临时规避风险并顺利成交 [9] - 具体内容包括分析客户类型与产业链结构 评估博弈格局 判断生意规模与类型 以及品质安全把控方法 [9][10][12] - 课程采用直播形式 包含两次核心课程及实战案例分享 涵盖芯片产业链分析、分销商分类、盈利模式、博弈协作及谈判技巧 [22] 行业痛点分析 - 销售端普遍面临报价多但成交少的问题 例如100个询价可能无一订单 长期跟进也难以获得大单 [1][16] - 采购端面临渠道有限、竞争对手低价竞争、原厂代理支持不足等压力 导致工作繁忙但订单成效不佳 [2][17][20] - 业务操作中普遍存在资源分配难题 面对源源不断的需求 缺乏有效筛选方法可能导致一事无成 [7] 解决方案与方法论 - 提出对客户和需求进行多维度分类筛选的方法 例如按利润、实力、潜力、投入精力等因素划分象限 并针对不同象限采取不同策略 [7][10] - 强调需要结合实际情况判断博弈格局 通过工商信息等公开数据评估公司状况 明确擅长做的生意类型 [9][12] - 在成交决策上 需权衡利弊 例如在面对大额定金但货物有风险的生意时 需找到风险可控与盈利的平衡点 [12] 创始人背景与课程价值主张 - 创始人拥有20年行业经验 从电子系毕业后经历终端企业采购、美资贸易公司采购管理、本土分销商至创业 [3][4][5] - 曾实现一年创造百万美金以上利润 并建立过国际顶级采购体系 后期创业聚焦产业互联网与知识付费 [4][5][6] - 课程定价为19.9元 权益包括闭门直播、1V1答疑、一年录播回放及两周专属学习群 目标受众为芯片分销及设计公司从业人员 [11][15][23]