选择悖论
搜索文档
清华教授翟季冬:Benchmark正在「失效」,智能路由终结大模型选型乱象
雷峰网· 2026-01-23 15:47
文章核心观点 - 当前AI模型与算力市场存在“选择悖论”,模型基准测试分数与用户真实需求脱节,服务商在性能、价格、稳定性上的差异导致企业选型负担沉重、成本高企 [2][7] - 清程极智公司开发的AI Ping平台旨在成为算力界的“大众点评”,通过系统性评测与智能路由,帮助用户在众多模型和服务商中做出高性价比选择,以解决行业信息不对称问题 [3][12] - AI基础设施(Infra)行业的核心价值在于通过软件技术优化算力利用效率,其生命力源于持续的模型演进、算力架构融合以及多样化的推理场景需求,商业化路径包括软硬件整机服务与算力平台整合 [20][21][27] 模型与算力市场的“选择悖论” - 模型基准测试的高分不一定匹配用户真实需求,同款模型在不同MaaS平台上的效果可能差异巨大,部分服务商为降低成本会进行“阉割级”量化(如从FP8变为INT4),影响输出表现 [2][8] - 影响模型使用体验的因素多维:服务商API服务吞吐量差异巨大,例如DeepSeek-v3.2模型在不同供应商的吞吐覆盖从15到200 token/s,相差10倍以上;支持的输入输出长度从8k到160k不等,相差20倍 [8] - 服务商的算力部署地理位置会影响调用延迟,例如用户在北京调用位于上海或深圳的模型,体验会有很大差异 [9] - 各服务商定价策略和促销活动导致成本相差甚远,而用户需求本身也是多维度的,有的看重性价比,有的追求稳定性或响应速度 [10] - 将模型选型的主动权完全交给用户是巨大挑战,对企业级用户而言,选择不当会引发巨大的成本鸿沟:同样预算,调用大模型可能仅支持十万次请求,而小模型可达百万次量级 [2][10] 清程极智的解决方案:AI Ping平台 - AI Ping是一款智能路由产品,旨在成为算力界的“大众点评”,通过持续评测国内MaaS供应商,对比同款模型在不同厂商的延迟、带宽、吞吐效率与价格成本差异 [12][13] - 智能路由能力分为两层:一是在众多API服务提供者中选择最佳服务商(服务商路由),二是在众多大模型中选择最佳模型(模型路由) [13] - 产品开发初期面临精准匹配模型的难题,因为需要积累海量用户历史数据,而目标市场(个人开发者和中小企业)对产品质量要求极高,八十分水准在他们眼中几乎等同于不合格 [13][14] - 团队通过“笨办法”冷启动:一方面为供应商进行大量基准测试,另一方面联合上下游企业在真实场景中积累用户数据 [14] - 为满足企业高吞吐需求,平台需具备强大的算力整合能力及国产算力接入能力,清程极智将其自研的“赤兔”推理引擎与AI Ping对接,完成算力资源整合调度 [14] - 平台采用类似“团购”的逻辑,通过聚合海量用户需求,以更大体量与算力厂商议价,形成马太效应:数据越集中,模型匹配越精准,用户成本越低,同时帮助算力厂商盘活资源 [3][17] - AI Ping已得到行业认可,例如硅基流动创始人袁进辉曾引用其测评结果向用户解释不同版本算力的指标差异 [18][19] AI基础设施(Infra)行业的价值与商业化路径 - AI Infra行业的核心焦虑在于如何赚到更多钱,商业化逻辑在于通过服务软件有效整合算力并提供给用户 [20][21] - 清程极智的核心竞争力是中间软件层技术(如编译、通信库、并行加速),其定位是与芯片厂商合作,在芯片系统软件之上做增量,让大模型在芯片上发挥极致效率 [22] - 公司探索的商业化路径包括:1) 将软件与硬件打包为整机服务,解决用户买了国产卡却难落地的问题;2) 通过AI Ping等平台与算力厂商合作,提升国产算力易用性 [23] - 行业对Infra价值的认知正在转变,例如DeepSeek通过模型架构设计和Infra软件技术,以极少的算力卡和极低成本训练出大规模模型,并开源了大量算力加速类Infra软件,使市场意识到其重要性 [24] AI基础设施行业的未来与挑战 - 行业存在一种担忧:AI Infra的价值可能只存在于国产算力群雄逐鹿阶段,一旦算力架构定型、大模型技术收敛,其必要性会大打折扣 [25] - 然而,Infra的生命力源于底层架构与上层软件的双重迭代,只要模型还在演进、算力架构还在融合发展,其需求就会持续存在 [27] - 模型侧尚未完全收敛:文生图、文生视频等多模态模型兴起,DeepSeek V4将引入更多稀疏性技术难题,AI for Science等新应用领域也在倒逼底层需求变革 [27] - 国内算力市场架构不统一,厂商众多,有的选择对标英伟达的SIMT架构,有的主攻SIMD架构,且许多厂商正走架构融合路线(如华为在SIMD中融入SIMT,英伟达则相反),这决定了AI Infra的不可替代性 [28][29] - 适配不同架构需要大量本土化改造,例如开源工具Triton在适配国产芯片时必须经过大量改造 [29] - 未来推理场景全面爆发将带来新挑战:芯片峰值算力与实际利用率存在巨大鸿沟,一块标称300TFLOPS算力的芯片,在大模型训练或推理中实际利用率往往只有10%-20%,即便英伟达在预训练场景下利用率也仅达50%上下 [30] - AI Infra未来的核心攻坚方向是如何针对文字、图像、视频等不同推理场景,实现硬件性能的最大化释放并满足极高时延要求 [30] - 行业还在探索“冷赛道”如AI for Science,这些领域短期内难见商业回报,但对科技发展至关重要,且对软硬件协同能力提出更高要求,这也体现了Infra行业穿越周期的本真价值 [30][31]
内耗的原理
36氪· 2025-07-24 12:13
内耗的本质与机制 - 内耗是外部叙事在脑内冲突的体现,本身没有正期望收益,反而消耗精力[3] - 内耗可视为警示器,提醒反思无意识接受的外部冲突叙事[4] - 从物理学看,内耗是大脑未能对外做功的"负功",能量被无效内部消耗[12][25] - 大脑占体重2%却消耗20%能量,80-90%用于维持静息态,内耗是冗余设计的副产品[23][24] 神经科学基础 - 内耗源于默认模式网络(DMN)、中央执行网络(CEN)和突显网络(SN)的失衡[28] - DMN失控时产生"负功",表现为异常神经连接模式:子系统连接过强而调节系统减弱[32] - 抑郁症患者DMN无法被任务抑制,且过度活跃与反刍思维相关[38] - 认知冲突激活跨半球神经回路,失衡时持续消耗精神资源[35][36] 进化心理学视角 - 内耗是进化保留的生存特性,用于处理复杂社会问题和威胁检测[42][45] - 抑郁倾向个体在复杂分析任务中可能表现更优[43] - 现代环境导致古老机制过载:信息爆炸、选择泛滥和社交媒体比较加剧内耗[50][53] 应对策略 - 识别冲突观点来源,设计"分类器"在不同场景决策[6] - 通过闭环未完成事项减少"在制品"积压[9] - 刻意在逃避领域重复训练以重塑神经通路[9][15] - 将能量导向具体行动实现"正功",而非空转消耗[62][66] 跨文化哲学观 - 佛教称内耗为"妄念",道家主张"无为"避免无谓对抗[49] - 集体主义文化倾向情绪抑制,个人主义多用认知重评[49] - 生命通过消耗负熵维持秩序,关键在于选择有价值的消耗方向[22][68]
不要在“理性决策”中耗尽自己 | 创业Lifestyle
红杉汇· 2025-07-20 11:10
决策疲劳与选择悖论 - 创业者日均面临数十至上百个决策,导致"决策疲劳"与"选择悖论"的双重消耗 [2][3] - 决策疲劳表现为大脑进入省力模式,导致冲动选择或回避决策 [5] - 选择悖论指选项越多,购买意愿越低,24种果酱试吃台的实际购买率低于6种口味 [6][7] 决策疲劳的神经机制 - 每个决策消耗大脑微量葡萄糖,连续决策导致精神能量耗尽 [5] - 睡眠不足使前额叶皮层功能断崖式下跌,夜间冲动消费占比达60% [8] - 慢性睡眠不足者倾向高风险投资但无法察觉判断偏差 [8] 决策优化方法论 内在标准建立 - 需确立坚定内在标准而非追求"最优解",接纳选择必然伴随舍弃 [9] - Stripe案例:坚持"让支付更简单"核心目标但灵活调整实现路径 [15] 能量管理策略 - 简化低价值决策如固定穿搭风格、预设午餐范围 [10] - 将战略问题安排在上午高活力时段,机械性任务移至下午 [10] - 每日冥想10分钟修复神经细胞 [10] 选择过滤技术 - 运用80/20法则聚焦20%核心决策(如用户需求、核心技术) [11] - 设定"决策过滤器"标准(如"能否提升用户留存")快速排除无效选项 [11] - 对非致命性决策(如营销话术)可先凭直觉启动再迭代优化 [13] 行动执行框架 - 大决策拆解为"迷你截止日期"小任务(如每周联系2家投资方) [12] - 定期收集用户反馈验证决策有效性,避免信息茧房 [15] - 战略性放弃低效业务线,资源重配至潜力领域 [11]