Workflow
二八法则
icon
搜索文档
用AI两年半,我常用到的12个思维模型
虎嗅· 2025-06-16 14:40
AI应用与创业转型 - 公司因ChatGPT重启公众号创作并开启AI学习与转型之旅[1][2] - 经过两年半AI实践后公司达到创业六年最佳状态[4] - 原创设计出一套AI课程理论体系并实现产品化[5] 发现问题阶段思维模型 - 乔哈里窗模型用于理解AI能力边界及商业机会象限[9][10] - 黄金圈法则强调优先明确"为什么用AI"以避免无效开发[15][17] - 二八法则聚焦20%高价值要素避免资源浪费[19][21] - 用户旅程地图通过亲身体验或AI模拟发现隐性需求[25][26] 拆解问题阶段方法论 - 金字塔原理+MECE实现结构化拆解适用于Prompt/OKR设计[28][30][32] - 奥卡姆剃刀原则选择最简单闭环方案防止过度复杂化[34][36] - 第一性原理回归本质变量重构业务流程[39][41][43] - AI-First思维优先判断AI代劳可能性释放人力创造力[44][46] 验证迭代阶段策略 - MVP思维要求一天内完成60分原型快速验证[49][51] - 迭代思维通过Prompt→Output→Review循环优化[54][56] - 复利思维沉淀高ROI方案形成组合杠杆效应[59][61][63] - ROI思维强化成本收益意识区分投资与无效成本[64][66][68]
教育部严管下,独立老师涨价 30%:是谁在推高 “地下补课” 成本?
36氪· 2025-06-11 11:41
行业现状 - 一对一私人家教行业在"双减"政策后兴起,大量原教培行业从业人员转型为独立老师,瓜分"培优"市场 [2] - 行业呈现典型二八法则,20%名师垄断80%收入,80%从业者仅分得20%市场 [2] - 2023年教育部新规明确禁止校外培训,义务教育阶段独立老师成为"影子职业" [2][21] - 高中阶段学科补习未受明确限制,从业者身份相对"光明" [18] 商业模式 - 主要依靠口碑招生,通过朋友圈、人脉、网络等非公开渠道获客 [2][30] - 收费标准差异大,上海知名独立老师时薪可达千元,需提前1年预约 [34] - 部分从业者采用民居改造教室,存在消防隐患和执法风险 [26] - 收入不透明且不纳税,缺乏五险一金等基本保障 [26][27] 从业者画像 - 典型收入分层:上海英语老师月入2-5万元,三线城市夫妻档月入2-4万元 [8][13] - 工作强度大:日均工作12小时,需个性化备课至凌晨 [15] - 职业认同感低:面临社会歧视,被举报风险高 [14][18] - 转型困境:机构岗位收入更低,考编竞争激烈,其他行业薪资落差大 [39][43] 市场供需 - 家长需求旺盛:上海50%初升高分流压力催生补课刚需 [33] - 信息不对称严重:新教师需接受"先上课后付费"不平等条款 [31] - 教学质量参差:存在刻意放缓进度、虚假宣传等行业乱象 [30] - 优质资源稀缺:头部教师可筛选生源,形成封闭招生圈层 [35] 政策影响 - "双减"政策促使行业从机构转向个人化 [19] - 2023年新规将个人补课纳入违规范围,但执行存在弹性空间 [21][26] - 义务教育阶段从业者长期面临政策不确定性 [24] - 高中阶段政策空白形成相对稳定市场 [18]
Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好
量子位· 2025-06-05 18:28
核心观点 - 强化学习训练大模型推理能力时,仅20%的高熵token能支撑整个训练效果,甚至优于使用全部token训练的效果 [1][6][15] - 高熵token在推理中扮演"逻辑连接器"角色,对模型性能提升至关重要,而低熵token贡献微乎其微甚至可能产生副作用 [11][18][20] - 该方法在Qwen3系列模型上实现显著性能提升,并展现出规模效应和泛化优势 [2][16][22] 高熵token的发现与特性 - 链式思考推理中,token熵分布呈现独特模式:50%以上token熵值低于0.01,仅20%token熵值大于0.672 [9][10] - 高熵token(分叉token)功能特殊,如"wait"、"thus"等逻辑连接词,决定推理路径方向;低熵token多为确定性内容如词缀或代码片段 [11] - 实验证实:提高高熵token解码温度可改善推理性能,降低温度则导致性能下降 [13] 训练方法与性能提升 - RLVR训练中仅保留top 20%高熵token策略梯度,Qwen3-32B在AIME'24分数提升7.71分,响应长度增加2553.39 token [15][17] - 反向实验显示:仅用80%低熵token训练会导致性能急剧下降 [17][18] - 规模效应明显:32B模型提升最大(AIME'24 +7.71分),14B次之(+5.21分),8B最小(+1.25分) [16][17][22] 机制分析与理论突破 - 高熵token的不确定性有助于模型探索推理路径,低熵token的确定性限制探索能力 [20] - RLVR训练后,模型与base model在高熵token位置重叠率仍保持86.67%,显示RLVR保留预训练模型的熵判断模式 [24][25] - 初始熵越高的token在RLVR训练后熵增幅越大,低熵token几乎不变 [25] 应用与泛化价值 - 数学数据集训练的模型在编程任务LiveCodeBench上表现优异,显示高熵token与泛化能力密切相关 [22] - 高熵token可能是强化学习泛化优于监督微调的关键因素,后者易导致分叉token熵降低 [26][27] - 传统强化学习假设动作熵均匀分布,而大模型推理需整合先验知识,输出包含高低熵token混合 [27]
连续40年增长,英国“餐饮界蜜雪冰城”凭什么?
FBIF食品饮料创新· 2025-04-27 08:55
公司概况 - GREGGS是英国本土最受欢迎的连锁烘焙品牌,已成为文化象征,从学生到前首相鲍里斯·约翰逊都是其忠实顾客 [6] - 2024年销售额达20亿英镑(约188亿人民币),门店数量突破2600家,远超麦当劳(1456家)和星巴克(1381家) [2][11] - 消费者满意度指数达36.9分(2024年),是行业平均水平的6倍,多年稳居"最受欢迎餐饮品牌"榜首 [6] 发展历程 - 1939年创始于纽卡斯尔,最初以自行车配送烘焙食品,1951年开设首家门店 [9] - 1984年上市后实现40年持续增长,2024年税前利润同比增长8.3%至1.898亿英镑(约17.8亿人民币) [11] - 采用中央厨房模式,将80%烘焙工序集中在工厂完成,为连锁化奠定基础 [10] 市场定位与竞争策略 - 坚持"高性价比+标准化产品"定位,平均商品价格比COSTA等竞争对手低30%-70% [15][20] - 避开与咖啡连锁正面对抗,主打2-4英镑的英式烘焙产品(如香肠卷),与赛百味形成差异化 [15] - 门店面积较小(主打外带),装潢简约,单位面积销售额高于同行 [20] 运营模式创新 - 中央厨房+门店二次加工模式:工厂预加工后,门店现烤18分钟上架,招牌香肠卷日均销量达100万个 [21][22] - 自建物流网络,运输车配备拖车提升配送效率,形成生产-销售闭环 [22] - 推出OUTLET折扣业态,以半价销售隔夜食品,已布局36家门店 [18] 区域扩张与时段拓展 - 英格兰占80%门店但密度最低,苏格兰(12%)和威尔士(7%)密度较高 [15] - 近半数门店延长营业至晚7-11点,晚间消费占直营店销售额9% [17] - 外送服务覆盖1600家门店,销售额同比增长30.9% [17] 产品体系与供应链 - 137个SKU分为6大类,单店精选70-100个单品,价格梯度为1-12英镑 [20] - 独创产品标识系统:通过烘焙品顶部"裂痕"(如斜纹、波浪线)实现快速识别 [22] - 员工总数达33000人,2024年净增198家门店(新开226家/关闭28家) [11][21]