慢思考
搜索文档
华为新开源!扩散语言模型突破32K上下文,还解锁了「慢思考」
机器之心· 2025-12-02 14:47
技术突破与行业范式转变 - 文本生成领域迎来从自回归模型向扩散语言模型的重要范式转变,但长序列训练不稳定性是核心痛点,即使是100B参数的LLaDA 2.0上下文窗口也仅为4K [1] - 华为发布openPangu-R-7B-Diffusion,基于openPangu-Embedded-7B进行少量数据(800B tokens)续训练,成功将扩散语言模型的上下文长度扩展至32K [1] 模型性能表现 - 在通用能力基准测试中,MMLU得分81.66,MMLU-Pro得分71.26,CMMLU得分76.43,CEval得分70.81,IFEval Prompt Strict得分60.81 [2] - 在数学能力基准测试中,GSM8K得分91.89,MATH得分84.26,大幅领先同类模型 [2][3] - 在代码能力基准测试中,MBPP得分84.05,HumanEval得分87.80,展现出卓越的逻辑泛化能力 [2][3] - 多学科知识(MMLU-Pro)超越16B参数量的LLaDA 2.0-mini-preview达22% [3] - Base模型在多个基准测试中平均得分65.26,优于对比模型 [4] 核心架构创新 - 创新性地融合了自回归的前文因果注意力掩码,而非沿用传统扩散模型的全注意力或分块掩码 [7] - 该设计从根本上解决了架构适配难题,消除适配壁垒,仅需从预测Next Token转变为预测Next Block中的Mask Token,极大降低适配成本 [8] - 兼容性最大化,使模型能自然继承自回归模型的预训练知识,为长窗口训练打下坚实基础 [8] 训练与推理优化 - 训练策略延续BlockDiffusion思路但进行关键优化,Context利用率达100%,将无掩码Context部分数据用于标准自回归Next Token Prediction训练 [15] - 双模式解码赋予模型自回归+扩散的双重解码能力,用户可通过不同采样设置灵活权衡生成质量与速度 [15] - 在并行解码模式下,其速度最高可达自回归解码的2.5倍,模型完整保留变长推理与KV-Cache特性 [15] 技术特点与能力展示 - 模型展现出结合扩散并行生成与深度思维链的"慢思考"能力,在处理复杂数学推理和编程任务时表现优异 [12] - 可视化实测显示,模型在4个生成步数内并行将多个[MASK]噪声逐步去噪还原为清晰语义Token,而非传统自回归模型的逐词生成方式 [12] - 该模型成功证明扩散模型不仅可以快(并行解码),更可以深(32K长文与慢思考),开启扩散语言模型新篇章 [14]
视频播客悄然兴起 重新发现长内容价值
经济日报· 2025-10-18 10:53
视频播客的兴起与用户需求 - 视频播客作为数字文化新潮流兴起,用户愿意花费一至两小时甚至更长时间观看深度对话[1] - 与短视频的即时爆点和强节奏刺激不同,视频播客篇幅更长、节奏更舒缓、更注重信息密度和思想深度,体现了快节奏生活中对"慢思考"的渴望[1] - 通过加入视觉元素,视频播客增强了内容感染力和沉浸感,观众能看到对话者的表情、神态和肢体语言,带来更丰富的观看体验、更强的互动性和陪伴感,满足现代人对"数字陪伴"的心理需求[1] 内容创作生态与成功案例 - 视频播客的兴起意味着内容创作新蓝海产生,在细分领域深耕专业素养正成为珍贵的创作资本[1] - 成功案例包括一位二胎妈妈的"蒙台梭利家庭教育实践"系列单期播放量突破50万,以及一名资深租房客的"千元改造老破小"教程帮助数万年轻人提升生活品质[1] - 制作技术普及使得一部智能手机加基础剪辑技能便能支撑内容生产,为有专业积累的普通人打开通往更广阔世界的大门[1] 平台布局与社群经济潜力 - 各大平台已纷纷布局视频播客,B站推出"视频播客出圈计划",小红书发起"随时随地视频播客"活动,抖音精选上线自有视频播客栏目[2] - 视频播客有望成为引爆"社群经济"的新引擎,其具备更强的"人格化"和"沉浸感",呈现创作者的性情、思维逻辑和现实实践[2] - 围绕内容展开的延伸讨论、观点交锋和知识补充将单向传播转变为双向奔赴的"价值共创",互动沉淀的信任与认同是组建优质社群的基石[2] 行业可持续发展关键 - 视频播客要实现持续发展,需要构建更加多元的创作生态,建立更为科学的评价与激励机制,帮助创作者探索多元化商业变现模式以形成良性循环[3] - 行业需要抵制"唯流量论"诱惑,以扎实的学识、真诚的态度和精良的制作为基石,沉下心来深耕特定领域并打磨思想深度[3] - 扎实的内容和真诚的创作是数字文化领域永恒的"王道",未来的赢家是那些能在喧嚣中保持定力、在浮躁中坚守深度的平台或创作者[3]
重新发现长内容价值
经济日报· 2025-10-18 06:05
行业趋势与用户需求 - 视频播客作为数字文化新潮流兴起,用户愿意花费一至两小时甚至更长时间观看深度对话[1] - 与追求即时爆点和强节奏的短视频不同,视频播客节奏舒缓,注重信息密度和思想深度,满足用户在快节奏生活中对“慢思考”的渴望[1] - 视频播客通过加入视觉元素增强内容感染力和沉浸感,提供更丰富的观看体验、更强的互动性和陪伴感,满足现代人对“数字陪伴”的心理需求[1] 内容创作生态与机会 - 视频播客的兴起意味着内容创作新蓝海产生,例如“蒙台梭利家庭教育实践”系列单期播放量突破50万,“千元改造老破小”教程帮助数万年轻人提升生活品质[1] - 在细分领域深耕专业素养成为珍贵创作资本,制作技术普及使得一部智能手机加基础剪辑技能即可支撑内容生产,为有专业积累的普通人打开大门[1] - 行业需要构建更多元的创作生态,建立更科学的评价与激励机制,帮助创作者探索多元化商业变现模式以形成良性循环[3] 平台竞争与市场动态 - 各大平台纷纷布局视频播客,B站推出“视频播客出圈计划”,小红书发起“随时随地视频播客”活动,抖音精选上线自有视频播客栏目[2] - 这些动向预示视频播客或将成为数字内容领域的一条新赛道[2] 商业模式与价值创造 - 视频播客具备更强的“人格化”和“沉浸感”,呈现创作者的性情、思维逻辑和现实实践[2] - 围绕内容的延伸讨论、观点交锋和知识补充将单向传播转变为双向“价值共创”,互动沉淀的信任与认同是组建优质社群的基石[2] - 行业长远发展需抵制“唯流量论”诱惑,以扎实学识、真诚态度和精良制作为基石,沉下心来深耕特定领域并打磨思想深度[3]
李开复:智能体才是未来AI的核心形态
母基金研究中心· 2025-09-13 17:04
大模型发展趋势 - 大模型从依赖数据和算力扩展转向具备慢思考能力 能通过数学和编程学习推理而非仅快速生成[3] - 慢思考提升AI推理深度 实现自我训练及长思考教短思考 形成加速发展曲线[3] - 阿里通义千问和DeepSeek推动该趋势发展[3] 开源模式优势 - 中国模型以开源为主 相比美国闭源模式在生态构建和行业适配方面具独特优势[3] - 开源使行业模型和主权模型训练更易 大幅降低成本并提供更广阔创新空间[4] 智能体核心价值 - 智能体拥有记忆和执行能力 能理解企业需求并完成任务 成为超级员工[4] - 智能体从工作流智能体进阶为推理智能体 能自主拆解执行复杂任务无需人类编程[4] - AI可取代人类数小时至数天工作 商业价值体现为降本增效和增收而非仅API调用[4] 企业智能体部署 - 智能体部署需企业高层亲自推动 结合战略目标深度定制以实现业务重组和组织重构[5] - 零一万物通过新型战略咨询团队基于万智平台帮助企业制定转型战略并批量打造智能体[5] - 在能源公司战略设计 专利撰写 游戏优化 供应链管理和新能源转型等领域实现降本增效与增收并举[5] 行业合作倡议 - 智能体是下一阶段关键突破 能为整个商业世界创造巨大价值[5] - 呼吁传统行业积极与AI企业合作把握智能体带来的新机遇[5]
把握好阅读选择权
经济日报· 2025-08-27 06:04
数字阅读行业发展现状 - 电子阅读器 阅读类手机应用 新闻聚合平台等数字阅读途径丰富了人们的选择 推动了全民阅读的普及与发展 [1] - 智能算法作用下读者接触内容与观点趋于同质化信息 产生"信息茧房"效应 [1] - 科技发展带来数字阅读山高海阔的同时也使部分用户被困信息孤岛 [1] 算法机制运作原理 - 平台运用算法推送与用户喜好一致内容以增强阅读体验和平台好感度 [1] - 算法机制通过抓住用户潜在倾向并放大该倾向来实现内容推送 [1] - 监管部门持续推动算法向透明 开放和多元方向进化 [1] 用户行为心理学基础 - 证实性偏差使用户有意识或无意识关注与既有观念一致信息 忽视矛盾内容 [1] - 用户信息获取过程中存在选择性关注和排斥不同立场内容的倾向 [1] 健康阅读习惯培养 - 读者需强化主体意识 培养健康多元信息饮食习惯 提升综合素养 [2] - 应避免被动接受算法投喂 防止大脑形成挑食偏食又懒惰状态 [2] - 通过师长推荐 实体书店偶遇等方式接触不同立场视角领域的优质内容 [2] 深度阅读实践方法 - 传统阅读与数字阅读相结合 数字阅读用于高效泛读 [2] - 定期选择纸质书籍 长报道 学术论文进行沉浸式深阅读 [2] - 主动拓展社交圈与观点各异者深度交流 通过输入输出锻炼认知思维 [2] 阅读价值定位 - 阅读价值超越知识积累 在于捍卫思想疆域和拓展思维边界 [2] - 应保持阅读选择权掌握在人的手中 听取多元声音观看不同风景 [2]
不想沦为算法人
虎嗅APP· 2025-08-03 18:09
思考的价值与方法 - 慢思考是一种可训练的"时间肌肉",能够将行动从"情绪回路"转回到"认知回路",为"想清楚"争取机会 [5] - 思考会累积成"决策口味",经常在关键节点思考的人能逐步摆脱"怕慢"的焦虑,学会与不确定性共处 [5] - 民航实行"无干扰驾驶舱"规定,核电医疗推行STAR操作法,NBA的"暂停后战术"都证明短暂思考能显著提升执行质量 [5] - 在信息密度指数级膨胀的当下,专注力、深度思考能力与长期主义成为拉开差距的"慢变量" [6] - 自2023年起"思考型消费"浪潮走高,高端静修营预订率年增28%,城市Retreat与深度阅读俱乐部会员转化率连续两季度保持两位数增长 [6] 行业趋势与商业机会 - 汽车行业正从性能竞争转向"心智争夺战",豪华品牌下一张王牌是在车内创造"思考第三区" [23] - 宝马5系提出"5系思考法",通过安静、顺畅、可调的座舱设计为驾驶者创造思考空间 [23] - 时间的质量正在被重新定价,能在物理世界打造"心流缓冲带"的品牌将获得更高情绪黏性与溢价空间 [25] - 跨国企业增设Quiet Room/Focus Room,主动降噪耳机、白噪声设备、冥想App渗透率持续走高,证明"购买宁静"成为显性需求 [26] - 长期阅读与写作社群留存率高于短平快课程,用户愿为"慢变量训练"付费 [26] 管理实践与决策优化 - 《哈佛商业评论》调查显示管理者每天平均做70次微决策,疲劳感来自深层次优先级排序而非任务数量 [10] - 咨询公司PwC报告指出"结构化思考框架"渗透率比信息量更能决定决策质量 [18] - 明略科技创始人认为万物皆可函数解,理性破题能在有限中寻找最优解 [12] - 方里品牌创始人遇到问题会找独处空间,理性为底感性加持,从品牌战略到用户需求都如此处理 [18] - Star VC创始人任泉定期复盘,从0到1学习新东西,不畏惧放弃已有荣誉重新出发 [16]
别让AI替你做判断
虎嗅APP· 2025-06-06 07:46
AI对认知方式的重构 - AI正在改变信息处理流程,从"人先看内容再做判断"转变为"AI先建议再确认方向",重构了决策路径[1] - AI通过智能推荐、一键总结等功能优先筛选信息价值,引导用户关注特定内容[1] - 行业普遍采用"降低认知负担"的AI产品设计逻辑,鼓励减少主动思考[2] 认知外包的依赖效应 - 用户行为显著变化:从自主筛选信息转向依赖AI预处理,注意力分散且思考动力下降[3] - 大脑偏好省力路径,AI提供的"低能耗"认知方式导致自主分析信心下降[4] - 公司系统性推动AI嵌入工作流程(如AI客服、AI做PPT),可能弱化员工批判性思维能力[6] AI对专业能力的潜在影响 - 学术领域出现双向AI依赖:学生用AI分析资料,教师用AI检查论文质量[7] - 创意行业呈现同质化趋势,品牌推广从头脑风暴转向AI生成方案,导致创新想法减少[13] - 经验积累方式改变:从内化沉淀转为外部存储,可能影响直觉判断等核心能力[17][18] 数据与研究的争议性 - 部分AI工具引用虚假研究数据(如大脑活跃度下降30%、海马体缩小8%),缺乏可靠出处[9][11] - 行业需警惕AI输出内容的可信度,避免形成"看似合理"的认知偏差[12] 人机协作的边界探索 - 欧盟提出"AI无权回答为什么",强调人类需保留终极判断权[23] - 未来角色可能从AI使用者演变为"个人AI助理守护者",需保持自主创造力[25][26] - 工具理性时代需平衡效率与慢思考,保留质疑空间以对抗认知惯性[20][24]
别让AI替你说出那句“我觉得”
虎嗅· 2025-06-05 14:41
AI对信息处理方式的重构 - AI正在改变传统的决策流程,从人先看内容再做判断转变为AI先给出建议再确认方向[2] - AI在帮助决定哪些信息应优先被看到、哪些内容更有价值、哪些观点值得深入探讨[3] - 公司正在系统性地将AI嵌入工作流程,如AI客服、AI做PPT等,提升效率的同时可能弱化批判性思维[14] 认知外包的依赖与影响 - AI产品设计鼓励"降低认知负担",如一键总结、自动归类等功能,引导用户放弃主动筛选和判断[4][5] - 用户习惯将内容先交给AI处理,导致注意力散漫和思考动力下降[6][7][8] - 研究显示依赖AI会减少对信息的深入加工,独立推理能力出现困难[11][12] AI对创意与经验的影响 - 创意流程从团队头脑风暴变为依赖AI生成方案,导致结构统一、创意趋同[32][33][34] - 经验从内化积累变为可调用的"压缩胶囊",但AI无法替代需要手感、直觉的真实经验[40][41][42][43] - 设计师和医生等职业的抽象判断(如美学、临床直觉)仍需人类经验积累[44][45] 工具理性与人性坐标的平衡 - 欧盟《人机共生宣言》提出AI无权替人类回答"为什么",强调人类需保留对终极问题的判断权[54] - 未来需在工具理性中寻找人性坐标,平衡AI使用与自主创造力[55][56][58] - 理性将成为人类守住判断权的关键能力[59]