深度思考 - 财报，业绩电话会，研报，新闻 - Reportify

深度思考

搜索文档

读书是一种被高估的美德

虎嗅· 2025-06-10 13:57

读书的社会认知 - 读书被视为一种近乎神圣的美德，常与"有教养""有深度"划等号，书架的厚度被等同于思想的深度 [1] - 读书行为被用作身份象征，土豪用书墙装点门面，明星通过掉书袋塑造文化人设 [2] - 现行文化默认读书是正向特质，甚至将其与道德挂钩，但忽略其低门槛特性 [7] 读书的本质与局限性 - 读书本质上是一种普通的认知活动，不天然高尚也不必然带来智慧，更多是被动接收而非主动创造 [3] - 神经科学研究显示阅读时大脑语言区活跃，但批判性思维的前额叶皮层处于抑制状态，类似观点"下载" [4] - 输入式阅读具有休闲性，与写作等输出行为相比几乎不需调动认知资源，这是其被高估的根源 [6] 读书的异化现象 - 读书被异化为道德优越感的表征，但历史表明读书与人品无必然联系（如秦桧、希特勒案例） [7] - 畅销书本质是社会流行趋势的投射，读者共鸣源于集体心理而非独立思考（如治愈系、成功学书籍） [8] - 当读书沦为数量竞赛或打卡游戏时，其消遣属性暴露无遗，与刷短视频无本质区别 [8] 读书的价值重构 - 读书的真正价值在于知识内化，需通过批判性思考和输出重构转化为思想建筑材料 [8] - 应警惕"输入即正义"幻觉，保持思想主体性，避免陷入认知茧房 [9] - 输出比输入更重要，主动输出（如写作）能倒逼深度思考，这是人类区别于AI的核心能力 [10][12] 技术时代的读书意义 - 若仅将读书视为知识搬运，人类在速度与准确性上已完败于AI的文本处理能力 [11] - 不可替代的是人类对知识的重构能力，包括批判、联想、创造等深度思考过程 [12]

批判性思维

批判性思维

别让AI替你做判断

虎嗅APP· 2025-06-06 07:46

AI对认知方式的重构 - AI正在改变信息处理流程，从"人先看内容再做判断"转变为"AI先建议再确认方向"，重构了决策路径[1] - AI通过智能推荐、一键总结等功能优先筛选信息价值，引导用户关注特定内容[1] - 行业普遍采用"降低认知负担"的AI产品设计逻辑，鼓励减少主动思考[2] 认知外包的依赖效应 - 用户行为显著变化：从自主筛选信息转向依赖AI预处理，注意力分散且思考动力下降[3] - 大脑偏好省力路径，AI提供的"低能耗"认知方式导致自主分析信心下降[4] - 公司系统性推动AI嵌入工作流程（如AI客服、AI做PPT），可能弱化员工批判性思维能力[6] AI对专业能力的潜在影响 - 学术领域出现双向AI依赖：学生用AI分析资料，教师用AI检查论文质量[7] - 创意行业呈现同质化趋势，品牌推广从头脑风暴转向AI生成方案，导致创新想法减少[13] - 经验积累方式改变：从内化沉淀转为外部存储，可能影响直觉判断等核心能力[17][18] 数据与研究的争议性 - 部分AI工具引用虚假研究数据（如大脑活跃度下降30%、海马体缩小8%），缺乏可靠出处[9][11] - 行业需警惕AI输出内容的可信度，避免形成"看似合理"的认知偏差[12] 人机协作的边界探索 - 欧盟提出"AI无权回答为什么"，强调人类需保留终极判断权[23] - 未来角色可能从AI使用者演变为"个人AI助理守护者"，需保持自主创造力[25][26] - 工具理性时代需平衡效率与慢思考，保留质疑空间以对抗认知惯性[20][24]

赚钱第一步，学会深度思考

洞见· 2025-05-30 02:21

核心观点 - 现代社会中赚钱的决定性因素并非单纯努力而是深度思考[3][9][36] - 低维勤奋不如高维思考通过差异化经营、发现隐藏商机、解决根源问题等方式实现财富积累[10][12][15][31] - 思考深度决定商业结果需通过连续追问和日记复盘等方法提升思考维度[40][45][49][56] 差异化经营案例 - 余姚电热毯商户谷文杰砍掉全品类业务专注单一品类通过差异化策略集中订单并研发全品类电热毯一年内成为当地龙头[7][8][10] - 差异化经营使客户选择倾向明确避免同质化竞争带来的随机性订单分配[6][9] 隐藏商机挖掘 - 房产销售曹志远发现售楼部新业主数据价值通过免费提供《业主手册》承载广告赚取第一桶金[12][13] - 商业机会存在于被忽略的环节如装修公司对购房者数据的精准投放需求[12] 问题根源解决 - 机修工徐振通过发现液封槽漏液问题提升生产线良品率从基层晋升至分公司总经理年薪百万[15] - 技术问题的深度探究能带来超出岗位层级的价值从而获得职业突破[15][34] 全球化布局 - 惠州小家电商末总将20年前中国模式复制到越南首月收益达国内一年水平[20][25][26][29] - 新兴市场存在早期红利成熟经验跨区域复制可快速打开增量空间[25][27] 深度思考方法论 - **连续追问法**：机械配件厂文刀通过五层追问（资金链断裂→库存积压→客户采购下滑→疫情成本增加）制定优惠方案清库存[40][42][45] - **日记复盘法**：销售专家李霖通过每日记录客户互动话术与反馈提炼高转化率销售模型[49][51][52] 思考与收益关系 - 思考积累触发收益指数增长底层逻辑认知决定财富获取效率[37][48] - 牛津"灰人理论"指出重复浅层劳动难以创造显著价值深度决策才是财富源头[57][60][62]

日记被动复盘法

连续主动追问法

日记被动复盘法

连续主动追问法

一场对话，我们细扒了下文心大模型背后的技术

量子位· 2025-05-22 20:34

大模型技术发展 - OpenAI CEO指出行业已进入复杂推理模型的新范式阶段[1] - 推理模型成为继基础模型后厂商竞争的新焦点[1] - 中国信通院评估显示文心X1 Turbo在24项能力中16项获满分5分，综合评级达最高"4+"级，为国内唯一通过该测评的大模型[1] 文心大模型技术突破 - 文心4.5 Turbo和X1 Turbo分别聚焦多模态与深度思考两大方向[6] - 多模态混合训练技术实现文本/图像/视频统一建模，训练效率提升2倍，理解能力提高30%[7][8] - 自反馈增强技术框架构建"训练-生成-反馈-增强"闭环，显著降低模型幻觉并提升复杂任务处理能力[10][12][13] - 融合偏好学习的强化学习技术使模型理解/生成/逻辑/记忆能力全面提升[14][16] - X1 Turbo突破线性思维链，构建复合型思维链实现"边思考边行动"等人类式策略，复杂任务效果提升22%[18][19][21][23] 基础设施与性能优化 - 飞桨框架3.0支持使文心4.5 Turbo训练吞吐达前代5.4倍，推理吞吐提升8倍[31][32] - 算力-框架-模型三位一体协同优化路径成效显著[34] - 文心4.5 Turbo在14个数据集平均成绩80分超越GPT-4.5和DeepSeek-V3[35] - X1 Turbo各项数据集表现均优于DeepSeek-R1[37] 实际应用场景 - 教育领域：X1 Turbo可模拟人类思维解析物理题目[42] - 代码场景：AI生成代码占比超40%，累计服务760万开发者[44] - 数字人技术：支持10万主播，直播转化率31%且成本降低80%[47][48] - 行业规模：2029年全球K-12在线教育预计达8991.59亿元，2024年数字人核心市场480.6亿元将带动6402.7亿元关联产业[49] 长期技术战略 - 6年迭代9大版本形成全栈技术能力[52] - 坚持知识增强技术强化事实性/时效性/知识性[56] - 通过智能体技术结合工具使用解决现实复杂问题[56] - 视大模型为新一轮科技革命周期，注重技术长期价值与层层扩散效应[57][58] - 底层飞桨框架到上层应用的完整技术栈构成核心竞争力[61]

百度集团(US:BIDU)

Artificial Intelligence

文心大模型

Artificial Intelligence

文心大模型

ICML 2025 | 大模型深度思考新范式：交替「推理-擦除」解决所有可计算问题

机器之心· 2025-05-15 14:04

核心观点 - 提出新型深度思考范式PENCIL，通过交替执行「生成-擦除」机制显著提升大模型复杂推理能力 [1][3] - PENCIL在理论上实现图灵完备性，能以最优空间O(S)和时间O(T)复杂度解决所有可计算问题，传统CoT需O(T)空间导致指数爆炸 [23][24] - 实验显示PENCIL在3-SAT、QBF等NP完全问题上准确率保持≥99%，Einstein's Puzzle任务中25M小模型准确率达97%远超CoT的25% [15][21][22] 交替生成-擦除范式 - 动态擦除机制：引入[CALL][SEP][RETURN]特殊标记，按规则丢弃无用中间结果，上下文长度从数万token压缩至千级 [5][8][9] - 支持递归结构：擦除后的上下文可包含其他特殊标记，实现类似函数调用的多层嵌套 [9] - 三大应用模式：任务分解（子问题处理）、搜索回溯（无效路径清理）、摘要总结（冗长思考压缩） [13] 性能优势 - **准确率**：在n=10的SAT任务中PENCIL准确率99% vs CoT 50%，QBF任务100% vs 73% [15][16] - **计算效率**：相同FLOPs下PENCIL训练收敛速度更快，上下文长度控制在问题规模n的线性增长（O(n)）而非CoT的指数级（O(exp(n))） [12][17] - **资源节省**：KV缓存复用机制使自注意力计算量减少，25M参数模型在Einstein's Puzzle上准确率提升3.88倍 [21][22] 理论突破 - 空间最优性：将图灵机模拟的上下文长度从O(T)降至O(S)，尤其适合S<<T的NP完全问题（如旅行商问题） [24][25] - 实现路径：通过FASP编程语言构造「思考-总结」循环，证明固定大小Transformer可达成最优复杂度 [28] - 本质差异：传统CoT需保留完整计算历史，PENCIL通过状态摘要实现内存回收 [27]

交替「推理 - 擦除」范式

Artificial Intelligence

交替「推理 - 擦除」范式

Artificial Intelligence

为什么你的工作运总是不顺？

36氪· 2025-04-24 17:10

核心观点 - 解决问题的关键在于识别并解决根本性的大命题，而非纠缠于表象的小命题 [2][4] - 在竞争环境中，应采用商业和市场营销的思路，通过提升自身价值排名来赢得竞争 [9] - 面对市场乱象，普通人的务实策略是顺应趋势并坚守个人道德底线，而非试图改变游戏规则 [18][21] 问题识别与解决策略 - 许多具体问题如老板压榨、市场行情差、同事关系恶劣等，均是大命题下的表象小命题 [2] - 执着于解决表象问题如同救火，永远处于被动，应致力于从根源上杜绝问题 [2][3] - 深度思考是通过搜集信息、抽丝剥茧，找到问题的根本原因 [22] - 养成深度思考习惯可将人生中百来个问题归纳为5-6个大命题，掌握其解法即可一通百通 [23] 竞争环境下的价值排名 - 获得高薪好工作的根本在于个人在就业市场价值排名的靠前程度 [4] - 价值排名高则稀缺性高，如同搜索引擎第一页的结果价值最高 [5][6] - 华为天才少年年薪几百万的案例体现了极端稀缺人才的价值 [8] - 竞争策略可退而求其次，在特定城市、分公司、部门或小组内做到排名前几 [9] 市场行为与信息差 - 市场上存在通过人为制造信息差来提升价值排名的现象，即使实际技术一般 [11] - 草台班子现象普遍，其特点是外表光鲜但内在水平一塌糊涂 [13] - 草台班子大行其道的原因是专业班子太少，导致劣币驱逐良币 [14] - 市场行为不分对错，会自行调节不合理现象，个人难以插手改变 [15][16] 个人应对策略 - 面对公司内部同流合污的困境，应反思个人人生目标是否能在当前环境下实现 [19] - 若以赚钱为目标，则应继续留在游戏中并努力提升自身价值排名，向利益中心靠拢 [19] - 若清高更重要，则应寻找新游戏并适应其规则，而非试图全盘改变 [20] - 普通人的务实出路是在乱象中坚守小道德，努力做到不作恶并保全自己 [18]

市场价值排名

市场价值排名

11款AI测评实录：新闻总结全线翻车，深度思考的AI爱上“添油加醋”｜AI幻觉捕手

21世纪经济报道· 2025-04-17 13:39

行业核心发现 - 对六款国产大模型进行新闻事件总结测试，在总计55次回复中，完全正确的回复仅有4次，大部分回复（42次，占比76.3%）为真假参半 [1] - 在四类常见错误中，“错误总结”是最高频类型，涉及全部AI，占全部错误量的40%以上 [7] - 开启“深度思考”功能后，AI模型普遍更倾向于编造细节和数据，例如深度思考版豆包为车祸事件编造了车主逃逸、伤者烧伤面积等情节，通义千问编造了车主涉毒及事故比例数据 [23] - 国际测试Vectara HHEM指出，深度思考版DeepSeek的幻觉率为14.3%，显著高于其通用版的3.9% [23] 模型表现评估 - 综合来看，豆包的表现最为可靠，其次是Kimi，其他大模型之间没有明显差距 [2][5] - 豆包的相对可靠性可能源于其大量引用了经过核查、引用规范的抖音百科原文内容 [5] - 所有被测试的AI模型均出现过“错误总结”的问题 [7] - 在引用来源时，Kimi有回答直接输出了《财新》付费部分的报道原文，疑似突破了付费墙或存在版权合作 [14] - 在答案提示方面，只有DeepSeek在每个回答下高亮了“内容仅供参考，请谨慎甄别”的提醒，其他模型未见类似提示 [5] 错误类型与特征 - 第一类错误为“无中生有”，即AI凭空捏造对话、故事或数据 [10] - 第二类错误为“错误总结”，包括误读原文、引用本身有误的信息，或在多种说法中片面摘取其一 [10] - 第三、四类错误属于引用错误，具体包括“移花接木”（内容与引用链接不符）和“无法核查”（链接失效或打不开） [10] - “移花接木”问题在通义千问和DeepSeek中相对突出，例如DeepSeek将《南方周末》的文章错误标注为“搜狐新闻分析” [14] - AI常犯的低级错误包括颠倒事实（如将“驾驶员非车主本人”总结为“车主本人驾驶”）和混淆专业概念（如将地震类型总结错误） [13] - AI倾向于将推测当作事实输出，很少使用“可能”、“推测”等限定词，也常省略信源主体，导致原意变味 [13] 信息源引用问题 - AI难以引用到正确的信息，是其共同软肋 [14] - 在信息更新迅速的事件中（如缅甸地震伤亡人数），多数AI无法引用到最新数据，例如仅文心一言和通义千问引用了缅甸官方4月12日公布的3689人死亡、5020人受伤的数据，仅豆包引用了中国公民死亡8人的最新数据 [15] - AI存在“时间错乱”问题，常将国内自媒体转载内容的滞后发布时间，错误当作事件实际发生时间，导致信息严重滞后，例如DeepSeek曾将4月5日自媒体帖子中提到的144人死亡，总结为缅甸官方当日数据，而当日实际累积死亡人数已达3354人 [16] - AI对信息源存在明显的“引用偏好”，倾向于引用那些篇幅长、面面俱到、结构清晰的“伪百科”型内容，这些内容往往不来自机构媒体或政府账号，阅读量也很低 [2][16][17] - 当事件缺乏专业媒体充分报道时，AI更容易借助各种质量不高的自媒体内容填充细节 [17] - 部分被引用的“伪百科”内容本身即由AI生成，形成了“垃圾进，垃圾出”的循环，例如DeepSeek在制油罐车事件中引用的链接原文底部标明了“内容由AI生成” [17] 深度思考功能影响 - 深度思考功能旨在通过展现思维链条来增强AI的推理能力 [18] - 在某些信息提炼场景中，深度思考功能能使回答更精准，例如DeepSeek深度思考版更准确地处理了采访信源，避免了通用版的错误简化 [23] - 然而，开启深度思考后，几乎所有AI都更爱编造内容，尤其是在细节和数据上 [23] - 分析认为，AI的思维链越长，越有可能为了填满推理过程而进行编造 [23][25] - 专家指出，推理能力与AI幻觉之间并非简单的线性关系，DeepSeek幻觉加重可能与其研发重点偏向高创造力的“文科思维链”，而在需要高度真实性的任务上出现副作用有关 [25]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

AI真的那么靠谱吗？提问330次，平均准确率25%！近一半链接打不开

21世纪经济报道· 2025-04-10 18:01

AI新闻引用准确性测试 - AI在新闻引用方面准确率很低，六款AI的平均准确率只有25% [3][5] - 豆包表现最佳，50%的回答完全准确，文心一言错误率最高，87%的回答出现错误 [9] - 通义千问最常拒绝回答，但在打开深度思考功能后回答数量增加但错误也更多 [10] AI错误类型分析 - 新闻来源是错误重灾区，27%的新闻来源被AI完全说错 [5] - 作者识别表现最差，90次回复完全错误，错误率约27% [12] - 43%的回复提供无效链接，部分链接纯属虚构 [21] 新闻分发模式对AI的影响 - AI难以识别多平台分发的原创作者，经常混淆实际作者与发布平台 [15] - 国内119家广东媒体共注册1197个公众账号，平均每家媒体拥有10个不同账号 [19] - AI经常被新闻分发矩阵迷惑，难以识别原始作者 [20] 平台链接引用偏好 - AI倾向于引用门户网站而非原始来源，四大门户网站是更普遍的索引资料 [25] - 今日头条链接出现37次，其中34次来自字节跳动旗下豆包AI [24] - 微信公众号链接出现27次，其中19条由腾讯旗下元宝AI引用 [24] 媒体可见度与流量分配 - 14%的AI回复引用转载链接而非官方链接，豆包情况最严重 [26] - 七成以上用户从微信获取新闻信息，四成左右在抖音看新闻 [26] - AI倾向于引用雅虎新闻、AOL等转载链接而非原始来源 [27] 行业合作模式挑战 - 传统媒体与互联网平台形成成熟合作模式，稿件全网多发 [16] - 版权合作效果未达预期，AI仍然错误引用转载版本 [27] - 移动互联网时代的自媒体洗稿问题在AI时代继续发酵 [20]

Artificial Intelligence

Artificial Intelligence

对话阿里吴嘉：夸克是一个天然的超级智能体

36氪· 2025-03-24 18:44

核心观点 - 未来是"AI使用工具，人使用AI"的时代，夸克推出的"超级框"旨在重塑人、工具（AI）、任务三者的关系 [5] - "超级框"不是传统搜索或ChatBot，而是能直接交付结果的"超级Agent"，整合了AI搜索、AI写作、AI讲题等多种能力 [4][5] - 夸克月活用户已超过2亿，累计下载量超过3.7亿，成为阿里AI To C战略的核心产品 [7][8] 产品定位与理念 - "超级框"超越传统搜索形态，是超级智能体与用户交互的界面，搜索只是AI使用的工具之一 [13][14] - 产品定位为"生活工作学习的全能助手"，强调"有用"而非仅"实用"，服务普惠人群 [18][21] - 三大标签：Smart（聪明）、专业、万能，目标是实现"All in One" [20][21] 技术实现与创新 - 通过让AI自主规划任务流程，而非模仿人类操作步骤，解决了复杂场景覆盖问题 [30][32] - 具备深度思考能力，未来将结合多模态技术处理更复杂任务 [35] - 整合夸克内部工具能力与阿里集团服务，形成开放生态 [5][39] 市场表现与战略意义 - 2024年完成组织调整，整合天猫精灵和通义C端产品，强化AI To C布局 [8] - 成为阿里在AI时代C端标杆产品，目标重构人与信息和任务的交互方式 [40] - 投资人评价其迭代速度快且务实，是阿里体系内的年轻力量 [7] 未来发展方向 - 短期以提升用户体验为主，创造足够厚的用户价值 [37] - 输入方式将从文字扩展到多模态（拍照、语音等） [22][23] - 不会完全取代传统搜索，但会承接大部分搜索需求 [25][26]

超级智能体

Internet Services

超级智能体

Internet Services

独家｜当传统搜索走向黄昏：看夸克AI搜索如何用自研模型打造“深度思考”新体验

Z Potentials· 2025-03-03 10:22

夸克AI搜索"深度思考"的核心创新 - 传统搜索引擎依赖关键词匹配和网页排序算法，而夸克"深度思考"通过模拟人类"系统二思维"实现深度语义理解和多步骤推理，重新定义搜索本质[1][2] - 在Z世代社交产品设计案例中，系统首先分析用户核心特征（如个性表达、碎片化注意力等），再从产品定位、功能设计等维度提供系统性建议，整合最新用户研究数据和成功案例[3][4][5][6] - 医疗健康领域展示专业优势，如"花粉过敏防护"问题提供系统化方案，涵盖过敏原理解释、防护维度建议和就医指导，大幅提升信息整合效率[9][10][11] 技术架构与功能演进 - 基于阿里通义千问基模开发，具备中文专业术语和行业语境的深度理解能力，确保信息安全、响应速度和本地化优势[12] - 实现三大维度突破：问题理解从关键词到真实意图（如团队创新能力问题识别多维度障碍）、思考过程从黑箱到透明展示推理链条、回答结果从分散链接到智能整合[13][14][15][20][22] - 发展为AI全能助手，支持专业写作、研究分析、AI生图等场景，免费提供PPT制作、简历生成等功能，用户量突破2亿后定位升级为"2亿人的AI全能助手"[23][24][25] 行业影响与未来展望 - 推动搜索行业范式转移：从信息检索到知识生成，从工具属性到助手角色，传统搜索模式可能逐渐被更智能的AI搜索取代[26][27] - 未来计划接入更大规模推理模型，能力边界将持续拓展，可能演变为知识助手、思维伙伴甚至创新催化剂[25][27] - 在专业场景价值显著：如学术研究可快速梳理领域现状、战略决策支持SWOT分析等，提升知识工作者效率[23][24]

百度搜索引擎

百度搜索引擎