Workflow
深度思考
icon
搜索文档
读书是一种被高估的美德
虎嗅· 2025-06-10 13:57
读书的社会认知 - 读书被视为一种近乎神圣的美德,常与"有教养""有深度"划等号,书架的厚度被等同于思想的深度 [1] - 读书行为被用作身份象征,土豪用书墙装点门面,明星通过掉书袋塑造文化人设 [2] - 现行文化默认读书是正向特质,甚至将其与道德挂钩,但忽略其低门槛特性 [7] 读书的本质与局限性 - 读书本质上是一种普通的认知活动,不天然高尚也不必然带来智慧,更多是被动接收而非主动创造 [3] - 神经科学研究显示阅读时大脑语言区活跃,但批判性思维的前额叶皮层处于抑制状态,类似观点"下载" [4] - 输入式阅读具有休闲性,与写作等输出行为相比几乎不需调动认知资源,这是其被高估的根源 [6] 读书的异化现象 - 读书被异化为道德优越感的表征,但历史表明读书与人品无必然联系(如秦桧、希特勒案例) [7] - 畅销书本质是社会流行趋势的投射,读者共鸣源于集体心理而非独立思考(如治愈系、成功学书籍) [8] - 当读书沦为数量竞赛或打卡游戏时,其消遣属性暴露无遗,与刷短视频无本质区别 [8] 读书的价值重构 - 读书的真正价值在于知识内化,需通过批判性思考和输出重构转化为思想建筑材料 [8] - 应警惕"输入即正义"幻觉,保持思想主体性,避免陷入认知茧房 [9] - 输出比输入更重要,主动输出(如写作)能倒逼深度思考,这是人类区别于AI的核心能力 [10][12] 技术时代的读书意义 - 若仅将读书视为知识搬运,人类在速度与准确性上已完败于AI的文本处理能力 [11] - 不可替代的是人类对知识的重构能力,包括批判、联想、创造等深度思考过程 [12]
别让AI替你做判断
虎嗅APP· 2025-06-06 07:46
AI对认知方式的重构 - AI正在改变信息处理流程,从"人先看内容再做判断"转变为"AI先建议再确认方向",重构了决策路径[1] - AI通过智能推荐、一键总结等功能优先筛选信息价值,引导用户关注特定内容[1] - 行业普遍采用"降低认知负担"的AI产品设计逻辑,鼓励减少主动思考[2] 认知外包的依赖效应 - 用户行为显著变化:从自主筛选信息转向依赖AI预处理,注意力分散且思考动力下降[3] - 大脑偏好省力路径,AI提供的"低能耗"认知方式导致自主分析信心下降[4] - 公司系统性推动AI嵌入工作流程(如AI客服、AI做PPT),可能弱化员工批判性思维能力[6] AI对专业能力的潜在影响 - 学术领域出现双向AI依赖:学生用AI分析资料,教师用AI检查论文质量[7] - 创意行业呈现同质化趋势,品牌推广从头脑风暴转向AI生成方案,导致创新想法减少[13] - 经验积累方式改变:从内化沉淀转为外部存储,可能影响直觉判断等核心能力[17][18] 数据与研究的争议性 - 部分AI工具引用虚假研究数据(如大脑活跃度下降30%、海马体缩小8%),缺乏可靠出处[9][11] - 行业需警惕AI输出内容的可信度,避免形成"看似合理"的认知偏差[12] 人机协作的边界探索 - 欧盟提出"AI无权回答为什么",强调人类需保留终极判断权[23] - 未来角色可能从AI使用者演变为"个人AI助理守护者",需保持自主创造力[25][26] - 工具理性时代需平衡效率与慢思考,保留质疑空间以对抗认知惯性[20][24]
赚钱第一步,学会深度思考
洞见· 2025-05-30 02:21
核心观点 - 现代社会中赚钱的决定性因素并非单纯努力而是深度思考[3][9][36] - 低维勤奋不如高维思考 通过差异化经营、发现隐藏商机、解决根源问题等方式实现财富积累[10][12][15][31] - 思考深度决定商业结果 需通过连续追问和日记复盘等方法提升思考维度[40][45][49][56] 差异化经营案例 - 余姚电热毯商户谷文杰砍掉全品类业务专注单一品类 通过差异化策略集中订单并研发全品类电热毯 一年内成为当地龙头[7][8][10] - 差异化经营使客户选择倾向明确 避免同质化竞争带来的随机性订单分配[6][9] 隐藏商机挖掘 - 房产销售曹志远发现售楼部新业主数据价值 通过免费提供《业主手册》承载广告赚取第一桶金[12][13] - 商业机会存在于被忽略的环节 如装修公司对购房者数据的精准投放需求[12] 问题根源解决 - 机修工徐振通过发现液封槽漏液问题提升生产线良品率 从基层晋升至分公司总经理 年薪百万[15] - 技术问题的深度探究能带来超出岗位层级的价值 从而获得职业突破[15][34] 全球化布局 - 惠州小家电商末总将20年前中国模式复制到越南 首月收益达国内一年水平[20][25][26][29] - 新兴市场存在早期红利 成熟经验跨区域复制可快速打开增量空间[25][27] 深度思考方法论 - **连续追问法**:机械配件厂文刀通过五层追问(资金链断裂→库存积压→客户采购下滑→疫情成本增加)制定优惠方案清库存[40][42][45] - **日记复盘法**:销售专家李霖通过每日记录客户互动话术与反馈 提炼高转化率销售模型[49][51][52] 思考与收益关系 - 思考积累触发收益指数增长 底层逻辑认知决定财富获取效率[37][48] - 牛津"灰人理论"指出重复浅层劳动难以创造显著价值 深度决策才是财富源头[57][60][62]
一场对话,我们细扒了下文心大模型背后的技术
量子位· 2025-05-22 20:34
大模型技术发展 - OpenAI CEO指出行业已进入复杂推理模型的新范式阶段[1] - 推理模型成为继基础模型后厂商竞争的新焦点[1] - 中国信通院评估显示文心X1 Turbo在24项能力中16项获满分5分,综合评级达最高"4+"级,为国内唯一通过该测评的大模型[1] 文心大模型技术突破 - 文心4.5 Turbo和X1 Turbo分别聚焦多模态与深度思考两大方向[6] - 多模态混合训练技术实现文本/图像/视频统一建模,训练效率提升2倍,理解能力提高30%[7][8] - 自反馈增强技术框架构建"训练-生成-反馈-增强"闭环,显著降低模型幻觉并提升复杂任务处理能力[10][12][13] - 融合偏好学习的强化学习技术使模型理解/生成/逻辑/记忆能力全面提升[14][16] - X1 Turbo突破线性思维链,构建复合型思维链实现"边思考边行动"等人类式策略,复杂任务效果提升22%[18][19][21][23] 基础设施与性能优化 - 飞桨框架3.0支持使文心4.5 Turbo训练吞吐达前代5.4倍,推理吞吐提升8倍[31][32] - 算力-框架-模型三位一体协同优化路径成效显著[34] - 文心4.5 Turbo在14个数据集平均成绩80分超越GPT-4.5和DeepSeek-V3[35] - X1 Turbo各项数据集表现均优于DeepSeek-R1[37] 实际应用场景 - 教育领域:X1 Turbo可模拟人类思维解析物理题目[42] - 代码场景:AI生成代码占比超40%,累计服务760万开发者[44] - 数字人技术:支持10万主播,直播转化率31%且成本降低80%[47][48] - 行业规模:2029年全球K-12在线教育预计达8991.59亿元,2024年数字人核心市场480.6亿元将带动6402.7亿元关联产业[49] 长期技术战略 - 6年迭代9大版本形成全栈技术能力[52] - 坚持知识增强技术强化事实性/时效性/知识性[56] - 通过智能体技术结合工具使用解决现实复杂问题[56] - 视大模型为新一轮科技革命周期,注重技术长期价值与层层扩散效应[57][58] - 底层飞桨框架到上层应用的完整技术栈构成核心竞争力[61]
ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
机器之心· 2025-05-15 14:04
核心观点 - 提出新型深度思考范式PENCIL,通过交替执行「生成-擦除」机制显著提升大模型复杂推理能力 [1][3] - PENCIL在理论上实现图灵完备性,能以最优空间O(S)和时间O(T)复杂度解决所有可计算问题,传统CoT需O(T)空间导致指数爆炸 [23][24] - 实验显示PENCIL在3-SAT、QBF等NP完全问题上准确率保持≥99%,Einstein's Puzzle任务中25M小模型准确率达97%远超CoT的25% [15][21][22] 交替生成-擦除范式 - 动态擦除机制:引入[CALL][SEP][RETURN]特殊标记,按规则丢弃无用中间结果,上下文长度从数万token压缩至千级 [5][8][9] - 支持递归结构:擦除后的上下文可包含其他特殊标记,实现类似函数调用的多层嵌套 [9] - 三大应用模式:任务分解(子问题处理)、搜索回溯(无效路径清理)、摘要总结(冗长思考压缩) [13] 性能优势 - **准确率**:在n=10的SAT任务中PENCIL准确率99% vs CoT 50%,QBF任务100% vs 73% [15][16] - **计算效率**:相同FLOPs下PENCIL训练收敛速度更快,上下文长度控制在问题规模n的线性增长(O(n))而非CoT的指数级(O(exp(n))) [12][17] - **资源节省**:KV缓存复用机制使自注意力计算量减少,25M参数模型在Einstein's Puzzle上准确率提升3.88倍 [21][22] 理论突破 - 空间最优性:将图灵机模拟的上下文长度从O(T)降至O(S),尤其适合S<<T的NP完全问题(如旅行商问题) [24][25] - 实现路径:通过FASP编程语言构造「思考-总结」循环,证明固定大小Transformer可达成最优复杂度 [28] - 本质差异:传统CoT需保留完整计算历史,PENCIL通过状态摘要实现内存回收 [27]
为什么你的工作运总是不顺?
36氪· 2025-04-24 17:10
核心观点 - 解决问题的关键在于识别并解决根本性的大命题,而非纠缠于表象的小命题 [2][4] - 在竞争环境中,应采用商业和市场营销的思路,通过提升自身价值排名来赢得竞争 [9] - 面对市场乱象,普通人的务实策略是顺应趋势并坚守个人道德底线,而非试图改变游戏规则 [18][21] 问题识别与解决策略 - 许多具体问题如老板压榨、市场行情差、同事关系恶劣等,均是大命题下的表象小命题 [2] - 执着于解决表象问题如同救火,永远处于被动,应致力于从根源上杜绝问题 [2][3] - 深度思考是通过搜集信息、抽丝剥茧,找到问题的根本原因 [22] - 养成深度思考习惯可将人生中百来个问题归纳为5-6个大命题,掌握其解法即可一通百通 [23] 竞争环境下的价值排名 - 获得高薪好工作的根本在于个人在就业市场价值排名的靠前程度 [4] - 价值排名高则稀缺性高,如同搜索引擎第一页的结果价值最高 [5][6] - 华为天才少年年薪几百万的案例体现了极端稀缺人才的价值 [8] - 竞争策略可退而求其次,在特定城市、分公司、部门或小组内做到排名前几 [9] 市场行为与信息差 - 市场上存在通过人为制造信息差来提升价值排名的现象,即使实际技术一般 [11] - 草台班子现象普遍,其特点是外表光鲜但内在水平一塌糊涂 [13] - 草台班子大行其道的原因是专业班子太少,导致劣币驱逐良币 [14] - 市场行为不分对错,会自行调节不合理现象,个人难以插手改变 [15][16] 个人应对策略 - 面对公司内部同流合污的困境,应反思个人人生目标是否能在当前环境下实现 [19] - 若以赚钱为目标,则应继续留在游戏中并努力提升自身价值排名,向利益中心靠拢 [19] - 若清高更重要,则应寻找新游戏并适应其规则,而非试图全盘改变 [20] - 普通人的务实出路是在乱象中坚守小道德,努力做到不作恶并保全自己 [18]
11款AI测评实录:新闻总结全线翻车,深度思考的AI爱上“添油加醋”|AI幻觉捕手
21世纪经济报道· 2025-04-17 13:39
行业核心发现 - 对六款国产大模型进行新闻事件总结测试,在总计55次回复中,完全正确的回复仅有4次,大部分回复(42次,占比76.3%)为真假参半 [1] - 在四类常见错误中,“错误总结”是最高频类型,涉及全部AI,占全部错误量的40%以上 [7] - 开启“深度思考”功能后,AI模型普遍更倾向于编造细节和数据,例如深度思考版豆包为车祸事件编造了车主逃逸、伤者烧伤面积等情节,通义千问编造了车主涉毒及事故比例数据 [23] - 国际测试Vectara HHEM指出,深度思考版DeepSeek的幻觉率为14.3%,显著高于其通用版的3.9% [23] 模型表现评估 - 综合来看,豆包的表现最为可靠,其次是Kimi,其他大模型之间没有明显差距 [2][5] - 豆包的相对可靠性可能源于其大量引用了经过核查、引用规范的抖音百科原文内容 [5] - 所有被测试的AI模型均出现过“错误总结”的问题 [7] - 在引用来源时,Kimi有回答直接输出了《财新》付费部分的报道原文,疑似突破了付费墙或存在版权合作 [14] - 在答案提示方面,只有DeepSeek在每个回答下高亮了“内容仅供参考,请谨慎甄别”的提醒,其他模型未见类似提示 [5] 错误类型与特征 - 第一类错误为“无中生有”,即AI凭空捏造对话、故事或数据 [10] - 第二类错误为“错误总结”,包括误读原文、引用本身有误的信息,或在多种说法中片面摘取其一 [10] - 第三、四类错误属于引用错误,具体包括“移花接木”(内容与引用链接不符)和“无法核查”(链接失效或打不开) [10] - “移花接木”问题在通义千问和DeepSeek中相对突出,例如DeepSeek将《南方周末》的文章错误标注为“搜狐新闻分析” [14] - AI常犯的低级错误包括颠倒事实(如将“驾驶员非车主本人”总结为“车主本人驾驶”)和混淆专业概念(如将地震类型总结错误) [13] - AI倾向于将推测当作事实输出,很少使用“可能”、“推测”等限定词,也常省略信源主体,导致原意变味 [13] 信息源引用问题 - AI难以引用到正确的信息,是其共同软肋 [14] - 在信息更新迅速的事件中(如缅甸地震伤亡人数),多数AI无法引用到最新数据,例如仅文心一言和通义千问引用了缅甸官方4月12日公布的3689人死亡、5020人受伤的数据,仅豆包引用了中国公民死亡8人的最新数据 [15] - AI存在“时间错乱”问题,常将国内自媒体转载内容的滞后发布时间,错误当作事件实际发生时间,导致信息严重滞后,例如DeepSeek曾将4月5日自媒体帖子中提到的144人死亡,总结为缅甸官方当日数据,而当日实际累积死亡人数已达3354人 [16] - AI对信息源存在明显的“引用偏好”,倾向于引用那些篇幅长、面面俱到、结构清晰的“伪百科”型内容,这些内容往往不来自机构媒体或政府账号,阅读量也很低 [2][16][17] - 当事件缺乏专业媒体充分报道时,AI更容易借助各种质量不高的自媒体内容填充细节 [17] - 部分被引用的“伪百科”内容本身即由AI生成,形成了“垃圾进,垃圾出”的循环,例如DeepSeek在制油罐车事件中引用的链接原文底部标明了“内容由AI生成” [17] 深度思考功能影响 - 深度思考功能旨在通过展现思维链条来增强AI的推理能力 [18] - 在某些信息提炼场景中,深度思考功能能使回答更精准,例如DeepSeek深度思考版更准确地处理了采访信源,避免了通用版的错误简化 [23] - 然而,开启深度思考后,几乎所有AI都更爱编造内容,尤其是在细节和数据上 [23] - 分析认为,AI的思维链越长,越有可能为了填满推理过程而进行编造 [23][25] - 专家指出,推理能力与AI幻觉之间并非简单的线性关系,DeepSeek幻觉加重可能与其研发重点偏向高创造力的“文科思维链”,而在需要高度真实性的任务上出现副作用有关 [25]
AI真的那么靠谱吗?提问330次,平均准确率25%!近一半链接打不开
21世纪经济报道· 2025-04-10 18:01
AI新闻引用准确性测试 - AI在新闻引用方面准确率很低,六款AI的平均准确率只有25% [3][5] - 豆包表现最佳,50%的回答完全准确,文心一言错误率最高,87%的回答出现错误 [9] - 通义千问最常拒绝回答,但在打开深度思考功能后回答数量增加但错误也更多 [10] AI错误类型分析 - 新闻来源是错误重灾区,27%的新闻来源被AI完全说错 [5] - 作者识别表现最差,90次回复完全错误,错误率约27% [12] - 43%的回复提供无效链接,部分链接纯属虚构 [21] 新闻分发模式对AI的影响 - AI难以识别多平台分发的原创作者,经常混淆实际作者与发布平台 [15] - 国内119家广东媒体共注册1197个公众账号,平均每家媒体拥有10个不同账号 [19] - AI经常被新闻分发矩阵迷惑,难以识别原始作者 [20] 平台链接引用偏好 - AI倾向于引用门户网站而非原始来源,四大门户网站是更普遍的索引资料 [25] - 今日头条链接出现37次,其中34次来自字节跳动旗下豆包AI [24] - 微信公众号链接出现27次,其中19条由腾讯旗下元宝AI引用 [24] 媒体可见度与流量分配 - 14%的AI回复引用转载链接而非官方链接,豆包情况最严重 [26] - 七成以上用户从微信获取新闻信息,四成左右在抖音看新闻 [26] - AI倾向于引用雅虎新闻、AOL等转载链接而非原始来源 [27] 行业合作模式挑战 - 传统媒体与互联网平台形成成熟合作模式,稿件全网多发 [16] - 版权合作效果未达预期,AI仍然错误引用转载版本 [27] - 移动互联网时代的自媒体洗稿问题在AI时代继续发酵 [20]
对话阿里吴嘉:夸克是一个天然的超级智能体
36氪· 2025-03-24 18:44
核心观点 - 未来是"AI使用工具,人使用AI"的时代,夸克推出的"超级框"旨在重塑人、工具(AI)、任务三者的关系 [5] - "超级框"不是传统搜索或ChatBot,而是能直接交付结果的"超级Agent",整合了AI搜索、AI写作、AI讲题等多种能力 [4][5] - 夸克月活用户已超过2亿,累计下载量超过3.7亿,成为阿里AI To C战略的核心产品 [7][8] 产品定位与理念 - "超级框"超越传统搜索形态,是超级智能体与用户交互的界面,搜索只是AI使用的工具之一 [13][14] - 产品定位为"生活工作学习的全能助手",强调"有用"而非仅"实用",服务普惠人群 [18][21] - 三大标签:Smart(聪明)、专业、万能,目标是实现"All in One" [20][21] 技术实现与创新 - 通过让AI自主规划任务流程,而非模仿人类操作步骤,解决了复杂场景覆盖问题 [30][32] - 具备深度思考能力,未来将结合多模态技术处理更复杂任务 [35] - 整合夸克内部工具能力与阿里集团服务,形成开放生态 [5][39] 市场表现与战略意义 - 2024年完成组织调整,整合天猫精灵和通义C端产品,强化AI To C布局 [8] - 成为阿里在AI时代C端标杆产品,目标重构人与信息和任务的交互方式 [40] - 投资人评价其迭代速度快且务实,是阿里体系内的年轻力量 [7] 未来发展方向 - 短期以提升用户体验为主,创造足够厚的用户价值 [37] - 输入方式将从文字扩展到多模态(拍照、语音等) [22][23] - 不会完全取代传统搜索,但会承接大部分搜索需求 [25][26]
独家|当传统搜索走向黄昏:看夸克AI搜索如何用自研模型打造“深度思考”新体验
Z Potentials· 2025-03-03 10:22
夸克AI搜索"深度思考"的核心创新 - 传统搜索引擎依赖关键词匹配和网页排序算法,而夸克"深度思考"通过模拟人类"系统二思维"实现深度语义理解和多步骤推理,重新定义搜索本质[1][2] - 在Z世代社交产品设计案例中,系统首先分析用户核心特征(如个性表达、碎片化注意力等),再从产品定位、功能设计等维度提供系统性建议,整合最新用户研究数据和成功案例[3][4][5][6] - 医疗健康领域展示专业优势,如"花粉过敏防护"问题提供系统化方案,涵盖过敏原理解释、防护维度建议和就医指导,大幅提升信息整合效率[9][10][11] 技术架构与功能演进 - 基于阿里通义千问基模开发,具备中文专业术语和行业语境的深度理解能力,确保信息安全、响应速度和本地化优势[12] - 实现三大维度突破:问题理解从关键词到真实意图(如团队创新能力问题识别多维度障碍)、思考过程从黑箱到透明展示推理链条、回答结果从分散链接到智能整合[13][14][15][20][22] - 发展为AI全能助手,支持专业写作、研究分析、AI生图等场景,免费提供PPT制作、简历生成等功能,用户量突破2亿后定位升级为"2亿人的AI全能助手"[23][24][25] 行业影响与未来展望 - 推动搜索行业范式转移:从信息检索到知识生成,从工具属性到助手角色,传统搜索模式可能逐渐被更智能的AI搜索取代[26][27] - 未来计划接入更大规模推理模型,能力边界将持续拓展,可能演变为知识助手、思维伙伴甚至创新催化剂[25][27] - 在专业场景价值显著:如学术研究可快速梳理领域现状、战略决策支持SWOT分析等,提升知识工作者效率[23][24]