Workflow
红杉汇
icon
搜索文档
棒球场上的管理课
红杉汇· 2025-12-04 08:04
文章核心观点 - 棒球运动是一项富含商业管理智慧的“智者运动”,其独特的节奏、高度的数据化、无时限的博弈规则以及成熟的联盟运营体系,为企业管理在人才培养、战略决策、数据应用、生态构建及文化融入等方面提供了深刻的启示和丰富的案例 [3][19] 棒球运动的独特管理价值 - 棒球运动具有“脉冲式”的决策节奏,比赛大多数时间用于“酝酿”和“筹划”,关键时刻瞬间执行,这种“思考—执行—思考”的循环与企业管理的决策过程高度相似 [6] - 棒球是世界上最早实现“数据驱动决策”的运动之一,拥有超过160年的数据积累,如今一场MLB比赛就能产生超过7TB的数据,这种极致的数据化思维是现代管理所必需的 [6] - 棒球比赛没有时间限制,理论上可以无限延长,历史上最长的比赛达8小时6分钟,这种“没有时钟的竞争”更接近真实的商业世界,落后者随时可能逆袭,领先者也可能被超越 [7][8] 个人成长与组织适配 - 棒球运动员的成长过程与企业员工从入门到资深的历程相似,过程残酷且需要长期在多层级的梯队中磨练 [10] - 球员需要根据球队需求和自身条件,不断思考和调整自己在9个防守位置或多个投手类别中的定位,体型和技术差异大的选手可以同场竞技,这启发企业员工思考如何根据自身优势为组织创造价值 [10] - 以日本球星铃木一朗为例,他在进入MLB后主动重新设计技术动作以适应新环境,展示了根据环境变化进行自我调整和加倍苦练的重要性 [10] 复杂环境下的决策与战术 - 棒球比赛局面瞬息万变,很少出现完全重复的局面,要求参与者像击剑过招一样,在短暂的几秒交锋中做出复杂决策 [12] - 应对复杂局面依赖两点:持续的“观察”(关注对手状态、站位、意图以发现破绽)和快速的“思考”(对不同情形下的数据和方案进行快速部署)[12] - 战术层面充满博弈,即使是最强击球手也可能被保送战术限制,而仅有速度优势的球员也可能通过战术决定胜负,体现了策略的重要性 [12] 数据驱动的精细化运营 - 电影《点球成金》的故事反映了20多年前数据分析在棒球领域的早期应用,如今数据驱动决策已深入人心并在多支球队取得成功 [13] - 具体应用包括:分析球员打击习惯以优化防守站位、根据投手习惯制定打击计划、分析裁判判罚偏好设计投球方案等,数据应用已极其精细化 [13] - 各队使用模型预测大量梯队球员的未来表现和价值,这已成为重要的管理领域,以至于联盟需出台规定限制过度的“定制化防守部署” [13] 商业生态系统的构建逻辑 - MLB通过“均贫富”机制构建良性生态,大市场球队的部分收入会分给小市场球队,小市场球队则通过培养优秀球员再交易给大市场球队来获利 [15] - 这种设计形成了独特的平台化生态:大市场球队球迷追求即时成绩,促使球队交易成熟球员;小市场球队则专注于培养和输送人才,一些来自小城市的球队因此战绩常年出色 [15] - 这种“球队平台设计”的逻辑为商业世界如何构建共赢的生态系统提供了借鉴 [15] 对企业出海的文化融入启示 - 棒球盛行的美国、日本及拉美市场,恰是中国企业出海的主要目的地,深入理解当地棒球文化有助于真正融入海外市场 [17] - 真正的文化融入超越表面化的语言学习,参与当地热爱的运动(如棒球)能为各方面交流打开方便之门 [17] - 美式英语中有大量源自棒球的俚语(如“swing and miss”、“curveball”),理解这些文化深意对于有效沟通至关重要,而简单的语言翻译可能无法触及 [17] 行业与市场规模背景 - 美国职业棒球大联盟(MLB)年收入超过120亿美元,其30支球队的平均估值达到24亿美元,背后是一套成熟的人才培养、战略决策、数据应用和商业运营体系 [4]
游戏行业的品牌战略:如何让产品从爆款进化为文化符号 | 红杉汇内参
红杉汇· 2025-12-03 08:03
行业核心观点 - 2025年游戏行业面临内容爆炸与激烈的注意力争夺,仅靠产品创新已不足以保证成功,品牌辨识度成为游戏从市场中突围的核心要素,其重要性超越单纯的产品层面 [3] - 强大的游戏品牌战略能构建连贯统一的游戏宇宙,支撑续作、衍生作品及文化拓展,让单款游戏蜕变为文化力量,实现长期商业价值 [3] - 游戏品牌并非附加元素,而是体验的核心,旨在打造沉浸感与情感认同 [3][6] 品牌战略与生命周期 - 品牌战略决定游戏的生命周期,早在游戏开发前期就已塑造游戏的核心基因,其核心是打造沉浸感与情感认同 [5][6][7] - 游戏品牌指向一整个世界,统筹游戏机制、美术风格、叙事手法和角色设计,打造具有长期吸引力的体验 [7] - 构建能支撑续作、衍生作品和文化拓展的游戏世界,可以保证IP的可持续性,将世界观构建转化为长期商业价值 [7][8] 品牌打造的关键节点:命名与Logo - 游戏命名是玩家接触游戏的首个触点,需贴合世界观、独特易记且能激发好奇心,优秀命名还可作为IP拓展蓝图 [3][9] - 命名需考量三大核心维度:是否贴合游戏世界、是否独特专属易记、能否激发好奇心 [10][12][13][15] - 进阶的命名策略需考虑IP蓝图拓展,采用“一致性+适应性”的命名体系,如《使命召唤》通过主副标题格式适配不同玩法与主题 [17][19] - 字体标志与logo设计是品牌身份的首个视觉符号,能精准传递世界观、基调与差异化特质,如《塞尔达传说》的标志性剑形元素 [19][20][22] 品牌一致性运营 - 品牌一致性是优秀游戏品牌的关键,从发布前预热到上线后运营,每个环节都需贴合核心游戏宇宙,避免品牌形象零散 [3][23][24] - 发布前预热应如同游戏品牌的自然延伸,有策略地打造期待感,将用户的期待感融入品牌神话之中 [25][26] - 不同厂商的预热策略各异:R星凭借《侠盗猎车手》的积淀以极简预告撬动期待;Epic Games为《堡垒之夜》打造持续进化的平台定位;Supercell实现新作对旧作品牌热度的承接 [26] 长线运营与社群生态 - 游戏上线后,品牌打造重心需转向“长线运营”,建立情感联结、培养玩家忠诚度、保持话题度 [27] - 广告和社交媒体运营应建立真实的情感联结,将营销自然地融入故事讲述、社区互动和共同体验之中 [27] - 成功案例如:CD Projekt Red通过透明沟通与问题修复让《赛博朋克2077》完成口碑逆袭;Riot Games将内容更新打造成沉浸式叙事事件;动视把《使命召唤》赛季更新塑造成“大片级事件” [27] - 社群运营的核心是营造对话而非单向输出,赋能社群让玩家主导讨论,将被动受众转化为主动参与者 [29][30] 跨维度生态拓展 - 顶级游戏品牌会突破游戏本身边界,通过电竞、影视、周边联名等方式构建跨维度生态宇宙,成为渗透日常生活的文化符号 [3][31] - 电子竞技是强大的品牌放大器,如《英雄联盟》全球总决赛每年吸引数百万观众,规模堪比传统体育赛事 [32] - IP拓展能从游戏延伸至大众传媒,衍生周边和品牌联名能以自然的方式触达新受众并扩大影响力 [33] - 真正的头部品牌构建的是横跨电竞、影视、时尚、主题乐园等多维度的生态宇宙,关键在于让玩家在非游戏时间也愿意沉浸在该品牌世界中 [33][35] 行业竞争背景数据 - 根据《2025年电子游戏行业现状》报告,Steam平台2024年月均上线游戏数量几乎与2014年全年持平,显示内容爆炸式增长 [3] - Steam平台每天有50多款新游戏上架,但80%的新游戏销售额未达到5千美元,凸显注意力争夺战的残酷 [4]
AI大家说 | 意识产生、符号推理……AI下一站该往哪走?
红杉汇· 2025-12-01 08:05
文章核心观点 - 文章整合了三位顶尖专家对人工智能未来发展的核心思考,探讨了AI的发展形态、意识可能性及应对不确定性的方式[5][6] - 当前AI处于平台转移关键期,技术部署需经历吸收、创新、颠覆三阶段,长期将重塑行业核心问题[9][10] - AI本质是“可计算的模式识别”,现有计算机技术难以产生真正意识,但AI仍可能在某些方面超越人类[15][16][17] - 未来AI发展将呈现多元化形态,技术演进聚焦符号推理、空间智能、情感智能和智能体四大方向[20][21] - 面对AI应保持“进托邦”的乐观视角,相信持续微小进步将带来文明跃迁,主动准备而非恐惧[4][22][23] 本尼迪克特·埃文斯:平台转移与产业重塑 - 科技产业每十到十五年经历一次平台转移,生成式AI可能是当前十五年周期的新主角[9] - 技术部署分为吸收(自动化明显用例)、创新(新产品与捆绑拆分)、颠覆(重新定义问题)三阶段[9] - 目前大多数成功用例仍处于吸收阶段,如编程、营销、客户支持等领域,这些领域还将有二十年部署时间[9] - 创新层面的关键在于LLM如何从相关性推荐转向意图理解,从捕获用户数据转向理解用户需求[9] - 颠覆层面类似蒸汽机革命,AI可能重新定义行业根本问题,但这需要时间和正确的问题[10] - 科技巨头正进行人类历史上最大规模资本支出竞赛之一,但产品形态和商业模式仍模糊不清[11] - 技术变革从来不是简单替代而是复杂重构,网络和出版业虽多次被预言“死亡”但始终在适应演变[12] 罗杰·彭罗斯:AI意识与智能本质 - 真正智能必然涉及意识,现有AI设备不具备意识,除非引入其他要素否则永远不会拥有意识[15] - AI本质是“可计算的模式识别”,仅能查看大量数据寻找模式,但智能其实依赖于意识[15][16] - 哥德尔定理指出数学体系存在不可计算内容,突破规则限制需要理解规则背后的深层原理[16] - 意识可能涉及量子世界中不可计算的特殊物理过程,现有计算机技术无法触及这些非可计算层面[16] - AI不清楚规则是否为真,没有意识去认知,无法理解规则为何能导向真理[16] - AI可能比人类更好且存在风险,如果AI有意识可能会有更大风险[17] 凯文·凯利:AI未来演进与应对策略 - 未来不会只有一种通用人工智能,而是会出现成百上千种特定领域表现卓越的“弱人工智能”[20] - 未来AI计算架构可能呈现“混合式”格局,中心化云计算与去中心化边缘计算共存,主导力量逐步向边缘侧转移[20] - AI目前带来的是效率提升而非大规模裁员,改变工作结构但未让工作消失,让人专注于更具创造性和判断力的工作[21] - 未来AI创新将聚焦四大方向:符号推理(补逻辑短板)、空间智能(懂真实世界)、情感智能(具共情能力)、智能体[21] - 符号推理需要结合神经网络学习与逻辑推导,空间智能让AI具备在真实世界中行动、感知、理解的能力[21] - 情感智能让AI具备共情能力,但会引发新的伦理问题,智能体将形成新的经济体系——智能体经济[21][22] - 应对AI需保持“进托邦”视角,相信世界每天变好一点点,持续微小进步终将带来文明跃迁[22][23] - 乐观是推动创新的道德责任,基于历史理性判断未来改善可能性远大于全面倒退可能性[4][23]
基因编辑疗法连破纪录,国产器械引领全球创新 | Healthcare View
红杉汇· 2025-11-28 08:04
基因编辑与基因治疗 - 正序生物CS-121注射液成为全球首个靶向碱基编辑APOC3基因成功治疗高血脂的疗法,首位患者在接受最低剂量单次给药后第3天顺利出院,空腹甘油三酯水平在三天内显著下降[2][3] - CS-121注射液基于tBE技术,利用LNP递送,实现单碱基精准校正而不破坏DNA双链,临床数据显示未出现产品相关不良事件,并在安全性上实现不激活p53通路、不引发染色体异常等突破[3] - 新芽基因的GEN6050X作为全球首创的DMD碱基编辑疗法,52周随访数据显示两位患者左心室射血分数平均提升13.3%,肺功能指标分别提高14.6%和26.8%[6] - 凌意生物LY-M003注射液是全球首个采用铜离子动态调控表达技术的AAV基因疗法,获美国FDA批准直接进入II期临床试验,在已完成7例患者给药中显示良好安全性且无严重不良事件[11][12] 细胞疗法与疫苗 - 启函生物QT-019B成为首个连续获得美国FDA和中国CDE默示批准的中国企业自主研发的通用型双靶点CAR-T细胞产品,采用双靶点设计靶向CD19和BCMA,并通过多基因编辑技术降低免疫排斥风险[15] - 瑞吉生物旗下依诺生物的冻干结核病mRNA疫苗临床试验申请获CDE批准,成为全球首款该类型疫苗,采用冻干工艺突破对超低温储运的依赖[13] 手术机器人与高端医疗器械 - 精锋医疗精锋云®远程手术系统获NMPA批准上市,已在全球辅助完成超过500例远程手术且手术成功率达100%,并创造12035公里跨洲际手术的吉尼斯世界纪录[8] - 心泰医疗介入引导导丝获准上市,采用创新梭形头端设计,提供2种导丝型号和10种头端规格,产品线覆盖61项上市及在研产品[18] - 同心医疗新一代全磁悬浮心室辅助装置BrioVAD系统在美国完成首例临床入组,其INNOVATE试验预计招募约800名患者,旨在与HeartMate 3进行对比[19][20] - 唯柯医疗与华中科技大学联合申报的经导管二尖瓣植入器械项目获批2025年度国家重点研发计划,致力于开发抗疲劳耐久、易锚定的二尖瓣置换系统[23][24] 医学影像与诊断技术 - 微光医疗参与项目荣获2024年度北京市科学技术进步二等奖,该项目在国内率先研发基于OCT三维血管成像的冠脉斑块光衰减指数分析模型,并突破3D-OCT系统分叉血管自动识别技术[26] - 项目技术成果已覆盖全国9个省直辖市50余家三甲医院,获得2项医疗器械注册证及32项国家发明专利[26] 生物工艺与工业支持 - 迪必尔生物入围工信部"高性能生物反应器创新任务"揭榜单位,创新任务覆盖细胞平行生物反应器、智能工业操作系统等全链条技术,致力于解决工艺放大成功率低的世界性难题[30] - 壹永科技荣获国家级专精特新"小巨人"企业称号,标志着公司在肿瘤大数据人工智能领域的技术创新能力和市场竞争力获得国家级认可[32] 行业投资动态 - 红杉中国在医疗健康领域投资超过200家企业,覆盖创新药、医疗器械等多个细分领域,其中超过45家已完成IPO[33]
从模型能力到生态布局,多款重磅产品发布,近期AI新鲜事还有这些……
红杉汇· 2025-11-27 08:04
Google Gemini 3模型发布 - 官方称其为"智能的新纪元"并定位为通往AGI的重要一步 在发布当天直接集成到Google搜索中[5] - 在各种基准测试上超越竞争对手并登上LMArena榜首 在红杉中国xbench-ScienceQA榜单中以71.6的平均分超越Grok-4成为新SOTA[5] - 具备原生多模态、强大推理和Agent能力 在推理和多模态理解能力上带来质的飞跃 在复杂决策任务中相对同类顶尖模型具有压倒性优势且价格更便宜[5] - 在Humanity's Last Exam测试中优势明显 领先GPT-5.1一档 几乎是Claude 4.5的三倍 在GPQA Diamond数据集上达到90%分以上[7] - 在常规数学测试集AIME上是当今数学推理最强的通用模型 使用代码执行可达100% 在MathArena Apex上领先竞争对手几十倍[7] - 视频理解能力达87.6%领先其他大模型 屏幕理解能力达72.7%而GPT-5.1仅3.5% 呈现碾压级优势[7] - AI编程能力全面领先 编程竞赛得分2439分 比GPT-5.1高出200多分[8] Google Antigravity IDE产品 - 颠覆性AI原生IDE产品 将AI代理、代码编辑器和浏览器三个核心开发工具集成在一起[8] - 构建由AI驱动的完整闭环 涵盖从编码、研究、测试到验证的全流程 打通自家生态[8] - 让开发者聚焦高层次工作 可管理跨工作区的智能体 智能体能在编辑器、终端和浏览器间无缝切换并自主执行复杂端到端任务[8] - AI会在工作关键节点主动汇报计划、进展与结果 刷新IDE使用体验[8] GPT-5.1版本升级 - 对GPT-5进行功能升级 强调更智能并突出个性化和对话舒适度[10] - 推出6种预设对话模式并支持用户精细调节参数 在聊天过程中会主动询问用户对语气的偏好[11] - 被描述为向"打造贴合用户需求的ChatGPT"迈出的重要一步[11] - GPT-5.1 Instant模型语气更亲切、更智能且善于遵循指令 引入自适应推理能力 日常对话很会接梗[13] - GPT-5.1 Thinking模型主打专业推理 简单任务响应速度更快 复杂问题通过深思考输出更优质答案[13] Manus Browser Operator浏览器扩展 - 用户无需下载新应用或改变上网习惯即可让任意浏览器升级为"AI浏览器"[14] - 支持跨账号会话感知、自动化任务执行 打破传统浏览器标签页壁垒 实现跨标签页协同与智能编排[14] - 解决AI访问受保护资源时触发验证码、速率限制或会话过期的问题 AI操作员使用用户已有的浏览器会话和IP地址[15] - 无需额外API密钥或复杂云端设置 能以极低成本提供自动化能力 可完成复杂的多步骤操作如交叉引用市场数据、生成报告等[15] 麦肯锡2025 AI报告洞察 - AI已成为近九成受访企业中的标配项 但仅约三分之一企业实现了AI的规模化应用[17] - 超六成受访者认可AI在创新方面的价值 但仅有39%的企业表示获得了可量化的财务回报[17] - 顶尖企业更注重利用AI重构工作流、升级客户体验以实现底层业务革新 AI Agent成新热潮且有62%的企业已入局[17] Kimi K2 Thinking模型表现 - 在Artificial Analysis评测中以67分的智能指数得分摘下开源模型桂冠[19] - 在智能体应用场景测评中获全球第二成绩紧追GPT-5 代码能力综合指数超越之前的开源领先者DeepSeek V3.2[19] - 具备万亿参数、性能赶超GPT-5且成本更低 正重新定义开源AI行业标杆[19] Grok 4 Fast模型升级 - 将上下文窗口扩展至200万token 相当于约150万英文单词 是GPT-5的5倍、Gemini 2.5 Pro的2倍[21] - 用户可一次性输入整本书或整个代码库而不必切碎文档 重新定义"实时AI推理"的样貌[21] - 推理质量显著提升 推理模式准确率从77.5%提升至94.1% 非推理模式从77.9%提升至97.9%[21] - Grok Imagine视觉创作能力同步升级 输出效果逼真 从x.ai的API调用量来看正成为开发者新宠[21]
想掌控全局,又不想事事亲为,该怎么办? | 首席人才官
红杉汇· 2025-11-25 08:03
文章核心观点 - 高质量放权的核心在于确保工作成果标准不降低,管理者需通过动态调整授权程度、评估下属任务相关成熟度、克服心态障碍、充分沟通以及避免主导执行等方式,实现高效管理与团队能力提升[3] 放权的核心原则与难点 - 放权后保证工作质量达到预期是核心难点,管理者需对团队产出负最终责任,不能因授权而降低要求或给出模糊反馈[4][5] - 管理者常年脱离一线业务是危险的,需在不事事亲为的前提下深度参与,理解工作细微差别以提供实际帮助[5] 放权的实施策略 - 放权不是非黑即白的二元选择,而是一个需结合任务类型、下属适配度、任务相关成熟度及检查节点灵活调整的“灰度光谱”[6] - 监督强度应基于下属在特定任务上的经验和过往表现(即“任务相关成熟度”),而非其整体能力,并随其表现提升而降低监督强度[7] - 对于在特定任务上是新手的下属,管理者需要更亲力亲为,需区分维护现有项目与从零创建新项目等不同能力需求[9] - 放权时需事先花5到10分钟认真解释项目背景、重要性、目标及风险,这能节省时间、减少误解并提升执行信心[12] 管理者的自我调整与工作方法 - 管理者需克制沉迷于自身擅长工作的逃避心态,坦诚自我反省,主动定义工作优先级而非被动应对各项事务[10][11] - 管理者应避免“主导”一线执行工作,但可参与执行以保持业务敏感度,目标应是尽量减少主导一线工作的比例[14] - 审核下属成果时,可先给出宏观结构性反馈,再让其优化,并可采用批量集中审核的方式以提升双方效率[15] - 在已有成果基础上修改比从零创建更省脑力,且通过展示修改案例能使下属获得更大收获[15] 提供高质量反馈的方法 - 提供反馈是让管理者判断力在组织中规模化传递的投资,每周仅需花1到2小时即可产生累积放大的效果[15] - 反馈应聚焦于一个能带来最大改变的核心杠杆点,并通过示范修改一处内容来教会团队应用逻辑,培养其“模式匹配”能力[16] - 若成果与预期相差甚远,应先给出结构性反馈,校准核心前提与策略,而非一上来就逐句修改细节[17] - 不必将所有反馈都写成文字,可灵活利用语音笔记、视频会议、电话等工具,但反馈内容需遵循战术性、可落地、具体明确、细节到位(TACS)原则[18][19] - 在反馈者与接收者之间找到平衡,优先保障反馈方式的可持续性,长期坚持才能看到真正改变[20]
“拿捏”表情包,让沟通更丝滑 | 创业Lifestyle
红杉汇· 2025-11-24 08:04
表情包在数字沟通中的普及与重要性 - 表情包已成为数字时代沟通中不可或缺的非语言要素,重塑人们在虚拟空间中的表达方式[3] - 超过90%的在线用户经常使用emoji,用户每天在社交媒体上发送的emoji数量超过60亿个[3] - 近九成受访职场人在社交沟通表达中习惯使用表情符号,超过六成高频使用,从不使用者不足5%[5] 创业者使用表情包的管理策略 - 创业者使用表情包可传递亲和力及建立良好关系的意愿,有助于打造平易近人形象并促进开放交流[7] - 过度使用表情包可能影响创业者在员工心目中的权威性和专业感,需根据员工期望调整使用策略[7][8] - 对思维活跃的年轻成员可增加活泼、搞怪表情使用,对年龄较大或偏好权威的员工应使用意义明确、保守的表情或减少使用[8] 表情包的歧义与跨文化沟通风险 - 表情符号在不同年龄群体中含义差异显著,例如在长辈眼中代表高兴友善,但对年轻人可能意味"冷笑",45.94%的年轻人将其列为最讨厌表情[9] - 63%的跨文化沟通误解直接源于符号歧义,远高于语言翻译错误(27%)和文化禁忌话题(38%)[9] - 跨文化沟通时需提前了解对方文化和禁忌,业务涉及海外可构建跨文化表情包传播体系并做好员工培训[10] 表情包的非常规应用场景 - 在笔记标注中插入表情符号可减少视觉疲劳并帮助快速定位重点,例如用标记灵感、标记关键点、用❓标记疑问[11] - 表情包可作为马赛克"平替"遮脸,比传统马赛克更便捷且能传达不同情绪增强趣味性[12] - 定制专属表情包有助于个人或公司文化传播,化身移动名片扩大影响力[14] 表情包与人格特质关联 - 表情包使用习惯反映使用者人格特质:低外向性者使用频率最高,高宜人性及高神经质者更多使用,高尽责性者较少使用[17] - 高尽责性、高外向性及高宜人性者较少使用消极表情,高神经质者偏好夸张情感类表情[17] - 表情包可辅助判断沟通对象性格特质,提升交流有效性[17] 表情包在沟通中的功能性优势 - 表情符号能强化文本情感传达,例如在项目进展公告中添加可增强喜悦情绪[18] - 添加表情包能更准确传达信息立场与态度,例如"今天太忙了"配或体现不同情绪[18] - 表情包提升沟通效率,如比打字"好的"更快捷,在跨语言沟通中能降低理解成本[18]
2025年度热词来了:AI相关词汇正高频进入我们生活
红杉汇· 2025-11-21 08:05
年度词汇总体趋势 - 各大权威词典和机构发布的2025年年度词汇显示,与人工智能相关的英文词汇正从技术术语演变为生活和社交中的高频词 [3] - 年度词汇不仅反映了AI技术的深远影响,也体现了社会在科技、健康、工作与生活方式上的最新潮流 [3][16] 2025年核心年度词汇:vibe coding - 英国柯林斯词典将“vibe coding”(氛围编程)评选为2025年年度词汇,指利用人工智能将自然语言转化为计算机代码 [4] - 该术语由OpenAI联合创始人Andrej Karpathy在2025年2月首次提出,描述了一种让程序员沉浸于编程氛围而无需手动编写代码的新方式 [5] - 该词在全球的使用频次在数月内暴涨,柯林斯词典从包含240亿词汇的语料库中捕捉到这一趋势 [5] - 2025年谷歌报告指出,软件开发专业人员的人工智能采用率已飙升至90%,比去年增长14个百分点 [5] 其他AI相关年度词汇 - “agentic”一词入围Dictionary.com 2025年度词汇候选名单,该词被用来描述能够自主执行任务和决策的AI技术(Agentic AI) [8][9] - “clanker”入围柯林斯2025年候选名单,该词源自《星球大战》,现成为网友吐槽AI或机器人的专用语,类似于中文的“人工智障” [10] - “slop”入围剑桥词典年度词汇候选列表,常被用来形容由AI生成的低质量、无价值的内容 [13] - 剑桥词典将“parasocial”(拟社会关系)选为2025年年度词汇,随着许多人将AI工具视为“朋友”或治疗替代品,该趋势呈现出新维度 [11][13] - 牛津大学出版社在2024年将“brain rot”(脑腐)评为年度词汇,该词指因过度浏览低质量网络内容导致的精神退化,其使用频率在2023至2024年间激增230% [14] 历年AI相关年度词汇回顾 - 英国柯林斯词典在2023年直接将“AI”评选为年度词汇,将其视为下一次技术革命的代表 [6] - 剑桥词典在2023年选择的年度词汇是“hallucinate”,该词在AI时代被赋予新含义,用于描述大语言模型胡编乱造、产出虚假信息的现象 [14] - 韦氏词典在2023年选择的年度词汇是“authentic”(真实),在AI生成内容泛滥的背景下,人们对该词的关注量暴增 [16] 非AI领域的年度生活趋势词汇 - Dictionary.com正式公布的2025年年度词汇是“67”,年轻人将其作为意为“还好”、“凑活”的口头禅,其搜索量从2025年6月开始显著上升 [17] - “biohacking”(生物黑客)进入柯林斯2025年候选名单,指通过各种方式改造人体自然机能以优化健康和寿命 [19] - “micro-retirements”(微退休)进入候选名单,描述了Z世代和千禧一代在不同工作期之间休息一段时间来追求个人兴趣的新趋势 [19] - “coolcation”(凉感假期)进入候选名单,反映了人们因气候变化而转向挪威、冰岛等气候凉爽目的地的度假新选择 [19]
Gemini 3 Pro刷新ScienceQA SOTA|xbench快报
红杉汇· 2025-11-20 11:38
文章核心观点 - Google正式发布新一代基础模型Gemini 3,在深度推理与思考、多模态理解、Agent编程能力上有极大提升[1] - Gemini 3 Pro在xbench-ScienceQA榜单中以71.6的平均分超越Grok-4成为新SOTA,并且响应时间快,价格低[1] - 模型实现了从“反应式”推理向“审慎式”推理的转变,解决了大模型常见的“幻觉”问题,标志着AI从“知识检索”向“逻辑推理”的跨越[8] 模型性能表现 - Gemini 3 Pro在ScienceQA榜单中平均分为71.6,BoN(N=5)达到85分,超越第二名Grok-4的分数6分[3][5] - 平均响应时间仅48.62秒,远快于Grok-4的227.24秒和GPT-5-high的149.91秒[3] - 官网API价格为输入每百万token 2美元,输出每百万token 12美元,低于Grok-4的3美元/15美元和GPT-5-high的1.25美元/10美元[3] - 与Gemini 2.5 Pro相比,平均分从59.4提升到71.6[5] - 运行ScienceQA成本估算显示,GPT-5.1花费32美元,Gemini 3 Pro仅花费3美元,成本约为前者的1/10[6] 技术架构创新 - 引入“深度思考”模式,在处理高复杂度任务时在内部构建多条推理链路进行自我博弈与验证[8] - 采用稀疏MoE架构,拥有海量参数专家但每次仅激活一小部分,显著降低计算开销[8] - 彻底摒弃外挂式编码器,采用极致的原生多模态架构,使文本、代码、图像、视频和音频在模型底层共享同一套“世界模型”[11] - 上下文长度显著扩充至百万级,可直接处理整本书、完整代码库或长时间音视频逐字稿[12] Agent与开发能力 - 带来“氛围编程”概念,模型能捕捉代码库中隐含的工程风格、架构规范及开发者直觉[9] - 作为自主Agent在IDE中运行,具备操作终端、浏览器和文件系统权限,拥有长程规划能力[9] - 在Google Antigravity平台中与Gemini 2.5 Computer Use模型、视觉模型Nano Banana等深度集成,实现“计划-执行-反馈”的自主多步骤工作流[10] 交互与生成能力 - 引入Generative UI,模型能根据用户意图实时编写前端代码并渲染出动态可交互界面[12] - 具备惊人感知能力,能转录3小时会议视频,精准识别说话人语气,从模糊低质量文档照片中无损提取结构化数据[11] 硬件支持体系 - 在Google自研的TPU上训练,TPU是为大型模型特别设计的高带宽、高并行计算芯片[13] - 借助TPU集群的强大算力和高效并行,在相对可控时间内完成训练,实现能耗与成本平衡[13]
AI越强大,人们越渴望品牌有“人味儿” | 红杉汇内参
红杉汇· 2025-11-19 08:06
文章核心观点 - AI已成为营销从业者日常工作的一部分,被视为提高效率的工具 [4] - AI时代,品牌的长期价值回归于人性与文化共鸣,人类的创造力、同理心与文化相关性愈加重要 [3][4] - 营销行业正被人工智能、创作者与社群、算法驱动的分发平台三股力量迅速改写 [23] AI在营销中的应用与认知 - 几乎每位受访的CMO都把AI当成提高效率的工具,用于简化流程、提炼要点、加快决策 [4] - CMO们普遍对AI在创意构思中的角色仍持保留态度,各国认知差异巨大,65%的CMO认为AI辅助的创作尚不能忠实呈现其品牌的调性与视觉风格,意大利该顾虑高达84%,印度仅为37% [3][15] - 90%的CMO认为生成式AI将帮助设计出更有用、更具个性化以及互动性更强的体验 [16] - 超过半数的CMO已经在用AI来个性化体验与定制讯息和内容 [18] - Agentic AI以更高的自主性和更细致的个性化能力,正在改变搜索、商业与用户体验的基本规则 [3] 人性洞察与消费者理解 - 86%的CMO认为在AI驱动的世界中,倾听真实顾客比以往更为重要 [8] - 62%的CMO使用社交聆听与监测来把握消费者动向 [8] - 把粉丝社群纳入受众与定向策略、作为获取新兴消费行为情报的渠道,是增长最快的做法 [8] - 微观细节与小众兴趣点更能引发共鸣,最能破圈的是最鲜活、最真实的微观洞察 [8] 品牌建设与共创策略 - 91%的受访者认为未来品牌建设将成为品牌、创作者与平台之间的合作,比去年高出14个百分点,在中国这一认同度高达98% [10] - 87%的受访者认为动员社群是放大品牌影响力的有力杠杆 [10] - 88%更倾向于让创意从社交和社群出发,而不是先做传统广告再在社媒上激活 [10] - 44%的CMO认为若品牌主张不明确,就会妨碍他们在不确定环境中快速应对并影响业绩 [10] - 86%的CMO认为当今的品牌需要可以被众多合作者与共创者讲述并传承的强大叙事 [10] 影响者营销与内容策略 - 90%的CMO认为社交与影响者内容带来的互动度高于传统广告,89%认为真实、接地气的创作者比名人更能带来效果,在中国这一比例高达96% [11] - 88%的受访者表示会用影响者来提升在AI驱动搜索中的可见性,86%会用影响者做品牌测评与口碑管理 [11] - 39%的受访者计划把20%–30%的营销预算投向社交/影响者渠道,另有27%打算投入超过30% [11] - 87%的受访者表示需要为所有社交渠道提供定制化内容,这给规模化生产带来了压力 [11] - 87%认为企业将需要产出更多内容,并且同样有87%认为必须为各个社交平台提供量身定制的内容 [18] 文化塑造与创新投入 - 81%的受访者认同通过文化来建设品牌的趋势,但缺乏足够成熟的案例可供借鉴 [12] - 40%的受访者认为不清楚品牌应如何或在哪里以可信的方式介入文化是当前营销面临的一大挑战,同样有40%的人觉得以文化节奏快速响应对其团队来说很难做到 [13] - 40%的营销从业者计划在2025/2026年将20%–30%的营销预算投入创新 [14] - 90%的CMO明确表示希望将创新聚焦于最紧迫的业务挑战,而非作为边缘性试验 [14] - 47%的CMO认为由市场/营销团队主导的创新可以推动企业整体变革并展现新的可能性 [14] 品牌体验与信任构建 - 86%的CMO认同当今的品牌通过体验构建,但同时有73%担心AI可能会削弱品牌体验的影响力 [16] - 90%认为工艺与设计对保持品牌差异化至关重要,在中国这一比例高达98% [18] - 89%的受访者强调在代理式AI环境下信任与品味更为重要,90%认为强烈的品牌偏好对保持购物篮地位至关重要 [20] - 超过一半的受访者把在假资讯与普遍怀疑的环境中建立消费者信任列为实现业务目标的主要障碍之一 [20] - 88%的营销从业者认为常常低估情感在推动根本性增长中的力量 [20] 算法环境与营销策略 - 87%的受访者认为算法对人们看到的内容与购买决策影响越来越大,在中国这一比例高达97% [6] - 在算法主导的生态中,成功来自于引导趋势而非被动追随,盲目追逐热点只会带来效果递减、成本上升,且传播力减弱 [6] - 接触已有粉丝群并借力触达新受众被视为在社交媒体上的首要机会,同时有87%表示更愿意根据用户的兴趣和社群来定向,而不仅仅依赖年龄层或购买行为 [10]