红杉汇
搜索文档
又到年底,绩效考核该怎么做? | 首席人才官
红杉汇· 2025-11-12 08:05
绩效管理的核心认知纠偏 - 绩效优秀不等于自动晋升 当前超出职级的预期表现仅是更高职级成长的起点 需区分当前胜任与更高阶准备度[7] - 绩效评估不等于直接加薪 薪酬调整受预算规则和跨部门绩效校准等多重约束 与评估时间节点和目标不同[7] - 绩效管理不是年终一次性工作 依赖模糊记忆的年度评估不公平低效 应成为全年持续沟通的过程[8] - 绩效管理本质是评估表现 核心定位是员工与管理者协同确认的建设性书面记录 聚焦行为、方式、价值观与价值创造 而非单纯评级工具[8] - 64%的员工认为绩效评估完全是浪费时间无助于提升工作表现 仅32%的高管认为当前体系能有效支持人才决策[8] - 企业每年因绩效评估损失的工时成本高达240万至3500万美元 仅关注产出数据会导致无效忙碌[9] - 仅约26%的企业认为其管理者在激发团队绩效方面非常有效 管理者只将13%的时间用于人才培养[9] - 仅有47%的员工清楚自己的工作职责 从岗位导向到技能导向的转型期使传统工作描述面临挑战[9] 构建有效绩效管理的基础框架 - 明确标准是关键 基于目标与理念设计绩效管理战略 而非流程与模式 明确流程目的并摒弃无关部分[10] - 绩效管理可以有多种目的包括人才培养和辅导 可将发展性沟通与绩效评估脱钩并融入日常工作[10] - 结合行业标准借助AI工具与资深员工经验 短期内完成初稿约80%准确率即可起步 再通过全员研讨优化[15] - 组织各职级员工逐行梳理明确职责、行为标准与优秀的具体体现 累计投入不超过2天即可形成落地文档[15] - 让员工与管理者共同参与流程制定并赋予决策权 建立基于数据与证据的透明评估体系以建立信任[15] - 用一对一的会谈作为全年绩效的记忆存储点 用纸质总结笔记为员工留存书面记录避免年终遗忘[15] - 记录内容包括超出预期的成就、践行价值观事例、每周骄傲成果、重点工作与职业目标、待解决的挑战及反馈[15] 绩效目标的动态设定与追踪 - 目标设定优先采用季度目标 90天周期的规划更清晰务实 员工对短期目标的把控力更强能及时调整适配变化[12][15] - 由员工自主制定目标 管理者仅提供护栏避免目标过易或过难 确保目标兼顾个人职业发展与公司需求[15] - 目标每月或每季度更新追踪 明确未达目标和未达预期之间的关联 意外导致目标无法完成不意味着没达到职级预期[15] 超越流程的人力效能工程系统 - 要最大化发挥人力效能需跳出单纯绩效管理流程 采取更全面长期的举措将人力效能工程融入日常工作场景[13] - 打造一套系统性驱动人力价值与产出质量的体系 意味着建立完整的人力效能战略而不仅是一套评估标准[13] - 企业文化必须同等重视业务成果与人才成长以实现人力效能倍增效应[14] - 具备成熟结构设计能力的组织其变革成功率是普通公司的五倍 为身心健康重新设计工作与组织比单纯加福利效果更显著[14] 管理者角色重塑与人力流程优化 - 让管理者从打分者转变为连接者与辅导者 鼓励积极协作关系并建立清晰的团队文化规范[16] - 允许冒险与失败 同时强化实时反馈习惯 既指出需要改进的地方也认可取得的成就[16] - 拥有浓厚认可文化的企业其人才管理和业务成果都显著更优[16] - 从招聘、学习到奖励与认可 各类人力实践应被重新设计以释放人的潜能 让制度更贴近个体、更多共创、更人性化[17] 科技数据与空间设计的赋能作用 - 利用AI与智能系统实现实时反馈和面向员工的学习指导 技术能直接改善人本成果尤其是幸福感[18] - 数据驱动的系统能主动发现安全隐患或不良互动以便及时处理[18] - 通过物理空间布局促进跨部门互动、融入自然元素 提升协作效率与员工幸福感进而带动绩效提升[19]
从经验主义到数据主义:“AI+体育”正在改写赛场答案
红杉汇· 2025-11-10 08:05
AI在体育数据采集与分析中的应用 - 体育场成为天然数据工厂,通过智能传感器、高速摄像头和物联网传感器实时采集运动员生理指标、动作细节和环境参数等海量数据[6] - F1赛车每辆搭载300多个传感器,每秒产生超过110万个数据点,足球训练中十分钟内十名球员用三个球可产生超过700万个数据点[6] - NBA通过光学追踪系统以每秒60帧频率捕捉球员29个关键点的3D动作数据,生成过去难以量化的"防守压力指数"[7] - 数据分析要求高时效性,F1进站分析需在2秒内完成,足球数据从捕捉到转播呈现需控制在500毫秒以内[9] - AI技术不仅能分析已发生事件,还能通过建立运动员"数字双胞胎"预测训练效果、受伤风险和辅助战术调整[10] AI对运动员训练与表现的革新 - 多支巴黎奥运会国家队使用AI进行日常训练,中国国家跳水队借助大模型技术实现实时打分和量化分析,为运动员定制训练方案[12] - AI成为体育医学革命性工具,通过分析训练数据、身体指标和历史伤病记录预测潜在受伤风险,使受伤概率降低[12] - 美国公司volley.ai开发AI训练器,适用于网球、板球等运动,可模拟专业选手动作为运动员提供赛级陪练服务[12] - 训练方法从依赖经验直觉转向数据驱动,推动训练科学化革命[12] AI在赛事运营与用户体验的升级 - 德甲联盟批准俱乐部接入uniqFEED虚拟广告技术,实现区域化定制广告内容,为俱乐部开拓新的收入渠道[14] - 亚马逊云科技为F1比赛提供Track Pulse系统,实时呈现车手对决、冠军概率预测和最高速度瞬间等精彩时刻[14] - 2022年卡塔尔世界杯使用半自动越位技术,通过12个专用摄像头和传感器每秒500次追踪足球和球员29个数据点,将判罚准确率提升至前所未有的高度[16] - AI催生新职业需求,NBA骑士队将数据质量分析师转型为全职人工智能解决方案架构师,未来需要具备AI工具使用能力的复合型人才[16] AI在大众健身领域的拓展 - 智能健身产品FITURE魔镜通过摄像头和传感器捕捉用户运动轨迹,其智能运动追踪系统能识别最多33个骨骼点,提供接近线下教练指导的实时动作反馈[17] - AI算法可根据用户运动目标和身体状况量身定制训练计划,让专业级运动指导进入寻常百姓家[17] - 社交平台通过数据分析为运动爱好者匹配能力相当的云队友,组织线上挑战赛,配合智能算法生成的个人进步曲线和好友排行榜提升健身趣味性和持续性[19] AI与体育融合的挑战与未来展望 - 数据隐私与伦理边界成为首要关切,需要建立完善的数据治理框架平衡数据价值与个人隐私保护,防止运动员沦为数据透明人[21] - 技术公平性问题凸显,资源雄厚组织能部署先进AI系统,而中小俱乐部难以跟上技术发展步伐,可能需要联赛管理机构引入技术使用规范或共享平台[21] - 生成式AI将参与创新训练方法与战术体系,脑机接口帮助运动员精准掌控肌肉状态,元宇宙概念将重塑观赛体验让全球观众沉浸于虚拟座席[22] - 体育的核心始终是人的拼搏与超越,关键时刻的直觉选择、道德判断和主观能动性才是体育精神的灵魂所在[23]
从“超级智能”到“未来之地”:人类文明的终极追问 | 红杉Library
红杉汇· 2025-11-07 08:04
文章核心观点 - 人工智能的终极挑战是对人类精神文明的深刻拷问,已超出单纯技术范畴[6] - 微软(中国)CTO韦青提出5项任务,帮助人类适应即将到来的超级智能时代[2][6] - 人类需提升“能所之辨”能力,树立理性工具观,坚守人性,方能在超级智能时代拥有未来[2][3][21] 机器祛魅 - AI本质是基于传统数学原理与“集成创新”的工具,其算法原理未超出存在上百年的线性代数、微积分、概率论[8] - 当前最火爆的人工智能计算加速卡,核心算子仅是与实现GEMM矩阵相乘有关的乘法和加法计算[8] - 为成为智能技术的主人,人类需掌握线性代数、微积分、概率论等基础知识,并具备语言学与认知神经科学基础,不被机器表面能力魅惑[8][9] 智慧升华 - 根据DIKW信息金字塔框架,智能机器可取代从数据、信息到知识的工作,人类真正的精神家园在智慧及人生目的和意义领域[11] - 人类智慧应表现为善于利用不同特长的机器处理问题,将确定性任务交给确定性算法,思索性任务交给概率性算法[12] - 真正的突破可能来自经过智能机器加持的认知科学进步,哲学现象学与神学唯识学可能为认知探索带来新思路[13] 人机相乘 - “人机相乘”概念是主观能动性决定论的,人类可通过自身努力弥补技术条件不足,例如能力值A"=2与最低技术能力x=70相乘结果为140,高于能力值A'=1与最高技术能力z=130相乘的结果130[16] - 相乘的人机关系比相加关系更能体现实际效果,再强大的技术能力也需要有能力的人驾驭才能发扬光大[16] - 恰当的语言应用能帮助客观区分技术差异与技术应用效果差异,更有效找到提升能力的路径[17] 坚守人性 - 机器越先进,人性越珍贵,需牢记“人是目的”,不混淆人与机器的本质区别[3][18] - 在技术浪潮中不应忽略大众,当热议AGI时不应忘记人类对自身意识产生尚众说纷纭[18][19] - 人类是因终身学习而生存的物种,需警惕自身而非机器,因为机器的知识均从人类处学习[19][21] 少安毋躁 - 此任务关乎人的精神境界,需认清AI是人类的一面镜子,人类高尚则机器高尚,人类下流则机器下流[21] - 人类应主动驾驭机器,秉持“无限游戏”原则,坚守人性并互帮互助[21] - 丧失终身学习能力、将人生决定让渡给机器的人类没有未来[21]
苹果、爱彼迎、百事CEO亲述:CEO该如何对抗孤独?
红杉汇· 2025-11-06 08:04
高管孤独感的普遍性与影响 - 哈佛医学院教授指出至少40%的高管因精力不济和孤立感正考虑离职[4] - 2022年德勤研究显示约70%的最高管理层领导者因身心健康问题考虑辞职[4] - 许多CEO认为承担的工作是孤独的[4] 爱彼迎CEO布莱恩·切斯基的观点 - 切斯基描述自己有一个孤独的童年并在成为CEO后心理健康状况恶化[7] - 成为CEO后越接近顶峰同行的人越少对此感到没有准备[7] - 建议新兴管理者分享决策权与管理权以分担创业的心理负担[7] - 认为当前可能是人类历史上最孤独的时期之一[7] 百事公司前CEO卢英德的观点 - 卢英德常感到孤立无人倾诉因涉及公司机密不能与配偶朋友董事会员工讨论[9] - 选择转向内心通过自言自语照镜子发怒掉泪来作为情绪出口[9] - 强调必须小心选择情绪出口对象避免被利用[9] 苹果公司CEO蒂姆·库克的观点 - 库克承认CEO是孤独的工作并曾有过失盲点可能影响成千上万员工[12] - 强调管理者需跳出思维定式让身边围绕能激发出最佳状态的聪明人[12] UPS CEO卡罗尔·托梅的观点 - 托梅在执掌750亿美元公司前未预料到孤独程度但后来发现异常孤独[15] - 高管团队会等她离开会议室后进行汇报必须习惯这种现实[15] Insomnia Cookies CEO塞思·伯科维茨的观点 - 伯科维茨告诫CEO职业具有沉重分量在艰难时期非常孤独[17] - 建议通过真诚有意义的联系找到同志情谊导师指导和社区感来对抗孤独[17]
夺回大脑的“选择权”,从让时间慢下来开始 | 红杉汇内参
红杉汇· 2025-11-05 08:05
时间感知的神经科学原理 - 时间感知并非由专门器官负责,而是由多个负责追踪运动、注意力、记忆和身体内部节律的神经系统联合构建的分散、灵活且高度依赖情境的过程[6] - 大脑通过记录“发生了多少不同的事”来感知时间,情境变化越多,产生的“心智时间点”就越多,时间感觉更长,反之则感觉时间模糊[8] - 大脑深处的起搏器系统通过发出规律脉冲来感知时间,专注时记录的脉冲更多使时间感觉更慢更充实,分心时记录的脉冲少则使同样时间感觉更短[9] 时间加速感的原因 - 新奇效应表明,当新鲜或意外事件发生时,大脑会投入更多注意力并形成更丰富记忆,使当下和回忆中的时间显得更长,成年人生活更可预测导致此效应减弱[7] - 可预测性会压缩时间感知,大脑对熟悉经历投入较少注意力,存储时保留细节少,导致同样时长在熟悉后感觉更快[10] - 长期高频刺激导致大脑麻木,需要更强刺激才能保持专注,使其他活动显得缓慢无聊,从而加速时间感知[17] 延长时间感知的策略 - 通过微小的变化重拾新奇感,如更换座位、尝试新路线、品尝新调料或学习新词,以在大脑世界模型中创造偏差来减缓时间[11][15] - 用感官沉浸当下,如留意触摸质感、仔细听环境音、观察光线变化,能激活负责身体感知的脑岛,减缓时间感知[12] - 创造“异常刺激时刻”,如听新歌单、进行即兴聊天、阅读有趣文章或更换灯光,通过独特显著的刺激让时间感觉更长[14] 注意力机制与分心管理 - 专注力是前额叶皮层、默认模式网络和显著性网络协同作用的结果,前额叶皮层负责抑制冲动,显著性网络判断信息优先级,默认模式网络在走神时活跃[21] - 在分心冲动出现时,通过贴标签如“这是分心冲动”来重新激活前额叶皮层,帮助重新决策是否切换任务[19] - 通过换“频道”满足新鲜感需求,如散步、伸懒腰、听老歌,而非直接改变习惯,以避免耗尽注意力[20][22] 提升专注力的长期方法 - 审视并减少高刺激信息输入,如少刷手机,让神经系统重置并重新记起“安静”的感觉,以降低专注基准线[24] - 主动体验无聊,如静坐观察窗外或散步不戴耳机,让不适感转化为平静,为创意生长提供“留白”[25] - 刻意训练专注力,如读5分钟书、写10分钟日记或专注看一段视频,通过小幅持续专注为大脑重建基础[26]
过去四分之一世纪,这些发明改变了世界 | 红杉爱科学
红杉汇· 2025-11-03 08:05
年度最佳发明榜单 - 《时代》杂志推出2025年“最佳发明榜单”,包含宇树Unitree R1人形机器人、比亚迪海鸥等300项创新成果,并首次设立“Best Inventions Hall of Fame”特别榜单,回顾自2000年以来最具代表性和持久影响力的科技发明[2] 扫地机器人行业 - 2002年推出的圆盘形扫地机器人通过传感器实现智能导航,依靠充电电池提供动力,能够自主穿梭家庭空间,高效吸除灰尘并清洁床底、沙发下等死角,重新定义家庭清洁模式[6] 视频平台行业 - YouTube平台自2005年4月开始托管视频,初期每天上传7万个视频,如今每天上传量超过2000万个,其内容生态强调真实性标准[7] 智能手机行业 - 苹果iPhone于2007年6月发布,当年售出140万部,全球累计销量突破30亿部,其设计理念强调优秀设计与技术同等重要,成为移动互联网时代的标志性产品[9] 公共交通行业 - 蒙特利尔公共自行车系统整合太阳能充电站、RFID标签追踪、全封闭防护部件等技术,能抵御恶劣天气和人为破坏,成为伦敦、纽约、芝加哥等全球城市的建设样板[12] 科学研究设施 - 大型强子对撞机深埋地下100米,环形轨道长17英里,通过质子和离子接近光速碰撞探索微观世界,2012年成功探测到希格斯玻色子[15] 照明行业 - LED灯泡耗电量控制在10瓦以内,使用寿命达25,000小时,相当于传统灯泡的25倍,推动全球照明领域的节能转型[18] 人工智能与计算行业 - IBM超级计算机Watson体型相当于10个冰箱,每秒可执行80万亿次运算,在智力竞赛节目中夺冠,推动大众对人工智能技术的认知[19] 太空探索行业 - 好奇号火星车重1吨,科学仪器重量为前代10倍,在火星工作13年,发现宜居证据、水的痕迹和有机分子[20] 游戏硬件行业 - Switch通过掌上平板、侧滑控制器和底座连接模式实现多场景游戏需求,销量超1.53亿台,成为史上第三畅销游戏机[22] 太空观测行业 - 詹姆斯·韦伯空间望远镜耗资100亿美元,重7吨,主镜直径21.3英尺,在距地球100万英里的拉格朗日点部署,红外成像系统可穿透宇宙尘埃,传回宇宙诞生初期的图像[24] 人工智能技术 - ChatGPT在2022年11月推出后,次年1月月活用户达1亿,GPT-4在律师资格考试中从超越10%考生提升至超越90%考生,展现AI技术的迭代实力[25] 娱乐设施行业 - 拉斯维加斯Sphere建筑高366英尺,外墙由123万个LED灯珠组成,内部拥有16万平方英尺曲面屏幕,2024年成为全球票房收入最高演出场馆,收入4.205亿美元[26] 制药行业 - 诺和诺德的司美格鲁肽原本为2型糖尿病患者研发,通过帮助减重控制血糖,其突出的减重效果使其成为备受追捧的处方药,重新定义减重与健康的关联[27] 医疗科技行业 - 双神经旁路技术通过在大脑内植入微芯片,构建思维与手臂动作的双向连接,让瘫痪患者重新掌握动作并感知触感,为全球瘫痪患者群体带来希望[28]
跨越万里山海,中国医疗创新获世界点赞|Healthcare View
红杉汇· 2025-10-31 08:05
精锋®手术机器人远程手术突破 - 中国自主研发的精锋®手术机器人完成跨越12035公里的远程手术,创下吉尼斯世界纪录,双向通信延迟仅199毫秒 [2] - 手术由巴西医生在科威特远程主刀,为患者实施经腹腹股沟疝修补术,出血量不足10毫升,并成功完成双向对调手术 [4] - 超低延迟为手术精准性和安全性提供保障,展现了系统卓越的技术性能 [4] 剂泰医药AI赋能新药研发进展 - 剂泰医药自研的AI驱动候选药物MTS-004顺利达到III期临床研究主要终点,成为国内首款完成III期临床的AI赋能制剂新药 [5][6] - MTS-004是中国首款且唯一完成III期临床试验的PBA口服治疗药物,采用口腔崩解片剂型,无需用水即可迅速溶解,旨在填补国内治疗领域空白 [8] 心泰医疗心血管介入器械创新 - 心泰医疗子公司自主研发的GuiTracker®硬导丝获批上市,主要应用于心血管及外周大血管介入手术,用于建立经皮进入通路 [10] - 该产品核心优势在于卓越的高支撑性,可为瓣膜、支架等介入器械提供强力稳定支撑,解决复杂血管病变中传统导丝支撑力不足的临床难题 [10] 西比曼生物科技CAR-T疗法学术认可 - 西比曼生物科技的核心产品C-CAR168的I期临床试验数据被2025年美国风湿病学会年会评选为突破性摘要 [11][12] - C-CAR168是一种靶向CD20和BCMA的自体双特异性CAR-T疗法,旨在清除产生自身抗体的细胞,为治疗难治性自身免疫性疾病提供新可能性 [13] M20 Genomics单细胞技术应用 - M20 Genomics的VITA高通量单细胞全长转录组平台被选为中国脑多组学图谱计划的核心方法,用于对珍贵脑部样本的单细胞核转录组研究 [14][19] - VITA平台采用随机引物技术,对RNA质量容忍度高,适用于冷冻及FFPE样本,能够最大化利用脑组织样本,解决了RNA降解问题 [19] 浩微医疗栓塞微球研究成果 - 浩微医疗新型二代载药栓塞微球UniPearls®的动物实验研究成果在核心期刊发表,评估了其用于肝动脉栓塞术的有效性与安全性 [20][21] - 动物实验显示UniPearls®微球在输送性能、栓塞效果及安全性方面表现优越,具有输送顺畅、栓塞持久稳定、末梢栓塞更彻底等特点 [24] 红杉中国医疗健康领域投资布局 - 红杉中国在医疗健康领域投资超过200家高成长性企业,覆盖创新药、医疗器械、医疗服务等多个细分领域 [25] - 其中超过45家被投企业已在全球主要证券交易所完成IPO [25]
AI大家说 | 你的商业模式是否可行?这6个问题无法回避
红杉汇· 2025-10-30 08:03
文章核心观点 - AI企业的可持续发展关键在于商业模式和产品形态,而非单纯追求大模型技术指标 [3] - 创业者需通过“蛋糕模型”的六个核心问题,系统评估自身商业模式的可行性与风险 [3] - 真正的差异化在于构建自身智能能力与反馈闭环,而非仅依赖租用外部模型 [8] - 企业需以公共服务心态应对AI成为社会基础设施后的广泛影响 [10] - 可持续增长依赖于构建防御力、积累真实数据及建立用户信任 [21][23][34] 价值空间 - 价值空间需评估产品是否创造价值以及是抢夺存量市场还是创造增量市场 [6] - 许多大模型产品旨在通过提高生产效率来抢夺现有蛋糕,但其市场潜力仍需验证 [6] - 公司需明确是在“构建智能”还是“租用智能”,差异化在于形成数据、反馈和用户交互的闭环学习回路 [7][8] - 当AI被数百万人使用时,它已成为社会基础设施,创始人需以公共服务心态设计系统 [9][10] 切入模式 - “锐利”的产品形态能精准命中用户痛点,如ChatGPT通过直观的对话模式激发大众兴趣 [13] - 产品形态与商业模式必须匹配目标用户的刚需场景,才能有效切入价值空间并实现盈利 [13] - 产品的交互逻辑会塑造用户行为,AI应帮助人更好地思考而非仅追求效率 [14][15] - AI创业是跨学科问题,团队需融合机器学习、心理学、社会学与设计,理解人的能力是核心竞争力 [16] 资源与壁垒 - 企业需建立高壁垒以抵御竞争者,许多AI产品仅是主流大模型的套壳应用,易被通用能力升级所覆盖 [18][19] - 防御力体现在模型层面的反馈数据和组织层面的文化,缺乏防御力的速度会导致用户流失或伦理丑闻 [20][21] - 可持续增长假设需基于持续价值而非技术新鲜感,真正的护城河是不断积累的真实使用数据 [23] 盈利模式 - 盈利模式中的定价方式可分为成本加成定价和价值分享定价两极,企业需在两者间找到平衡点 [25][26] - 市场竞争性影响定价平衡点,长期缺乏清晰盈利模式且卷入价格战将使许多AI公司难以生存 [26] - AI产品存在易变性与不确定性,企业面临可见成本之外的未知成本,对成本可控性提出挑战 [26] 生态协助 - 新技术普及需生态价值链配合,通过商业模式创新创造新细分赛道、构建新生态系统 [28][29] - 硬科技企业需找到稳定运营的生态,使技术在应用场景下持续迭代,设计出能释放价值的交易结构 [29] - 成熟产品有机会催生全新生态,彻底颠覆原有价值链条,以更大规模实现商业价值 [29] 安全与开放 - 安全风险重点关注数据泄露,包括组件漏洞导致的敏感信息泄露和提示词操控引发的机密数据泄露 [32] - 在AI时代,最稀缺的资源是信任,而非算法或算力,可信赖是可解释性带来的核心壁垒 [34][35] - AI系统决策责任需明确责任链,通过建立内部日志、影响假设记录和伦理审查流程来完善决策 [36][37] - 可解释性是安全前提,需建立事后可追溯机制,使任何输出都能解释到责任人和训练数据 [38] - AI安全与开放需平衡,最健康状态是可控透明,早期建立数据审计接口为未来合规留空间 [39]
AI时代,组织人才出现断层怎么办? | 首席人才官
红杉汇· 2025-10-28 08:05
AI对人力资源管理的影响 - AI显著提升人才培养与招聘效率但发展尚未完善[3] - AI招聘系统依赖简历筛选可能遗漏精通AI但缺乏传统资历的新型人才[3] - AI完成基础流程化工作可能导致组织人才断层[3] AI对员工职业发展的挑战 - AI处理入门级任务使初级员工失去技能提升机会[5] - 职业成长依赖重复实践和错误纠正的过程被AI打破[6] - AI接手常规分析工作阻碍新人培养模式识别和情境理解能力[6] - 资深员工退休与新人培养不足形成企业监管缺口[6] - 自动化系统普及导致基础技能下降增加系统性风险[7] - 职业发展阶梯消失削弱企业长期抗风险能力[7] 企业人才培养的新策略 - 设立混合岗位让新员工与AI协作学习处理特殊情况[7] - 扩大导师计划促进资深员工与新人知识传递[7] - 投资培训项目通过模拟实践加速员工成长[7] - 系统识别面临风险的关键技能领域和核心员工退休计划[7] - 设计结合AI辅助的新入门级岗位接触复杂问题[8] - 建立结构化导师机制和经验文档体系[8] - 通过岗位轮换和跨部门项目培养全面业务视野[8] - 设立量化指标追踪职业成长与知识传承成效[8] AI时代招聘流程的变革 - 混合智能成为战略优势改变公司运作模式[10] - AI缩小从纸面合格到实际交付的差距要求重新定义人才评估[10] - 招聘应从简历筛选转向实际问题解决测试和真实场景试作项目[10] - AI招聘工具存在历史数据偏见和可及性鸿沟问题[11] - 招聘流程应贴近真实工作场景注重适应力沟通力和快速学习能力[11] - AI素养应从加分项变为基础技能纳入新员工培训[12] - 定期审查招聘算法指标消除对非传统背景求职者的偏见[12] - 建立非传统人才数据库提供能力证明通道[13] 未来人才特征 - 最优秀候选人可能无名校名企背景但具备AI实战经验和垂直领域积累[13]
DeepSearch题库和榜单更新,最新题库已开源|xbench月报
红杉汇· 2025-10-27 08:04
评测概览 - xbench对DeepSearch评测集进行了更新升级,构建了全新的100道题目,发布DeepSearch-2510版本 [1][2][8] - 评测结果显示,ChatGPT-5 Pro优势显著,评测分数断档式领先,准确率达到75+;SuperGrok位列第二档,准确率为40+;其他公司的Agent产品多在30-40分档位,无明显差距 [1][3] - DeepSearch-2510题库已经开源,并采用长青评估机制,每月持续汇报最新模型的能力表现 [1] 产品性能与成本分析 - 在准确率方面,ChatGPT-5 Pro以75+的分数领先,SuperGrok Expert为40+,而包括Minimax Agent、StepFun Research等在内的多家产品准确率在35+,Genspark Super Agent为30+ [3] - 在成本方面,完成每个任务的平均花费从免费到约2美元不等,其中StepFun Research、Doubao (Deep Research)和Coze Space为免费,ChatGPT-5 Pro约为0.085美元,而Fellou成本最高,约为2美元 [3] - 在时间效率方面,每个任务的耗时从2-3分钟到8-15分钟不等,Coze Space响应最快(2-3分钟),而Minimax Agent、StepFun Research等耗时较长(8-15分钟)[3] - 用户体验甜区定义为每道搜索题目成本在0.25美元以下且响应时间在8分钟以内,目前ChatGPT-5 Pro、SuperGrok Expert、Doubao等产品位于该重叠区域 [6] 评测集更新细节 - 新题库全面增加难度,原因是旧版本中多家公司产品分数已达70+,ChatGPT-5 Pro更达80+,已无法有效检测模型能力提升,新版本主流厂商(除ChatGPT外)分数在40分左右,为迭代预留空间 [9] - 新题库增加10道多模态题目,要求Agents识别图片或视频内容进行推理 [9] - 新题库增加20多道需要动态交互获取信息的工具使用题目,以适配工具使用能力的进展,例如输入筛选条件、使用地图服务等 [9] 领先产品优势分析 - ChatGPT-5 Pro在评测分数上断档式领先,主要优势体现在幻觉率大幅降低和工具使用能力极强 [12][13] - 在降低幻觉方面,ChatGPT-5 Pro规划能力极强,能快速定位并召回核心信源,对冲突信源进行交叉验证,并列出问题不同理解下的相应回答 [13] - 在工具使用方面,其能够灵活同网页进行动态交互,如动态加载、输入筛选条件等,从而获取更丰富精确的信源 [12] - SuperGrok基于Grok-4,独列第二档,猜测主要原因是Grok-4本身模型推理能力的优势 [14] 行业动态与产品演进 - 对比2505题库的评测结果,大部分公司的产品在几个月内搜索能力有较大幅度提升 [16] - ChatGPT从2505题库5月的“未提供分数”提升至9月的80+,提升来自于模型更新,ChatGPT-5 Pro相比前代在幻觉上大幅降低 [17] - SuperGrok从50+提升至70+,提升来自于模型更新,Grok-4相比Grok-3在推理能力上大幅提升 [17] - Doubao从50+提升至60+,提升来自于深度研究功能上线 [17] - 国内开发的Agents多在30-40分档位,无明显差距,原因在于基模能力差距或无法同基座模型协同优化 [19] - 部分产品如Doubao和Gemini更追求响应效率,在推理资源上投入保守,导致评测分数不及竞品但时间优势明显 [19] - Gemini在中文信源上有明显短板,基本定位不到正确信源,是分数偏低的核心原因 [19]