Supervised Fine - Tuning (SFT)

搜索文档
AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
虎嗅· 2025-07-25 12:16
一、Perplexity AI的引用规范与监督机制 - 公司明确标注信息来源,不声称拥有内容版权,核心功能是帮助用户更易获取并总结互联网信息,同时清楚展示来源 [6] - 模型训练时被要求避免直接复现原文,而是归纳总结不同来源观点,结合监督微调(SFT)和人类反馈强化学习(RLHF)技术优化 [10] - 产品设计上不支持用户直接粘贴URL要求总结,但承认当前技术无法完全杜绝滥用场景,需持续迭代防护措施 [12][14] 二、AI搜索与传统搜索的差异化路径 - 与传统搜索引擎如Google相比,Perplexity用户平均查询长度达10-11个词,更倾向于直接回答完整问题而非返回链接列表 [17] - Google商业模式依赖搜索广告(单季度收入450亿美元),其激励机制促使用户多点链接,而Perplexity定位为AI原生信息检索工具 [16][18] - 公司近期新增NFL实时比分功能,通过与体育数据提供商合作确保准确性,并计划扩展至深度数据分析如球员对比、历史表现等 [19][21] 三、产品功能扩展与用户习惯重塑 - 根据用户日志数据优先开发金融垂类功能,支持市场调研、投资组合管理等需求,同时解决体育等领域的信息幻觉问题 [23] - 目标覆盖从学术研究到日常查询的全场景,包括本地搜索、天气、购物等基础需求,以推动用户从传统搜索转向AI原生交互 [24] - 近期密集推出数十项新功能,但强调策略基于用户需求分析而非盲目试错,例如金融方向因核心用户群体需求而优先落地 [22][23] 四、内容合作与商业模式探索 - 推出Publisher Program,承诺与媒体分享广告收益,若其内容被引用为答案来源,同时提供API支持媒体站内部署AI助手 [26][31] - 区分两类AI公司:一类训练模型内化内容,另一类实时检索公开信息生成回答,Perplexity属于后者且不将内容纳入训练权重 [27][28] - 广告变现被视为长期方向,但需平衡用户体验与商业利益,预计需两年时间完善机制,当前API成本每4-5个月下降50% [35][37] 五、行业竞争与法律争议回应 - 回应道琼斯诉讼时强调开放合作态度,指出与Fortune、Time等媒体已有合作案例,诉讼方News Corp亦与OpenAI存在协议 [25] - 法律层面主张"事实不受版权保护",认为信息自由传播符合科学精神,但承认当前法律框架存在模糊地带需通过案例明确 [33][34] - 否认与新闻媒体直接竞争,用户使用场景多为分析新闻影响(如股票决策)而非获取原文,强调产品定位差异 [30]
深度|Perplexity CEO专访:AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
Z Potentials· 2025-07-25 11:24
Perplexity AI的核心定位与产品理念 - 公司定位为AI原生搜索引擎,专注于通过归纳总结而非直接复制来提供信息,并明确标注来源[6][7] - 产品设计初衷是改变传统搜索习惯,平均查询长度达10-11个词,远高于Google的2.7个词[15] - 强调事实本身不应被版权保护,主张信息应自由传播的价值观[10][28] 技术实现与内容处理机制 - 采用监督微调(SFT)和基于人类反馈的强化学习(RLHF)技术防止直接复制原文[11] - 每句话标注来源信息,包括页面顶部source panel和文末脚注[7] - 明确反对用户通过"总结URL"等方式滥用产品功能[12][13] 商业模式与行业合作 - 推出Publisher Program,承诺与内容方分享广告收益[23][26] - 区分两类AI公司:训练基础模型型与实时检索型,自认属于后者[23] - 预计API成本每4-5个月下降一半,未来可能再降10-50倍[30] 市场竞争策略 - 指出Google季度搜索广告收入达450亿美元,但其商业模式依赖多点链接[14] - 认为与Google非零和博弈,广告预算可能从100%Google变为95%+5%分配[31] - 优先覆盖金融、体育等垂直领域,解决用户在其他搜索引擎的痛点[20][21] 产品功能演进 - 新增NFL实时比分功能,与专业数据提供商合作[17][18] - 根据日志数据持续优化功能,早期用户主要为学术研究型人群[19][20] - 目标覆盖搜索全场景包括本地、天气、购物等基础需求[21] 版权争议应对 - 回应News Corp诉讼,强调已建立合作机制并当天做出正式回复[22] - 主张产品非新闻工具,用户更多是查询新闻对自身影响而非获取原文[25] - 为媒体提供API支持和企业版产品,帮助其提升内容创作效率[27]
深度|ARR过亿美金AI招聘00后创始人:未来最有价值的是拥有“反常识性观点”和“品味”的人,人们最应该优化自己的适应性
Z Potentials· 2025-04-24 11:10
AI赋能人才评估的新范式 - Mercor通过训练模型预测人才胜任力,准确率超越人类判断,自动化简历审阅和面试流程[3] - 系统已应用于顶尖AI实验室招聘数千名工作人员,这些人员正在训练下一代AI模型[3] - 评估范围覆盖所有具有经济价值的技能,从咨询、软件工程到视频游戏领域[5] - 强化学习效率提升使模型能通过学习评估任务掌握新能力,关键在于设计优质评估任务[4] 人才评估的行业变革 - 人类数据市场从众包低技能工作转向筛选顶尖人才,推动模型能力边界[5] - 评估重点从学术化"零样本测试"转向经济价值导向的实际工作能力评估[18] - 软件工程师评估需包含PR写作、跨团队协调等全方位工作表现,远超单一技能测试[18] - 行业表现呈幂律分布,投资业最显著,工厂工作趋近正态分布,软件工程介于两者之间[7][8] 模型评估优势领域 - 文本可测量领域表现超人类,如面试答题记录分析[8] - 高体量标准化招聘流程最易自动化,20人同岗位评估效果优于20种不同岗位[8] - 在线作品信号利用不足,如GitHub项目、个人博客等未被传统招聘充分挖掘[10] - 隐藏信号识别能力突出,如国际背景与协作能力的关联性分析[11] 劳动力市场未来趋势 - 知识型工作替代将引发重大政治问题,可能催生民粹运动[13] - 实体世界自动化速度慢于数字世界,人际互动类工作留存率更高[14] - 适应性学习能力成为保持经济价值的关键,快速转型优于单一技能深耕[15] - 可验证任务最易被攻克,如数学和代码,而"品味"类能力最难自动化[15][20] 评估系统演进方向 - 按行业构建Agent评估体系,客户服务等同质化领域先行[19] - 强化微调(RFT)数据效率极高,几百样本即可实现应用层定制[39] - 模型未来将参与评估标准创建,人类负责验证领域专家制定的基础标准[27] - 医疗等行业出现专家评估反超现象,模型表现可能超越普通医生基准[28] 企业招聘策略建议 - 早期阶段优先人才密度,质量重于招聘速度[45] - 数据驱动分析成功员工特质,建立可衡量的招聘标准[45] - 试用期评估数据共享将提升市场效率,但目前存在隐私壁垒[48] - LinkedIn聚合初级信息,但面试等深层流程尚未实现集中自动化[49] 全球劳动力市场展望 - 消除匹配低效将促成全球统一市场,候选人与公司实现最优匹配[45] - 未来市场由人类与Agent混合构成,共同解决客户问题[45] - 顶尖人才收入呈幂律分布,前沿评估任务创造者价值最大化[30][31] - 平台需提供免费工具(如AI模拟面试)吸引顶尖人才,构建网络效应[42]