AI偏见
搜索文档
一个让VC直接打钱的电话与其背后的生意
虎嗅APP· 2026-01-15 17:45
文章核心观点 - 文章介绍了一家名为Boardy AI的初创公司,其通过AI Agent以“无界面”的语音电话形式,充当创业者与投资人之间的“AI超级连接者”,成功完成了一轮由AI自主主导的融资,并阐述了其产品逻辑、商业模式及创始人背景[5][6][7][8] 产品与商业模式 - **产品定位**:公司将自己定义为“AI超级连接者”,核心切入创投对接场景,充当类似财务顾问(FA)的角色,连接创业者与投资人[8] - **交互方式**:采用“无界面”策略,用户无需下载App,主要通过电话、短信、WhatsApp或邮件进行语音或文字交互,产品哲学是“少即是多”[11][12] - **使用流程**: 1. 用户通过LinkedIn私信、官网或WhatsApp申请加入,此过程用于筛选B端专业人士[14] 2. Boardy AI通过电话与用户深入交流,询问如“最近在忙什么项目”等开放式问题,并能识别用户语气中的情绪,建立信任感[16][20][23] 3. 系统理解用户“意图”并进行匹配,发现潜在匹配后,会通过AI撰写推荐语分别联系双方,且需双方都回复“同意”才会正式介绍[20][21][22] 4. 介绍完成后会进行回访,收集反馈以优化算法[22] - **商业模式**:目前对大多数用户免费,通过创始人项目积累初始用户和数据[27];半商业化尝试是“Boardy Founders Program”,向急需融资的创始人收费,承诺提供特定数量的投资人引荐,本质是将熟人介绍工业化、规模化[28][29] 融资与市场影响 - **融资事件**:公司通过AI Agent自主完成了一轮800万美元的种子轮融资,累计融资额达到1100万美元[5][7] - **市场切入点**:在社交网络被巨头垄断的红海赛道中,选择了未被充分满足的创投对接市场[8] - **范式转变**:产品实现了从“人找人”到“AI找人”的转变,是一个动态的智能体,能主动思考并安排连接,这是其最大亮点[24][25] 创始团队与公司背景 - **创始人背景**:创始人Andrew D'Souza是金融科技独角兽Clearco的前联合创始人兼CEO,Clearco曾估值超过20亿美元,其经历使其认识到人脉与资源的重要性[31] - **产品灵感**:创始人讨厌邮件和Zoom会议,偏好非结构化的电话交流,Boardy AI随意的电话体验是其个人生活方式的投射[33][34] - **技术团队**:通过收购Beavr Labs获得了Ankur Boyed和Abhinav Boyed兄弟及其团队,他们拥有生成式AI应用开发和微调模型以适应人类情感交互的经验[36][37] - **孵化与冷启动**:公司在HF0加速器孵化,创始人以学员身份加入,利用该加速器的顶级创始人网络进行模型训练和产品测试,成功解决了冷启动问题[37][38][40] 发展前景与挑战 - **发展愿景**:创始人提出了惊人的KPI目标,即Boardy促成的经济价值总量要超过瑞士的GDP(约1万亿美元)[45] - **潜在挑战**: - 需要向核心客户(早期创业者)证明能创造长期深度价值,而面向该群体的商业模式(如财务顾问、增长服务)已被证明非常有限[42] - LinkedIn被视为该赛道最危险的潜在竞争对手[43] - 曾因一场营销活动引发公关危机,AI模仿特朗普语气点评用户档案时出现性别偏见,引发了公众对AI在“机会分配”中可能存在系统性偏见的担忧[46][47] - **护城河**:用户愿意向AI透露不愿公开的私密信息(如计划离职创业、公司现金流紧张),这些数据构成了公司的护城河[44][45]
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
虎嗅· 2025-05-23 13:32
人工智能技术发展现状 - 通用人工智能(AGI)概念已从五年前需要解释发展为当前社会广泛关注的热点话题 [5][6] - 顶尖科学家如杰弗里·辛顿教授多次公开强调AI可能带来的社会风险 [8] - 当前AI技术存在幻觉、偏见等核心问题,但距离毁灭社会仍较远 [10][11] 对抗样本技术问题 - 自动驾驶系统可能因路牌上微小扰动(如胶带)而错误识别交通标志 [12][15] - 图像识别系统在添加人类难以察觉的扰动后会产生完全错误的识别结果(如将汽车识别为Hello Kitty) [18][20][22] - 大语言模型在输入细微改动时会产生完全不同的翻译结果,甚至可能被诱导输出危险内容 [31] AI偏见问题根源 - 训练数据不平衡导致模型偏见,如Google Photo将黑人误标为"大猩猩"、亚马逊招聘系统歧视女性简历 [40][45] - 大模型存在过度自信现象,ResNet模型60%情况下会给出100%确信的判断 [61][63] - 数据中隐含的社会结构信息(如职业性别分布)会被模型放大 [85][86] 算法局限性 - 主流AI算法学习的是相关性而非因果性,导致模型在未知问题上产生幻觉 [93][94][99] - 强化学习可通过设计奖励机制缓解幻觉问题,如在狼人杀游戏中使AI行为更合理 [113][116][117] - 不同研究团队使用相同数据可能得出完全相反的结论,显示算法选择的主观性 [131][132] 价值对齐挑战 - 目标函数设计缺陷可能导致AI采取极端行为(如为不饿孩子而伤害宠物) [126] - 超级智能时代可能出现"超级对齐问题",即低智能体难以控制高智能体 [129] - 国际学术界已成立专门机构研究AI安全,多位图灵奖得主联合推动安全倡议 [134][137]
速递|Llama 4突袭周末发布!Meta用2万亿参数怪兽硬刚GPT-4.5,却暗禁欧盟用户
Z Finance· 2025-04-06 15:45
文章核心观点 Meta发布新一代AI模型集合Llama 4,该系列模型有新特性和优势,但授权条款或引发争议,且在应答策略上有调整以应对行业问题 [1][2][9] 模型发布情况 - Meta在周六发布Llama 4系列,含Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth四款新模型 [1] - Scout和Maverick已通过Llama.com及Hugging Face等平台开放获取,Behemoth仍在训练阶段 [1] - Meta旗下AI助手Meta AI完成升级,将在40个国家启用Llama 4技术,多模态功能仅限英语版美国用户使用 [1] 研发推动因素 - 中国AI实验室深度求索开源模型成功,性能超Meta前代旗舰Llama模型,推动Llama研发进程加速 [1] - 据传Meta紧急组建战情室,试图破译深度求索降低模型运行和部署成本的技术路径 [1] 授权条款情况 - 欧盟境内注册或主要营业地的用户及企业被禁止使用或分发Llama 4模型,受该地区AI与数据隐私法规合规要求影响 [2] - 月活用户超7亿的企业须向Meta申请特殊授权,Meta拥有绝对审批权 [2] 模型架构特点 - Llama 4是Meta首个采用混合专家(MoE)架构的模型系列,能提升训练及查询应答的算力效率 [4] - MoE架构将数据处理任务分解为子任务,交由小型专业化“专家”模型处理 [4] 模型参数情况 - Maverick总参数量达4000亿,通过128个“专家”模型仅激活170亿参数 [4] - Scout激活170亿参数,包含16个专家模型,总参数量1090亿 [4] - Behemoth激活参数达2880亿,包含16个专家模型,总参数近2万亿 [6] 模型性能表现 - Maverick在编程、推理等测试中超越OpenAI的GPT - 4o和谷歌Gemini 2.0,但逊色于部分最新顶级模型 [5] - Scout在文档摘要和大规模代码库推理任务有优势,拥有1000万token的超大上下文窗口 [5] - Behemoth在数学解题等STEM能力评估中表现优于部分模型,但不及Gemini 2.5 Pro [6] 模型架构差异 - Llama 4全系均未采用类似OpenAI o1和o3 - mini的专用“推理”架构 [9] 模型应答策略调整 - Meta对Llama 4全系模型调优,使其更少拒绝回答“争议性”问题,回应涉及政治社会议题的提问 [9] - Meta表示新模型在拒绝回答的提示词选择上“显著更平衡” [9] 行业相关问题 - AI偏见是行业公认的技术难题,马斯克自创的xAI公司也未能造出完全政治中立的聊天机器人 [9] - OpenAI等公司持续调整模型策略,使其能应答更多过往被规避的问题 [10]