Anthropic Interviewer
搜索文档
Anthropic基于新AI工具开展大规模调查研究
搜狐财经· 2025-12-10 00:54
公司研究:Anthropic的AI使用调查与工具 - Anthropic公司近期公布了一项关于大语言模型使用情况的开创性调查,并为此创建了一个名为Clio的全新调查工具,该工具能在保护隐私的同时深入挖掘用户群体的详细信息 [2] - 该公司利用AI辅助研究,构建了名为“Anthropic Interviewer”的访谈工具,在Claude的支持下,该工具能够以前所未有的规模自动进行详细访谈,并将结果反馈给人类研究者进行分析 [2] - 该调查项目涉及情感态度研究,有超过1200名专业人士为此宏观视角做出了贡献 [2] 行业洞察:AI使用态度与主要场景 - 行业对AI的前景普遍持积极乐观态度,这种情绪在各个领域都占据主导地位,尽管存在一些例外,例如担心被取代的创意工作者 [3] - 根据调查,用户主要将大语言模型Claude.ai用于工作相关任务,特别是编程,其中约10%的回答涉及“Web和移动应用程序开发”,教育占7%,商业策略/运营接近6% [4] - 使用AI工具在职场中仍存在“污名化”问题,一些管理者和同事认为使用AI的员工是懒惰的或试图获得不公平优势,这可能导致负面反应,甚至在招聘决策中受到歧视 [5][7] 用户画像:职业分布与研究方法 - 调查回答中的职业分布显示,计算机和数学专业占37.2%,艺术和媒体占10.3%,教育和图书馆科学占9.3%,办公和行政占7.9%,生命科学占6.4%,商业和金融专业占5.9% [5] - Clio工具实现了研究人员所称的“半结构化数据收集”,这种方法平衡了结构化访谈的一致性和非结构化访谈的深度,适用于广泛的研究 [5][6]
腾讯研究院AI速递 20251208
腾讯研究院· 2025-12-08 00:01
生成式AI技术进展 - 英伟达发布20年来最大更新CUDA Toolkit 13.1,核心是基于tile的编程模型CUDA Tile,抽象化张量核心等专用硬件,并新增Green Context运行时支持、MPS内存局部性优化分区和静态SM分区,cuBLAS引入双精度单精度模拟提升FP64矩阵乘法性能 [1] - 谷歌在NeurIPS 2025发布Titans架构和MIRAS框架,融合RNN极速响应与Transformer强大性能,引入神经长期记忆模块,在200万token上下文中召回率和准确率最高 [2] - 谷歌向Ultra用户推出Gemini 3深度思考模式,采用IMO和ICPC金牌推理技术,在ARC-AGI-2、HLE、GPQA Diamond等基准测试中性能超越Gemini 3 Pro,并通过多轮迭代式思考机制在复杂任务上表现出色 [3] - 伯克利、纽约大学等机构提出GenMimic方法,让机器人通过观看AI生成视频零样本复现人类动作,研究推出GenMimicBench数据集(428个生成视频),并在宇树G1机器人上验证可行性 [4] 主要科技公司战略动态 - Meta战略重心从“元宇宙优先”转向“AI硬件优先”,计划对Reality Labs部门削减高达30%预算,将超轻薄MR头显Phoenix从2026年下半年推迟至2027年上半年,并计划2026年发布限量版可穿戴设备Malibu 2 [5][6] - Meta通过收购AI硬件初创公司Limitless并从苹果挖来人机界面设计副总裁艾伦·戴伊等高管,加速AI可穿戴设备布局 [6] - 苹果硬件技术高级副总裁Johny Srouji(M系列和A系列芯片核心功臣)正认真考虑离职,库克考虑破天荒设立CTO职位挽留,过去一周苹果还失去了AI主管、设计负责人、法务负责人和政府事务主管等多位高管 [7] - AI教父Hinton断言谷歌凭借Gemini 3、自研芯片、强大数据与研究团队正在超越OpenAI,Sensor Tower数据显示ChatGPT月活增速放缓至6%,而Gemini月活同期跃升30%,用户日均使用时长翻倍增长至11分钟 [10][11] AI行业应用与市场趋势 - OpenRouter和a16z联合报告基于100万亿Token元数据显示,开源模型流量占比达30%,中国开源模型占比从1.2%飙升至近30%,推理优化模型流量占比飙升至50%以上 [8] - 编程应用占总AI流量50%以上统治生产力领域,角色扮演占开源流量52%统治创造力领域,亚洲付费使用量从13%翻倍至31%,中文以近5%份额成为全球第二大AI交互语言 [8] - AI搜索正从为人类设计转向为智能体重构,大多数涉及网络搜索的企业选择外包给专业API供应商而非自建,深度研究被视为Agent搜索主导和最具货币化的形式 [9] - Anthropic发布Claude驱动的访谈工具,对1250名专业人士进行大规模访谈,核心发现包括:86%认为AI节省时间但69%提到使用污名,41%认为工作安全而55%表示焦虑,48%考虑转向管理监督AI系统 [12] - 创意工作者中97%称AI节省时间但面临经济焦虑和污名压力,科学家中79%提到信任和可靠性问题是主要障碍,91%渴望在研究中获得更多AI辅助 [12]