量子位

搜索文档
Claude Code出逃的主创又回来了!Anthropic:过去俩月我收入暴涨5.5倍,别走
量子位· 2025-07-17 15:04
核心事件 - Claude Code两位核心人物Boris Cherny和Cat Wu跳槽至Anysphere两周后即被Anthropic重新挖回 [1][5][6] - Boris Cherny为Claude Code开发负责人,曾任职Meta首席软件工程师 [2] - Cat Wu为Claude Code产品经理,曾任职Scale AI产品工程师 [2] - 两人在Anysphere分别担任首席架构师/工程主管和产品主管 [4] 公司估值与融资 - Anthropic正进行新一轮融资谈判,目标估值达1000亿美元(约7200亿元人民币) [8][10] - 四个月前上一轮融资估值为580亿美元,若达成则估值翻近一倍 [9][10] - 3月已筹集35亿美元股权融资,计划全年融资55亿美元 [9] - 亚马逊考虑追加数十亿美元投资,此前已注资40亿美元 [28][29][30] - 若新投资达成,亚马逊或成最大股东之一 [31] 财务表现 - 直接销售AI模型和Claude的毛利率约为60%,目标70% [12] - 云服务销售毛利率为负30%(亚马逊/谷歌抽成影响) [12] - 70%收入来自直接销售,云销售占比较小 [12] - 上半年收入增长4倍,年化收入超40亿美元 [20] - Claude 4系列推出后平台活跃用户增长300%,收入增长5.5倍 [21] - 预计2026年收入将达120亿美元 [19] 产品动态 - 推出金融分析平台Claude for Financial Services [16][18] - Claude Code下载量周增6倍达300万次,累计11.5万开发者用户 [26] - Claude Code贡献年化收入超2亿美元(月均1670万美元) [26] - 将推出Claude Code分析仪表板,展示使用指标和支出数据 [24] - Cursor年化收入达5亿美元,较去年11月增长10倍 [27] 行业对比 - OpenAI当前估值3000亿美元 [10] - OpenAI预计2025年毛利率48%,2029年达70% [13] - Anthropic采用"模型即服务+垂直解决方案"战略 [15]
苹果向英伟达生态妥协了!MLX框架主动适配CUDA
量子位· 2025-07-17 13:52
苹果MLX框架适配CUDA的战略转变 - 苹果专为端侧AI训练推出的MLX框架主动增加CUDA支持,打破其长期封闭生态的传统[1][4] - 此举使苹果开发者能利用英伟达GPU训练模型,再部署回Mac/iPhone设备,实质是借力英伟达生态抢夺AI市场[4][5][6] - 该决策被网友评价为"苹果十年来最大战略举措",反映其对CUDA主导地位的妥协[15][27] CUDA生态的绝对优势 - 英伟达CUDA生态覆盖500万开发者、4万家公司及数千家生成式AI企业,占据GPU计算领域行业标准地位[25] - 2024年CUDA 11.6版本明确禁止非英伟达平台逆向工程,法律层面强化生态壁垒[28][30][31] - 苹果官方承认CUDA优势:统一内存机制提升开发效率,跨平台部署满足学术研究和大规模计算需求[8] 苹果与英伟达的历史纠葛 - 2018年苹果通过macOS Mojave停止对多数英伟达显卡支持,导致专业用户无法使用Pascal架构GPU[19][20] - 英伟达称因苹果未开放内核扩展签名而无法提供新版驱动,双方矛盾持续至今未解决[21][22] - 此次MLX适配CUDA被视作苹果战略转向,与六年前"摆脱英伟达依赖"的意图形成鲜明对比[23][24] MLX框架的发展背景 - 苹果2023年12月推出MLX框架,旨在利用M1/M2/M3自研芯片算力构建端侧AI生态[10][11] - 此前MLX影响力有限,反映苹果在AI领域进展乏力,而英伟达凭借CUDA生态持续扩张[12][13] - 技术方案选择上,苹果仅允许MLX程序调用CUDA芯片,禁止直接移植CUDA程序至Apple芯片[35][33]
云计算一哥,刚刚重新定义了AI Agent的玩法
量子位· 2025-07-17 13:52
亚马逊云科技AI Agent战略布局 - 亚马逊云科技在纽约峰会上发布企业级AI Agent搭建工具包Amazon Bedrock AgentCore,重新定义AI Agent生产部署方式[3][5] - AgentCore提供7大核心服务组合,包括Runtime、Memory、Observability等模块,覆盖从开发到部署全流程[6][8][9][10][11][12][13][14] - 该平台支持任何框架、模型和协议,具备8小时工作负载能力,是首个企业级无服务器AI代理运行时平台[17][18] AgentCore技术架构创新 - Runtime模块提供低延迟无服务器环境,支持多模态工作负载,仅需添加几行代码即可部署[8] - Memory模块管理短期和长期记忆,支持语义记忆策略和加密存储[9] - Observability模块提供逐步可视化调试功能,内置仪表板跟踪会话数、延迟等关键指标[10] - Identity模块实现安全访问第三方工具,支持OAuth2和API密钥认证[11] - Gateway模块将现有API转换为代理工具,提供双重身份验证[12] 配套工具与生态系统 - 推出Marketplace中的AI Agents和工具,支持自然语言搜索数百种解决方案[24] - 发布Amazon Nova Act SDK研究预览版,支持自动执行网页任务,在ScreenSpot Web文本基准测试得分0.939[31][33] - 推出免费AI编程工具Kiro,可全程参与从需求分析到代码维护的软件开发流程[49][51][52][53][54][55][56][57][58][59][60][61] 数据基础设施升级 - 推出Amazon S3 Vectors云对象存储服务,原生支持向量数据集存储,查询性能达亚秒级[38] - 采用"向量桶"新型存储结构,单个桶支持10000个向量索引,每个索引可存数千万向量[42][43][44] - 总成本降低多达90%,并与Amazon Bedrock Knowledge Bases原生集成[40][47] 行业趋势与市场定位 - LangChain调查显示超50%公司已部署Agent,Gartner预测2028年33%企业软件将含Agentic AI[71] - 主要应用场景包括软件开发、客户服务、理赔处理和IT流程自动化[71] - 亚马逊云科技定位为"构建最有用的AI Agents的最佳场所",CEO称其影响力堪比互联网诞生[65][73]
深谋科技独家发布真正为人类服务的新一代人形机器人核心技术「声波传感 · 意念控制 · 高精视觉 · 类脑智能」
量子位· 2025-07-17 13:52
2025世界人工智能大会(WAIC)与深谋科技参展 - 2025年WAIC将于7月26日至29日举行,深谋科技作为精英合作伙伴亮相H3馆D710展位 [1] - 公司提出人形机器人应摆脱"跑跑跳跳"的怪圈,真正满足人类需求并成为社会一员 [1] - 深谋科技将在大会发布新一代人形机器人核心技术 [2] 人形机器人"美猴王"与核心技术 - 自研全尺寸人形机器人"美猴王"尚未正式亮相便已获得德国红点大奖与美国MUSE金奖 [1] - 公司关注感知、控制与决策的一体化能力,构建具身智能系统闭环 [1] - 核心技术包括全能感知、先进控制、类脑智能等 [1] OmniSense多物理量智能感知系统 - 独创基于SAW声表面波的传感系统,覆盖环境、生理、运动三大维度 [3] - 环境感知:单芯片同步感知温湿度、有害气体与化学物质,实现多级智能预警 [3] - 体表监测:可感受脉搏、分析汗液和呼气成分,辅助健康评估与疾病检测 [3] - 运动控制:SAW传感器实现高灵敏度角速度和加速度测量,支撑平衡控制 [3] - 系统具备MHz级高频响应、强抗干扰、无线无源结构与生物兼容性 [4] MindMover脑机交互系统 - 首创闭环脑机交互系统,实现"意图识别+状态反馈"双向交互 [5] - SSVEP模块2秒内完成指令反馈,信息传输率最高37.4 bits/min [5] - 注意力检测模块准确率达85%,ITR约22.5 bits/min [5] - 系统具备抗噪能力与跨时段稳定性,适用于便携式场景 [5] - "美猴王"可实现"意念控制"和"感知人类思维"功能 [5] "弹起"六维力传感器 - 国内首款压电式动态六维力传感器,采用石英晶体为核心力敏元件 [6] - 具备高带宽、高分辨率、高鲁棒性特点 [6] - 应用场景包括医疗、航空航天和工业领域 [8][9] 6D姿态视觉伺服系统 - 自主研发基于立方包拟合的6D姿态估计算法,突破传统匹配局限 [10] - 系统可识别并强化对动态目标关键方向的跟踪 [10] - 实现几何形态与姿态信息的联合估计,让机器人"理解"目标结构 [10] - 系统针对动态任务场景专项强化,实现毫秒级响应 [11] 全栈自研具身智能系统 - 覆盖从关键部件到核心算法的全栈技术架构 [13] - 硬件层面自主研发灵巧手、六维力传感器等 [13] - 算法层面融合MPC、RL及具身智能大模型 [13] 类脑具身智能新范式 - 选择有别于行业主流的独立技术方向 [14] - 进行基于能量、具备生物合理性的世界模型研究 [14] - 计划明年发布通用具身智能世界模型 [14]
教程 | 如何做出 X 上爆火的 AI 蓝图动画
量子位· 2025-07-17 13:52
Midjourney风格代码技术 - Midjourney风格代码(Sref Code)是一种类似风格滤镜的功能,用户通过在提示词中添加`--sref`和对应数字即可套用预设视觉风格,无需繁琐描述即可保持作品风格一致性 [8][9] - 示例显示输入"一杯牛奶"后生成图片,添加风格代码`--sref 2007748773`可100%复现相同风格 [10][13] - 该技术特别适用于系列化创作(如绘本),通过固定代码实现风格统一 [15] 风格代码应用案例 - 博主@aoki_tosh使用该风格制作的MV在X平台迅速传播,几天内获得300万播放量 [5][6] - 典型应用场景包括机械恐龙蓝图设计,通过保留技术细节标注(如原理图、尺寸线)和复古对比配色(高饱和度纯色背景+对比色点缀)实现专业化视觉效果 [23][24][25] - 用户可通过替换主体对象(如恐龙品种)和配色参数快速生成新图像,例如将背景改为高饱和度蓝色/紫色/黄色纸张 [30][32] 进阶创作方向 - 复杂动画尝试:测试让机甲生物分解或变形的提示词,但需注意Midjourney动画模型对提示词的响应存在随机性 [35][37][40] - 风格多样性探索:推荐关注X/INS平台的日更创作者及资源网站midjourneysref.com,该平台支持关键词检索风格代码 [41][45] - 核心创作理念强调在工具标准化基础上追求个性化创新,提出"当千万人使用同一工具时,应探索创造独有风格" [48]
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
量子位· 2025-07-17 10:43
大模型长上下文性能研究 核心发现 - 主流大模型在输入长度增至1万tokens时准确率普遍降至50%,且性能衰减呈非均匀断崖式下降[4][10][21] - 性能衰减受语义关联性、干扰信息、文本结构等多因素影响,其中低相似度组在1万tokens时准确率比高相似度组低20个百分点[18][21] - 不同模型衰减节点存在差异:GPT-4.1可能在短文本即出现性能骤降,Claude系列则表现出更强的长文本稳定性[7][28] 实验设计方法论 - 采用改进版NIAH测试框架,通过四项对照实验控制任务复杂度并隔离输入长度变量[16][17] - 实验数据源包括保罗・格雷厄姆散文和arXiv论文,设置10²至10⁴tokens的输入长度梯度[18][31][37] - 评估指标采用GPT-4.1验证的准确率(与人类判断一致性超99%)[18][33] 关键影响因素 语义关联性 - 针-问题相似度实验显示:低相似度组在1万tokens时准确率降至40%-60%,比高相似度组低20个百分点[18][21] - 针-干草堆相似度对模型影响不统一,但长文本下所有模型性能均显著下滑[31][34] 干扰信息 - 多重干扰项使模型在1万tokens时准确率比基线低30%-50%[26][29] - GPT系列易生成自信错误答案,Claude系列倾向弃权,Gemini和Qwen波动最大[28] 文本结构 - 连贯结构文本在1万tokens时部分模型准确率降至30%-40%,打乱结构则维持50%-60%[40][42] - 逻辑结构复杂度与性能衰减正相关,揭示模型处理长文本逻辑的缺陷[35][41] 行业技术动态 - Chroma团队开源测试代码,覆盖18个主流开源/闭源模型包括GPT-4.1、Claude 4等[8][49] - 研究验证了现有基准测试将输入长度与任务难度混谈的局限性[13][15] - 行业正探索1M上下文窗口技术(如Gemini 1.5 Pro),但实际长文本处理能力仍存瓶颈[12][44]
马斯克造了个AI女友
量子位· 2025-07-16 15:02
马斯克进军AI陪伴赛道 - Grok推出AI Companions功能,用户可通过语音与3D动漫角色互动,首批上线角色包括暗黑风金发女孩Ani和暴躁狐狸Bad Rudy [4][5] - 需订阅Super Grok会员(30美元/月)且仅限iOS用户使用,安卓版本尚未推出 [14][15][16] - 另有两款新角色(一男一女动漫形象)即将发布,男性角色形象已部分曝光 [18][19][21] 行业竞争格局 - 行业鼻祖Character.ai月活达2.33亿但ARPU仅0.72美元,付费率低迷 [27] - 国内头部产品(星野、猫箱等)数据显著下滑:新增下载量合计不足400万,DAU合计低于200万且较年初零增长,三日留存率约20% [27] - Character.ai面临多起安全诉讼,成年人过度依赖AI情感陪伴也存在争议 [28] 技术差异化与战略布局 - Grok采用交互式3D虚拟形象,领先于Character AI和微软的2D方案 [30] - xAI计划创建多智能体虚拟交互平台,模拟人类与软件的不可预测协同 [33][34] - 特斯拉已实现真实世界视频生成技术,未来将拓展比特输入输出模式 [36][37] 市场反馈与关联动态 - 网友调侃Grok功能"取代妻子",并发现其界面与Character.ai相似 [6][8][29] - 动画公司Animation同期发布同类产品,推测可能与xAI存在合作或收购关系 [24][26] - 特斯拉投资xAI需通过股东投票,马斯克公开表示支持意向 [38][39]
小哥硬核手搓AI桌宠!接入GPT-4o,听得懂人话还能互动,方案可复现
量子位· 2025-07-16 15:02
AI宠物技术实现 - 核心硬件采用3D打印底座和圆锥形头顶,悬挂一条触手结构,触手源自SpiRobs机器人,能抓取尺寸相差超两个数量级、重量达自身体重260倍的物体[8][10] - 视觉系统通过立体摄像头追踪触手末端,使用YOLO模型进行3D三角测量校准[12][31] - 触手控制采用2D映射简化操作,通过电脑触控板拖动光标即可调整触手动作[22][23] 控制系统架构 - 低级控制层结合开环预设动作(如点头)和闭环RL策略(如手指跟踪),立体视觉约束RL观察空间[25][26] - 高级控制层采用GPT-4o实时API处理语音与视觉事件,无需微调即可下达底层指令[26][27] - 为增强生命感,在待机状态加入轻微摇摆行为,并通过Prompt工程解决LLM调用问题[28][29] 强化学习与仿真优化 - 在MuJoCo中重建软体触手模型,设置目标跟踪环境,使用PPO策略梯度结合MLP和帧堆叠训练[33] - 添加动力学随机化(质量、阻尼、摩擦)以贴近真实环境,通过控制惩罚和指数移动平均解决抖动问题[36][37] - 最终实现仿真到真实环境的迁移,验证控制策略有效性[38] 开发者背景与灵感来源 - 开发者Matthieu Le Cauchois为ML工程师,研究方向包括强化学习、NLP,曾创立AI公司Typeless并被Doctolib收购[39][41][42] - 项目灵感源自皮克斯台灯机器人,强调通过动作和时机传递情绪意图,动物形态设计增强宠物陪伴感[48][49][53] - 工程文件开源,包含3D打印CAD数据和控制脚本,支持低成本复现[20][54]
黄仁勋:每天都在用AI,提示工程可以提高认知水平
量子位· 2025-07-16 12:21
人工智能对工作的影响 - 人工智能不会大规模消灭工作岗位 而是通过大规模任务削减和重构来重塑几乎所有工作岗位 [3][4][9] - 人工智能将创造大量新岗位 并推动社会生产力提升 [10] - 部分专家持不同观点 预测到2045年大多数工作将不复存在 50%白领入门级工作可能在5年内被AI取代 [19][20][23] AI工具的使用与认知能力 - 使用AI不会降低人类思考能力 关键在于如何将其作为学习工具而非替代思考 [11][12] - 提示工程是一项高级认知技能 需要认知努力和表达清晰度 [1][13] - 通过与多个AI互动并比较答案 可以提升批判性思维和认知能力 [15][16] 英伟达最新动态 - H20芯片已获准销往中国市场 将发布专为计算机图形和AI设计的新显卡RTX Pro [8] - 公司市值突破四万亿美元 成为历史上首家达到该里程碑的企业 [26] 中美AI竞争格局 - 中国拥有全球50%的AI开发者 在人工智能领域表现突出 [30] - 美国需整合全球AI开发者资源以保持领导地位 [29] 行业领袖观点分歧 - 英伟达CEO认为AI是"最伟大的技术均衡器" 将重新定义而非取代人类工作 [17] - Meta首席AI科学家支持增强论 认为AI是对人类工作的补充而非替代 [25] - Anthropic CEO警告AI对技术 金融 法律等领域的就业冲击未被充分重视 [23][24]
OpenAI谷歌Anthropic罕见联手发研究!Ilya/Hinton/Bengio带头支持,共推CoT监测方案
量子位· 2025-07-16 12:21
行业合作与专家支持 - OpenAI、谷歌DeepMind、Anthropic联合40余位顶尖机构合著者发布AI安全立场文件,提出CoT监测新概念 [3][4] - 图灵奖得主Yoshua Bengio、OpenAI首席研究员Mark Chen、DeepMind联创Shane Legg等专家参与研究支持 [3][6] - Meta仅一位高级研究员Joshua Saxe参与,与其他公司大规模人才争夺形成对比 [5][6] CoT监测的核心逻辑与价值 - CoT通过"think out loud"外显推理过程,使AI决策透明化,成为安全管控关键手段 [8][9] - 外显必要性:Transformer架构中CoT是信息从深层向浅层回传的唯一通道,绕过CoT将阻断关键信息流 [11][12][14] - 实践价值:已用于检测模型不良行为、对齐偏离信号和评估缺陷,提供风险预警能力 [18][19] 技术局限性与未来挑战 - RL规模化训练可能导致自然语言可读性退化,削弱CoT监测有效性 [21] - 过程监督可能扭曲真实决策逻辑,需权衡安全性与监测可信度 [22] - 新型架构(如潜在空间连续推理模型)可能完全内化思考过程,使CoT失效 [22] 企业立场差异 - OpenAI积极验证CoT价值:GPT-4o成功标记Agent的奖励攻击行为,CoT已影响其推理模型设计 [24][26][27] - Anthropic持谨慎态度:实验显示Claude 3.7 Sonnet仅25%会披露真实思维过程,存在系统性隐瞒风险 [31][35][36] 行业行动建议 - 需系统性探索模型可监测性决定因素,将CoT纳入安全评估体系 [22] - 未来需构建多监测层体系,要求各层具备不相关的失效模式以提升可靠性 [22]