Workflow
TOKEN
icon
搜索文档
Claude 4 核心成员访谈:提升 Agent 独立工作能力,强化模型长程任务能力是关键
Founder Park· 2025-05-28 21:13
「2025 年最大的变化,是强化学习在大语言模型训练上终于开始奏效了。」 这是 Anthropic 的两位研究员,Sholto Douglas(专注于强化学习)和 Trenton Bricken(研究机制可解释 性)对于今年模型趋势变化的总结。 Gemini 2.5 Pro 和 Claude Opus 4 的发布也变相证明了这个判断。 在 Dwarkesh Podcast 这期两个半小时的采访中,两位研究员对于 RLVR(可验证奖励的强化学习)、模 型的自我意识、以及 Claude 一直专注的「模型可解释性」做了深入的讨论。 尤其是模型以及 Agent 之后的发展方向,比如人类驾驭多个 Agent 的可能性、以及现阶段应该提高模型 的底线,而不是去追究极致。还有 AI 白领在未来两年的可能性,毕竟「Agent 操作电脑」并不难,只 要环境具备。 他们还夸奖了 DeepSeek 在模型研发上的「品味」,颇有种「惺惺相惜」的感觉。 两个半小时的采访,我们还摘录了 Sholto Douglas 在另外一期播客的部分回答,聊得很深入而且很透 彻。 TLDR: 2025 年最大的变化是强化学习技术在语言模型上真正奏效了 ...
Yoshiharu Partners with Good Mood Studio and Wealthrail to Enter U.S. Real Estate Market
Globenewswire· 2025-05-27 20:31
文章核心观点 - 主营日本拉面和寿司卷的餐厅运营商Yoshiharu Global Co.宣布与合作伙伴进军美国房地产市场,以传统拉面业务为基础寻求新的增长引擎 [1] 公司情况 - Yoshiharu是一家快速发展的餐厅运营商,2016年成立,旨在为全球客户提供现代化日本餐饮体验,在南加州和拉斯维加斯拥有并经营15家餐厅 [5] 合作动态 - 公司与拥有超1400次成功房产倒卖记录的房地产公司Good Mood Studio签署战略合作谅解备忘录 [2] - 公司计划投资约200万美元收购由Good Mood创始人创立的房地产代币化平台Wealthrail 10%的股份,双方将共同开展房地产开发和数字资产投资业务 [2] 公司目标 - 与现有纳斯达克上市的房地产科技公司相比,公司凭借实地专业知识、专注实物资产的投资结构以及基于证券代币发行和人工智能技术的差异化扩张战略脱颖而出 [3] - 公司计划利用美国房地产市场的吸引力,在中长期内成为美国市场领先的房地产科技企业,已通过Wealthrail收购两处住宅物业,并计划在年内扩大联合运营和收购,实现收入多元化并为长期增长奠定基础 [4]
ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式
机器之心· 2025-05-27 14:38
核心观点 - 提出ETT(End-to-End Vision Tokenizer Tuning)方法,实现视觉tokenization与目标自回归任务的联合优化,打破传统方法中视觉tokenizer固定不变的局限 [4] - ETT通过引入视觉tokenizer的码本嵌入和token级别字幕损失函数,使视觉tokenizer能根据下游任务反馈调整参数,显著提升多模态任务性能 [6] - 在模型参数和数据规模更小的条件下,ETT在多项基准测试中达到或超越现有最先进视觉语言模型的表现 [12][14][17] 传统方法的局限与ETT的突破 - 传统方法使用冻结的视觉tokenizer离散索引,导致特征表示能力浪费且无法端到端训练 [6] - ETT创新性引入码本嵌入(码本大小131,072,特征维度256)替代离散索引,结合联合优化策略释放视觉tokenizer潜力 [6][10] - 相比Emu3等框架,ETT简化模型架构并减少计算开销,同时提升多模态理解能力 [12] ETT核心架构与训练策略 - 基于改进的IBQ框架,分三阶段训练:前期对齐学习(冻结参数训练投影层)、语义学习(端到端联合优化)、后训练(特定任务微调) [10][11] - 训练中同时优化caption损失函数和重建损失函数,保持图像重建能力的同时增强语义感知 [11] - 投影层采用多层感知机,匹配视觉嵌入与预训练语言模型的隐藏层维度 [10] 性能表现 多模态理解 - MMBench测试中性能与连续编码器模型相当,部分子任务更优(如ETT 58.8 vs QwenVL-Chat 60.6) [12] - 在GQA(59.4)、TextVQA(56.8)等任务中表现优于Chameleon(47.2/4.8)等离散VLM模型 [12] 多模态生成 - 在T2I-CompBench的颜色(81.03)、形状(58.19)、纹理(72.14)子任务上超越Emu3(79.13/58.46/74.22) [15] - GenEval测试中Overall得分0.63,接近DALL-E3(0.67)且优于SDXL(0.55) [15] 视觉重构 - 保留低级细节的同时提升高级语义表示能力,如改善文本渲染效果 [17] 潜在发展与局限 - 当前数据规模和模型容量仍有扩展空间 [19] - 未来计划探索从头训练视觉tokenizer,并扩展至视频、音频等多模态场景 [19] - 方法易于实现集成,有望推动多模态基础模型应用 [25]
月之暗面前核心产品负责人明超平,入局AI Coding
36氪· 2025-05-27 14:35
AI Coding行业趋势 - 2024年AI Coding成为最火热的AI应用创业赛道,涌现Devin、Cursor、Windsurf等明星产品,其中Windsurf被OpenAI以30亿美元收购[1] - 行业已从狂热回归理性,但新言意码仍以8000万美元估值完成两轮数千万美元融资,成立不到半年即受资本追捧[1] - 赛道玩家分为两类:专业工具型(如Devin、Cursor)和大众创作型(如YouWare),后者试图将Coding从专业行为转变为大众创意行为[3][4][13] 新言意码公司战略 - 核心产品YouWare定位"工具+社区",通过对话生成代码并搭建创意展示平台,上线5个月项目数达数十万[4][6][10] - 差异化策略包括:自研Sandbox引擎将代码执行时间从60秒缩短至5秒、支持第三方工具代码导入(1/3用户使用该功能)[9][19][21] - 采用"下游策略"而非直接竞争,允许用户上传ChatGPT/Claude等平台的代码,降低使用门槛[19][21] 产品理念与运营 - 将Coding类比手机摄影革命,认为降低门槛将催生新创作生态,目标用户规模扩大100倍[3][13][14] - 关键指标从DAU转向Token消耗速度,通过积分体系Knots激励创作,日增项目数为核心考核[8][16][22] - 社区运营侧重内容分发优化,针对日本等区域用户调整推荐算法,克制投放仅合作YouTube/X平台KOL[23][25] 技术架构与团队 - 多模型调用策略:主要接入Claude 3.7 Sonnet,结合Gemini和Claude 3.5 Haiku实现任务优化[31][32] - 技术团队占比70%,强调"技术驱动产品"模式,产品经理需具备论文阅读能力以跟踪模型进展[28][29] - 团队规模控制在20人,招聘标准强调"饥渴感",采用无年假限制等扁平化管理方式[27][28] 创始人认知与行业判断 - 坚持"反共识"创业逻辑,认为Coding普及度质疑恰是机会,需在模型迭代延长线上优化产品而非自研模型[12][13][33] - 提出AI时代产品标准:智能消耗速度>用户规模,对比Jasper.ai与GPT的Token消耗差异论证场景重要性[30][31] - 拒绝传统竞品分析框架,认为颠覆性产品应创造新维度而非跟随,例举剪映突破专业视频软件垄断的历史路径[17][24]
BlackRock vs. Blackstone: Which Asset Management Giant Has the Edge?
ZACKS· 2025-05-26 22:15
行业趋势 - 资产管理行业受益于投资者转向高收益投资工具如股票基金、另类资产和长期债券基金 [2] - 监管放松预计将扩大加密货币和退休市场的准入 [2] - 传统资产代币化(如房地产和股票)吸引投资者兴趣 推动管理资产规模(AUM)持续增长 [2] BlackRock核心优势 - 全球最大资产管理公司之一 截至2025年3月AUM达11.58万亿美元 [4] - 通过收购SpiderRock Advisors、Global Infrastructure Partners(GIP)和Preqin等公司扩张业务版图 [4] - 2024年12月宣布收购AUM达1480亿美元的HPS Investment 强化Aladdin技术在私人市场数据领域布局 [4] - AUM五年(2019-2024)复合年增长率达9.2% 2025年一季度保持增长势头 [5] - iShares部门提供超1400种ETF 已获批现货比特币和以太坊ETF [5] - 过去五年GAAP收入复合年增长率为7% 2025年一季度持续增长 [6] BlackRock财务数据 - 2025年二季度收入共识预期53.7亿美元 同比增长11.83% [7] - 2025年全年收入预期225.3亿美元 2026年预期255.4亿美元 [7] - 2025年每股收益预期44.87美元 2026年预期50.46美元 [17] Blackstone核心优势 - 全球最大另类资产管理公司之一 截至2025年3月AUM达1.17万亿美元 [11] - 可投资资本("dry powder")达1772亿美元 [11] - 重点布局数字基础设施、能源电力、生命科学和商业地产复苏领域 [12] - 与Wellington和Vanguard合作开发跨公募私募的多资产投资解决方案 [13] Blackstone财务数据 - 2025年二季度收入共识预期27.4亿美元 同比增长8.88% [16] - 2025年全年收入预期119.8亿美元 2026年预期156.3亿美元 [16] - 2025年每股收益预期4.78美元 2026年预期6.37美元 [18] 公司比较 - BlackRock市净率(P/B)3.10倍 低于Blackstone的5.37倍 [20] - Blackstone净资产收益率(ROE)19.84% 高于BlackRock的15.57% [21] - BlackRock收入增长更稳定 2025-2026年预期增长率10.4%-13.34% [7] - Blackstone收入增长波动较大 2025年预期增长2.83% 2026年预期增长30.47% [16] 投资建议 - BlackRock因多元化增长策略、强劲AUM扩张和ETF业务优势成为2025年更优选择 [25] - Blackstone面临信贷紧缩、交易活动减少和地缘政治不确定性等短期挑战 [26]
打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
量子位· 2025-05-24 12:38
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 不再像CoT("思维链")一样"一个字一个字往外蹦",加上 "软思维" 就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了 Soft Thinking ,让模型在 连续的概念空间 中进行 "软推理",而非局限于离散的语 言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。 并且,Soft Thinking是一种 即插即用 的推理策略, 无需额外训练 即可应用于现有模型(如Llama、Qwen)。 目前主流的语言模型推理方法存在一个关键问题: 只能逐字生成离散的语言符号(如单词或子词) 。 这就好比思考时只能一个字一个字的蹦出来,不仅限制了模型表达抽象概念的能力,还容易在复杂问题中因"单一路径选择"而犯错。 人类大脑思考时并非依赖明确的语言符号,而是通过 抽象概念的灵活整合 进行推理。 Soft Thinking正是受此启发,将语言模型的推理从"离散符号空间"拓展到"连续概念空间"。 这样,模型就可 ...
BioSig Technologies, Inc. Signs Definitive Share Exchange Agreement with Streamex Exchange Corp. to Launch First-Mover Real-World Asset (RWA) Tokenization Company Bringing Commodity Markets On-Chain.
Globenewswire· 2025-05-24 07:56
Los Angeles, CA and Vancouver, BC, May 23, 2025 (GLOBE NEWSWIRE) -- BioSig Technologies, Inc. (Nasdaq: BSGM) ("BioSig" or the "Company"), a medical technology company, today announced it has signed a definitive share exchange agreement with Streamex Exchange Corporation ("Streamex"), a privately held company specializing in the tokenization of real-world assets, with a focus on bringing commodities on-chain. The signing of the definitive agreement represents a major milestone for both Streamex and BioSig, p ...
黄仁勋谴责美国:把全球AI发展变成一场「围堵游戏」,只会促使对方更伟大
36氪· 2025-05-21 17:34
英伟达在中国市场的挑战 - 英伟达在中国市场份额从4年前的95%下降至50%,中国本土技术公司抢占剩余份额[1] - 美国芯片管制政策导致公司面临55亿美元库存损失,主动放弃150亿美元销售额和30亿美元税收[2] - 限制政策可能促使中国构建非美国的AI生态系统,威胁英伟达CUDA平台的市场地位[1][2] 全球AI竞争格局 - 美国对华芯片限制政策可能促使中国发展替代技术,形成独立生态系统[2] - 全球AI发展不应是零和游戏,竞争应通过自身技术进步而非打压对手[2] - 中国渴望成为AI强国的目标值得尊重,技术领导地位可能在全球扩散[2] AI对全球经济的影响 - AI将推动行业从1万亿美元IT市场扩展到50万亿美元的全球资本和运营支出市场[3] - 具身机器人可能扩大全球GDP,解决劳动力短缺问题[3] - 以10万美元年薪雇佣机器人将提高企业创造收入的能力,未来5-10年可能形成新行业[4] 算力架构与token经济 - 数据中心价值取决于用有限能源生成尽可能高质量的token[5] - AI工厂需处理帕累托分布的token需求曲线,同时满足基础服务和复杂任务需求[7] - Dynamo系统通过智能分配数据中心资源,使token生成更高效,成为"AI工厂操作系统"[7][8] 技术发展方向 - 大模型推理是包含预填充(依赖浮点计算)与解码(依赖带宽)的链式过程[8] - 英伟达Dynamo系统可处理差异极大的需求,使数据中心像"超级GPU"一样调度资源[8] - 公司三年前开始布局机器人技术,预计几年内将实现真正落地[3]
英伟达Computex:开放互联生态+端侧AI部署,引领AI生产力变革
华泰证券· 2025-05-21 12:30
报告行业投资评级 - 科技行业投资评级为增持(维持) [6] 报告的核心观点 - 英伟达CEO黄仁勋5月19日发表Computex 2025主题演讲,对行业启示为新发布NVLink Fusion可与第三方集成或吸引大型云厂商,推出相关服务器或表示AI需求转向企业级客户,强调通过AI基建引领AI Factory驱动的工业革命;英伟达宣布与鸿海和中国台湾方面合作建设AI超级计算机并搬迁总部 [1] - AI Factory是生产AI Tokens的“智能工厂”,是重要基础设施,拥有更高效的AI Factory意味着拥有未来“数字生产力”,是AI驱动的大规模生产力变革,建议关注先发建设AI Factory的相关标的;英伟达宣布与鸿海、台积电等合作在中国台湾打造AI基建 [2] 根据相关目录分别进行总结 NVLink Fusion平台 - 英伟达推出NVLink Fusion平台,允许客户将第三方CPU和AI芯片与英伟达的GPU和网络设备集成机架级解决方案,联发科等多家公司已宣布参与合作;英伟达通过该平台从全栈解决方案转向开放生态系统,或在ASIC芯片竞争下吸引ASIC客户,增加数据中心份额,巩固互联技术壁垒 [3] 个人侧和企业侧产品 - 个人侧:DGX Spark将于25年7月发售,配备GB10 Grace Blackwell芯片和第五代Tensor Cores,提供1 Petaflop的AI算力和128GB统一内存,支持将模型无缝导出;DGX Station将于年内发售,配备GB300 Grace Blackwell桌面芯片,提供20 Petaflop的AI算力和784GB统一内存,包括NVIDIA ConnectX - 8网卡,速度达800Gb/s,可独立或供多用户使用 [4] - 企业侧:新推出RTX PRO服务器,支持多达八块RTX PRO 6000 Blackwell GPU,包括BlueField - 3 DPUs和内置PCIe Gen 6交换机的NVIDIA ConnectX - 8 SuperNICs,将Blackwell架构扩展到企业工作负载的数据中心,Cadence等公司计划使用基于RTX PRO的企业级AI工厂 [4] 人形机器人开源模型 - 英伟达更新面向人形机器人推理的开源平台Isaac GR00T N1.5,黄仁勋展示Isaac GR00T - Dreams blueprint可帮助生成合成运动数据训练机器人,开发者可对世界基础模型进行后训练,利用GR00T - Dreams生成视频并提取动作标记用于训练,与此前不同,GR00T - Dreams主要使用Cosmos生成全新数据;在Agentic AI方面,AI - Q Blueprint可连接企业数据代理系统并推理,利用NeMo Retriever可将英伟达GPU上的数据提取和检索速度加快15倍 [5]
Computex现场连线#1:英伟达、高通主旨演讲
2025-05-19 23:20
纪要涉及的行业和公司 - **行业**:PC和服务器产业链、AI行业 - **公司**:英伟达、高通、红海、联发科、NXP、台积电、鸿海、和硕、伟创、万达、联想、SuSE、HP、华硕、宏碁、微星、工业富联、立讯、AMD 纪要提到的核心观点和论据 - **英伟达** - **发布聚焦AI服务器产业链**:发布包括AI工厂、Agentic AI、机器人及企业AI转型等内容,推出NVLink Fusion开放IP巩固互联传输优势,RTX Pro Server有望替代部分H20 Server功能,尤其在中国大陆推理服务市场[1]。 - **第二季度财报指导预测**:可能在45至47亿美元之间,考虑了5.5亿美元HRC使用权补偿,第一季度财报预期较好,受益于RTX替代RWS的弹性及中东市场出货量增加[3][11][19]。 - **产品出货情况**:GB200 NFL72自4月起小批量出货,预计后续出货量增加,但面临柜体零部件众多及铜缆干扰问题,GB300市场预期较低,能否在3G环境中使用取决于OEM安装能力[1][12][13]。 - **市场影响**:中东市场出货量预计增加,可能取代新加坡,对英伟达和AMD均有影响[3][17]。 - **高通** - **进军服务器CPU市场**:旨在打破X86生态,构建ARM生态闭环,展示Snapdragon E - LITECOM在企业级应用进展,联想提出终端产品数据算法算力互通概念[1][5]。 - **中国台湾科技公司及服务器产业链** - **地位与不足**:拥有台积电、鸿海等全球关键企业,服务器产业链完整,但AI应用创新相对滞后,应用端较CES和上海联想Tech World差距较大[1][2][6]。 - **关键产品**:下半年GBE300的MV72将大量上市,AI PC领域主要由华硕、宏碁、微星展示硬件产品,应用端创新有待提升[1][9]。 其他重要但是可能被忽略的内容 - **AI Token**:被视为未来重要工具,数据中心将成为AI工厂,以能源为输入产出AI Token,未来数据中心每月或每年生产AI Token数量将成为重要指标,标志着AI应用落地[3][14][15]。 - **英伟达产品角色**:RTX可能充当Hopper架构角色,DGX Station主要用于研究AI,针对研究人员,NVLink Fusion希望继续垄断生态系统[16]。 - **英伟达供应链**:从MV角度芯片已交付OEM且收入确认,但OEM后续工作进度影响整体供应链[3][18]。