Workflow
算法
icon
搜索文档
绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世
机器之心· 2025-05-08 09:37
在人工智能领域,推理能力的进化已成为通向通用智能的核心挑战。近期,Reinforcement Learning with Verifiable Rewards(RLVR)范式下涌现出一 批 「Zero 」类推理模型,摆脱了对人类显式推理示范的依赖,通过强化学习过程自我学习推理轨迹,显著减少了监督训练所需的人力成本。然而,这些方法的学 习任务分布仍由人类预先设计,所依赖的数据依旧高度依赖专家精心策划与大量人工标注,面临着难以扩展与持续演化的瓶颈。 更重要的是,如果智能系统始终受限于人类设定的任务边界,其自主学习与持续进化的潜力将受到根本性限制,这一现实呼唤一种全新的推理范式,迈向超越人 类设计约束的未来。 为应对这一挑战, 清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学的研究者们提出了一种全新的推理训练范式 —— Absolute Zero,使大模型无需依赖人类或 AI 生成的数据任务,即可通过自我提出任务并自主解决,实现 「自我进化式学习 」。在该范式中,模型不仅学习如何生 成最具可学习性的任务(maximize learnability),还通过解决这些自主生 ...
AI芯片股的下一个难关是……
搜狐财经· 2025-05-07 21:09
超威半导体(AMD)季度业绩 - 2025财年Q1收入74.38亿美元,同比增长35.9%,超出市场预期的71.3亿美元 [3] - 非会计准则毛利率提升2个百分点至54%,每股盈利0.96美元,同比增长54.84% [3] - 数据中心分部收入36.74亿美元,同比增长57.21%,经营利润率提升0.22个百分点至23.37% [3] - 因出口管制导致Q1损失7亿美元收入,预计全年损失15亿美元 [3] - Q2收入指引74亿美元,毛利率受8亿美元库存储备影响降至43%(剔除影响后为54%) [3] 超微电脑(SMCI)业绩下调 - 2025财年Q3净销售额46亿美元,同比增长19.48%,低于市场预期的54.2亿美元 [6] - 非会计准则每股盈利0.31美元,同比下降53.03%,低于预期的0.5美元 [6] - 下调全年收入指引从235-250亿美元降至218-226亿美元 [6] - 业绩疲软主因客户延迟交付Hopper/Blackwell GPU评估及关税影响 [6] 行业影响与政策风险 - 英伟达因出口管制计提55亿美元费用,H20芯片在华销售受阻 [4][8] - 大中华区占英伟达2024财年收入39%(2023财年达47%) [8] - 美国半导体设备商(AMAT/LRCX/KLAC)年损失或超10亿美元 [8] - 特朗普关税政策导致科技企业搁置资本开支,供应链不确定性加剧 [7][9] - DeepSeek算法进步削弱算力依赖,可能降低AI芯片需求 [8][9]
托普云农:政策东风劲吹智慧农业赛道,多维布局抢占高标准农田建设新蓝海
全景网· 2025-05-07 20:50
政策机遇 - 农业强国战略及高标准农田建设政策为公司带来广阔成长空间 [1] - 国家高度重视农业现代化发展 致力于提升农业综合生产能力和粮食安全保障 [1] - 到2030年累计建成高标准农田13.5亿亩 到2035年将具备条件的永久基本农田全部建成高标准农田 [1] 公司优势 - 专注于智慧农业领域 能为高标准农田建设提供全方位解决方案 [1] - 技术层面精研智能感知、机器视觉、AI算法模型、农业大数据等前沿科技 [2] - 构建"天空地"一体化数据采集系统监测农情 用自主算法模型提供农事决策支持 [2] - 项目实施经验丰富 拥有众多成功案例 [2] 发展举措 - 持续加码研发投入 优化现有产品和服务 推出更贴合市场需求的新技术新产品 [2] - 积极拓展市场 加强与各地政府职能单位、企事业单位、农业企业的合作 [2] - 将成功经验推广至全国更多地区 [2] - 参与相关行业标准制定 引领行业发展方向 [2]
如何利用抖音算法?这5条AI指令,拆解品牌爆量密码
搜狐财经· 2025-05-07 18:12
本文来源:有米有数,作者:燕尾 关于我们:U渠道,艾奇在线旗下广告资源对接平台,汇聚全网优质广告资源,助力甲乙方更高效的对接,实现人脉拓展和流量变现 编者按: 相比起来,你我使用着更高纬度的抽象语言,可以说出"红橙黄绿青蓝紫", 看似足以自傲了,但你我最多能说出多少种颜色? 几十、一百、一千种? 我们和皮拉罕人本质没有区别, 都被语言决定了认知的上限。 那计算机呢? 计算机通常采用RGB数值来描述颜色。 即红(R)绿(G)蓝(B)是方向、程度是数值化的量,这三个"向量"组合起来,能表示约1677万种颜色。 算法也是一样,它并不打"标签"、"人群",因为这只是一种"像天一样"的低纬度描述。 算法本质是用海量特征,来描述一个人、或一个内容,也即抖音所说的, 现实世界的所有事物都可以被转化为向量,模型的输入和目标首先被向量化,再进行各种复杂运算。 我们做创意素材,强调"内容为王"、"卖点多元化"等等观念,其实不是冲着标签去的,而是为了: 在一个推荐算法主导的电商平台中,理解并掌握AI,就是掌握生意的命运。 为帮助品牌们更好地应用AI、把控内容策略、实现可持续爆单,本栏目将结合AI分析优质品牌案例,从中窥见新时代下的 ...
DeepSeekGRM带来新的推理Scaling路径
华泰证券· 2025-05-07 15:25
报告行业投资评级 - 计算机行业投资评级为增持(维持) [8] 报告的核心观点 - DeepSeek团队新论文引入SPCT方法,推出DeepSeek GRM模型,带来推理阶段新Scaling方法,或暗示DeepSeek R2技术路径,模型迭代加速可期 [2] - SPCT方法拓展推理Scaling路径,提高强化学习质量,为大模型算法迭代提供启发 [3] - DeepSeek GRM-27B以27B参数媲美621B参数R1的性能,证明推理阶段新探索有望拓展模型边界 [4] - DeepSeek GRM模型压缩硬件需求,降低本地化部署成本,利好端侧部署与端侧AI进展 [5] - DeepSeek R2有望近1 - 2月内发布,GRM模型发布或是其算法创新雏形,建议关注算法创新带来的模型迭代加速 [6] 根据相关目录分别进行总结 DeepSeek新论文及模型情况 - DeepSeek团队新论文《Inference-Time Scaling for Generalist Reward Modeling》发布,引入SPCT方法,推出DeepSeek GRM模型,27B参数能跑出目前R1模型671B参数相当性能 [2] SPCT方法优势 - 强化学习在一般领域难获LLMs准确奖励信号,SPCT方法可自适应生成评判原则并评价,提高强化学习质量,拓展推理Scaling路径 [3] DeepSeek GRM模型性能 - DeepSeek GRM-27B在多个综合奖励模型基准测试中优于现有方法和模型,达到与DeepSeek R1(621B参数)、GPT - 4o相当效果;SPCT采用双循环结构,R1单一线性模式会积累错误;推理阶段应用SPCT方法扩展策略性能更优 [4] 硬件消耗与部署情况 - DeepSeek GRM模型采用128块A100 - 80G GPU训练,成本为R1的1/6;推理阶段降低算力与显存需求,能耗为R1模型的17%左右;有望在端侧设备部署,精度优化后显存需求理论上可被消费级显卡满足 [5] R2模型展望 - 预训练阶段Scaling Law放缓,算法优化成各大厂追求方向;DeepSeek R2有望近1 - 2月内发布,GRM模型发布或是其算法创新雏形 [6]
Beta Bionics Inc(BBNX) - 2025 Q1 - Earnings Call Transcript
2025-05-07 05:30
财务数据和关键指标变化 - 2025年第一季度净销售额为1760万美元,同比增长36% [10] - 第一季度新患者启动中通过药房报销的比例达到低20%多,已超过之前大于20%的指导目标,而2024年第一季度为中个位数百分比,2024年第四季度为低十几百分比 [11] - 第一季度毛利率为50.9%,低于2024年第一季度的55.7%,主要归因于新患者启动通过药房渠道的比例大幅增加 [11] - 第一季度运营费用为2760万美元,较2024年第一季度的1670万美元增加66%,主要是由于现场销售团队的扩张和作为上市公司运营的新成本 [18] - 截至2025年3月31日,公司季度末现金、现金等价物和短期及长期投资为2.955亿美元 [18] - 公司将2025年全年净销售额指导上调至8200 - 8700万美元,此前为8000 - 8500万美元;预计新患者启动中通过药房渠道报销的比例为22% - 25%,此前为大于20% [20] - 公司将2025年全年毛利率指导上调至50% - 53%,此前为至少50% [23] 各条业务线数据和关键指标变化 - 胰岛素泵业务:第一季度有3853名新患者采用了Islet,同比增长48%;其中约71名来自之前使用多次每日注射的糖尿病患者 [10][15] - 药房业务:第一季度新患者启动中通过药房报销的比例达到低20%多,超过预期;公司预计全年该比例为22% - 25% [11][20] 各个市场数据和关键指标变化 文档未提及相关内容 公司战略和发展方向和行业竞争 - 公司致力于打造高度差异化的公司,与传统胰岛素泵行业商业模式不同,拥有自适应闭环算法、按使用付费的药房商业模式和创新产品线 [8] - 公司计划在2027年底前实现贴片泵的商业化,并对该目标充满信心;第一季度开始了双激素泵项目中胰高血糖素候选药物的桥接研究 [31] - 公司认为其Islet泵在易用性方面具有优势,能够适应每个用户并学习其胰岛素需求,与其他泵相比具有独特性 [27][28] - 公司目前集成了Dexcom G6、G7和Abbott Freestyle Libre 3 Plus,将在15天的Dexcom G7传感器推出时提供支持,保持在美国CGM集成方面的优势 [35] 管理层对经营环境和未来前景的评论 - 公司对2025年的业务发展充满信心,认为能够实现或超越更新后的全年指导目标 [9][35] - 公司相信药房模式在中长期内对毛利率扩张有利,尽管短期内可能会带来一些逆风 [11][14] - 公司有信心在较早阶段实现正自由现金流,主要基于有吸引力的毛利率、按使用付费的药房收入模式和高效的管理团队 [19] 其他重要信息 - 公司将在6月的ADA投资者活动中展示贴片泵的演示,并深入探讨其设计和用户体验优势 [31] - 公司计划在6月的ADA投资者活动中全面更新Islet推出前两年的真实世界证据 [30] 总结问答环节所有的提问和回答 问题1:Q1药房渠道业务动态及增加展望的原因 - 公司在与计划本身的销售方面取得了更大的成功,与Prime Therapeutics的合同带来了更快的增长,且对全年药房采用率的增长有信心 [39][41] 问题2:新患者增加的成功因素及新销售代表的贡献 - 新患者增加得益于Q3和Q4的新产品推出以及销售团队的成熟;第一季度新增的20个销售区域对新患者启动没有贡献,主要结果来自现有的43个区域 [45][46][47] 问题3:新指导假设的新患者启动增加幅度及对竞争的考虑 - 公司增加了收入指导,但实际隐含的新患者启动指导增加幅度高于收入指导;目前不认为市场上有对公司构成特别威胁的竞争 [52][53][54] 问题4:对22% - 25%药房混合比例的信心来源及对渠道的控制 - 公司在与PBM和计划的讨论中有较好的可见性,能够控制患者处方通过药房或DME渠道的流向 [63][64][67] 问题5:新增的20个销售区域是否在第二季度开始运营、是否有业务脱节以及新区域代表的生产力提升时间 - 20个新销售区域在第二季度开始产生收入;没有业务脱节情况;新区域代表开始产生需求的时间不需要几个季度 [75][76] 问题6:医生和处方者对Islet的使用情况及产品认知的变化 - 随着销售团队规模的增加和临床数据的分享,医生对Islet的接受度逐渐提高,开始从在较难治疗的患者上使用扩展到更广泛的患者群体 [80][83][85] 问题7:贴片泵的进展里程碑及DME业务收入和患者收入模型中每患者收入下降的原因 - 公司将在6月的分析师日详细展示贴片泵;DME业务收入每患者收入下降是由于分销商在Q4的库存高于Q1,存在行业内的业务波动 [90][93] 问题8:已放置的19000台泵的早期流失率情况 - 公司不会分享药房或DME渠道的实际流失率,但表示目前看到了较强的留存率 [107] 问题9:桥接研究的预期结果、2型标签扩展试验的时间和规模以及商业组织规模的更新计划 - 桥接研究是一项药代动力学和药效学研究,若成功可将之前的双激素临床数据与新的胰高血糖素配方联系起来;公司暂不评论2型标签扩展试验的相关内容;将在每个季度末分享销售区域的数量,但不分享是否会在今年剩余时间内扩大现场团队规模的预期 [111][113][115] 问题10:与Abbott Libre 3设备集成对新患者启动的影响 - 公司不讨论不同CGM采用的相对权重,但表示Libre 3的集成对第一季度的强劲表现有贡献 [119][121] 问题11:药房业务在中长期内对公司有意义的增值以及患者自付费用降低但支付方热情高的原因 - 药房业务在中长期内对公司有意义的增值,在第11个月时,药房渠道的累计收入高于DME渠道;支付方欢迎按使用付费的药房商业模式,原因一是避免DME渠道中难以监管的患者换泵问题,二是认为更多患者使用胰岛素泵有助于改善患者健康结果并降低系统成本 [124][125][127] 问题12:2型市场中,已使用基础胰岛素或GLP - 1的患者和使用多次每日注射的患者哪个更有机会 - 公司认为目前2型患者中使用强化胰岛素治疗的市场较大,可能是产品进入2型市场的自然切入点,但其他市场的机会还有待观察 [135][137]
获批FDA!可穿戴式心脏转复除颤器
思宇MedTech· 2025-05-06 18:30
产品获批与市场准入 - 2025年5月美国FDA正式批准Element Science公司开发的Jewel Patch-WCD贴片式可穿戴心脏转复除颤器进入美国市场 [1] - 该产品2024年已获得欧洲CE和英国UKCA认证,成为欧美主要市场均合规的可穿戴除颤产品之一 [3] 产品设计与功能 - 采用低轮廓防水贴片式设计,由一次性心电图与除颤电极贴片(每周更换)和可重复使用的除颤主机组成 [3] - 支持全天候监测心电节律,自动识别并治疗可电击心律失常,首次电击后恢复正常心律成功率100% [3][6] - 支持睡眠、洗澡和适度运动期间佩戴,平均每日佩戴时长超过23小时,显著提升患者依从性 [3][6] 目标人群与临床效果 - 专为暂时性高风险人群设计,包括心肌梗死恢复期患者或不适合植入式除颤器的成人,欧美年适用患者超50万 [6] - 关键临床试验中成功治疗6名患者8次心律失常事件,无死亡或严重并发症报告 [6] - 误报率仅0.36次/百患者月,显著低于同类产品 [7] 技术创新与数据管理 - 搭载基于机器学习的心律失常识别系统,精准识别心室性心动过速和心室颤动 [7] - 支持与移动应用程序联动,实时传输数据至医生团队,实现远程监测与个性化护理 [7] 公司背景与融资 - Element Science成立于2011年,总部位于旧金山,聚焦可穿戴技术预防心源性猝死,团队规模100-200人 [8] - 2020年完成1.45亿美元C轮融资,投资方包括Deerfield Healthcare、Google Ventures等 [8] - 创始人Uday Kumar博士为医生兼医疗设备工程师,团队融合iRhythm、美敦力等公司人才 [8] 核心技术参数 - 佩戴方式为胸前贴片,无需绑带或外部模块 [9] - 电极每周更换一次,临床试验中误报率0.36/百患者月 [9] - 支持自动除颤机制,数据实时同步至移动App [9]
新研究:孕期压力可影响新生儿压力反应系统
新华网· 2025-05-06 10:43
结果显示,"高压"组孕妇的孕期压力会影响新生儿,但影响方式具有性别差异。女婴表现出更显著的分 子变化,特别是胆碱tRNA片段几乎完全消失,这类小RNA分子调控着负责合成乙酰胆碱(神经系统中 的神经传导物质)的基因。男婴体内乙酰胆碱酯酶水平较高,这种酶能分解乙酰胆碱,这意味着其压力 反应系统自出生起就已失衡。 新华社耶路撒冷5月5日电(记者王卓伦 陈君清)以色列研究人员参与的一个国际团队最新研究发现, 女性在怀孕期间承受的心理压力会"重新编程"胎儿关键的分子通路,并通过不同方式影响新生儿的压力 反应系统。 来自耶路撒冷希伯来大学和德国慕尼黑理工大学等机构的研究人员介绍,他们以2016年至2018年间在德 国招募的120余对母婴为研究对象,通过孕妇填写的压力感知量表,筛选出"高压"组,并把采集的新生 儿脐带血及孕妇的静脉血冷冻保存至零下80摄氏度进行RNA测序分析。 研究人员表示,本次研究的目标是专注于那些感知压力较高、但尚未被诊断为抑郁或焦虑的孕妇,因为 她们往往不会受到额外的监测,而这些压力仍可能对她们或新生儿造成影响。本次研究强调孕期心理健 康的重要性,并为早期诊断与支持提供可能。 相关研究成果已发表在英国 ...
关于量子计算,我们仍不知道它到底能做什么
虎嗅· 2025-05-06 09:13
当前,量子计算领域蓬勃发展,却仍面临"它到底有什么用"的本质问题。在本文作者来看,在这样的环境下,正是大力推动量子算法的时刻,应降低对量子 算法原有要求,寻找可验证且实用的算法,呼吁理论家积极探索,推动量子计算突破瓶颈。值得一提的是,本文得到了理论物理学家John Preskill的推 荐:"如果你对量子计算感兴趣,我强烈推荐加州理工学院学生robbieking1000的这篇文章,呼吁采取'更务实(scrappier)的方法'来寻找新的应用。" 本文来自微信公众号:返朴 (ID:fanpu2019),作者:robbieking1000,翻译:一二三,题图来自:AI生成 量子计算正处在一个奇特的阶段。技术层面上,经过数十亿美元投资和数十年的研究,实用的量子计算机正逐步接近实现。但令人尴尬的是,如今人们对量 子计算最常提出的问题,仍然和20年前一样:量子计算机到底能做什么?诚实的回答暴露了房间里的大象:我们至今也没有完全的答案。对于像我这样的理 论家来说,这既是一种挑战,也是一种行动的召唤。 技术动能 假设几十年后我们仍未拥有实用的量子计算机,原因会是什么?不太可能是因为遇到了无法逾越的工程障碍。量子纠错的理论基 ...
【UNFX课堂】外汇选择适合自己交易风格的货币对
搜狐财经· 2025-05-05 16:49
选择适合交易风格的货币对:分步指南 不同交易风格对货币对的流动性、波动性、持仓周期有差异化需求。以下根据常见交易风格分类,结合 货币对特性,提供适配选择及实战建议: 一、交易风格分类与货币对匹配 1. 日内交易(Day Trading) 特征: · 持仓时间数分钟至几小时,不过夜。 · 依赖技术分析,追求小波幅收益。 适配货币对: · EUR/USD:高流动性,点差低(0.5-1 点),适合高频进出。 · USD/JPY:亚盘时段活跃,美日政策消息驱动短期波动。 · 黄金(XAU/USD):避险属性带来日内趋势行情,配合美元指数反向操作。 策略工具: · 5 分钟图结合 RSI、布林带捕捉超买 / 超卖信号。 · 伦敦与纽约时段重叠期(UTC 13:00-17:00)集中交易。 2. 波段交易(Swing Trading) 特征: · 持仓数日至数周,捕捉中期趋势。 · 结合基本面与技术面分析。 适配货币对: · AUD/USD:受铁矿石价格与中国经济数据驱动,趋势持续性强。 · GBP/USD:政策预期(如英央行加息周期)带来波段机会。 · USD/CAD:原油价格周期波动形成中长线趋势。 策略工具: · ...