Workflow
量子位
icon
搜索文档
清华给电子显微镜加上Agent,DeepSeek V3全程调度,数天流程缩短至几分钟
量子位· 2025-06-06 12:01
AutoMat团队 投稿 量子位 | 公众号 QbitAI 它相当于一位精准的"地图翻译官",把原子级 STEM 图像自动转成标准 CIF 结构,并一步到位给出形成能等关键物性。 过去的人工流程被缩短到几分钟,真正打通了"显微成像 → 结构重建 → 性质预测"的断层。 此外,团队还专门构建了二维材料数据集 STEM2Mat‑Bench(450 余个样本)进行验证—选择二维材料是因为其单层结构减少多重散射与投 影歧义,更便于精确成像与评测。 AI Agent又解锁了一个领域! 清华大学牵头,与西北工业大学以及上海AI lab等机构推出了电镜领域的AI agent—— AutoMat 。 结果显示,AutoMat在重建精度与能量预测上全面超越现有多模态大模型与AtomAI等专用工具,首次让"看到原子"真正等同于"理解材料",为 材料发现和实验流程的自动化闭环开启了高速通道。 电镜领域的AI Agent 电子显微技术的快速发展已达到亚原子级的成像效果,但解析表征图像的原子结构仍然需要专家逐像素判读、手动建模,对应模板结构,这样 才能得到可供计算的晶体结构文件,这一过程往往耗时数小时甚至数天,还容易因噪声或元素重叠出 ...
Figure机器人分拣快递新视频曝光,网友:太像人类
量子位· 2025-06-06 12:01
西风 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 与OpenAI分道扬镳后,Figure 02开启日夜进厂打工模式。 这不,创始人刚刚放出 最新监工视频 。它干 快 递分 拣员 的活儿,愈发得心应手了。 只见它把快递逐个码放整齐,让条形码朝下,方便扫描仪识别。 碰到纸片型快递,翻面操作也轻松拿捏: 它还懂得把快递整理得更平整,瞅见红色充气快递,也不盲目按压,直接放行: 翻箱子的动作那叫一个丝滑,网友看后直呼手部动作真是太像人了: 即便快递压在下面,它也能抽出来,虽说捏了好几下才成功: 关键这一连串操作, 完全是由端到端通用控制模型Helix自主驱动 。 Figure创始人兼CEO Brett Adcock放出的这段视频,直接打脸一位网友的质疑。 起因是在放出这段视频之前,Brett Adcock发推文称Helix在物流场景有大幅改进,迫不及待要展示新内容。 结果一位AI质疑者在评论区放话:"包裹随机变化的情况下,这绝对行不通"。 没想到,这话刚说没几个小时,Brett Adcock就甩出最新视频。 网友纷纷表示Helix加持的Figure 02最新表现令人印象深刻。 它的动作非常流畅自然。头部微微的 ...
Gemini新版蝉联竞技场榜一,但刚发布就被越狱了
量子位· 2025-06-06 08:58
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌CEO劈柴哥还发了一张AI合成的狮子照片,配文一个"Gemini",暗示了新模型的实力。 没等来o3 Pro和GPT-5,隔壁谷歌的Gemini先更新了。 深夜,谷歌通过等多个账号同时官宣, Gemini 2.5 Pro再次推出新版本 (0605)。 新版本在代码、推理等任务上的表现更上一层楼, 在超难数据集"人类最后的考试"中以21.6%的成绩超过了o3 。 在大模型竞技场上,新版Gemini也超越了自己, Elo评分比上个月的版本提升了24分 。 | ഗ്ര Text | | | 1 7 hours ago | | --- | --- | --- | --- | | Rank (UB) ↑ | Model ↑↓ | Score 1J | Votes 1↓ | | 1 | G gemini-2.5-pro-preview-06-05 | 1470 | 4,701 | | 2 | G gemini-2.5-pro-preview-05-06 | 1446 | 10,386 | | 2 | இ o3-2025-04-16 | 1443 | 13,808 ...
12.1万高难度数学题让模型性能大涨,覆盖FIMO/Putnam等顶级赛事难度,腾讯上海交大出品
量子位· 2025-06-06 08:58
DeepTheorem团队 投稿 量子位 | 公众号 QbitAI 12.1万道IMO级难度数学"特训题",让AI学会像人类一样 推导数学证明 ! "特训"过后,模型定理证明性能大涨 ,7B模型性能比肩或超越现有的开源模型和Claude3.7等商业模型 。 "特训题"为 Deep Theore m ,是首个基于自然语言的数学定理证明框架与数据集,由腾讯AI Lab与上海交大团队联合推出。 团队表示,定理证明是数学前沿的重要组成部分,但当前大语言模型 (LLM) 在数学推理,特别是通过强化学习 (RL) 进行训练时,往往 需要可以自动验证的答案,导致大模型无法像数学家那样通过自然语言进行定理证明。 图(b)展示经过强化学习训练的DeepTheorem-7B模型性能,比肩或超越现有的开源模型和商业模型 (Gemini2.0-flash, Qwen2.5-72B- Instruct, Claude3.7 等 ) ,仅次于o1、o3以及Gemini2.5-pro强推理模型。 DeepTheorem-121K 1、规模与难度:专为"极限挑战"而生 DeepTheorem训练集的显著特点是其大规模与高难度。其包含121K ...
精准调控大模型生成与推理!浙大&腾讯新方法尝试为其注入“行为定向剂”
量子位· 2025-06-05 18:28
STA团队 投稿 量子位 | 公众号 QbitAI ACL 2025中选论文中,来自浙江大学与腾讯的联合团队提出了新思路: Steering Target Atoms (STA),尝试为大模型注入"行为定向 剂",助力对模型行为的精准调控,为构建既聪明又听话的AI打下基础。 该方法通过"原子级"粒度对大模型进行行为编辑干预,实现了更鲁棒、更安全的生成控制。 在Gemma和LLaMA系列模型上的实验表明,STA方法能够有效抑制越狱攻击带来的违规输出,同时不削弱模型在正常问题回答中的高质量智 能表现。 方法&实验结果 大模型行为控制的挑战与突破 在参数训练完成后,很多应用场景会需要在推理阶段调整模型的特定行为,例如让模型拒绝用户的恶意请求。 然而,模型的"安全防御"能力往往和它的"通用智能"能力紧密耦合:为了让模型学会拒绝有害输入,可能会不小心削弱它对正常问题的应对能 力。 如果你面前有两个AI助手:一个能力超强却总爱"离经叛道",另一个规规矩矩却经常"答非所问",你会怎么选? 这正是当前大模型控制面临的两难困境:要么模型聪明却难以约束,要么守规矩却缺乏实用性。但我们真正追求的,并不是在"聪明但难 控"与"听话但 ...
最新AI眼镜格局报告:百镜大战拉开序幕,阿里DeepSeek高通成幕后赢家
量子位· 2025-06-05 18:28
以下文章来源于量子位智库 ,作者量子位智库 量子位智库 . 连接AI创新,提供产业研究 量子位智库 发自 凹非寺 量子位 | 公众号 QbitAI 如果要问近期最火热的AI硬件品类是什么, AI眼镜 一定榜上有名。 从Ray-Ban Meta的销量屡破上限,到雷鸟V3的火热开卖,再到凭借演讲提词功能出圈的 Rokid Glasses,及「李书福同款」的StarV Air2,不同配置、不同功能的AI眼镜产品层出 不穷。 大模型改写智能眼镜进程:AI眼镜站上风口 报告中研究的AI眼镜,主要指接入大语言模型或多模态模型,具备语音交互、图像识别、信 息显示等典型功能的智能眼镜。随着AI大模型、AR显示、微型传感与边缘计算的融合突破, AI眼镜正以更成熟的姿态进入大众视野。 「百镜大战」序幕拉开,第一批量产商用接受市场检验 我们可以看到,AI眼镜逐渐从场景佩戴转向追求全天候佩戴,产品受众也逐渐从科技发烧友 扩展到更大众化的用户。 随着AI眼镜供给侧与需求侧的双向火热,今年以来,「百镜大战」的言论不绝于耳。但实际 上截至目前,现货交付的AI眼镜产品仍寥寥无几。 百镜大战是否名不副实?AI眼镜市场现状到底是什么样的?具备哪 ...
Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好
量子位· 2025-06-05 18:28
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 近期arxiv最热门论文, Qwen&清华LeapLab 团队最新成果: 在强化学习训练大模型推理能力时, 仅仅20%的高熵token就能撑起整个训练效果 ,甚至比用全部token训练还要好。 团队用这个发现在Qwen3-32B上创造了新的SOTA记录:AIME'24上达到63.5分,AIME'25上达到56.7分, 这是600B参数以下直接从base模型训练的最高分。 最大响应长度从20k延长到29k,AIME'24的分数更是飙升到了68.1分。 揭开Chain-of-Thought的熵分布密码 要理解这项研究,需要先从一个有趣的观察说起: 团队发现,当大模型进行链式思考(Chain-of-Thought)推理时,token的熵分布呈现出一个独特的模式: 大部分token的熵都很低,只有少 数token表现出高熵特征 。 具体来说,超过50%的token熵值低于0.01,而只有20%的token熵值大于0.672。 经典的二八法则(或帕累托法则)指出,通常80%的结果由20%的关键因素驱动,但剩下80%也是不能轻易舍弃的。 但是在大模型强化学习这里,80 ...
CVPR 2025 Tutorial:从视频生成到世界模型 | MMLab@NTU团队&快手可灵等联合呈现
量子位· 2025-06-05 16:32
MMLab@NTU团队 投稿 量子位 | 公众号 QbitAI 图像生成已经"卷"入日常,视频生成也不再是最初的"抖动幻影",而是跃升为能够讲故事、控制动作、进行较长时推理的高质量动态内容。 视频生成是否能成为通往世界模型的桥梁? 它是否具备成为可执行、可交互、可推理的智能中枢? 它是否正在走向支撑具身智能(Embodied Intelligence)的核心能力? 这些问题将在 CVPR 2025 Tutorial 《From Video Generation to World Models – 从视频生成到世界模型》中深入探讨。 如何将视频生成作为强大的视觉先验,赋能 AI 感知世界、理解交互、推理物理,从而迈向更通用、更具具身智能能力的世界模型。 本Tutorial(教程)汇聚来自学术界与产业界的一线研究者: 他们将在生成建模、3D理解、强化学习与物理推理等方向展开分享,探讨如何将生成能力转化为感知、预测与决策的智能基座。 日程安排一览(CVPR 2025 |6 月 11 日) | Time (GMT-5) | Programme | | --- | --- | | 09:20 - 09:30 | Ope ...
推理时间减少70%!前馈3DGS「压缩神器」来了,浙大Monash联合出品
量子位· 2025-06-05 16:32
比如编码器容量有限,难以处理密集的多视角输入。 而 ZPressor ,一种即插即用的轻量级模块——可以无缝集成到现有的前馈3DGS模型中,增强模型密集视角扩展性和性能。 在36个输入视图下提升4.65dB,推理时间减少70%,显存占用减少80%,并拓展可输入的视图数目到接近500个。 ZIP Lab和Monash团队 投稿 量子位 | 公众号 QbitAI 在增强现实(AR)和虚拟现实(VR)等前沿应用领域,新视角合成 (Novel View Synthesis,NVS) 正扮演着越来越关键的角色。3D高 斯泼溅 (3D Gaussian Splatting,3DGS) 凭借其革命性的实时渲染能力和卓越的视觉质量,迅速成为NVS领域备受关注的技术方案。 现有的前馈3D高斯泼溅 (Feed-Forward 3D Gaussian Splatting,3DGS) 模型,虽然在实时渲染和高效生成3D场景方面取得了显著进 展,但仍存在一些关键缺陷。 信息过载:前馈3DGS的"甜蜜负担" 深入分析现有前馈3DGS模型的架构,可以发现其核心症结在于编码器容量的有限性。 当输入视图变得密集时,编码器难以有效处理随之而来的 ...
抽象小视频秒变特效大片:原视频精髓不变角色环境任意换,Luma出品
量子位· 2025-06-05 16:32
AI爆改视频可以有多夸张? 这么抽象的"过家家"小船,AI直接给原地飞升为在汹涌海浪中前行的帆船。 不仅画面精细、大片视效果,还保留了原视频的动作运镜。 鹭羽 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 或者是进行风格迁移,"给手部扫个X光"。 动作、位置都与原视频几乎一致。 这感觉,自己在家就能当导演手搓CG大片了。 还要什么动捕、建模、特效渲染啊,AI直接全部搞定。 △ 康伯巴奇如何"成为"史矛革巨龙 这就是AI视频模型最新玩法, Modify Video ,直译就是改造视频,由 Luma AI 推出。 它能 重新"想象" 任何视频,类似于人类拍个草稿,AI负责搞定你想要的各种后期视效。 最关键是能对角色、场景、动作进行精准控制,只编辑你想编辑的元素,不会篡改本来的人物动作。 背着孩子骑大马,现在也能秒变驯龙高手。 要知道,现在很多AI视频生成模型都被诟病不受控制,容易让生成的人物、物体动作诡异或者不符合物理规律。 △ 右边为runway效果,人物凭空产生一件夹克 一经发布,这个玩法就在推特火了。 大家在惊呼amazing同时,也自己试玩了一把,效果确实非常nice。 先看下面这个小哥,本来在停 ...