Software and Internet
搜索文档
Google最新!Gemini Robotics 1.5:通用机器人领域的突破进展
具身智能之心· 2025-10-16 08:03
技术架构 - 采用“协调器+动作模型”的双模型协同智能体架构,协调器由Gemini Robotics-ER 1.5实现,负责高层任务规划与拆解,动作模型由Gemini Robotics 1.5实现,负责将自然语言指令转化为机器人底层动作轨迹 [2] - 架构支持ALOHA、Bi-arm Franka、Apollo三种形态机器人的直接控制,无需额外适配,并通过环境反馈形成“感知-思考-行动”的闭环执行链路 [2][4] 核心创新:运动迁移机制 - Motion Transfer机制通过多形态机器人混合数据训练,学习通用运动规律,解决了传统机器人模型的“数据孤岛”问题 [5][7] - 该机制在Apollo人形机器人上实现“零样本技能迁移”,任务泛化得分从单形态数据训练的0.49提升至0.62,提升约26.5% [13] - 对于数据量中等的Bi-arm Franka机器人,引入多形态数据和MT机制后,任务泛化得分从0.30提升至0.50,解决了新机器人数据少、训练难的行业痛点 [13] 核心创新:思考-动作融合 - 在VLA模型中引入“思考-动作交织”机制,将复杂指令的转化拆分为“指令→自然语言思考轨迹→动作”两步,提升任务执行的可解释性和鲁棒性 [8] - 在ALOHA机器人“按颜色分类衣物”任务中,开启思考模式后进度得分从0.55升至0.67,提升约21.8% [11] - 思考VLA展现出隐式成功检测、自主错误恢复和场景几何理解三大关键能力,例如能在0.5秒内完成物体滑落后的纠错指令更新 [16] 嵌入式推理能力 - Gemini Robotics-ER 1.5在嵌入式推理得分(59)和通用性得分(75)上取得平衡,是唯一处于“高推理+高通用”象限的模型,既能处理专用机器人任务,也保留通用多模态能力 [17][19][20] - 在复杂指向任务中表现优异,其精准指向能力能为VLA提供结合物理约束和语义理解的动作目标定位,是机器人精准动作的核心支撑 [20][24] 性能评估:多形态泛化 - 在视觉、指令、动作、任务四个泛化维度上,1.5版本相比前代模型均有显著提升,例如在Apollo人形机器人上的任务泛化得分从0.07提升至0.63 [25][27][28] - 在ALOHA机器人上,指令泛化得分从0.53提升至0.76,能理解不同表述的同一指令 [28] - 在Bi-arm Franka机器人上,动作泛化得分从0.24提升至0.66,能根据物体重量调整握力以避免滑落 [28][29] 性能评估:长周期任务 - “ER 1.5+VLA”组合在长周期多步骤任务中表现优异,在“Blocks in Drawer”任务中得分0.83,是“Gemini 2.5 Flash+VLA”方案的2.4倍,凸显ER模型精准任务拆解的价值 [33] - ER模型具备工具调用能力,如在“Nut Allergy”任务中能通过网页搜索正确判断食物成分,而对比模型则出现误判 [33] - ER方案在需要场景记忆的“Desk Organization”任务中得分0.88,远高于仅使用VLA的0.32,证明其场景记忆优势 [33] 安全机制 - 通过ASIMOV-2.0基准测试,覆盖文本风险识别、多模态约束适配、视频风险干预三大维度,例如在文本风险识别中能准确判断儿童误食药片的风险类型为“中毒”及严重程度为“重度” [34][36] - 在多模态约束适配测试中,对于承重限制规则,ER 1.5指向8kg和15kg物体的准确率达到90.9% [36] - 在视频风险干预测试中,能预测“儿童接近热水壶”视频中的最后可干预帧,展示出关键的时间推理能力 [36]
企业在院校设奖学金,不能简单地理解为“抢人”
南方都市报· 2025-10-15 08:00
项目概述 - 腾讯全面启动青云奖学金项目,重点关注人工智能领域的基础研究与应用创新 [1] - 项目面向中国大陆及港澳台地区院校就读、具有中国国籍的硕士或博士生 [1] - 首期预计评选15位获奖者,每位将获得总价值20万元现金奖励及价值30万元的云异构算力资源 [1] - 获奖者有机会进入公司实习或就业 [1] 项目背景与行业趋势 - 多位顶尖AI专家(如杨立昆、李飞飞、理查德·萨顿)认为当前大型语言模型缺乏对物理世界的理解和真正推理能力,离人类水平智能尚远 [2] - 行业共识认为人工智能发展需要颠覆性创新,而青年学者最有可能实现此类突破 [2] - 公司设立奖学金旨在发现拥有前瞻性科研视野的青年人才,以应对AI领域的根本性挑战 [2] 青年学者面临的挑战 - 人工智能研究,特别是大模型领域,对硬件算力要求极高,导致资金需求巨大 [3] - 全球GPU因AI爆发式发展及区块链等需求而供不应求,价格高昂 [3] - 许多课题组GPU资源匮乏,学生需自购显卡或依赖需要经费的云算力平台 [3] 项目资源支持的意义 - 奖学金提供的30万元云异构算力资源约可支持3个月前沿GPU实例24小时不间断使用,缓解青年学者的算力瓶颈 [4] - 企业科研人员获奖案例增多(如2025年诺奖得主玛丽·布伦科),表明企业支持对前沿科研至关重要 [4] - 通过提供资源与岗位,企业可能助力中国未来获得诺奖级成果 [4] 企业战略与社会效益 - 企业设立奖学金是履行社会责任、获取人才、发现前瞻性技术路线的多赢举措 [4] - 此类项目有助于公司提前布局可能引领未来的颠覆性AI创新 [2][4]
AI 时代可观测性的“智”变与“智”控 | 直播预告
AI前线· 2025-10-14 17:46
直播活动概述 - 直播主题为AI时代可观测性的"智"变与"智"控之道 [2] - 直播时间为10月15日20:00-21:30 [2] - 参与方包括阿里云、字节跳动、小红书三家公司的技术专家 [2][3] 核心讨论议题 - 头部交锋议题为三大企业共话AI时代可观测新边界 [6][7] - 路线之争议题探讨大模型落地是智能治理还是算法优先 [6][7] - 效率革命议题关注SRE Agent降噪提效的真功夫 [6][7] 技术分享亮点 - 分享构建"观测-分析-行动"的通用智能闭环经验 [7] - 探讨可观测指标归因的底层原理 [7] - 介绍eBPF在大规模常态化运行中的实践经验 [7] - 新型归因平台实现分钟级定位80%线上故障 [7]
抖音在海南投资成立巨量引擎信息技术公司
企查查· 2025-10-14 14:18
公司动态 - 抖音集团(香港)有限公司在海南间接全资持股成立新公司海南巨量引擎信息技术有限公司 [1] - 新成立公司法定代表人为易鲁娜 [1] - 公司经营范围涵盖企业管理咨询、广告制作、广告设计、代理、广告发布及软件开发等业务 [1] 股权结构 - 通过企查查股权穿透显示,海南巨量引擎信息技术有限公司由抖音集团(香港)有限公司间接全资持股 [1]
总价值 50 万元奖金及算力支持!腾讯青云奖学金启动
新浪科技· 2025-10-14 13:37
腾讯招聘全球负责人罗海波表示,作为面向顶尖技术人才的科研激励计划,青云奖学金坚信"为更值得 的探索",支持敢于探索未知、富有创新精神的学子,进行创造性的研究,并转化为推动进步的真实力 量,推动人工智能领域的前沿突破。 新浪科技讯 10月14日下午消息,腾讯青云奖学金全面启动。项目重点关注人工智能领域的基础研究与 应用创新,针对中国大陆及港澳台地区院校就读、具有中国国籍的硕士或博士同学,希望申请者来自计 算机科学、人工智能及其交叉领域,具备卓越的研究能力和深厚的学术造诣,并拥有前瞻性科研视野。 项目首期预计评选出15位获奖者,每位获奖者将获得总价值50万元人民币的现金及算力资源支持。 责任编辑:江钰涵 ...
别Claude Code了,一个国产免费命令行就够了
量子位· 2025-10-14 12:08
产品定位与核心优势 - 阿里心流研究团队推出的终端AI智能体iFlow CLI,定位为Claude Code的国产平替,专为国内开发者设计 [1][2] - 产品面向个人用户永久免费且无限流,支持零成本调用Qwen3 MAX、Kimi K2、DeepSeek V3.2、GLM4.6等最新尖端模型 [2][7] - 团队更新迭代迅速,例如在DeepSeekV3.2和GLM4.6发布后立即适配,国庆前后就发布了3个版本 [9] 性能表现与技术特点 - 在四项基准测试(GAIA、SWE-bench、Terminal-Bench、BrowseComp-ZH)中,使用Qwen3-Coder模型时,iFlow CLI相较于Claude Code和Codex表现出更优的综合性能 [2] - 针对国内开发者优化模型集成和自动化能力,在使用DeepSeek-V3.1-Terminus、Kimi-K2-0905和GLM-4.5等国内Top开源模型的评测中优势明显 [4][6] - 产品通过Context Engineering和Pipeline等方面的优化,使基于国产模型的问题解决能力趋近于海外闭源模型水平 [49] 功能特性对比 - 相比Claude Code和Gemini CLI,iFlow CLI具备更全面的功能支持,包括ToDo规划、SubAgent、自定义Command、Plan模式、Task工具等 [10] - 支持搜索海内外最新资讯,内置多模态理解能力可识别图片,并为国内用户量身打造本土化体验,如中文显示切换、中文社区等 [10][11] - 提供VS Code插件和JetBrain插件,支持对话恢复、内置开放市场、Memory自动压缩等功能 [10] 实际应用场景 - 在数据整理和分析场景中,能够自动安装数据分析和可视化库,完成多维度专业销售分析并以图表形式展现 [16][17][18][21] - 作为项目开发助手,可结合LangChain、streamlit等工具创建基于RAG的大模型问答系统,具备智能搜索、文档获取、制定计划、自主测试、持续优化等完整工作流程 [23][24][26][27] - 支持CodeReview场景,通过代码审查专家subagent自动生成详细的代码审查报告,涵盖变更摘要、良好实践、需要关注的问题等 [29][30][32] 平台生态与扩展能力 - 心流开放平台上线工作流管理系统,支持将不同AI能力组合成完整workflow,实现从代码分析、开发、测试到部署的全流程自动化 [32][33] - 平台预置常用工作流,如小红书发文、深度研究、PPT制作、画流程图等,以及GitHub spec、BMAD等开发者工作流 [33] - 开放Agent SDK,支持安卓SDK、Node.js、Java、Python,让业务快速集成CLI并具备AI能力 [11] 行业影响与发展趋势 - 产品标志着国产AI生态的崛起,在Claude等海外工具调整对国内用户使用策略的背景下具有重要意义 [55][56] - 通过自然语言对话降低命令行使用门槛,改变原有工作流,使AI能力从专业编程人员扩展到数据科学、项目管理、产品设计等领域 [51][52][53] - 配套的开放平台和开发者交流论坛为国内开发者和AI应用普及提供了良好生态基础 [58]
好友互删后朋友圈所有互动会被清除?微信回复“一直都是这样”……网友:挺好的,相忘于虚拟世界
环球网资讯· 2025-10-14 10:41
微信产品功能更新 - 微信更新至8.0.64版本,互删好友后双方的朋友圈点赞和评论将被删除 [1] - 新版本允许用户在删除好友时选择保留聊天记录 [1] - 微信员工澄清互删好友后朋友圈互动不可见是长期存在的逻辑,并非新版本特性 [1] 微信账号管理与数据安全 - 微信客服回应账号长期未登录(通常超过一年)可能被系统回收 [8] - 账号被回收后所有内容将被清空且无法恢复,包括朋友圈、头像、个性签名等 [10] - 客服建议用户定期登录账号保持活跃,并将重要数据备份至外部存储设备 [10] 微信用户规模与生态发展 - 微信及WeChat合并月活跃用户数达14.02亿,同比增长3%,环比增长1% [10] - 微信生态圈主要包括朋友圈、公众号、小程序、视频号和微信小店 [10] - 小程序日活账户数从2018年初的1亿+增长至2022年的5亿+,交易规模从5000亿元+增长至10万亿元左右 [10]
Former Apple CEO John Sculley Identifies This Company's As Apple's First Real Competitor In Decades - Apple (NASDAQ:AAPL), Amazon.com (NASDAQ:AMZN)
Benzinga· 2025-10-13 21:36
竞争格局 - 前苹果CEO约翰·斯卡利指出OpenAI是苹果几十年来首次遇到的真正竞争对手[1][2] - 斯卡利认为人工智能并非苹果的特别优势领域而OpenAI的智能体AI将接管知识工作流程中的复杂任务[2] - 苹果在AI战略上经历重大调整此前在AI领域落后于Meta、亚马逊、Alphabet和OpenAI等公司[5] 行业趋势与商业模式转变 - 人工智能发展将推动行业从应用时代向智能体时代转变智能体将取代大量应用[4] - 这一转变将促使更多科技公司采用基于订阅的商业模式[1][3][4] - 苹果未来的成功取决于其适应这一新时代的能力[4] 公司战略与动态 - 苹果公司在2023年9月宣布彻底改革其AI战略优先发展类聊天机器人体验并全面升级Siri语音助手[6] - 这一举措被视为对苹果此前忽视聊天机器人方法的回应该方法曾导致用户转向独立的OpenAI应用[6] - OpenAI在5月以65亿美元收购了乔尼·艾维的初创公司艾维担任OpenAI设计总监此举被视为对苹果在科技行业主导地位的重大挑战[7]
独家丨原钉钉副总裁林锋离职创业,杀入AI办公硬件赛道
雷峰网· 2025-10-13 14:47
高管离职与创业动态 - 原钉钉副总裁、智能硬件生态总经理林锋已从阿里巴巴离职 [3] - 林锋计划创业进入AI办公硬件领域 [3] - 林锋为阿里元老级人物 于2008年加入公司 曾担任阿里B2B搜索和广告CTO、蚂蚁创新实验室负责人等职务 [4] - 林锋在钉钉期间负责智能硬件战略规划及生态合作 并主导推出钉钉XR混合办公、VR/AR支付、支付宝盒、区块链跨境汇款等创新产品 [4] - 时任钉钉CEO叶军也已从阿里巴巴集团离职 计划创业投身AI Agent赛道 [4][6] - 林锋与叶军在同一时期离职 目前均处于筹备创业阶段 [4] 其他行业人士创业动态 - 前安克UV打印机产品负责人付瀚龙计划创业 已获得多家头部投资机构关注 [5]
Apple Looks to Acquire Tech and Expertise From Prompt AI
PYMNTS.com· 2025-10-13 05:12
收购交易核心信息 - 苹果公司据报正就收购计算机视觉初创公司Prompt AI的人才与技术进行后期谈判 [1][2] - 交易谈判于10月10日被报道 Prompt AI的领导层已于上周告知员工此项待定交易 [2] - 未加入苹果的Prompt AI员工将获得减薪 并被鼓励申请苹果公司的空缺职位 [2] 被收购方Prompt AI业务状况 - Prompt AI成立于2023年 其旗舰应用Seemour可连接家庭安全摄像头以检测特定人物、宠物和物体 并在异常活动发生时发送警报和文本描述 [3] - 尽管应用和技术表现良好 但公司商业模式面临困境 将关闭Seemour应用并删除用户数据 [4] - 除苹果外 Prompt AI也曾被其他潜在买家接洽 包括埃隆·马斯克旗下的xAI和Neuralink [3] 行业趋势与背景 - 此次计划中的交易属于美国科技巨头进行"收购式招聘"以获取人工智能人才的大趋势之一 [5] - 该领域的其他交易包括Meta向Scale AI投资143亿美元 以及谷歌以24亿美元收购Windsurf公司高管和领导层 [5] 苹果公司AI战略动态 - 苹果公司正在内部测试一款类似ChatGPT的iPhone应用 以测试升级版Siri 但该工具仅限于内部测试 不会向消费者发布 [6] - 公司在iPhone 17发布会上强调芯片性能和设计升级 AI功能如信息实时翻译、FaceTime和照片视觉识别仅被简要提及 [7] - 苹果的谨慎立场和 prolonged testing state 可能使其在影响消费者期望方面落后 有报告显示Siri正失去市场相关性 [7] - 相比之下 竞争对手正从已大规模部署的产品中收集大量消费者数据 [8]