视觉识别

搜索文档
中国足球还是靠机器人吧!首届机器人运动会闭幕:票价终究保守了
量子位· 2025-08-18 17:16
机器人足球赛 - 清华火神队以1-0战胜德国队 通过一记乌龙球锁定胜局 赢得5v5机器人足球赛冠军 [1][2][4] - 比赛采用全自主行动模式 机器人数量增至5台 复杂度显著高于传统3v3赛制 [21] - 胜负关键取决于算法 火神队凭借独家射门算法在50支队伍中脱颖而出 [25] 技术突破 - 机器人配备4摄像头系统 主摄像头负责视觉感知 辅助摄像头进行距离分析和环境判断 响应速度达0.1毫秒 [27][28] - 引入躲避碰撞算法 红队采用灵活的人盯人战术 蓝队执行稳健的联防策略 [29][30] - 赛事首次实现端到端自主决策 涵盖视觉识别 空间定位和团队协作等前沿技术 [20][21] 赛事影响力 - 比赛门票定价128-428元 销售表现火爆 反映公众对机器人技术的高度关注 [35] - 26个赛项487场比拼 包括100米障碍赛(冠军成绩33.71秒)和自由搏击等项目 [8][11][32] - 赛事成为技术展示窗口 推动机器人运动算法 环境交互等实验室成果向公众转化 [33] 商业化潜力 - 宇树科技在障碍赛等7个项目夺金 体现运动机器人领域的技术积累 [5][6] - 采用BoosterT1标准硬件平台 差异化竞争集中于算法优化层面 [22][24] - 赛事IP商业化初见成效 门票体系验证消费级机器人娱乐市场的付费意愿 [35]
主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK
虎嗅· 2025-08-17 12:08
智谱AI模型技术进展 - 智谱推出GLM-4.5模型 在逻辑推理、代码编写及工具调用等方面实现显著提升[1] - 基于GLM-4.5模型推出开源视觉推理模型GLM-4.5V 在42项公开视觉基准测试中获得41项第一[2] 多模态AI能力测试 - 测试选取十张设计非常规的卫生间标识图片 模拟真实场景下AI视觉识别能力[7][11] - 参与测试模型包括智谱GLM-4.5(开启/关闭推理模式)、豆包、Kimi、元宝和ChatGPT GPT-5[9][10] - 测试采用统一指令:"我着急上厕所,但是厕所门口的男女标识让我分不清楚哪个是男厕所了,请你快速告诉我应该去哪个" 并采用新对话避免上下文干扰[15][16] 模型性能表现 - 智谱GLM-4.5关闭推理版本以86分(满分100分)位列第一 智谱开启推理版本与ChatGPT GPT-5同获78分并列第二[12] - 豆包和元宝均获得70分 Kimi仅得38分 显示其在视觉识别训练投入相对不足[12][22] - 所有模型在染色体标识(XX/XY)测试中均正确应答 显示基础知识识别能力稳定[29] 技术应用前景 - 多模态AI技术在工业安全检测领域具有应用潜力 可快速识别异常人或物并结合知识库排查安全隐患[39] - 农业领域可通过卫星图像分析作物生长状况 畜禽识别等应用场景[40] - 医疗诊断领域能辅助医生快速定位医学影像问题 提升诊断效率[41] - 视觉识别能力为AI系统提供"眼睛"功能 显著扩展技术落地场景[42]
理想第一产品线负责人也回应了为啥焕新版方向盘取消电容?
理想TOP2· 2025-06-11 10:59
方向盘监测技术演进 - 2019年理想ONE采用电容方案作为主要方向盘监测方式 因特斯拉扭矩方案需施加较大力度且体验不佳 同时行业普遍采用电容方案[2][3][4] - 电容方案需手部接触面积大于3个完整手指才能识别 受制造公差 标定误差及气温影响 实际要求"整握"方向盘[8][9] - 2021款理想ONE切换为自研辅助驾驶方案 但保留电容方向盘监测[6] 技术路线迭代决策 - 2022年理想L9开发时考虑改用特斯拉扭矩+视觉方案 因电容需"捏"方向盘且与主流方案不一致 但视觉识别不稳定导致误报率高 最终维持电容方案[6][7][10] - 2024年视觉识别能力显著提升 智能驾驶团队决定回归扭矩+摄像头主流方案 实测显示新方案体验优于22款L9电容方案[10] - 视觉方案采用隐藏式非RGB摄像头 2025年技术成熟后误报问题基本解决[10] 产品设计理念 - 方向盘监测为法规要求而非用户功能 需确保驾驶员专注道路而非操作手机[11] - 技术方案选择遵循用户体验优先原则 避免技术自嗨或盲目跟随竞争[13] - 建议用户试驾理想L9智能焕新版或MEGA 体验摄像头+方向盘监测方案的实际表现[12]