Workflow
瑶华珊瑚礁多模态AI大模型1.0版
icon
搜索文档
大模型下沉的N个可能
北京商报· 2025-09-26 00:53
技术从论文走向现实,不是动动手指那般简单,但有不少想象空间。9月25日,北京商报记者在云栖会 场内外,听到了珊瑚保护从业者与大模型交叉的故事以及助盲眼镜创业者讲述的AI改变生活的实例。 "云RTC(即时通讯)技术能满足实时避障的低延迟需求,我们的AI眼镜可以在300毫秒内识别障 碍。"杭州瞳行科技市场总监陈刚透露,公司的眼镜同时还整合了通义千问VL(视觉语言模型)、OCR (光学字符识别)模型。大模型可以打破学科壁垒,土木工程专业的个人开发者张子豪靠大模型一个人 就能完成具身智能复杂系统开发。 根据国际权威市场调研机构Omdia发布的《中国企业GenAI(生成式AI)采用格局,2025H1》报告,超 七成的《财富》中国500强企业已采用GenAI。当大模型与产业需求碰撞,抽象的算法正变为触手可及 的生产力工具,在田间地头、深海暗礁、城市角落书写技术普惠的新可能。 智能眼镜:300毫秒内识别 过去十年,他和团队走遍南海300多座岛礁,积累了20多T水下影像资料和100万张照片。"这么多照片 靠人分析是不可能的,传统方法分析100个样方,经验丰富的专家要花18.6小时,还容易出现误差。"杨 红强说依靠AI是自己的 ...
云栖观察|大模型下沉的N个可能
北京商报· 2025-09-25 23:10
生成式AI与产业融合现状 - 国际权威市场调研机构Omdia报告显示,超七成(超过70%)的《财富》中国500强企业已采用生成式AI(GenAI)[1] - 大模型与产业需求结合,正从抽象算法转变为触手可及的生产力工具,在农业、海洋、城市等多个领域实现技术普惠[1] 智能眼镜(杭州瞳行科技)应用案例 - 公司产品“瞳者-助盲AI眼镜”利用云RTC技术实现实时避障,可在300毫秒内识别障碍,低于成年人一步(约37厘米)所需时间[1][4] - 产品整合了通义千问VL视觉语言模型、OCR模型及百炼平台语音交互能力,通过计算机视觉技术能识别151类常见物体[1][4] - 产品在出行场景可引导用户走盲道并提示绕行障碍,生活场景可帮助找物品、读信息,内置双频GPS与北斗模块提升定位精度,并支持一键联系亲友及位置共享[4] - 公司为2025年4月注册的初创企业,创始团队因有成员孩子先天失明而更理解视障群体需求[4] - 公司承认实际需识别的物体远超151类,目前建议用户搭配盲杖使用,并计划未来接入Be my eyes公益服务以提供额外帮助[5] 珊瑚礁监测(中国科学院南海海洋研究所)应用案例 - 研究团队基于通义千问VL多模态大模型,研发出“瑶华”珊瑚礁多模态AI大模型1.0版,用于分析珊瑚礁退化[6][7] - 该模型珊瑚属级识别准确率达88%,部分属集准确率超90%甚至100%,较传统方法性能提升20%[7] - 在一次海试中,AI仅用12小时就完成了原本需要20多小时处理的500多张水下影像,大幅提升效率[7] - 团队计划升级模型,目标将准确率提高到90%以上[8] - 研究背景是全球第四次珊瑚白化危机蔓延,部分区域如大堡礁珊瑚死亡率高达70%—80%,团队过去十年积累了南海300多座岛礁的20多TB水下影像和100万张照片[6] 具身智能开发(个人开发者)应用案例 - 土木工程专业出身的个人开发者张子豪,利用大模型自学AI与机器人技术,完成具身智能复杂系统开发[1][9] - 其展示案例包括:通过虚拟环境几千万次强化学习训练使宇树机器狗能在瑜伽球上站立,以及用成本约千元的3D打印SO ARM机械臂训练抓取小龙虾[9] - 开发者表示,通义大模型(如Qwen3 Coder Plus)帮助其打破了自动化、电子、视觉等多学科壁垒,能快速搞定C++、Python、OpenCV等多语言代码,实现单人开发[9] - 开发者拥有30万粉丝,视频累计播放量超1300万,主题为“几千元玩转具身智能”[9] - 对于普通人入门建议是:利用AI学习代码与知识,明确自身需求,扮演好“产品经理”角色[10]