加码多模态能力,夸克发布全新“AI相机”
夸克AI相机功能升级 - 公司发布全新AI相机功能"拍照问夸克",基于视觉理解与推理模型创新下一代搜索体验[1] - 功能覆盖旅游(行程制定、景点识别)、文物识别(中外语音讲解)、跨国翻译(菜单翻译)、图像处理(杂物消除、表情调整)及社交文案生成[3] - 生活场景支持故障诊断(电器蓝屏拍照解决方案)、物品购买指导(灯泡/螺丝型号识别)[5] - 健康管理功能包括体检报告解读、用药禁忌查询及定制化食谱生成(如尿酸偏高食谱)[7] - 工作学习场景支持合同补全、图表计算、代码注释复现等[10] 多模态AI行业动态 - 行业竞争聚焦多模态能力,OpenAI推出视频生成工具Sora,谷歌发布跨模态模型Gemini[13] - 国内企业快速跟进:腾讯混元大模型新增视频生成,月之暗面发布Kimi1.5支持跨模态推理,字节豆包1.5实现视觉推理[13] - 公司通过"AI超级框"迭代拓展多模态应用场景,3月发布后持续升级用户体验[12] 技术实现与定位 - 产品定位为阿里巴巴AI旗舰应用,目标打造生活/工作/学习的超级入口[1] - 核心技术依托视觉理解与思考推理模型,实现物理世界问题的交互解答[1] - 交互方式创新体现在拍照即搜索的跨场景应用(旅游/健康/工作等)[3][5][7][10]