Workflow
AGI布局
icon
搜索文档
30秒,我用蚂蚁灵光复刻了个支付宝(doge)
量子位· 2025-11-18 17:00
灵光APP核心功能与特点 - 蚂蚁集团推出业界首个全模态通用AI助手“灵光”,支持3D、音视频、图表、动画、地图等多种模态内容的一站式生成[1][3] - 应用生成功能强大,最快仅需30秒即可生成一个可编辑、可交互、可分享的私人定制小APP[3] - 答案呈现形式结构化且可互动,排版美观并采用卡片设计突出重点,不同于传统的文字包轰炸[10][11][32] 主要功能模块实测 - 灵光对话功能能够化繁为简,对复杂问题提供一目了然的答案,指令遵循能力强且生成速度快[7][8][10] - 灵光闪应用功能支持低门槛AI Coding,实测可生成功能完整的应用如电子猫咪捕获器和仿支付宝应用[17][19][20][22] - 灵光开眼功能搭载AGI相机技术,通过摄像头识别万物,并可对识别内容进行延展知识查询和再创作[24][25][27][29] 技术架构与实现原理 - 背后采用多智能体协作的Agentic架构,主模型理解需求,后台专用Agent动态协作完成全模态内容生成[35][36] - 实现了基于全代码生成的多模态输出能力,不仅是文本回答,更是AI生成能力的整体提升[33][35] - 灵光开眼功能通过实时视频流解析实现对物理世界的观察和理解,支持文生图/视频、图生图/视频等多种创作模式[39] 产品定位与竞品差异 - 与阿里系千问APP定位不同,灵光底层模型预估为自研百灵大模型,主打全模态生成和轻量化应用[40][42] - 千问更聚焦传统对话场景并强调深度思考能力,而灵光侧重表现形式多样和交互丰富性,前者偏工作后者偏生活[42][43] - 二者核心架构均为“对话+搜索”,但灵光在可视化方面做足功夫,对用户更友好[32][42] 公司AGI战略布局 - 蚂蚁集团战略方向明确,依托金融场景优势转型为AI驱动型科技公司,并从大模型、多模态、具身智能全方面发力[44][50] - 公司AGI布局关键词为低门槛、多模态、重C端、落场景和全链路,今年已推出AI医疗管家AQ和成立灵波科技涉足具身智能[44][46][47][50] - 百灵大模型已进入万亿参数模型阵营并以开源形式发布,在推理、代码生成等核心能力上表现亮眼[50]