Workflow
Agent Neo
icon
搜索文档
腾讯研究院AI速递 20250603
腾讯研究院· 2025-06-02 23:08
注意力机制优化 - Mamba核心作者提出GTA和GLA两种推理定制注意力机制,解码速度和吞吐量最高提升2倍 [1] - GTA可减少50% KV缓存使用,GLA比DeepSeek的MLA解码更快,优化内存和计算逻辑同时保持生成质量 [1] AI Agent技术突破 - Flowith的Agent Neo支持无限执行和产出,具备百万级token上下文能力,解决AI记忆问题 [2] - Agent Neo集成3D、语音、视频等多模态生成管理功能 [2] - Fairies通用AI Agent支持1000种操作,兼容GPT 4.1等主流模型,专业版每月20美元 [4][5] 多模态与图像处理 - FLUX.1 Kontext实现角色一致性保持,生成速度约10秒,支持物体修改和背景替换 [3] - 当前局限包括多轮编辑质量退化、无法参考多图像,需遵循明确保留内容的提示原则 [3] 语音交互与边缘计算 - ElevenLabs Conversational AI 2.0识别语气词意图,集成多语言和RAG技术,支持企业级应用 [6] - Google AI Edge Gallery开源手机本地AI运行器,支持离线图像生成和代码编写,性能依赖设备配置 [7] 机器人硬件与成本趋势 - Hugging Face发布250美元开源人形机器人Reachy Mini,全尺寸HopeJR含66个驱动自由度 [8] - AI推理成本两年内下降99.7%,中国模型成本或为GPT-4.5的0.2%,DeepSee等快速崛起 [9] 行业生态与战略布局 - OpenAI企业服务付费席位超300万(增长50%),推进国家级AI架构"Stargate" [9] - 下一代AI入口将转向全能智能体,OpenAI与Jony Ive合作开发环境化交互硬件 [9] 认知研究与技术瓶颈 - LeCun团队揭示LLM在精细语义任务中失效,与人类认知存在本质差异 [10] - 研究质疑单纯扩大模型规模实现AGI的路径,需重新设计优化目标 [10]