Workflow
Stable Audio Open
icon
搜索文档
腾讯研究院AI速递 20250516
腾讯研究院· 2025-05-15 22:38
生成式AI 一、 5090将被定位?美或强制植入「地理追踪」锁定高端GPU 1. 美参议员提出法案要求英伟达、AMD等厂商在高端GPU和AI芯片中植入地理追踪功能,6 个月后生效; 2. 管制范围包括AI处理器、高性能服务器及RTX 5090等高端显卡,目的是防止战略硬件流入 未授权国家; 3. 芯片厂商需承担产品追踪责任,法案还要求进行为期三年的年度评估,或将实施更多限制 措施。 https://mp.weixin.qq.com/s/ngr8SSSzneq050_u_lcNvg 2. 新模型能够自主暂停、重新评估问题并调整策略,在代码生成任务中可自动测试和修正错 误; 3. 消息称确实有个正在测试、代号为Neptune的新模型,最大支持128k tokens上下文长 度。 https://mp.weixin.qq.com/s/pkhgH2Q7kta0KwHH5_jdgA 四、 超越OpenAI、ElevenLabs?MiniMax新一代人格化语音模型 二、 GPT-4.1正式在ChatGPT中上线,但暂时没有1M上下文 1. OpenAI在ChatGPT中正式上线GPT-4.1模型,Plus、Pro和Tea ...
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频
Z Potentials· 2025-05-15 11:30
图片来源: Stability AI AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的"立体声"音频生成 AI 模型,该公司 宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。 Stable Audio Open Small 是 Stability AI 与芯片制造商 Arm 合作的成果,后者生产了众多平板、手机 及其他移动设备中的处理器。尽管已有许多 AI 应用如 Suno 和 Udio 能生成音频,但多数依赖云端处 理,意味着无法离线使用。 Stability 还宣称, Stable Audio Open Small 的训练集完全由免版税音频库 Free Music Archive 和 Freesound 中的歌曲构成。这与前述 Suno 和 Udio 的训练集形成对比——据报道后者包含受版权保护 内容,存在知识产权风险。 Stable Audio Open Small 拥有 3.41 亿参数规模,并针对 Arm CPU 进行了优化。 (参数有时被称为 " 权重 " ,是模型内部决定其行为的关键组件。)该模型专为快速生成短音频样本和音效( ...
速递|Stability AI 生成速度提高30倍,优化音频生成模型,在Arm芯片上运行
Z Potentials· 2025-03-04 13:33
合作与技术优化 - Stability AI与芯片制造商Arm合作,将Stable Audio Open模型引入运行Arm芯片的移动设备[1] - 优化后的模型生成速度提高30倍,在Armv9 CPU上生成11秒音频样本仅需8秒[2] - 公司计划未来将模型引入消费者应用和设备,但目前尚不能下载[2] 产品特点与竞争优势 - Stable Audio Open可基于文本描述生成音效(如"日落时分的轻柔海浪声")[2] - 模型训练数据完全采用免版税音频和歌曲,规避知识产权风险[2] - 区别于依赖云端处理的竞品(如Suno和Udio),该模型支持离线使用[2] 公司动态与战略方向 - 新任CEO Prem Akkaraju强调生成式AI需"无处不在",以服务专业创作者和企业需求[3] - 公司正与Arm进一步优化模型以适应移动设备[3] - 近期动作包括:更换CEO、引入James Cameron加入董事会、发布多款新图像生成模型[4] 行业背景与挑战 - Stability AI以Stable Diffusion图像生成模型闻名,但此前因管理不善导致财务危机[3] - 曾面临员工流失、Canva合作终止、投资者信心动摇等问题[3] - 去年通过融资引入Eric Schmidt和Sean Parker等投资者以扭转业务[3]