Programming intelligent agent

搜索文档
24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练
量子位· 2025-05-22 11:21
Mistral AI发布开源编程模型Devstral - Mistral AI与All Hands AI合作推出最新开源编程模型Devstral,在软件工程任务上表现优异,超过DeepSeek全家桶和Qwen3 235B [2] - Devstral参数规模为24B,可在单卡RTX4090或32G内存的Mac上运行,具有较高的硬件兼容性 [3] - 该模型专为解决现实世界软件工程问题而设计,突破了传统大模型仅擅长碎片化编程任务的局限 [4] Devstral的技术特点与性能 - 模型针对真实GitHub Issue进行训练,专注于大型代码库的上下文理解、组件关系识别和复杂函数错误检测 [5] - 在包含500个真实GitHub Issue的SWE-Bench Verified基准测试中,Devstral成为开源SOTA,并优于许多同等参数规模的闭源模型 [5] - 使用Apache2.0开源许可,相比前代Codestral模型放宽了使用限制 [7] 实际应用表现 - 在开发待办事项列表APP时,模型会主动询问用户技术栈偏好,展现出交互式开发能力 [9] - 开发者成功为模型添加视觉支持并复刻Claude网页版界面,证明其可扩展性 [12][14] - 模型可能是基于Mistral-Small微调而来,但官方移除了视觉编码器 [16] 合作方与生态建设 - 合作方All Hands AI专注于智能体框架开发,其口号是"少写代码,多做事" [17] - Devstral可与OpenHands或SWE-Agent等智能体框架配合使用,支持代码修改、命令执行、网页浏览等完整开发流程 [18] - OpenHands框架自去年4月推出以来已在GitHub获得5万+标星 [23] 未来发展 - Devstral目前处于研究预览版状态,团队计划在未来几周内发布更强大的代理编码模型 [22] - 模型已开放下载,社区可立即体验其功能 [23]