Workflow
VeriGen
icon
搜索文档
一个能生成Verilog代码的大模型
半导体行业观察· 2025-06-30 09:52
文章核心观点 - 纽约大学坦登工程学院的研究团队成功开发了首个专门用于生成Verilog代码的人工智能模型VeriGen,该模型在特定领域的性能超越了通用大模型,标志着AI辅助硬件设计领域的重大进步 [2][3][5] 技术突破与模型性能 - VeriGen是首个成功训练用于生成硬件描述语言Verilog代码的专用AI模型,其研究成果获得了ACM电子系统设计自动化学报2024年度最佳论文奖 [2] - 研究团队通过创建并发布迄今规模最大的Verilog代码AI训练数据集来应对训练数据稀缺的挑战,该数据集包含从GitHub收集的约5万个Verilog文件以及70本Verilog教科书的内容 [2] - 研究人员对包含160亿参数的Salesforce开源CodeGen-16B模型进行微调,训练过程计算需求巨大,需要三块NVIDIA A100 GPU并行工作,消耗约250 GB的GPU内存 [3] - 微调后的模型在测试中表现出色,功能正确率达到41.9%,超越了商用Code-davinci-002模型35.4%的正确率,其准确率从1.09%提升至27%,展现了领域特定训练的显著优势 [3] - 该方法证明通过对特定任务微调可大幅缩减模型规模,使得模型能在标准笔记本电脑上运行而无需专用硬件 [3] 行业影响与后续发展 - NVIDIA在2025年的研究将VeriGen评为基于大语言模型的Verilog生成最早、最重要的基准之一,为AI辅助硬件设计奠定了基础 [5] - 该项目的开源特性引发领域极大兴趣,团队后续开发了性能更出色的改进模型系列“CL Verilog”,并已提供给高通和恩智浦等硬件公司评估其商业应用潜力 [5] - VeriGen是对纽约大学坦登分校其他AI辅助芯片设计计划的补充,包括通过自然语言对话设计微芯片的Chip Chat项目、为STEM研究生提供芯片设计培训的Chips4All以及向非专业人士教授芯片设计的BASICS项目 [6]