Workflow
混合模型
icon
搜索文档
上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型
机器之心· 2025-11-01 12:22
核心技术突破:SDAR范式 - 上海人工智能实验室提出全新范式SDAR,旨在解决大模型推理速度慢、成本高的核心瓶颈[2][3] - SDAR通过“训练-推理解耦”设计,无缝融合自回归模型的高性能与扩散模型的并行推理优势,能以极低成本将任意AR模型改造为并行解码模型[4] - 该方法可理解为先培养强大的AR模型,再用极短时间教会其块状并行生成技巧,在保留原有性能的同时实现推理效率的质的飞跃[12] 性能验证结果 - 在多个基准测试中,SDAR模型与原版AR模型性能持平甚至超越,例如在30B规模下,SDAR-Chat在18个基准中的11个上持平或超越了其AR版本[18] - 在科学推理任务上表现突出:SDAR-30B-A3B-Sci模型在ChemBench和GPQA-diamond基准上得分分别从60.5提升至72.8和从61.2提升至66.7,取得12.3和5.5个百分点的显著优势[6][27] - 通过简单的多轮采样+多数投票,SDAR性能可进一步飞跃,在AIME-2025上提升+19.3%,在LMB-hard上提升+15.7%[28] 效率与成本优势 - SDAR仅需50B token的开源数据进行继续预训练即可达到与AR基线相当的性能,远低于需要580B token从头训练的Dream等工作,实现了高效的“即插即用”式适配[19] - 在工业级推理引擎LMDeploy上的实测显示,SDAR-8B-chat在单张H200上实现了相较于AR版本2.3倍的实际加速,峰值吞吐量高达6599 token/s[23] - 模型越大,并行效率越高:更强的模型预测更自信,能一次性并行生成更多token,实现更高的“有效每步生成Token数”,形成“能力与速度”的良性循环[17][22] 行业影响与潜力 - SDAR不仅是一个“加速器”,更是一个“增强器”,为解决复杂推理任务提供了性能与效率俱佳的新范式[27][29] - 该范式的局部双向注意力机制对于精准理解化学式等结构化知识至关重要,在科学领域展现出巨大潜力[6][28] - 研究全面开源了从1.7B到30B的SDAR模型、推理引擎及迄今最强的开源扩散类推理模型,为行业提供了强大而灵活的新工具[31]
实测低调上线的DeepSeek新模型:编程比Claude 4还能打,写作...还是算了吧
36氪· 2025-08-20 20:14
模型发布与性能 - DeepSeek-V3.1-Base模型正式上线并开源,拥有6850亿参数,支持BF16、F8_E4M3、F32三种张量类型,以Safetensors格式发布,推理效率优化,上下文窗口拓展至128k [1] - 在编程基准测试Aider Polyglot中得分71.6%,表现最佳的开源模型,击败Claude 4 Opus [5][6] - 长文本处理测试中成功从10万字文档中检索特定信息,并提供文学角度的补充建议 [3][4] 技术能力测试 - 编程任务测试显示模型能够处理复杂代码生成,包括物理特性模拟和交互式3D场景构建,如六边形小球弹跳程序和Three.js粒子星系 [6][8] - 数学问题解答逻辑清晰,步骤完整,准确解决牧场草量计算问题 [12][13][14] - 武器对比分析引入方差概念,评估伤害稳定性,超出简单平均计算 [16][17][18][19] 模型应用与创新 - 在Hugging Face平台趋势榜排名第二,接近登顶,显示社区高度关注 [79] - 官方移除深度思考模式中"R1"标识,新增原生"search token"支持,优化搜索功能 [79] - 模型生成内容涵盖创意写作,如冰岛蚊子发布会故事,但存在信息密度过高和意象堆砌问题 [53][56][57][65] 行业比较与定位 - 模型在多项测试中表现优于GPT-5和Claude 4 Opus,特别是在编程和复杂问题解决领域 [5][26] - 社区和行业领袖如Hugging Face CEO公开关注模型发展,强调其技术影响力 [79] - 模型开源发布未附带详细模型卡,但技术细节和性能数据已通过测试验证 [1][81]
云从科技业绩会:在泛AI领域探索新增长点
证券时报网· 2025-07-07 15:28
公司战略与业务布局 - 公司坚持前沿创新与实用落地深度结合的战略方向,以期为投资者带来可持续价值增长 [1] - 人工智能产业已从建设期步入运营期,公司认为Agent技术将带来更多有价值的产出和机会 [1] - 公司业务布局涵盖智慧治理、智慧金融、智慧出行、智慧商业及泛AI五大板块,正在深耕高毛利领域和强化产品策略 [1] - 公司自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中以80.7分的综合成绩登顶榜首 [1] - 公司将通过混合模型(开源+闭源)和混合云(公有云+私有化部署)模式发挥视觉和多模态模型优势 [1] - 2025年经营策略包括技术落地与项目积累提升营收能力、强化回款与成本控制优化现金流、推进业务"双曲线"布局 [3] 财务与运营情况 - 公司核心业务"人机协同操作系统"2024年收入同比下跌55.86%,主要因主动收缩高投入、周期长、资金效率低的项目 [1] - 公司正通过优化成本结构、提高运营效率、加大盈利性项目推进力度来改善现金流状况 [1] - 2025年股权激励方案业绩考核目标为以2024年营业收入为基数,当年营业收入增长率不低于25% [2] - 公司持续致力于优化业务结构,加强成本控制,并积极拓展市场,目标实现扭亏为盈 [3] 研发与人才管理 - 公司核心技术人员张岭和姜迅相继离职,引发投资者对技术人员稳定性的关注 [1] - 公司将灵活调整研发团队规模,吸引顶尖人才,优化团队结构以保障研发效率和创新能力 [2] - 公司正推进研发投入优化工作,集中资源于核心研发领域,强化技术优势 [2] - 公司将通过股权激励计划和优化考核机制等措施加强人才梯队建设 [2] 行业与市场展望 - 泛AI行业收入占比增长显示公司在新行业的拓展成效 [1] - 2025年上半年小而美的应用需求逐步涌现,产品正在进行迭代 [1] - 公司在多个行业的人工智能模型和应用试点中看到机会和趋势 [3] - 公司产品和业务拓展有序进行,部分行业试点已取得成功 [2]