AI前线

搜索文档
阿里最新开源模型Qwen3到底能不能打?不妨上「通义App」亲自试试
AI前线· 2025-04-30 13:11
作者 | 付秋伟 4 月 29 日凌晨,阿里正式发布并开源了最新的通义千问 Qwen3 模型(以下简称 Qwen3),并迅速登顶多项大模型测评榜单,引发了全行业的关注。 据介绍,Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,尤其是旗舰模型 Qwen3-235B-A22B,在多个国际权威基准测试中刷新 了开源模型纪录。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-ol | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIME'24 | 85.7 | 81.4 | 74.3 | 79.8 | 83.9 | 92.0 | 79.6 | | AIME'25 ...
英特尔 CEO 陈立武:18A 制程节点已进入风险试产阶段,14A 节点即将推出
AI前线· 2025-04-30 13:11
作者 | 褚杏娟 今天,2025 英特尔代工大会(Intel Foundry Direct Connect)开幕,英特尔分享了多代核心制程和先进封装技术的最新进展,并宣布了全新的生态系统 项目和合作关系。此外,行业领袖齐聚一堂,探讨英特尔的系统级代工模式如何促进与合作伙伴的协同,帮助客户推进创新。 英特尔公司首席执行官陈立武(Lip-Bu Tan)在开幕演讲中分享了英特尔代工的进展和未来发展重点,强调公司正在推动其代工战略进入下一阶段。陈 立武表示:"英特尔致力于打造世界一流的代工厂,以满足日益增长的对前沿制程技术、先进封装和制造的需求。我们的首要任务是倾听客户的声音,提 供有助于其成功的解决方案,以赢得客户的信任。我们在英特尔全公司范围内推动以工程至上为核心的文化,同时加强与整个代工生态系统的合作关 系,这将有助于我们推进战略,提高执行力,在市场上取得长期成功。" 制程技术方面,英特尔代工已与主要客户就 Intel 14A 制程工艺展开合作,发送了 Intel 14A PDK(制程工艺设计工具包)的早期版本。这些客户已经表 示有意基于该节点制造测试芯片。相对于 Intel 18A 所采用的 PowerVia ...
全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?
AI前线· 2025-04-30 13:11
作者 | 李飞 昨天凌晨,阿里巴巴开源新一代通义千问模型 Qwen3,AI Agent 厂商数势科技的数据分析智能体 SwiftAgent 已率先完成全面适配,并发布了 Qwen3 与 DeepSeek-R1 的测评报告,下面是具体评测内容,我们来看看在企业级的数据分析和智能决策场景上,Qwen3 与 DeepSeek-R1 到底有哪些差异? ( 声明 : 本次测评主要针对 Qwen3-32B 和 Qwen3-235B-A22B, 对比 Qwen2.5-72B 和 R1 效果 ) 针对数据分析 Data Agent,我们有如下关键节点 (如图 1),分别是改写,任务编排,工具选择和参数解析,工具运行和总结等。其中数据查询工具又 涵盖了复杂的能力,例如如何将用户的查询语句解析成对应的语义层要素 (时间,指标 ,维度,逻辑算子等)。不同节点的准确性对最终结果都会造成较大的影响。 图 1:数据分析 Agent 流程概要 当前在落地的过程中,不同厂商针对其中节点的准确性优化基本都是三种手段,分别是提示词工程、RAG 增强判断和模型微调等。这三种手段的实施成 本是递进的,效果也不可控。因此,数势科技一直秉持积极拥抱最先 ...
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
AI前线· 2025-04-29 07:57
Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在官方的测评中,Qwen3 创下所有国产模型及全球开源模型的性能新高:在奥 数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | Open Al-o 3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | MoE | Dense | 2024-12-17 | | Think | | Medium | | ArenaHard | 95.6 | 93.8 | 92.1 | 93.2 | - | 96.4 | 89.0 | | AIM ...
Docker 推出 MCP Catalog 和工具包,供应商不顾安全问题争相支持
AI前线· 2025-04-29 07:57
作者 | Tim Anderson 译者 | 平川 策划 | Tina 本文最初发布于 DEV CLAS 。 Docker 推出了自己的 MCP(模型上下文协议)目录和用于管理 MCP 工具的 MCP Toolkit。 MCP Catalog 是 Docker Hub 的一部分,该公司声称其有 100 多台初始服务器,可以访问来自 Elastic、Salesforce Heroku、New Relic、Stripe、 Pulumi、Grafana Labs、Kong 和 Neo4j 等供应商的第三方工具。未来,他们计划让企业发布自定义的 MCP 服务器,而 Docker 承诺将提供 "全面的企 业控制"。 MCP 的目的是为 AI 代理提供一个标准化的 API,用于控制这些服务器提供的服务,从而扩展 AI 代表用户执行任务的能力。如果您正在寻找一份友好的 入门指南,可以看一下我们为您准备的 MCP 实践指南。 MCP 由 Anthropic 公司于 2024 年 11 月推出,是 "一个连接 AI 助手与数据所在系统的新标准"。该协议被包括 OpenAI、微软和谷歌在内的许多公司迅 速采用;供应商们争先恐后地 ...
FastAPI-MCP 开源:简化 FastAPI 与 AI 智能体的集成
AI前线· 2025-04-28 19:10
作者|Robert Krzaczyński 译者|明知山 策划|Tina 最近,一个叫作 FastAPI-MCP 的开源库问世,旨在帮助开发者更轻松地将传统 FastAPI 应用程序与现代 AI 智能体通过模型 上下文协议 (MCP) 连接起来。FastAPI-MCP 旨在实现零配置,使得开发者能够自动将 API 端点暴露为与 MCP 兼容的服 务,从而以最小的改动让 Web 服务对 AI 系统可用。 这个库能够识别所有可用的 FastAPI 端点,并将它们转换为 MCP 工具。它保留了请求和响应模式,以及为 Swagger 或 OpenAPI 接口创建的文档。这些功能确保 AI 智能体能够访问端点,并有效地、安全地与它们发生交互。此外,开发者可以 直接在 FastAPI 应用程序内挂载 MCP 服务器,也可以将其作为独立服务部署,从而在不同架构中提供灵活性。 服务器既可以作为 FastAPI 应用的一部分进行托管,也可以独立部署,具体取决于架构需求。它支持通过 uv(一个高效的 Python 包管理器)和传统的 pip 进行安装。 这种方法在开发者和 AI 社区引起了广泛关注。AI/ML 工程师兼多云架构师 ...
细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!
AI前线· 2025-04-28 19:10
作者|冬梅 字节 Top Seed 启动 2026 届招聘,瞄准顶尖博士 4 月 27 日,字节跳动 Seed 在其官微上发布了一则招聘启示,宣布正式启动 2026 届 Top Seed 大模型顶尖人才校招计划, 研究课题包括大语言模型、机器学习算法和系统、多模态生成、多模态理解、语音等方向,基本覆盖大模型研究各个领域, 计划招募约 30 位顶尖应届博士。 值得一提的是,本届 Top Seed 强调不限专业背景,更关注研究潜力,希望寻找具有极强技术信仰与热情、具备出色研究能 力、富有好奇心和驱动力的年轻研究者。 值得注意的是,字节跳动在此次招聘启事中还透露了几位刚毕业的同学已经做出了一些有影响力的研究。 比如,Z 同学构建并开源了首个多语言代码修复基准 Multi-SWE-bench,在 SWE-bench 基础上,首次覆盖 Python 之外的 Java、TypeScript、C、C++、Go、Rust 和 JavaScript 七种编程语言,1632 个真实修复任务,是真正面向"全栈工程"的评测 基准,其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。 ...
曝百川智能老班底所剩无几;小红书取消员工大小周、竞业;马拉松亚军“松延动力 N2”以 5.7 万元拍卖价成交 | AI周报
AI前线· 2025-04-27 12:28
整理 | 傅宇琪、褚杏娟 小米被曝要求员工日均工时不低于 11.5 小时;小红书宣布取消员工大小周、竞业;传百川智能重大组织结构变化,老班底所剩无几,多位核心高管变动; 传 Manus 母公司完成超 5 亿元融资;贾跃亭首次回应"下周回国"梗;英特尔本周宣布裁员 20%,超 2.18 万人或被裁撤;裁掉 2000 人后,微软对绩效不佳 员工使出一系列"组合拳";平台"二选一"?京东美团"外卖战"打得火热…… 行业热点 小米被曝要求员工日均工时不低于 11.5 小时,员工:平均 12 小时仍被约谈 近日,有用户发帖称,小米要求员工日均工时不低于 11.5 小时,其中低于 8 小时需要提交说明,工时排名靠后的要被约谈,甚至劝退。"小米查工时"相 关话题在小红书等平台引发讨论。多位小米员工证实了这一情况。 小米手机部门一员工告诉记者,不同组情况不一样,日均工时要求低的组是 10.5 小时;有的组甚至要求日均 14、15 个小时,他们部门要求 12.5 小 时,"但领导都是口头要求,不会留下痕迹。"小米上海一员工说道,他们部门确实要求平均 11.5 小时,就是 9 点上班、8 点半下班。"我之前平均工时达 到了 12 ...
Anthropic 下架逆向工程者代码,网友开始称赞OpenAI开放
AI前线· 2025-04-27 12:28
整理 | 核子可乐、褚杏娟 近期, Claude Code 迎来一次品牌危机。据报道,部分是 Anthropic 向一位试图对 Claude Code 进行逆向工程的开发者发出了下架通知,而 Claude Code 的使用许可比 Codex CLI 更为严格。 据悉,OpenAI 的 Codex CLI 源代码遵循 Apache 2.0 许可证,允许分发和商业使用。Claude Code 遵循 Anthropic 的商业许可证,限制未经公司明确许 可的修改。 据报道,Anthropic 还对 Claude Code 的源代码进行了"混淆"。Claude Code 的源代码不易获取。当一位开发人员对其进行了去混淆处理并在 GitHub 上 发布源代码时,Anthropic 提交了一份 DMCA (数字千年版权法案)投诉,要求删除该代码。 为此,开发者们认为这种做法还不如 OpenAI 发布 Codex CLI 时的开放态度。"真的觉得 Anthropic 的态度非常令人厌烦。"有网友评价。 其他几位开发人员同样分享了自己在单条提示词中取得出色编码成果的难忘经历。EverArt 创始人 Pietro Schira ...
酷开一口气甩出 6 个超级智能体!CEO:一定要做 AI 原生,性价比是我们追求的主要方向
AI前线· 2025-04-25 21:48
当下,市面上各类智能体如雨后春笋涌现,但由于缺乏应用广度及深度,以及设备交互无法承载场景需求,智能体的应用价值未得到充分发挥。市面上 不缺乏智能体,但缺少能够提供满意服务的智能体。 据王志国介绍,此次推出超级智能体后,酷开接下来的规划是分步走的。第一,做用户数据的闭环,要观察三个月左右的时间,尤其是用户留存、活跃 数据和功能满足率大方面;第二,主动服务能力是下一个重心,准备把超级智能体的意图识别模型从 7B 模型换到 32B 模型,把它做成跟用户情感对话 的工具;第三,时刻保持着跟行业内最领先的大模型做,一定要做 AI 原生,只要中间隔着人,大模型的能力就会被大幅度衰减。 同时,酷开超级智能体和六大专业智能体支持软件售卖、设备授权、PaaS 服务、生态共赢的等合作模式,致力构建开放智能生态。据王志国透露,今 年 Q1 季度,酷开签约智能体销售(软件销售)已经达到了软件和硬件各占一半。 作者 | 华卫 4 月 22 日,酷开在以"大爱 AI"为主题的 2025 春季发布会上发布超级智能体,包括影音、健康、生活、设备、创作、教育六大智能体,以及智能体硬件 酷开学习机 Y41 Air、酷开闺蜜机 C20 系列等产品 ...