Workflow
智能模型
icon
搜索文档
英特尔新显卡拉爆性价比,可本地跑DeepSeek-R1
观察者网· 2025-05-20 23:03
5月19日,在台北国际电脑展(ComputeX)上,英特尔发布了Arc Pro B50和Arc Pro B60两张显卡,起售价仅299美元(约合人民币2156元)。 英特尔官网 价格上,16GB显存的Arc Pro B50售价299美元(约合人民币2156元);24GB显存的Arc Pro B60,售价为500美元(约合人民币3605元)。 性能上,B50面向图形工作站,采用双槽厚度设计,拥有16个Xe核心和128个XMX引擎,可提供高达170 TOPS的峰值运算能力,同时配备16GB显存,显存 带宽为224GB/s,典型主板功耗为70W,支持PCIe 5.0×8连接。在图形工作负载方面,英特尔声称其性能比上一代A50提升了高达3.4倍,并且在MLPerf等一 系列AI推理测试基准上全面超越英伟达的RTX A1000 8GB。 在通用性能方面,锐炫Pro B50相比上一代产品提升50%-130%。其性价比不仅相较锐炫Pro A50、英伟达RTX A1000翻倍提升,比起锐炫Pro A60也略胜一 筹。 英特尔官网 B60则主要面向AI推理工作站,拥有20个Xe核心和160个XMX引擎,峰值TOPS可达197, ...
火山引擎发布豆包视频生成模型Seedance 1 lite
快讯· 2025-05-13 15:12
产品发布 - 火山引擎在FORCE LINK AI创新巡展上海站发布豆包视频生成模型Seedance1lite 支持文生视频和图生视频 生成时长支持5秒和10秒 分辨率提供480P和720P [1] - 同时发布豆包1 5视觉深度思考模型 并升级豆包音乐模型 [1] - 通过更全面的模型矩阵和更丰富的智能体工具 帮助企业打通从业务到智能体的应用链路 [1] 产品应用 - 企业用户可在火山方舟平台使用Seedance1lite模型API [1] - 个人用户可在豆包APP和即梦体验该视频生成模型 [1]
只有通过海量测试才能抓住泛化性的本质吗?
机器之心· 2025-05-10 11:42
本文第一作者为上海交通大学博士生程磊,指导老师为上海交通大学张拳石教授。 当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时,我们是否可以回到起点重看模型表征本身——究竟什么才是一个人工智能模 型的「表征质量」或者「泛化性」?我们真的只有通过海量的测试数据才能抓住泛化性的本质吗?或者说,能否在数学上找到一个定理,直接从表征逻辑复 杂度本身就给出一个对模型泛化性的先验的判断呢? 论文地址: https://arxiv.org/abs/2502.10162 本文就上述问题给出了初步的探索,从神经网络内在精细交互表征复杂度的角度来探索「可泛化交互表征」和「不可泛化交互表征」各自所独有的分布。 一、大模型时代呼唤更高效的泛化性分析策略——中层表征逻辑的交流与对齐 尽管深度学习基础理论近年来取得了长足的发展,但一些根本性问题仍未得到有效解决。典型地,对神经网络泛化性的研究依然停留在一个相对较浅的层面 ——主要在高维特征空间分析解释神经网络的泛化性(例如通过损失函数景观平滑度来判断泛化性)。 因此,我们始终无法对神经网络泛化性给出一个「究竟」的解释——究竟怎样的确切的表征才叫高泛化性的表征。 ...
速递|O'Reilly指控OpenAI"窃书" 训练 GPT-4o,AI数据黑箱再陷版权风暴
Z Potentials· 2025-04-02 11:17
核心观点 - 多家机构指控OpenAI可能未经许可使用付费墙后的O'Reilly书籍训练其AI模型,尤其是GPT-4o [1][2] - AI监督组织通过论文指出,GPT-4o对付费墙后书籍内容的识别率显著高于旧版模型,暗示其训练数据可能包含未授权内容 [2][3] - OpenAI面临多起诉讼,其训练数据实践和版权法处理引发争议 [5] 训练数据争议 - OpenAI被指控利用O'Reilly Media付费墙后的书籍训练GPT-4o,且未签署许可协议 [2] - 论文采用DE-COP方法(成员推理攻击)检测模型训练数据中的受版权保护内容,结果显示GPT-4o对付费墙后书籍的识别率远高于GPT-3.5 Turbo [2][3] - 研究分析了34本O'Reilly书籍中的13,962个段落摘录,评估模型训练数据中可能包含的版权内容概率 [3] 模型表现差异 - GPT-4o对付费墙后O'Reilly书籍内容的识别能力显著强于GPT-3.5 Turbo,后者对公开可获取的书籍样本识别率更高 [2][3] - 研究指出,GPT-4o可能掌握了其训练截止日期前出版的非公开O'Reilly书籍内容,但未评估最新发布的GPT-4.5等模型 [4] OpenAI的数据策略 - OpenAI在耗尽公共网络数据后,开始采用AI生成的数据训练模型,但完全摒弃现实世界数据的实验室极少 [1] - 公司长期倡导放宽使用受版权保护数据的限制,并寻求更高质量的训练数据,甚至聘请记者和领域专家协助微调模型 [4] - OpenAI与部分新闻出版商、社交网络等签订了授权协议,并提供了不完善的退出机制供版权所有者标记不希望用于训练的内容 [4] 行业趋势 - AI公司普遍招募科学、物理等领域专家,将专业知识输入AI系统以提升模型性能 [4] - 纯合成数据训练存在风险,可能导致模型性能下降,因此多数实验室仍依赖现实世界数据 [1]