Workflow
人工智能模型
icon
搜索文档
博世加码人工智能投入自动驾驶是关键应用领域
新浪财经· 2025-06-30 20:26
投资计划与销售预测 - 公司计划2027年前在人工智能领域投资超过25亿欧元 [1] - 预计到2035年软件、传感器技术、高性能计算单元、车载通讯类零部件销售额将翻倍,超过100亿欧元 [1][3] 人工智能技术应用 - 公司将辅助驾驶与自动驾驶作为人工智能优势的关键应用领域 [1] - 早期在摄像头和雷达上部署人工智能用于物体识别和环境感知 [1] - 未来重点是将所有传感器数据输入大模型,融合环境信息并提升预判能力 [1] - 生成式人工智能模型可模拟不同驾驶场景(如雨天、夜间) [2] 数据与技术优势 - 公司累计超过200PB(2亿GB)全球交通场景数据用于训练人工智能模型 [2] - 采用"联邦学习"技术实现全球数据训练而不共享原始数据 [2][3] - 通过联邦学习解决全球数据跨境传输的复杂要求 [3] 市场合作与全球化 - 公司与奇瑞合作成功,为中国市场建立人工智能计算集群 [3] - 中国团队具备完整产品开发能力,使用本土云服务器和数据 [3] - 辅助驾驶技术在中国市场对吸引消费者至关重要 [3] - 预计自动驾驶技术将在2035年实现长期商业成功 [3]
Nature报道:谷歌新模型1秒读懂DNA变异!首次统一基因组全任务,性能碾压现有模型
量子位· 2025-06-26 22:11
核心观点 - 谷歌DeepMind推出突破性生物模型AlphaGenome,能够从1兆碱基的DNA序列中预测数千种功能基因组特征,并以单碱基分辨率评估变异效应[3][4] - AlphaGenome在基因表达、剪接、染色质可及性等任务上性能全面超越现有模型,为解析基因组调控代码提供强大工具[5][7] - 该模型是首个统一基因组任务的单一模型,将多模态预测、长序列背景和碱基对分辨率统一于单一框架[10][11] - AlphaGenome在临床上有潜力帮助理解疾病原因、发现治疗靶点,例如在T细胞急性淋巴细胞白血病研究中解析致癌变异[29] 模型架构与技术细节 - 模型架构受U-Net启发,处理1兆碱基DNA输入序列,生成一维和二维嵌入,分辨率分别为1bp/128bp和2048bp[13] - 内部结合卷积层和Transformer块,通过8个张量处理单元实现完整碱基对分辨率训练,最终输出11种模态,涵盖5930条人类或1128条小鼠基因组轨道[13] - 采用预训练和蒸馏两阶段训练,在NVIDIA H100 GPU上推理时间可达1秒以内[15][17] 性能表现 - 在24项基因组轨道评估中,AlphaGenome在22项保持领先,例如在细胞类型特异性LFC预测上相对改进+17.4%[16][19] - 在26个变异效应预测基准中,24项达到或超越现有最强模型,例如表达QTL方向预测提升25.5%,可及性QTL提升8%[19][21] - 在剪接模态方面首次实现全方位预测,在7项基准测试中的6项实现最先进水平,auPRC达0.54[25][27][28] 应用与未来发展 - 可帮助研究人员更精准理解疾病潜在原因,例如解析T-ALL中TAL1基因附近的致癌变异[29] - 未来可通过扩展数据提升预测精度并涵盖更广泛物种,科学家只需微调即可快速生成和测试假设[29] - 目前提供预览版并计划正式发布,代码已开源[30]
速递|三年可省百万美元!ChatGPT最高20%折扣,企业客户正在“叛逃”微软,销售恐痛失大单
Z Potentials· 2025-06-19 11:54
OpenAI企业折扣策略 - 公司为购买附加产品的企业客户提供10%至20%的ChatGPT企业版折扣,前提是签署多年协议购买其他工具(如Deep Research智能体、Codex编程智能体)或承诺API消费金额[2] - 折扣实际将ChatGPT企业版价格从每位用户每月30美元降至25美元左右[8] - 部分企业获得AI模型价格折扣的条件是承诺一年内投入数百万美元[8] 企业业务增长预期 - ChatGPT企业版2023年收入1亿美元,占ChatGPT总收入3%-4%[6] - 公司预测2025年企业版收入达4亿美元(200万用户),2026年10亿美元(400万用户),2030年62亿美元(1600万用户)[6] - ChatGPT Teams产品2023年收入2亿美元(100万用户),预计2024年底达8亿美元(400万用户),2030年85亿美元(2200万用户)[6] - 2030年Teams和Enterprise总用户预计3800万,贡献147亿美元收入,占ChatGPT总收入620亿美元的四分之一[6] - 企业版、团队版及高校订阅付费用户已突破300万(2024年2月为200万,2023年9月为100万)[7] 与微软的竞争关系 - 微软Copilot聊天机器人起售价同为每用户每月30美元,但最大折扣仅5%-10%,无法匹配OpenAI折扣导致交易流失[2][10] - 某软件公司因OpenAI提供20%折扣(三年节省100万美元)转向直接采购[10] - 私募股权公司考虑3000个Copilot席位(原价超100万美元/年)时,OpenAI报价20%折扣(80万美元/年)[10] - 微软通常仅对年消费数百万美元的客户提供5%-10%折扣[11] 行业背景与客户选择 - 企业采用AI技术驱动客服机器人、内部工具以降低成本或替代员工[4] - 部分客户(如Notion、Salesforce)因优先获得Codex工具和工程师支持选择OpenAI而非微软[9] - 其他客户(如Intuit、Fidelity)因现有云服务合同选择微软[9] 技术成本与定价趋势 - AI公司通过降低数据中心模型运行成本后将部分节省让利给客户[2] - OpenAI与Anthropic等公司在过去一年将前沿模型API价格下调90%以上[8] - 公司表示折扣策略源于模型效率提升,旨在将成本节省回馈客户[8]
借助生成式人工智能构建知识生产新体系
新华日报· 2025-06-13 08:14
生成式AI技术演进 - 生成式人工智能(GAI/GenAi)基于算法模型生成文本、图像、音频等多模态内容,是AI领域关键分支[2] - 技术发展历经三阶段:20世纪50-80年代奠定概率模型理论基础(马尔可夫链等),2014年GAN网络实现图像生成突破,2018年后大语言模型(GPT系列)推动自然语言生成跨越式发展[2] - 2022年ChatGPT上线标志大规模商业化应用开启,2023-2024年全球政策框架加速形成(中国工信部/联合国标准)[2] 行业应用价值 - **效率提升**:处理海量数据生成文献综述/科普素材,学术研究场景可缩短70%文献梳理时间,科普内容创作周期压缩50%以上[3] - **创新驱动**:多模态模型(如DALL-E)打破学科壁垒,通过跨领域知识关联分析助力科研突破点发现,设计行业创新效率提升40%[4] 技术局限性 - **知识产权风险**:训练数据70%涉及未授权内容,生成成果归属存在开发者/用户/模型三方争议,学术领域署名纠纷增长300%[5] - **数据质量缺陷**:因逻辑推理局限导致15%生成内容含事实错误,医疗/金融领域错误信息传播可能引发决策失误率上升25%[5] 生态发展方向 - 需建立数据授权/内容溯源技术体系,通过联邦学习降低30%隐私泄露风险,同时开发事实核查算法将错误率控制在5%以内[6]
DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
每日经济新闻· 2025-05-29 21:13
5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑 等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 其他能力更新比如: 1.幻觉改善:新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降 低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。 2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的 长篇作品,同时呈现出更加贴近人类偏好的写作风格。 3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Ben ...
DeepSeek R1,新升级!
第一财经· 2025-05-28 22:15
DeepSeek模型更新 - DeepSeek R1模型已完成小版本试升级 用户可通过官方网页 App 小程序测试新版本 [1] - DeepSeek R1模型API接口和使用方式保持不变 现有用户无需调整接入方式 [1] - DeepSeek R2模型仍处于开发阶段 公司未透露具体发布时间 [1]
英特尔新显卡拉爆性价比,可本地跑DeepSeek-R1
观察者网· 2025-05-20 23:03
5月19日,在台北国际电脑展(ComputeX)上,英特尔发布了Arc Pro B50和Arc Pro B60两张显卡,起售价仅299美元(约合人民币2156元)。 英特尔官网 价格上,16GB显存的Arc Pro B50售价299美元(约合人民币2156元);24GB显存的Arc Pro B60,售价为500美元(约合人民币3605元)。 性能上,B50面向图形工作站,采用双槽厚度设计,拥有16个Xe核心和128个XMX引擎,可提供高达170 TOPS的峰值运算能力,同时配备16GB显存,显存 带宽为224GB/s,典型主板功耗为70W,支持PCIe 5.0×8连接。在图形工作负载方面,英特尔声称其性能比上一代A50提升了高达3.4倍,并且在MLPerf等一 系列AI推理测试基准上全面超越英伟达的RTX A1000 8GB。 在通用性能方面,锐炫Pro B50相比上一代产品提升50%-130%。其性价比不仅相较锐炫Pro A50、英伟达RTX A1000翻倍提升,比起锐炫Pro A60也略胜一 筹。 英特尔官网 B60则主要面向AI推理工作站,拥有20个Xe核心和160个XMX引擎,峰值TOPS可达197, ...
火山引擎发布豆包视频生成模型Seedance 1 lite
快讯· 2025-05-13 15:12
产品发布 - 火山引擎在FORCE LINK AI创新巡展上海站发布豆包视频生成模型Seedance1lite 支持文生视频和图生视频 生成时长支持5秒和10秒 分辨率提供480P和720P [1] - 同时发布豆包1 5视觉深度思考模型 并升级豆包音乐模型 [1] - 通过更全面的模型矩阵和更丰富的智能体工具 帮助企业打通从业务到智能体的应用链路 [1] 产品应用 - 企业用户可在火山方舟平台使用Seedance1lite模型API [1] - 个人用户可在豆包APP和即梦体验该视频生成模型 [1]
只有通过海量测试才能抓住泛化性的本质吗?
机器之心· 2025-05-10 11:42
本文第一作者为上海交通大学博士生程磊,指导老师为上海交通大学张拳石教授。 当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时,我们是否可以回到起点重看模型表征本身——究竟什么才是一个人工智能模 型的「表征质量」或者「泛化性」?我们真的只有通过海量的测试数据才能抓住泛化性的本质吗?或者说,能否在数学上找到一个定理,直接从表征逻辑复 杂度本身就给出一个对模型泛化性的先验的判断呢? 论文地址: https://arxiv.org/abs/2502.10162 本文就上述问题给出了初步的探索,从神经网络内在精细交互表征复杂度的角度来探索「可泛化交互表征」和「不可泛化交互表征」各自所独有的分布。 一、大模型时代呼唤更高效的泛化性分析策略——中层表征逻辑的交流与对齐 尽管深度学习基础理论近年来取得了长足的发展,但一些根本性问题仍未得到有效解决。典型地,对神经网络泛化性的研究依然停留在一个相对较浅的层面 ——主要在高维特征空间分析解释神经网络的泛化性(例如通过损失函数景观平滑度来判断泛化性)。 因此,我们始终无法对神经网络泛化性给出一个「究竟」的解释——究竟怎样的确切的表征才叫高泛化性的表征。 ...
速递|O'Reilly指控OpenAI"窃书" 训练 GPT-4o,AI数据黑箱再陷版权风暴
Z Potentials· 2025-04-02 11:17
核心观点 - 多家机构指控OpenAI可能未经许可使用付费墙后的O'Reilly书籍训练其AI模型,尤其是GPT-4o [1][2] - AI监督组织通过论文指出,GPT-4o对付费墙后书籍内容的识别率显著高于旧版模型,暗示其训练数据可能包含未授权内容 [2][3] - OpenAI面临多起诉讼,其训练数据实践和版权法处理引发争议 [5] 训练数据争议 - OpenAI被指控利用O'Reilly Media付费墙后的书籍训练GPT-4o,且未签署许可协议 [2] - 论文采用DE-COP方法(成员推理攻击)检测模型训练数据中的受版权保护内容,结果显示GPT-4o对付费墙后书籍的识别率远高于GPT-3.5 Turbo [2][3] - 研究分析了34本O'Reilly书籍中的13,962个段落摘录,评估模型训练数据中可能包含的版权内容概率 [3] 模型表现差异 - GPT-4o对付费墙后O'Reilly书籍内容的识别能力显著强于GPT-3.5 Turbo,后者对公开可获取的书籍样本识别率更高 [2][3] - 研究指出,GPT-4o可能掌握了其训练截止日期前出版的非公开O'Reilly书籍内容,但未评估最新发布的GPT-4.5等模型 [4] OpenAI的数据策略 - OpenAI在耗尽公共网络数据后,开始采用AI生成的数据训练模型,但完全摒弃现实世界数据的实验室极少 [1] - 公司长期倡导放宽使用受版权保护数据的限制,并寻求更高质量的训练数据,甚至聘请记者和领域专家协助微调模型 [4] - OpenAI与部分新闻出版商、社交网络等签订了授权协议,并提供了不完善的退出机制供版权所有者标记不希望用于训练的内容 [4] 行业趋势 - AI公司普遍招募科学、物理等领域专家,将专业知识输入AI系统以提升模型性能 [4] - 纯合成数据训练存在风险,可能导致模型性能下降,因此多数实验室仍依赖现实世界数据 [1]