MLX框架

搜索文档
腾讯研究院AI速递 20250718
腾讯研究院· 2025-07-17 22:12
谷歌DeepMind新架构MoR - MoR架构结合参数共享与自适应计算,以更少参数实现大模型性能[1] - 动态路由机制根据token复杂度分配递归深度,减少冗余计算并优化KV缓存[1] - 实验显示推理吞吐量最高提升2.06倍,训练时间减少19%,峰值内存下降25%[1] 亚马逊AI Agent全家桶 - Bedrock AgentCore预览版提供7大AI agents核心服务,包括运行时、记忆、身份验证等[2] - 推出Nova定制选项和Strands Agents V1.0,简化多agents协同开发[2] - Amazon S3 Vectors云对象存储降低90%向量存储成本,Kiro AI IDE优化开发者体验[2] 马斯克Grok AI伴侣生态 - Grok男性AI伴侣征名"Draven",形象参考《暮光之城》风格[3] - 开源3D数字伴侣"Bella"分三阶段演进:感知核心、生成式自我和主动式陪伴[3] - 计划加入语音识别和好感度系统,但当前仅保留美少女形象[3] 谷歌搜索AI通话功能 - AI代打电话可自动预约本地服务如宠物美容[4] - 集成Gemini 2.5 Pro模型和Deep Search功能处理复杂查询并生成深度报告[4] - 新功能已在美国上线并将逐步全球推广[4] Claude Sonnet 4回归Windsurf - Pro用户每月可享250次免费调用Claude Sonnet 4模型[6] - 模型具备跨文件智能重构、20万token上下文窗口和精准代码补全[6] - 合作回暖是Windsurf在OpenAI收购失败后的战略举措[6] Anthropic人才与业务动态 - 两周内挽回Claude Code核心负责人Boris Cherny和Cat Wu[7] - Claude Code周下载量增长6倍达300万次,贡献超2亿美元年化收入[7] - 直接销售模型毛利率60%,但通过AWS/谷歌云销售为负30%[7] CrePal AI视频创作Agent - 通过一句话指令自动调度多种模型完成视频制作全流程[8] - 系统自动规划脚本、生成画面、添加音效,整合分散工具为一体化方案[8] - 创新点在于改变创作流程,降低技术操作门槛[8] 苹果MLX框架适配CUDA - MLX框架新增CUDA支持,允许开发者用英伟达GPU训练后部署回苹果设备[8] - 苹果向拥有500万开发者的英伟达生态妥协[8] - 虽2018年停止对英伟达显卡支持,现出于合规和生态考量重新合作[8] 他山科技触觉传感技术 - 研发全球首款AI触觉感知芯片,基于电容层析成像技术[10] - 实现"感控一体"融合,服务国内70%以上机器人厂商[10] - 从硬件提供商转型为整体触觉解决方案提供商[10] AlphaFold与AI4Science前景 - AlphaFold通过统一框架实现蛋白质结构原子级精度,被引用35000次[11] - 算法研究价值是数据的100倍,推动结构生物学发展速度提升5-10%[11] - 预言AI4Science将更通用化,各科学领域应用遍地开花[11]
苹果向英伟达生态妥协了!MLX框架主动适配CUDA
量子位· 2025-07-17 13:52
苹果MLX框架适配CUDA的战略转变 - 苹果专为端侧AI训练推出的MLX框架主动增加CUDA支持,打破其长期封闭生态的传统[1][4] - 此举使苹果开发者能利用英伟达GPU训练模型,再部署回Mac/iPhone设备,实质是借力英伟达生态抢夺AI市场[4][5][6] - 该决策被网友评价为"苹果十年来最大战略举措",反映其对CUDA主导地位的妥协[15][27] CUDA生态的绝对优势 - 英伟达CUDA生态覆盖500万开发者、4万家公司及数千家生成式AI企业,占据GPU计算领域行业标准地位[25] - 2024年CUDA 11.6版本明确禁止非英伟达平台逆向工程,法律层面强化生态壁垒[28][30][31] - 苹果官方承认CUDA优势:统一内存机制提升开发效率,跨平台部署满足学术研究和大规模计算需求[8] 苹果与英伟达的历史纠葛 - 2018年苹果通过macOS Mojave停止对多数英伟达显卡支持,导致专业用户无法使用Pascal架构GPU[19][20] - 英伟达称因苹果未开放内核扩展签名而无法提供新版驱动,双方矛盾持续至今未解决[21][22] - 此次MLX适配CUDA被视作苹果战略转向,与六年前"摆脱英伟达依赖"的意图形成鲜明对比[23][24] MLX框架的发展背景 - 苹果2023年12月推出MLX框架,旨在利用M1/M2/M3自研芯片算力构建端侧AI生态[10][11] - 此前MLX影响力有限,反映苹果在AI领域进展乏力,而英伟达凭借CUDA生态持续扩张[12][13] - 技术方案选择上,苹果仅允许MLX程序调用CUDA芯片,禁止直接移植CUDA程序至Apple芯片[35][33]
苹果MLX框架新增对CUDA的支持
快讯· 2025-07-15 16:01
苹果MLX框架更新 - 苹果MLX框架新增对CUDA的支持 这一更新显著提升了框架在NVIDIA GPU上的兼容性和计算性能 [1]
特朗普呼吁伊朗无条件投降;油价大涨逾4%,特斯拉跌近4%;外交部:正迅速组织撤离中国公民;阿里+苹果,大消息丨每经早参
每日经济新闻· 2025-06-18 06:01
宏观经济与市场动态 - 中国央行进行1640亿元7天期逆回购操作[3] - 5月外资增持境内股票规模环比扩大 非银行部门跨境资金净流入330亿美元[13][14] - 国有企业改革深化提升行动重点任务平均完成率超80% 2025年为收官之年[15] 国际金融市场 - 美股三大指数集体收跌 纳指跌0.91% 道指跌0.7% 航空股领跌 JetBlue重挫8%[5] - 欧洲主要股指全线下跌 德国DAX30指数跌0.86% 意大利股指跌1.10%[8] - WTI原油期货大涨4.28%至74.84美元/桶 布伦特原油涨4.4%至76.45美元/桶[7] - COMEX黄金期货跌0.37%报3404.8美元/盎司 白银期货涨1.97%[6] 科技与创新 - 新一代载人飞船"梦舟"完成零高度逃逸试验 载人月球探测工程获突破[15] - 磁悬浮试验车实现650公里/小时极速 百公里加速不足1秒[15] - 歼-35A隐身战机首次海外亮相巴黎航展 展示多任务能力[16] - 阿里巴巴通义千问3全系适配苹果MLX框架 推出32个量化模型[22] 企业动态 - 英伟达确认首次参展中国链博会 将展示AI领域最新成果[21] - 京东刘强东宣布将发行稳定币 打造差异化外卖商业模式[23] - 美团CEO王兴减持理想汽车573万股 套现6亿港元[24] - 特斯拉因FSD功能无法使用遭车主起诉 涉及HW3.0硬件兼容问题[32] - 宝能汽车否认清算传闻 称经营正常且有新车将发布[28] 产业合作与创新 - Rokid与支付宝推出"看一下支付" 通过智能眼镜完成交易[29] - 微信测试聊天记录备份至外部存储设备功能 支持多份备份管理[31] 上市公司公告 - 海螺新材拟1.86亿元收购康宁特80%股权[40] - 京东方A计划收购咸阳彩虹光电30%股权[40] - 中油资本拟6.55亿元增资昆仑资本 投资可控核聚变领域[41] - 中超控股中标10.61亿元项目 中辰股份获2.46亿元国家电网订单[41]
为国行苹果智能做准备!阿里巴巴发布升级版Qwen3:全系适配苹果MLX架构
硬AI· 2025-06-17 22:30
阿里巴巴通义千问发布Qwen3系列模型 - 阿里巴巴通义千问正式发布基于苹果MLX框架深度优化的Qwen3系列模型 [2] - 此举被视为为国行苹果智能做准备 阿里巴巴可能成为苹果在中国大陆的大模型合作商 [4] MLX框架与模型部署 - MLX是专为苹果芯片深度适配的开源机器学习框架 可高效训练和部署AI大模型 [5] - 团队一次性开源32款官方Qwen3 MLX模型 包含4bit、6bit、8bit和BF16四种不同精度量化版本 [5] - 模型可在iPhone、iPad和Mac电脑上轻松部署 实现全场景覆盖 [1][5] 开源与社区支持 - Qwen3的MLX模型已在魔搭社区和Hugging Face全面开源 [7]