Workflow
大模型
icon
搜索文档
DeepSeek新技术移植苹果芯片!Mac本地大模型加速60%
量子位· 2026-07-03 19:03
文章核心观点 - DeepSeek开源的DSpark投机解码技术,在开源一周后即被工程师Abdur Rahim成功移植到苹果芯片平台,并命名为mlx-dspark[1] - 该移植版本在保持生成质量无损(输出与原始模型逐字节相同)的前提下,显著提升了特定大语言模型在Mac设备上的推理速度[4][5] - 该工作不仅实现了DSpark的苹果原生版本,还集成了另一项投机解码技术DFlash,使Mac设备能够根据任务类型(聊天或代码/数学)智能选择最优解码方案,从而获得更全面的性能提升[33][34] 技术实现与性能提升 - 移植版本mlx-dspark成功在苹果M4 Pro芯片上运行Gemma-4 12B和Qwen3-4B模型,并实现了显著的生成速度提升[2] - 具体性能数据:Gemma-4 12B的生成速度从18.4 tok/s提升至约30 tok/s,提速约1.6倍;Qwen3-4B从52.9 tok/s提升至约73 tok/s,提速约1.4倍[17] - 工程师通过将权重量化为4-bit、在MLX框架中重构验证流程,并针对苹果芯片的验证成本特点进行优化,实现了上述加速[14][15] - 该移植工作成功复现了原始论文中16%到18%的接受率提升[25] 质量保证与技术创新 - mlx-dspark不仅实现了常见的贪婪解码,还完整实现了原始论文中的温度采样方法,确保了输出与目标模型在相同温度下的精确分布完全一致,而非近似版本[19][21] - 通过测试发现,使用经过指令微调的目标模型版本,可使草稿模型生成的候选词通过核对的比例从47%提升至82%[22] - 工程师为DFlash技术增加了可调参数,允许在聊天场景中使用较短的有效块长度,以适配不同任务对解码策略的需求[33] 不同投机解码技术的对比与整合 - 文章对比了DSpark与DFlash两种投机解码技术在不同任务场景下的性能表现[30][31] - 在代码和数学任务上,DFlash(使用完整的16个token块)接受长度达到5.95至6.20,速度约36 tok/s,提速约2.1倍,性能超过DSpark[30] - 在开放聊天场景中,由于内容难以预测,DFlash的块填充率不足,接受长度仅在2.2-2.7左右,此时DSpark凭借其Markov尾部校正机制反而速度更快[31][32] - mlx-dspark在v0.0.3版本中正式整合了z-lab原版的DFlash,使用户可以在同一个工具包内根据任务类型自动或手动选择最佳解码方案[33][34]
突发!阿里内部禁用 Claude
程序员的那些事· 2026-07-03 16:50
公司内部政策变动 - 阿里巴巴于7月3日发布内部通知,将全面禁用Anthropic公司旗下所有产品,包括Claude全系列模型及Claude Code,该政策自7月10日起正式生效 [1] - 公司为此次禁用提供了替代方案,推荐使用其自研的代码生成工具Qoder,并配套通义千问企业版 [2] 行业竞争与策略变化 - 国内大型科技公司此前并不排斥使用国外先进大模型,阿里巴巴在今年年初曾鼓励工程师使用Claude和GPT,并为此提供相应的额度报销 [2] - 此次政策转向,从鼓励使用转为全面禁用,反映出公司在技术供应链安全与自主可控策略上的重大调整 [1][2] 事件背景与风险考量 - 禁用决定大概率与近期两起事件相关 [3] - 事件A:6月30日,有网友曝光Claude Code通过隐写术技术给中国用户生成的内容添加水印,其工程师于次日公开承认,该技术自四月份起已开始使用,并表示将在引发舆情后次日进行回滚 [4] - 基于此,阿里巴巴经过综合评估,已将Claude Code列入高风险软件名单 [4] - 事件B:6月25日,有外媒报道称Anthropic公司向美国国会写信,指控可能存在的“蒸馏攻击”行为,不过该指控在海外社交平台上引发了较多嘲讽 [5]
千里科技(601777):千里科技深度:智行千里,“AI+车”破局启新篇
长江证券· 2026-07-03 14:50
[Table_scodeMsg1] 公司研究丨深度报告丨千里科技(601777.SH) [Table_Title] 千里科技深度:智行千里,"AI+车"破局启新篇 %% %% %% %% research.95579.com 1 丨证券研究报告丨 报告要点 [Table_Summary] 公司脱胎于老力帆,以传统汽摩制造业务起家,经历 2020 年破产重整后,引入吉利、重庆政 府以及旷视等多方资源,形成"车企+AI 科技+出行"全产业链闭环,更名"千里科技",开启 "AI+车"新篇章。制造业务稳健向上贡献基盘,以"AI+车"为核心,加速构建智能驾驶、智 能座舱、Robotaxi 全栈能力,持续驱动技术创新和商业化闭环。智驾联合阶跃星辰打造原生基 模,联合吉利推"千里浩瀚"系统,量产进入快速放量期,逐步拓展新客户。Robotaxi 合作曹 操出行,打造"定制车型+智驾技术+出行平台",有望推进 Robotaxi 商业闭环。 分析师及联系人 [Table_Author] 高伊楠 张扬 SAC:S0490517060001 SAC:S0490524030004 SFC:BUW101 请阅读最后评级说明和重要声明 2 ...
恒指升174點,滬指跌83點,標普500平收
宝通证券· 2026-07-03 13:26
港股市场表现 - 恒生指数收报23,055点,上涨174点或0.76%,全日总成交额3,696.33亿元[1] - 国企指数收报7,612点,上涨54点或0.72%[1] - 恒生科技指数收报4,454点,下跌17点或0.4%[1] A股市场表现 - 上证指数收报4,028点,下跌83点或2.03%,成交额1.58万亿元[1] - 深成指收报15,498点,下跌620点或3.85%,成交额1.87万亿元[1] - 创业板指收报4,017点,下跌243点或5.71%,成交额8,903.73亿元[1] 美股市场表现 - 道琼斯指数收报52,900点,上涨594点或1.1%,创下新高[2] - 纳斯达克指数收报25,832点,下跌207点或0.8%[2] - 标准普尔500指数报7,483点,近乎平收[2] 宏观经济与政策 - 美国6月非农新增职位5.7万个,远低于预期的11万个[2] - 中国人民银行单日通过逆回购净回笼资金820亿元人民币[1] - 人民币兑美元中间价报6.8088,按日下调21点[1] 零售业数据 - 今年5月零售业总销货价值临时估计为338亿元,按年上升7.9%[2] - 今年5月零售业网上销售价值临时估计为34亿元,按年上升32.3%[3] - 今年首五个月合计的零售业总销货价值临时估计按年上升10.6%[2] - 今年首五个月合计的零售业网上销售价值临时估计按年上升31.2%[3] 行业与公司动态 - 伦敦金属交易所(LME)正考虑放宽规则以提升香港作为金属交易中心的地位[3] - 美团-W(03690.HK)据传内部开始限制使用豆包大模型,并要求业务团队规划迁移至其他模型[4]
快手可灵完成近30亿美元融资,腾讯、阿里云、百度入局
广州日报· 2026-07-03 12:35
融资概况 - 可灵完成近30亿美元融资,投后估值有望达到180亿美元,创下全球视频大模型公司最大额融资纪录 [2] - 本轮融资由CPE源峰、国方创投、BlueFive、腾讯、中关村科学城基金(联合国科投资)、中信证券联合领投,阿里云、百度等产业资本及文娱产业方共同参与 [4] - 初始21家机构出资138.236亿元人民币,15家额外投资方追加52.235亿元人民币,整体增资规模上限为204.471亿元人民币,对应可灵扩大后注册资本的16.67% [4] 资金用途与控制权 - 所有融资资金将全部用于模型迭代、商业化拓展与全球化团队搭建 [4] - 交易完成后,快手科技将继续间接持有北京可灵约68.33%的股权,并保持控制权,其财务业绩继续并入快手报表 [4] - 增资协议设置退出兜底条款:若北京可灵未能在2031年10月前完成IPO,或无法在九个月内完成全部重组相关监管程序,投资方有权要求公司按年化8%利率回购股权 [4] 财务与经营数据 - 2025年全年实现营收11亿元人民币;2026年3月的年化收入运行率(ARR)已达5亿美元 [5] - 截至2025年12月31日,北京可灵资产总额2.44亿元,负债总额2.53亿元,资产净值为-900万元 [5] - 2024年和2025年的未经审计净亏损分别为5亿元和19亿元人民币 [5] - 2026年第一季度,可灵AI营业收入超过6.5亿元,同比增长超300% [7] - 2026年3月ARR近5亿美元,相比2025年3月的1亿美元,一年内增长4倍 [7] 业务表现与驱动因素 - 一季度收入高速增长主要来自B端企业客户API调用收入和P端(专业用户)付费用户订阅收入的双轮驱动,B端和P端客户均保持较好留存趋势 [7] - 当前主要应用场景包括广告营销、影视、短剧和游戏等专业创作场景 [7] - 可灵AI持续位列全球AI视频模型头部梯队,第三方平台使用量与ARR高速增长,行业处于“优质供给创造需求”的时期 [7] 市场反应与公司动态 - 受可灵融资消息影响,7月3日港股开盘,快手股价一度涨超6%,随后回落 [8] - 快手董事会此前正在评估拟议重组可灵AI相关资产及业务的方案,或涉及引入外部融资,但当时尚未签署任何最终协议 [6]
【九点特供】交换机龙头预计Q2净流入环比增长超280%,分析师强call交换机网络是AI基建的“神经中枢”,对大模型训练效率至关重要
财联社· 2026-07-03 08:51
交换机与AI基建 - 交换机网络被分析师强调为AI基建的“神经中枢”,对大模型训练效率至关重要 [1] - 某交换机龙头公司预计第二季度净利润环比增长超过280% [1] - 一家公司已实现集成以太网物理层芯片的交换机芯片规模量产 [1] 机器人产业与IPO - 宇树科技科创板IPO注册申请仅用时104天即获证监会同意,标志着机器人产业投融资加速 [1] - 宇树科技IPO注册获批也意味着其商业化路径将逐步明晰 [1] - 一家公司已与宇树科技签订合作协议并取得了订单 [1] 消费电子与折叠屏手机 - 苹果股价上涨近5% [1] - 苹果已将折叠屏iPhone的备货预期从700万-800万台大幅上调至约1000万台 [1]
万兴科技(300624.SZ):未接入英伟达大模型能力
格隆汇· 2026-07-02 21:57
公司业务澄清 - 万兴科技澄清其未接入英伟达大模型能力 [1] - 公司主业聚焦于AIGC数字创意软件领域 [1] 行业技术应用区分 - 英伟达Cosmos平台主要应用于机器人、自动驾驶等物理AI领域 [1] - 该应用领域与公司当前专注的AIGC数字创意软件领域存在区分 [1]