猿大侠

搜索文档
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
猿大侠· 2025-09-02 12:20
模型性能表现 - 在Agent工具调用和指令遵循等基准测试中超过DeepSeek-V3.1、Qwen3 MoE-2507及Claude4 Sonnet [3] - 编程能力与Claude4 Sonnet相当 在TerminalBench测试中表现突出 [5] - 总参数量560B 激活参数动态范围为18.6B–31.3B 低于DeepSeek-V3.1(671B/A37B)和Kimi-K2(1T/A32B) [12][13] - 在数学题测试中解答完全正确 包括全国一卷圆锥曲线问题及复杂坐标计算 [22][23][24][26][32][33][35][36][39][42][46][47][50][51] - 成功绘制生物学卡尔文循环SVG示意图 展现多模态代码生成能力 [53][54] - 准确解答迷惑性量子力学问题 识别"薛定谔的死猫"陷阱并指出与原版实验区别 [58][59][61][62][63][64][65] 技术创新架构 - 采用Zero-computation Experts与Shortcut-connected MoE双重架构 通过恒等专家映射实现动态计算分配 [13][16] - 使用新路由架构优化专家模型调用 通过MoE与密集层通信重叠执行提升效率 [14] - 引入设备级负载均衡损失和PID控制器调节路由概率 避免序列级失衡 [16] - 规模化训练采用超参数迁移+模型生长初始化策略 用14层模型堆叠成28层加速收敛 [17] - 预训练使用20T token语料 中期扩展上下文窗口至128k 后期通过多Agent合成框架进行高难度工具使用训练 [17] - 推理阶段实现多步重叠调度器 使CPU调度与GPU计算交错 单张H800 GPU生成速度超过100 tokens/s [17][20] 训练效率与成本 - 在30天内完成20T token预训练 使用上万个加速卡且训练可用率达98.48% [20] - 输出成本约为0.7美元/百万token 在560B参数规模下实现高效推理 [20] - 相比同级模型在不同上下文长度下均实现更高单GPU吞吐和单用户速度 [20] 公司AI战略布局 - 2023年通过收购光年之外团队强化大模型研发能力 王慧文以顾问身份回归后领导GN06独立AI团队 [74][76][77] - 2024年明确"主动进攻"AI战略 推出AI编程应用NoCode和代码助手CatPaw 内部AI工具调用量从10%提升至68% [81][82][85] - 2024年研发投入211亿元 规模居国内第四 过去5年累计投入超1000亿元 [83] - 三层战略架构包括AI提升员工效率(AI at Work)、产品AI化(AI in Products)和自研大模型(Building LLM) [89] - 早期布局具身智能领域 投资宇树、星海图、银河通用等头部公司 [88] - AI应用覆盖情感陪伴(Wow)、图像生成(妙刷)、餐饮推荐(问小袋)、交互问答(米鲁)等多场景 [75][78][84]
大侠后宫:“第一次去山东男友家这些菜算重视吗?”哈哈哈一辈子没见过的丰盛程度!
猿大侠· 2025-09-01 12:12
转自:吐槽星君 74011X140WC ♡ 6.3万 ♡ 1天前 ·山东 回复 - 这是什么菜呀?我从来没见过(2) ♡ 7191 ♡ 1天前·山东 回复 l The Land 蓝莓山药泥8 0002870吐槽 男 1天前·河北 回复 此乃何物,小女子在山东生活了18年从未见过此 物, 分享于母,母让小女子滚而蛋之 & 上十八: ♡ 26.0万 ♡ 昨天 00:14 · 山东 回复 好一个滚而蛋之 29.9.9.5万吐槽具 昨天 09:56 · 山东 回复 ナノイナース | 上 n + = / > → + △ 사 .. 中国的美食都藏在这种街边小摊里 五星级酒店的美食都是骗假钱 但是骗不到我。" 第一次去山东男友家这算重视吗.. .? (vi a .@少女囤货日记 ) 小 ♡ 1.2万 ♡ 天前 · 山东 回复 此物我只在饭店见过 昨天 00:30 · 山东 回复 · ○ 1092 3 n a ma 行了,小生未曾见过这等饭菜 * 32分钟前·山西 回复 | 2公公 27吐槽 3 看见这个了吗? 我表哥得一等功都没捞着吃这个 2 ♡ 10.8万 ♡ 昨天 10:22·河北 目复 所以这是啥一 ♡ 1.4万 ♡ ...
马斯克亲口证实xAI代码库被盗!涉案前员工被起诉,已跳槽OpenAI
猿大侠· 2025-09-01 12:12
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,马斯克自曝, xAI的整个代码库都被偷走了 。 就在今天,xAI 起诉了一名离职员工 ,指控他窃取商业机密。 而且按xAI的说法,这名员工已经跳槽到了OpenAI。 前有离职研究员威胁Meta,后有新员工从xAI窃密,让网友不禁要问上一句, 为什么总是OpenAI 。 虽然xAI在这起案件中并未将OpenAI列为被告,但这波奥特曼挖马斯克墙角,也是挖到了烫手山芋。 到目前为止,被告员工和OpenAI均未进行任何置评。 值得一提的是,就在窃密事件发生之前,这位前员工刚刚将手中的xAI股权套现,累计获得近700万美元。 尴尬的是,这位被告前员工还是硅谷AI争夺中最受关注的华人。 离职员工偷走xAI整个代码库 这名离职华人员工是Xuechen Li,xAI向加州北区联邦地方法院递交的起诉书显示,xAI一共对他进行了四项指控。 指控包括 违反保密协议、侵犯商业秘密、违反加州计算机数据法规和欺诈 ,诉求则包括赔偿金和禁止加入OpenAI等竞争对手的禁制令,以 及交出要求Xuechen Li交出所有涉案设备和账户。 不过,这四项指控指向的都是Xuechen L ...
领导说:“年轻人不要总想着钱,要想着怎么成长。”,听到这话,你会怼回去吗?
猿大侠· 2025-09-01 12:12
不会笑青年 . 全网唯二的程序员主题漫画公众号。 出处:不会笑青年(ID:laughyouth) 以下文章来源于不会笑青年 ,作者不会笑青年 前两天看到个帖子,挺有意思。 某饭局上,领导又说了一遍:"年轻人不要总想着钱,要想着怎么成长。" 一小伙直接来了句: "那为什么您每年为了年终奖据理力争?" "年轻人,不要总想着钱,要想着成长、格局、能力提升。" 这句话你听过多少次? 空气突然安静。 我从刚毕业,到后来换了几家公司工作,这句话听了很多次了,只换了不同的版本,但意思都一 样:"别太计较工资"、"成长才是第一位"、"你眼界太小了"。 都是大饼 "成长比赚钱更重要",这话看起来没错啊。 谁不想成长呢? 可问题是, 很多领导嘴里的"成长",很可能只是用来糊弄员工的说辞罢了。 你想要的是: 系统的培训;明确的晋升路径;有挑战但不至于过劳的任务;合理的反馈机制 但领导给你的往往是: 临时抓壮丁似的"锻炼机会";加班不止的"责任担当";什么都做但没成果归你的"团队协作"。 领导没说别的,只是说:"下周你来我办公室聊聊。" 估计是不太妙。。。 讲真,被喂大饼,没什么必要当场拆台。 很现实的一个原因: 嘴上赢了,现实未必 ...
第3批国补启动!这类首次纳入补贴,仅剩130天
猿大侠· 2025-08-31 12:11
国家以旧换新补贴政策进展 - 第三批补贴资金总额690亿元已下达 自8月26日起恢复领取[1] - 淘宝天猫平台率先开放领取通道 覆盖北京/上海/浙江/广东等省市区[4] - 政策执行窗口期剩余130天 将于2025年12月31日24时全国统一结束[4] 补贴范围与标准 - 教育品类首次纳入补贴范围 包括智能灯/学习桌椅/学习机/词典笔等 最高补贴20%[4] - 一级及以上能效/水效家电家装产品至高享20%补贴 二级享15%补贴[12] - 居家适老化改造产品补贴高达30%[12] - 单价6000元以内3C数码产品享15%补贴 最高减500元[13] - 3333元价位数码产品可享受最高折扣比例且拿满500元补贴[14] 平台活动与叠加优惠 - 8月25日至31日学生用户可叠加教育优惠 最高省4000元 相当于低至5折[5] - 浙江/广东/江苏/安徽/上海等地同步发放地方消费券[15] - 杭州教育类用品补贴15% - 南京家电家具/3C数码全品类补贴10% - 广东天河运动户外品类补贴10% - 10月将有第四批资金到位 可叠加双十一优惠[18] 实施现状与消费者策略 - 补贴领取模式从"普惠申领"改为"抢券/资格制" 领取难度提升[16] - 前两批资金因参与人数超预期而快速消耗[16] - 建议消费者查看180天价格曲线 警惕商家"先涨后补"行为[17]
Nano banana手办玩法火爆出圈!无需抽卡,效果惊了(°o°)
猿大侠· 2025-08-31 12:11
模型发布与市场反响 - 谷歌匿名发布的图像编辑模型nano-banana在LMArena平台突然爆火后由官方确认为Gemini 2 5 Flash Image模型[5][7][8] - 该模型在国内外社交平台引发大规模试玩热潮 尤其在手办生成领域形成刷屏现象[2][4][9] 核心功能与技术特性 - 支持通过文本提示词生成1/7比例写实风格手办 需指定亚克力底座 电脑屏幕显示ZBrush建模过程及TAMIYA风格包装盒等细节[10][11] - 采用原生多模态架构 实现图像理解与生成的深度整合 通过交错式生成技术支持多轮复杂编辑 可分解包含50个编辑要求的任务[61][63][64] - 创新性使用文本渲染作为核心评估指标 该指标具备客观可量化特性 能持续指引模型改进并带来意外性能提升[55][56][58][59] 实际应用表现 - 能够识别动漫角色名称(如艾伦耶格尔)并生成对应手办 对非全身像参考图可能产生局部异常但整体效果逼真[13][15][16] - 支持宠物照片转手办 生成效果引发用户主动寻求购买链接 并可结合3D打印实现实体化[18][20][21] - 真人照片需使用全身图生成 包括动态姿势 需额外提示词添加支撑结构防止模型漂浮[24][26][28][29] 多元化应用场景 - 支持三图联合创作 通过姿态控制实现角色互动(如搭肩比心 战斗动作)[33][44][46] - 可生成漫展场景下的真人化二次元角色 效果接近真实cosplayer生图[41][42][48][51] - 结合视频生成模型创作连贯动画 仅需火柴人草图即可驱动完整动作[36][37] 模型优化路径 - 团队通过社交平台系统性收集用户失败案例构建评估基准 新版本需通过真实场景测试[65][66] - 针对Imagen 2 0存在的像素级编辑偏差 角色一致性不足及图像质感不自然等问题进行专项优化[68][69][70] 生态建设与访问方式 - 谷歌计划举办为期2天的Nano Banana Hackathon活动 提供免费API额度及奖品激励[72][73] - 模型可通过AI Studio Gemini API或直接集成至Gemini使用 支持中文提示词但建议英文以降低错误率[11][73][75]
大侠后宫:“45岁阿姨说要分期买我的小卡....”哈哈哈哈哈哈哈笑点过多了!
猿大侠· 2025-08-30 12:11
粉丝经济与收藏品交易 - 粉丝为购买明星小卡声称1980年出生并请求分期付款或免费获取 显示收藏品市场存在非理性消费行为 [3][6][8] - 交易过程中要求家长语音验证身份 反映未成年人参与高价值收藏品交易需监管介入 [4][5] - 收藏者自称拥有数百张小卡并寻求折扣 表明二级市场存在规模性囤货和议价行为 [8] 社交媒体内容传播特征 - 关于打扫卫生的帖子获得48.3万点赞和1.2万条回复 显示生活类内容具有高传播度 [13] - 用户互动中提到"中途看手机导致打扫中断"获24.9万点赞 体现内容共鸣性 [13] - 阶段性洁癖相关讨论获得6.2万点赞 反映特定生活场景内容易引发群体讨论 [14] 网络消费心理与行为 - 用户尝试以明星私人联系方式交换免费商品 显示非标品交易中存在信息不对称 [6] - 对商品定价合理性质疑("他知道小卡卖这么贵吗")反映价格敏感型消费心理 [7] - "分期付款"和"现在没钱"等表述体现超前消费倾向 [8] 内容创作与用户互动 - 教育场景幽默内容(作业被爸爸吃掉)获得高互动 显示戏剧化叙事增强传播效果 [29] - "销冠到哪里都是销冠"等评论体现职场内容易引发认同 [32] - 厕所释放瞬间的比喻获得共鸣 反映压力释放类内容具有情绪价值 [44]
“干1个月赚了800万就跑路?”小扎「天价挖角」惨遭翻车!
猿大侠· 2025-08-30 12:11
Meta AI人才流失情况 - Meta新成立的Meta Superintelligence Labs(MSL)团队在成立不到两个月内出现关键员工离职潮 包括核心老将和高薪新秀 其中两名研究员入职不满1个月即重返OpenAI [1] 天价薪酬与团队摩擦 - 公司为AI团队招募超过50人 部分人员获得超1亿美元薪酬合同 挖角行为引发OpenAI CEO公开抱怨 [5] - 高薪策略引发内部摩擦 老员工对新人的高薪与快速晋升不满 导致团队内部出现离职潮 [6] 离职员工构成 - 离职人员包括工作12年的Bert Maher(参与开发PyTorch和Triton) 现已加入Anthropic [7] - 工作8年多的Tony Liu(曾管理PyTorch GPU系统团队)上周离职 [8] - 工作5年以上的Chi-Hao Wu转投AI初创公司 透露员工因公司频繁重组感到工作不稳定 [9] - 工作4年的Aram Markosyan(研究AI模型安全与公平性)也已离职 [10] - 资深员工Chaya Nayak(工作近9年 参与Llama开发)和Afroz Mohiuddin(去年加入)均跳槽至OpenAI [11][12] 新入职研究员离职 - Avi Verma(斯坦福毕业 曾任职OpenAI)加入Meta不到一个月即重返OpenAI [13] - Ethan Knight(曾任职xAI)被Meta挖走后很快回到OpenAI [14] - Rishabh Agarwal(今年4月加入Meta)本周宣布离职 提及想尝试不同风险 [14] 内部管理问题 - 高频率团队重组和经理更换频繁导致员工感到工作不稳定 [9][16] - 即便提供天价薪酬仍难以留住业界顶尖人才 [17] - 面临OpenAI Anthropic和Google等公司在AI领域的激烈竞争压力 [18] 网友反应 - 网友计算显示 以1亿美元年薪计 工作不满一个月的研究员可能获得800万美元(税前) [19] - 公司内部研究员质疑该计算 认为并非所有离职人员都获得1亿美元签约金 [21][22]
小米主动召回一型号部分充电宝,超14万台
猿大侠· 2025-08-30 12:11
产品召回事件概述 - 小米宣布主动召回2024年8月至9月期间生产的PB2030MI型号部分充电宝 共计146,891台 [1][3][15] - 召回原因为上游供应商提供的126280型电芯2.0版本存在缺陷 极端场景下可能存在安全隐患 [3][13][14] - 受影响产品为小米自带线充电宝20000 33W型号 [1] 召回实施细节 - 公司按建议零售价159元/台办理全额退款 [3][15] - 提供两种召回渠道:线下小米之家门店专人处理 或线上通过指定链接办理 [3][8][15] - 要求用户通过产品SN码验证是否属于召回范围 可通过官网或扫码查询 [6][16] - 必须提供充电宝实物或无害化处理凭证方可办理召回 [20] 技术处理要求 - 要求用户在相对开阔通风环境下对充电宝进行放电处理 [22] - SN码需保持清晰可见 破损或覆盖则无法完成召回流程 [21] - 不在召回范围内的同型号产品使用其他供应商电芯 可继续安全使用 [19]
DeepSeek “极你太美” bug,官方回应了
猿大侠· 2025-08-29 12:12
事件概述 - DeepSeek V3 1模型在代码生成输出中随机出现"极"字 导致编译错误等问题 引发全网热议 [1][2][5] 问题表现 - 输出结果中随机出现"极"字 影响代码编译和结构化输出 [2][11] - 问题波及多个平台 包括火山引擎 chutes 腾讯CodeBuddy和DeepSeek官方 [5] - 腾讯CodeBuddy出现更严重情况 直接插入带"极"字的广告内容 [8] - 国外Reddit平台讨论热烈 关键词包括"extreme" "极"和"極" [7] 临时解决方案 - 通过提示词缓解 禁止特定符号序列模式 [15][19] - 该方法主要针对调用API的第三方平台 DeepSeek V3 1官方不需要此操作 [19] 问题原因分析 - 类似现象在早期R1模型测试中出现过 与模型编程中的"恶性模式"有关 [22] - 模型陷入"thinking"末尾循环时 有千分之一概率输出"极"字后终止思考 [22] - 根本原因可能是数据清洗不彻底 SFT数据合成和预训练数据中存在未清洗的"脏数据" [23] - 模型在RL+阶段将"极"字学习为终止符或语言切换标记 [23] 官方回应 - DeepSeek团队已确认问题 将在最近版本中修复 [12]