猿大侠

搜索文档
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥
猿大侠· 2025-05-02 12:23
核心观点 - LMArena排行榜被指控存在大公司操纵排名的现象,斯坦福、MIT等机构研究者联合发布论文指出Meta等公司利用漏洞刷分[1][2] - 论文分析280万场对战数据发现,少数公司通过私下测试机制选择性提交高分模型,导致排行榜结果偏见[13][16] - 闭源商业模型在LMArena中占据数据优势,Google和OpenAI分别获得19.2%和20.4%的用户对战数据,83个开源模型仅占29.7%[27][33] - LMArena官方回应称论文存在事实错误,开源模型实际占比40%而非8.8%,并强调政策透明度[42][47] - Andrej Karpathy推荐OpenRouterAI作为替代平台,认为其基于真实用例的机制更难被操控[51][56] 排行榜争议 - Gemini-2.5-Pro-Exp-03-25以1443分排名LMArena第一,但Karpathy实测体验不如Claude 3.5[5][6][7] - 排行榜前十中Google占4席,OpenAI占3席,DeepSeek和Alibaba各占2席[8] - 研究者发现部分小模型排名异常高,疑似缺乏现实知识但通过机制漏洞刷分[8][9] 论文指控细节 - 公司利用"best-of-N"策略提交多个变体,仅公布最优结果使排名虚高[14][17][20] - 允许撤回评分的机制导致提供商人为抬高分数,模拟显示额外数据可带来112%性能提升[22][36] - 数据分配不平等:61.3%对战数据流向特定公司,开源模型被移除概率更高[27][30][35] 行业影响 - LMArena最初由高校学生创建,采用匿名对战机制成为行业标准,但创始团队更迭后透明度下降[58][59][62] - 大公司通过预发布测试机制优化模型以适应排行榜指标,而非提升通用能力[37][51] - OpenRouterAI以真实API调用量排名,Claude 3.7 Sonnet以1.21T tokens用量居首[54][55] 公司回应 - LMArena否认操纵指控,称模型下架均因公开可用性不足,政策已公开一年多[45][48][50] - 谷歌DeepMind研究员反驳论文数据,称Gemma 3仅提交一个预发布模型测试[44] - 官方强调排行榜模型需满足长期支持条件,临时版本不会列入排名[50]
小公司的通病,面试过了也不一定录用。。
猿大侠· 2025-05-02 12:23
薪资与招聘 - 985硕士候选人技术面试通过但因期望薪资28k(可接受25k)超出公司预算25k而未获录用 业务面试官认为高薪资会破坏团队薪资平衡[1] - 团队内部薪资差异普遍存在 因学历 工作年限 能力差异可能导致2-3倍差距 薪资应基于个人综合实力而非团队平均水平[1][2] 算法题解析 - LeetCode 1546题要求找出数组中和不重叠且等于目标值target的子数组最大数量 使用前缀和与哈希表结合解决 滑动窗口不适用于含负数的数组[3][8] - 关键解法:通过前缀和定位子数组起始位置(开区间) 记录结束位置(闭区间)确保不重叠 示例1输入[1,1,1,1,1] target=2时输出2个子数组[1,1]和[1,1][4][6] - 代码实现:JAVA和C++均采用哈希表存储前缀和 当preSum-target存在且起始位置≥上一子数组结束位置时计数+1 时间复杂度O(n)[9][11] - 约束条件:数组长度1≤n≤10^5 元素值范围-10^4≤nums[i]≤10^4 target范围0≤target≤10^6[10]
iPhone17 Pro Max设计炸裂,这次真要彻底封神了!!!
猿大侠· 2025-05-01 06:50
iPhone 17系列升级亮点 - iPhone 17系列外观将进行重大改变 采用一体式玻璃材质和更轻薄的航天级中框 提升质感和手感 [3][5] - 后置相机模组改为横向大矩形设计 模组面积比前代增加一倍 可能带来拍照性能大幅提升 [10] - 镜头排列方式保持不变 最右侧为闪光灯和激光雷达扫描仪 [10] 影像系统升级 - 主摄保持4800万像素大底设计 [12] - iPhone 17 Pro Max将首发4800万像素潜望式长焦镜头 支持3 5倍-5倍动态光学变焦 [12] - 低光拍摄能力和解析力将显著增强 [12] 性能与AI升级 - 全系列将搭载Apple Intelligence AI功能 [14] - 配备12GB内存 采用台积电N3p工艺的A19 Pro芯片 性能显著提升 [15] - 供应链信息显示iPhone 18系列将首发6通道LPDDR5X大内存 [16] iPhone折叠屏进展 - 苹果首款折叠屏手机将采用"阔折叠"设计 内屏7 76英寸± 外屏5 49英寸± [19][21] - 内屏将采用屏下摄像头技术 但不带3D人脸组件 [21] - 外屏采用挖孔方案 未来两代iPhone数字系列仍将保持挖孔形态 [21] 市场表现与发布时间 - 华为Pura X折叠屏手机上市后激活量已超过22万台 [18] - iPhone 17系列预计9月发布 售价与上代基本持平 [21][22]
大侠后宫:“相亲好像相到了人机...”哈哈哈哈哈事事有回应的感觉真好呀!!
猿大侠· 2025-05-01 06:50
根据提供的文档内容,未发现与公司或行业研究相关的实质性信息。所有文档均为社交媒体平台的碎片化对话、段子或生活片段,缺乏可分析的商业数据、行业趋势或企业动态。建议提供财经类、上市公司公告或行业研究报告等材料以便进行专业分析。
为什么大众喜欢称马云为「马爸爸」,称雷军为「雷布斯」,而对刘强东的称呼则是「大强子」或「东子」?
猿大侠· 2025-05-01 06:50
阿里巴巴生态与马云形象 - 阿里巴巴生态覆盖广泛 包括淘宝 天猫 支付宝 阿里云等核心业务 形成完整商业闭环 [3] - 马云被称"马爸爸"源于其"金主"形象 通过双11红包 余额宝收益 投资项目等让用户感知直接利益 [4] - 马云擅长用大白话传递愿景 如"让天下没有难做的生意" 强化了既提供资源又激励努力的"父辈"人设 [5][6] 小米与雷军的科技人设 - 雷军被称为"雷布斯"源于小米早期对标苹果 从产品设计到发布会风格均模仿乔布斯 [10][12] - 雷军以"性价比"策略和黑T恤形象塑造亲民技术宅形象 与马云的高调形成反差 [13][16] - 通过微博互动 接受"Are you OK"等网络梗 强化接地气特质 弱化传统大佬距离感 [15][17] 京东与刘强东的草根标签 - 刘强东"大强子/东子"称呼体现草根认同 其反复强调的农村奋斗史引发共鸣 [18][19][21] - 京东以正品物流为核心竞争力 刘强东通过参与快递配送 与员工聚餐等行为强化实干形象 [23][25] - 昵称反映其"带头大哥"定位 用户感知为可信任的兄弟而非资本象征 [22][26] 企业家昵称与品牌关联 - 三个昵称精准对应企业家人设:马云-资源掌控者 雷军-技术追梦者 刘强东-草根实干家 [27][28] - 称呼差异源于企业业务特性 阿里生态的资本属性 小米的科技情怀 京东的务实服务形成不同用户认知 [3][10][23]
小米 YU7 续航全公布!这次真快了啊!!
猿大侠· 2025-04-30 12:11
小米YU7上市时间 - 公司此前宣传小米YU7的上市时间为6-7月份 [5] - 自媒体猜测可能出现在4月上海车展但未出现 [6][7] - 公司回应上市时间未改变仍为6-7月 [8] - 5月临近发布预计将开始预热 [10][34] 小米YU7续航信息 - 工信部更新显示新增835公里续航版本车型型号为XMA6500LBEVR3 [17] - 电池能耗13.3千瓦时/100公里整备重量2315公斤 [18] - 单电机车型包含835/820/810/725公里四个续航版本 [19] - 最高续航比小米SU7 pro版本830KM更高 [21] - 续航提升源于电池和充电技术进步 [23] 小米YU7内饰配置 - 中央扶手箱和杯架布局变化取消实体按键设计 [26] - 取消翻转式仪表盘新增挡风玻璃下方长条形PHUD [28] - PHUD显示面积是普通HUD的3倍亮度15000尼特 [29] - PHUD可显示电量续航档位时速导航等信息 [29] - 支持AR实景融合警示功能提升驾驶安全性 [31] 市场反应与预期 - 835公里续航和全景PHUD带来较多惊喜 [33] - 5月可能开始预热更多配置信息将陆续公布 [34][35] - 产品技术升级符合2025年新能源汽车发展趋势 [23]
大侠后宫:“相亲对象说话好像在模仿小说霸总…?”啊啊啊这是什么霸道发言!
猿大侠· 2025-04-30 12:11
转自:吐槽星君 相亲对象立霸总人设...? (vi a .@咸鱼一条 ) 哦 我 我 我 记好了,我只说一次 魏 我大概 174 左右上 玉以为我 180 3 不好意思 我 175 黄金身高啊 我不找比我矮的男生 可你不到 175 你不是 174 吗? 对,我穿鞋 177.5 2 公众号 · 吐槽星君 对, 我穿鞋 177.5 我减去鞋底估计 174 那没关系 鱼丸面: 我不找比我矮的男生 公众号 · 叶槽星君 记好了,我只说一次 女儿 你不是 174吗? 对, 我穿鞋 177.5 2公众号 · 吐槽星君 O 【】【"】【是】【 记好了,我只给你赞一次 5天前 江苏 回复 240 哈哈哈 6 5天前 山东 回复 ന 2公公号 · 吐槽星君 展开 3 条回复 C ■ 日 "穿鞋177.5""我穿鞋180,站二楼 480"20 374 5天前 宝蛋早点 一人生喜喜剧小。 O 别恐高,你站珠穆朗玛峰去,好几大 80 千米 念 哈哈哈哈哈! 4天前 福建 图复 · 吐槽星君 记好了,我只说一次,感觉像老板对秘书说 17 的60 5天前 浙江 回复 L = 可能是把自己的当成霸总了 ...... 2 2 公众号 · 吐 ...
GitHub实施严格规则阻止中文用户访问 疑似是反爬虫和反抓取
猿大侠· 2025-04-30 12:11
GitHub风控规则调整 核心观点 - GitHub实施新规则检测中文用户请求头并限制访问 主要目的是反爬虫和反抓取 而非针对中国IP地址 [2][4] - 限制条件包括IP质量检测和语言检查(zh_CN) 通过企业代理等脏IP访问更易触发风控 [4] - 公司解释早前中国IP封锁为规则部署失误 但当前语言检测策略被明确为主动调整 [2] 规则触发机制 - 采用多条件判断流程:先检查黑名单IP/UA 再评估IP质量 最后验证语言字段 [4] - 仅当IP质量达标时跳过语言检测 使用中文界面且IP不佳的用户将直接受阻 [4] - 限制对象主要为AI爬虫大规模抓取行为 此类操作增加服务器负载和流量成本 [4] 用户应对方案 - 修改浏览器请求头语言设置为en_US等非受限选项可绕过检测 [5] - 更换高质量IP地址避免触发风控 但可能伴随额外使用成本 [5] - 公司可能升级检测机制 未来或对人工修改语言行为进行识别 [5] 行业影响 - 反映代码托管平台面临AI训练数据抓取压力 需持续优化反爬虫技术 [4][5] - 中文开发者群体可能因语言检测规则面临额外访问障碍 [2][4]
我国电视迎重要转折!视频、电商平台集体发力
猿大侠· 2025-04-29 12:36
政策推动超高清产业发展 - 国家广电总局宣布2025年底起全国新拍电视剧、网络剧、纪录片将全面采用超高清标准制作 新闻、综艺等节目超高清占比显著提升 [1] - 国家广播电视总局将2025年定为"超高清发展年" 目标到2027年实现全国50个超高清频道落地 65%的网络新节目普及4K [2] - 广电总局要求IPTV和互联网电视等平台设立超高清专区 爱奇艺、优酷、腾讯、B站、芒果TV、咪咕等6家头部视频平台已开设超高清专栏 [3] 超高清技术特性 - 超高清具有超高分辨率(3840*2160)、高帧率(50P)、高动态范围(HDR)、广色域(BT.2020)、高量化精度(10Bit)等技术特性 [7][8][10][12][14][16][18] - 超高分辨率能更精细刻画纹理、图案、场景细节 高帧率能展现更有动感的视觉效果 高动态范围强化光影刻画和氛围渲染 [8][10][12][14] - 广色域提供更丰富色彩表达手段 高量化精度更精细呈现颜色亮度和数量 [16][18] 产业配套措施 - 京东等电商平台通过"以旧换新"补贴加速超高清电视入户 [7] - 国家广播电视总局推出"超高清标准信号图"产品 已纳入广播影视行业标准GY/T 413-2024 并获得国际电信联盟标准化立项 [18] - "超高清标准信号图"能全面检测4K超高清频道端到端全链路系统性能 已在省级及以上4K超高清频道完成应用验证 [18] 市场影响 - 超高清技术将为视听作品带来主观感受上质的飞跃 从"看得清"到"看得真" 彻底颠覆观众视听体验 [7] - 古装剧服饰纹理、战争剧爆炸特效、都市剧夜景灯光等细节表现力将远超以往 [7] - 爱奇艺热播剧《无忧渡》以高清画面、无磨皮及唐风美术建筑提升观剧体验 [3]
QQ偷偷搞了个大动作,就离谱
猿大侠· 2025-04-29 12:36
综合读者投稿并经验证,目前手机QQ客户端已接入微信小程序功能,用户将自己的客户端更新 至最新版本( iOS和安卓版都可以 )后,即可体验到相关功能。 目前,这一小程序功能入口位置较深,用户需要先点击搜索框,然后才能看到小程序按钮。 第一次使用需要加载兼容组件,点击小程序则会跳转到微信授权登录。 授权登录后就可以搜索并打开各种小程序了,并且都是在QQ中打开运行的,其他方面与原生微 信客户端运行微信小程序没有区别。 不过,也并不是所有微信小程序都能在QQ里运行,只有部分带微信角标的小程序可以。 那些没有角标的,则是QQ原生小程序。 网友猜测,此次QQ内测使用微信账号登录,或许是为了用户回流。但目前腾讯并没有针对此事 作出回应。 有业内人士指出,此举将为小程序开发者带来更广阔的流量机会,有望催生新一轮小程序创新浪 潮。 此外,微信在近一段时间里的小功能调整也比较频繁,可以看出微信正在逐步降低个人创作门 槛,希望更多的短内容,个人原创内容加入到这一内容池中来。 近年来,微信用户数量飞速增长,微信及WeChat月活已达13.09亿,而QQ移动终端月活仅为5.74 亿,微信月活已比QQ高出一倍多。 ...