算法

搜索文档
当“每经影视”决定成为你的“消费搭子” 买2万元冲锋衣的人和薅1.28元咖啡羊毛的人,在这里神奇汇合
每日经济新闻· 2025-06-18 18:11
媒体品牌升级 - 微信公众号"每经影视"更名为"消费物语",标志着从影视领域向更广泛的消费领域拓展,视角升级为关注当代消费浪潮下的故事和隐喻 [3] - 更名后仍保留影视内容,同时增加物质消费和精神消费的报道,如餐饮经济、体育经济等 [4] - 报道风格强调有温度的田野调查,而非冰冷的商业报告 [3] 消费趋势观察 - 中等收入群体消费行为呈现多元化,如购买2万元冲锋衣和排队购买Labubu等 [2] - 咖啡市场竞争激烈,出现1.28元的库迪咖啡和瑞幸进入"6块9"时代等现象 [2] - 演唱会市场分化明显,刀郎、刘若英等演唱会票房收入或超千万元,同时有近两千个项目打折卖票 [2] 行业深度报道 - 曾调查"印象·刘三姐"破产案例,揭示文旅IP泡沫和资金链断裂问题,该IP年净利润达7000万元 [1] - 探讨AI对创意行业的影响,如AI生成海报效率远超传统方式 [1] - 分析文化产品的溢价现象,如解码《繁花》中排骨年糕的文化溢价 [1] 品牌营销活动 - 举办读者互动活动,提供25个获奖名额,奖品包括迪士尼乐园门票、腾讯视频VIP年卡、泡泡玛特盲盒等 [6][7][9][10][12] - 奖品总价值较高,涵盖娱乐、餐饮等多个消费领域,如星巴克饮品券、达美乐比萨代金卡等 [7][12] - 活动获得腾讯音乐、腾讯视频、星巴克中国等多个知名品牌支持 [12]
谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分
机器之心· 2025-06-18 17:34
大语言模型在竞技编程领域的表现评估 核心观点 - 当前前沿大语言模型(如GPT-4、Gemini等)在竞技编程领域与人类大师级选手仍存在显著差距,尤其在复杂算法推理和边界情况分析上表现欠佳 [1][12][18] - 模型的高分更多依赖外部工具和多次尝试(pass@k),而非真实推理能力 [3][17][34] - 在知识密集型和逻辑密集型问题上表现较好,但在观察密集型和分类讨论问题上表现较差 [20][22][24] 模型性能表现 - **整体表现**:表现最好的模型o4-mini-high在中等难度题上pass@1仅为53.5%,高难度题完全无法通过(0%),而人类专家可稳定发挥 [12][15] - **排行榜数据**: - o4-mini-high:中等难度53.5%,简单83.1%,评分2116(前1.5%) [15] - Gemini 2.5 Pro:中等25.4%,简单70.4%,评分1992 [15] - DeepSeek R1:中等9.9%,简单56.3%,评分1442 [15] 不同算法范式表现差异 - **优势领域**: - 知识密集型(线段树、图论等):模型可通过拼接训练数据中的模板解决 [22] - 逻辑密集型(动态规划、二分搜索等):受益于记忆化脚手架代码 [23] - **劣势领域**: - 观察密集型(博弈论、贪心算法等):评分骤降至1500以下,缺乏新颖见解能力 [24] - 分类讨论:所有模型评分低于1500,无法处理边界情况 [25] - 交互式问题:o4-mini-high评分骤降至1500,其他模型表现更差 [26] 失败原因分析 - **主要错误类型**: - 概念性错误:o3-mini比人类多犯34个算法逻辑错误 [28][30] - 实现优势:比人类少犯25个实现逻辑错误,几乎无运行时错误 [30] - 交互问题异常:80%提交被判"空闲时间超限" [31] 工具与多次尝试的影响 - **pass@k效果**:o4-mini-medium评分从pass@1的1793升至pass@10的2334,但仍低于工具加持的2719分 [34][36] - **推理能力效果**: - 组合数学提升最大(DeepSeek R1比V3高1400分) [41] - 知识密集型提升显著(如线段树问题+700分) [42] - 观察密集型提升有限(博弈论提升最低或负增长) [42] 评测基准设计 - **LiveCodeBench Pro**:包含584道来自Codeforces、ICPC等顶级赛事的高质量题目,由奥赛选手标注算法类别 [6][7] - **研究团队**:包含ICPC世界总决赛参赛者等专业背景 [5]
大模型全员0分!谢赛宁领衔华人团队,最新编程竞赛基准出炉,题目每日更新禁止刷题
量子位· 2025-06-18 17:17
大模型编程能力测试结果 - 参赛大模型在LiveCodeBench Pro测试中全军覆没,通通0分 [1][2] - 测试包含来自IOI、Codeforces和ICPC的竞赛级编程问题,题库每日更新以防止模型"背题" [3][4] - 表现最佳的模型o4-mini-high在中等难度题上的一次通过率仅53%,难题通过率为0% [9] - 即使最好的模型o4-mini-high在工具调用被屏蔽时Elo评分仅2100,远低于大师级2700水平 [10] 测试设计与题库构成 - 测试由奥林匹克获奖者构建,在比赛结束后立即收集题目以避免互联网答案污染 [14] - 题库包含584道顶流竞赛题,分为知识密集型、逻辑密集型和观察密集型三类 [15] - 题目难度通过正态分布自动选择,如Codeforces评分2000分以上归为困难等级 [16] - 数学类题目占比13%,组合数学类11%,动态编程类23%,贪心算法类28% [17] 模型表现分析 - 22款测试模型中,o4-mini-high表现最佳但仍有81.7%未通过率 [12][21] - 模型在知识密集型和逻辑密集型问题表现较好,但在观察密集型问题表现差 [26] - 模型擅长精确实现但算法设计能力弱于人类,常给出看似正确实则错误的解释 [28][29] - 模型对题目示例输入利用不充分,经常无法通过样例测试 [30] - 增加尝试次数(pass@k)可提升中简单题表现,但对难题无效 [33][34] 团队背景 - LiveCodeBench Pro团队超半数成员为华人,主要由奥林匹克竞赛得奖者组成 [40] - 负责人郑子涵曾获ICPC世界总决赛第二名,现为OpenAI实习生 [41][42] - 另一位负责人柴文浩开发了首个长视频理解超大多模态模型MovieChat [44][46] - 团队成员来自纽约大学、华盛顿大学、普林斯顿大学等顶尖院校 [48]
我在618主场,和3位顶尖技术博士聊了聊
量子位· 2025-06-18 15:49
618购物节技术升级 - 今年618购物节用户体验显著提升,商品推荐精准度提高、物流速度加快、智能客服更拟人化[1][2] - 技术改进聚焦实际应用而非概念炒作,支撑亿级用户流畅购物体验[3][4] - 京东618始于公司周年庆,通过限时秒杀等简单玩法吸引消费者,已持续二十余年[5][6] 零售技术突破 - 京东零售开发"同品判别系统",通过商品属性对比实现同类商品自动归类,提升比价效率[8][9] - 采用模型蒸馏技术解决7B大模型成本过高问题,将训练资源消耗降低40%-60%同时保持精度[12][13][16] - 创新数据筛选机制优先处理模糊样本,并开发自动数据配比算法提升多任务训练效率[16] 物流智能化实践 - 京东物流开发智能分区模型,结合快递员画像和小区特征优化末端配送效率[33][34] - 分拣中心部署具身智能机械臂,专注中小件包裹分拣码放单一场景,利用内部海量图像数据优化识别[36][38][39] - 建立样本识别失败快速反馈机制,形成模型训练闭环[40] 语音识别技术创新 - 语音识别系统已接入协同办公、智能客服等核心业务线,会议转写系统效果超越外部竞品[42][48][49] - 针对方言识别难题收集全国样本,采用MoE机制增强模型泛化能力[52] - 开发语音情感分析技术,通过语气波动判断用户意图倾向[52] 技术人才培养体系 - 京东推出TGT计划全球招募技术人才,提供无上限薪资和三导师制培养[57][59] - 公司拥有电商数据、物流网络等完整技术生态,支持从研究到规模部署的全链路实践[59] - 博士管培生项目提供业务导师指导,6个月基础培养后进入实战项目[46] 公司技术文化 - 京东技术风格强调踏实敢为,鼓励长期深耕业务实际问题[54][56] - 完整供应链体系带来独特技术挑战与机会,需在更大搜索空间寻优[22][23] - 技术人员可获得充分资源支持,验证期即获团队协作保障[20][47]
整合多源植物转录组数据,山东理工大学等构建PlantLncBoost模型,跨物种lncRNA预测准确率最高达96%
36氪· 2025-06-18 15:44
植物lncRNA研究突破 - 山东理工大学联合多国科研机构构建PlantLncBoost模型,解决植物lncRNA鉴定泛化性难题,在12个不同科属植物数据集的交叉验证中平均预测准确率达91.7%,较现有工具提升18.2% [1][3] - 研究团队整合9种被子植物的24,152条lncRNA序列和等量mRNA序列,通过严格质量控制构建平衡训练集,并开发包含1,662个特征的特征体系,其中3个核心参数实现94.35%准确率 [4][6][15] - PlantLncBoost采用CatBoost算法,在五折交叉验证中准确率达93.92%,超参数优化耗时仅14.45分钟,显著优于XGBoost和LightGBM [10][11] 模型性能与验证 - PlantLncBoost在20种植物测试集中灵敏度98.42%、特异性94.93%、准确率96.63%,AUC达98.35%,全面领先LncFinder-plant等9种主流工具 [19][21] - 在高置信度实验验证集中识别357条lncRNA(检测率99.72%),唯一未识别案例经追溯分析证实为潜在编码RNA误标 [22][23] - 模型关键特征包括ORF覆盖率(拟南芥lncRNA峰值0.2 vs mRNA 0.7)、复数傅里叶平均值和原子傅里叶振幅,三者解释97%分类方差 [15][17] 行业应用与协同创新 - 北京大学团队发现拟南芥非编码RNA HID1同源基因HIL1的转录抑制机制,法国萨克雷大学揭示COOLAIR lncRNA调控低温胁迫响应的动态模式 [24][25] - 先正达集团利用双单倍体技术将玉米自交系创制周期从4年缩短至1年,2023年审定121个品种多项指标行业领先 [26] - 贝纳基因开发全长lncRNA测序技术,突破Nanopore平台检测瓶颈,应用于苹果花色苷积累等农业育种研究 [26]
36氪对话元鼎智能CEO汪洋:攻占欧美10万+泳池社区店,捏住行业命脉
36氪· 2025-06-18 10:58
行业概况 - 全球泳池机器人市场正以32.1%的年复合增长率扩张,2024年渗透率突破25%,预计2028年市场规模将达132亿美元 [1] - 行业由Maytronics、Fluidra等传统巨头主导,近年涌现三类中国新势力:无线化创新的元鼎智能(Aiper)、低价策略的深圳思傲拓(Solavto)、亚马逊白牌商家 [1] - 行业集中度提升,元鼎智能与全球第一大泳池设备商Fluidra达成战略合作,并完成近10亿元融资 [1] 市场格局与竞争策略 - 竞争格局已定,低价(深圳系)、高价(传统巨头)、渠道稳固(老玩家)三方并存,新变量难现 [3] - 技术派玩家押注无线化和智能化,但具体路径差异明显,如元鼎智能量产水下无线通信技术,部分同行因技术难度或成本放弃 [3][4] - 低价策略短期冲击线上份额,长期不可持续,元鼎智能通过自研优势、规模化生产和平台化开发优化成本结构,新产品平均售价提升近一倍 [5] 技术壁垒与创新 - 水下AI清洁面临两大挑战:复杂垃圾种类与泳池纹理识别、水流动态追踪,传统扫地机效率仅30%,AI需精准定位脏污点 [6] - 元鼎智能拥有40多人AI团队,长期在全球采集数据,技术壁垒体现在迭代速度、用户需求理解及综合能力(资金、供应链、渠道) [4] - 召回事件涉及电池技术缺陷(故障率0.049%),第三代产品采用灌胶工艺并通过华为最高标准测试 [7] 渠道战略与全球化布局 - 线上渠道疲软(亚马逊电商零售增速仅7%),专业泳池渠道(占全球60%高端市场)壁垒高筑,中国品牌占比不足5% [2] - 元鼎智能布局全球化渠道基建:IT系统直连沃尔玛库存、自建欧洲海外仓,核心策略为抢占线下信任节点(社区泳池专卖店) [8][10] - 欧洲市场依赖本地代理商网络,澳洲市场Google搜索份额从26%升至59%,线下销售占比接近线上且增长迅猛 [13] 产品与渠道协同 - 分品策略避免渠道冲突:泳池专卖店销售千元以上高端机型(如Scuba X1 Pro Max),沃尔玛主打500-800美金性价比款 [11] - Fluidra选择合作因元鼎智能开放技术底牌并为渠道定制供应链,中国制造需从"流量货架"转向"信任货架" [11] 产能与供应链 - 越南工厂年产量超100万台,国内产能200万台,总年产能超300万台,美国60%-70%货提前抵港以应对关税 [14]
经济日报:算法“破茧”非一日之功
快讯· 2025-06-18 07:19
算法推荐技术的影响 - 算法推荐技术深度融入经济社会发展的各个领域和场景,通过抓取用户日常使用数据,分析行为、习惯和偏好,精准提供信息、娱乐、消费等服务 [1] - 算法推荐帮助用户过滤冗余信息,提高信息获取效率,解决信息过载问题,成为平台吸引高黏性用户、驱动增长的重要方式 [1] - 算法推荐是一把"双刃剑",运用失范会产生乱象,首要问题是同质化内容过多,形成"信息茧房" [1] 算法推荐的负面影响 - 低俗信息现象不容轻视,可能破坏平台的内容创作生态 [1] - "劣币驱逐良币"的势头会导致优质创作者和用户流失,给平台健康发展造成重创 [1]
量子计算机能秒解密码吗
经济日报· 2025-06-18 06:26
另一方面,量子计算并非万能。为了应对可能的威胁,如今各国都在加紧研发并推广"抗量子加密",目 前中国和美国的抗量子加密算法标准化和产业化工作都在推进中。由于抗量子加密涉及的技术基于经典 物理,全面部署此类加密方案所需要解决的技术困难,相较于量子计算机的制造要小得多。 科技发展日新月异,曾经颇具神秘感的量子计算机,如今已逐渐为人们所熟知。一些传言也随之而来, 比如"量子计算机可瞬间破解所有密码""银行账户将集体裸奔"。这是真的吗? 量子计算机,简单而言,是完全遵循量子力学原理进行信息处理的计算机。与之相对的,是我们日常所 用的电脑、智能手机等,是基于经典物理规律运转的计算机。 一方面,当前量子计算机的研制整体上依然处于初级阶段。主要原因在于量子力学的特殊性质对环境是 有极为苛刻的要求;同时,计算本身是复杂且精密的任务,需要对处于量子状态的物质进行精准无误的 操控。截至目前,虽然超导量子电路、光量子等技术路线都相继取得了一些阶段性成果,但还远远达不 到成熟的地步。主要的困难在于如何进一步提高量子计算机的规模,以及如何及时纠错,从而保证更久 的工作时间。 所以,一般而言,除少数特别设计的任务之外,现有技术下的量子计 ...
算法“破茧”非一日之功
经济日报· 2025-06-18 06:21
算法推荐技术现状 - 算法推荐技术已深度融入经济社会各领域 通过分析用户行为数据精准提供信息 娱乐 消费等服务 显著提升信息获取效率并解决信息过载问题 [1] - 该技术成为平台吸引高黏性用户和驱动增长的核心手段 但过度依赖用户偏好易导致同质化内容泛滥 形成"信息茧房"阻碍多元信息流动 [1] 算法失范的主要问题 - 同质化内容推送造成用户认知偏差 长期封闭在单一信息空间可能加剧观点极化 [1] - 低俗内容因"流量至上"逻辑被算法优先推荐 侵蚀用户理性思辨能力 对未成年人危害尤甚 [2] - 劣质内容挤压优质创作空间 扭曲平台创作生态 引发"劣币驱逐良币"效应 导致优质创作者流失 [2] 治理进展与改进方向 - 重点平台已推出"茧房评估""一键破茧"等功能 提升内容多样性 但功能实际效果仍待优化 [3] - 平台需将正向价值观嵌入算法全生命周期 利用技术手段抑制低质内容传播 [3] - 监管部门应加强违法违规打击力度 用户需主动打破信息茧房 提升信息鉴别能力 [3]
跨界工商储!这家AI企业拟100%收购阳光优储
行家说储能· 2025-06-17 19:25
公司动态 - 泰禾智能拟以不超过5000万元收购控股股东阳光新能源全资子公司阳光优储100%股权,以拓展工商业用户侧储能业务 [1] - 本次交易为跨界收购,公司此前无工商业用户侧储能业务经验和技术人员储备,但认为对整体经营影响较小 [3] - 泰禾智能2024年实现营业收入5.64亿元(同比增长10.68%),净利润2146.96万元(同比增长89.89%) [3] - 阳光优储2024年营收1977.61万元(占泰禾智能营收3.51%),净亏损613.21万元;2025年1-3月营收1570.29万元(占比15%),净亏损2265.66万元 [5] 业务布局 - 泰禾智能当前核心业务为智能检测分选装备和智能包装装备,在光谱检测、智能算法和工业机器人自动化方面有技术积累 [3] - 阳光优储成立于2023年2月,注册资本2亿元,专注工商业用户侧储能项目投资、开发和运营 [5] - 阳光优储投资运营的工商业储能电站规模位列安徽省前列,采用阳光电源PowerTitan液冷储能系统和阳光新能源智慧能源解决方案 [5][7] - 阳光优储参与项目包括:安徽友进冠华工商业储能电站(35MW/70MWh)、安利股份用户侧储能电站(12.5MW/25MWh)、广悦化工用户侧储能电站(75MW/150MWh) [7] 技术协同 - 工商业用户侧储能正向市场化价值驱动转型,AI自动化预测电力市场变化成为趋势 [4] - 泰禾智能在工业AI视觉识别、光谱检测、智能算法方面的技术积累,可能应用于储能系统安全监控和智能运维场景 [4] - 收购后或将AI视觉识别等技术导入工商业用户侧储能电站的安全监控和智能运维 [4] 战略意图 - 阳光新能源为阳光电源旗下子公司,专注于光伏新能源项目开发,2023年12月已宣布启动分拆上市计划 [7] - 阳光新能源估值达193亿元,接近独角兽级别,此次交易可能为未来资本运作铺路 [7] - 交易完成后将签署协议规避阳光新能源旗下其他子公司的同业竞争问题 [8]