算法

搜索文档
算法推荐带来“信息茧房” 视野受限、认知固化 如何“破茧”?
央视网· 2025-05-25 19:10
央视网消息:随着信息技术的飞速发展,信息算法推荐在给用户带来个性化内容推送便利的同时,也引发了"信息茧房"现象,简单来说就是用户因长期 接触同质化信息,导致视野受限、认知固化。为应对这一问题,中央网信办持续加强信息推荐算法治理,各大平台也积极响应,采取多种措施助力用户突 破"信息茧房"束缚。那么,哪些人群最容易被困在"信息茧房"中?又该如何"破茧"?来看总台记者的报道。 算法如贴心"小秘书"提供个性化内容 在这个信息爆炸的时代,算法就像个贴心的"小秘书",天天变着法儿地给我们推荐喜欢的内容。早上一睁眼,打开手机,全是自己爱看的搞笑视频、明 星八卦;晚上躺在床上,刷到的还是那些老一套。感觉就像被算法关进了一个透明的"茧房"里,里面全是自己喜欢的东西,可时间一长,问题就来了。外面 的世界啥样都不知道了。 算法存在"滥用"现象 推荐内容同类化 其实,算法也具有两面性。一面注重用户的喜好,提供个性化内容,可以给用户带来更好服务体验。但另一面,也存在"滥用"现象,也有"失控"的风 险。 网民吴先生说,这种信息茧房如果个人没有好的辨别、甄别能力,很容易陷入其中无法自拔。 网民 吴先生:如果你自己没有一点辨别能力的话,你就 ...
新产品、新业态、新消费、新趋势汇聚 文化出海正从走出去到融进去
央视网· 2025-05-25 17:52
文博会规模与参展情况 - 第二十一届中国(深圳)国际文化产业博览交易会于5月22日至26日举办 共有6280家政府组团、文化机构和企业线上线下参展 展出文化产品超过12万件 [1] - 文化消费文旅融合展馆人气旺盛 展示历史名胜、文化街区、文创产品、沉浸式旅游体验等特色展品 [3] 科技赋能文旅产品创新 - 浙江科创企业推出可折叠飞行相机 具备AI算法精准定位跟拍功能 支持全地形、低空、近距离飞行及高速运动跟拍 手掌感应回收技术提升用户体验 [4][6] - AI生成旅游照片技术受追捧 可根据文旅目的地和写真风格定制私人照片 设备已投入多个景区应用 [8] 非遗国潮IP化转型 - 江苏展区非遗苏绣与三星堆IP结合 绒花产品衍生为胸针、发饰、相册摆台等 赋予传统文化新寓意 [10] - 安徽展区创意实景搭建六尺巷 黄梅戏人物手办IP"有戏"融合萌态造型与传统戏曲元素 [10] - 北京展区藻井冰箱贴、潮玩IP泡泡玛特labubu海外营收翻3倍 推动中国设计国际化 [10] - 浙江展区潮玩积木结合古建筑榫卯结构 马面裙融合传统剪裁与现代面料 [12] 文化出海新趋势 - 网文、网剧、网游成为文化出海"新三样" 《哪吒》《熊出没》海外票房破纪录 《黑神话:悟空》全球畅销 [13] - 游戏出海从简单翻译转向本地化定制 网剧出海借助大模型工具快速生成文本、剧本及海报 提升文化融合深度 [13]
她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽
量子位· 2025-05-25 14:07
核心观点 - 微软亚洲研究院张丽团队选择了一条不同于行业主流Scaling Law的路径,专注于提升大模型的深度推理能力,而非单纯扩大参数规模[1][2] - 团队通过蒙特卡洛搜索算法让7B小模型实现了接近OpenAI o1级别的数学推理能力,突破了传统强化学习路线的局限[4][10] - 团队最早将认知科学中的System2概念引入大模型领域,强调深度逻辑思考能力是模型智商的关键[3][18][19] - rStar-Math工作意外涌现出self-reflection能力,验证了该能力对提升模型智商的重要性[21][22][27] 研究方向与技术路径 - 团队研究分为两个方向:拓展模型长文本记忆能力(LongRoPE)和提升深度推理能力(rStar系列)[10][16][17] - 采用蒙特卡洛搜索算法结合过程奖励模型,实现步骤级优化,显著提升小模型在数学推理任务的表现[38][39][51] - 算法创新包括code-augmented CoT(链式思维代码增强)和Tool-Integrity Reasoning(工具完整性推理)[47][48][50] - 蒙特卡洛搜索在小模型上表现优异,7B模型效果接近OpenAI o1,引发行业对小模型潜力的讨论[33][34][41] 行业影响与反馈 - rStar-Math发布后产生破圈效应,学术圈外如媒体、教育、智能车领域均高度关注[33][67][68] - 成果引发对Scaling Law的重新审视,部分观点认为2025年可能是小模型时代的开端[34] - 主要质疑集中在方法泛化性和蒙特卡洛搜索的必要性,团队通过开源代码和数据回应[37][43] - 蒙特卡洛搜索算法在金融、医疗等需轻量化模型的领域展现出应用潜力[43] 技术细节与实验发现 - 蒙特卡洛搜索的核心优势在于过程奖励模型,相比传统Best of N的结果奖励模型更精细[38][39][55] - 实验显示参数规模与效果正相关,但蒙特卡洛算法在固定size下潜力优于强化学习[44][45][46] - 合成数据效果优异归因于code-augmented CoT和过程奖励模型对高质量步骤的筛选[47][51] - 奖励模型构建是当前技术瓶颈,尤其在数学等需严格过程验证的任务中[56][59][60] 未来研究方向 - 团队将聚焦三方面:优化奖励模型、提升策略模型的高级推理能力、扩展至代码推理等新领域[80][81][82] - 数学推理被视为智商天花板任务,当前最强模型在FrontierMath基准上准确率仅2%[84][86][87] - 长文本方向已通过LongRoPE实现算法突破,但需解决效率、数据和算力问题才能规模化[74][77] - 蒙特卡洛搜索在通用任务中性价比有限,更适合复杂场景如数学证明或代码生成[70][72][73] 行业趋势与条件 - 数学能力研究受青睐因数据丰富、验证明确,但实现通用深度推理仍需长期探索[85][87][89] - 模型架构创新聚焦Transformer改进与非Transformer探索,被视为AGI发展关键路径[92][93] - 当前主流仍依赖强化学习,蒙特卡洛搜索尚未形成趋势,但跨领域合作需求显现[43][46][59]
我,北大毕业,现在跟大伙一起捡破烂
新浪财经· 2025-05-25 01:28
微信公众号生态变化 - 微信公众号算法权重提升 粉丝权重降低 导致创作者需迎合算法而非核心读者偏好 [3] - 平台内容分发机制转向短平快模式 削弱了深度内容与读者间的长期连接 [3] - 行业出现"微信公众号已死"论调 认为平台丧失特色导致运营价值下降 [3] 内容创作者策略调整 - 创作者采取"轻装上阵"策略 减少深度思考内容 转向更轻松的互动风格 [5][6] - 通过立人设和贴标签增强算法识别度 适应碎片化传播环境 [7][8] - 采用游戏化心态应对行业变化 避免陷入传统创作模式的心理落差 [8] 行业现象观察 - 经济下行期公众号创作者数量增加 被类比为"在线捡破烂"的低门槛职业 [11] - 创作者尝试将学术背景与休闲内容结合 形成差异化定位 [12][15] - 平台出现"摸鱼"文化现象 部分账号以非严肃内容作为核心卖点 [14][15]
电子税务局|环保税抽样测算法税源采集及申报操作步骤
蓝色柳林财税室· 2025-05-24 18:50
环境保护税申报流程 - 宁波税务推出环境保护税操作系列图解,提供全流程操作指南,帮助纳税人掌握申报要点 [3] - 申报流程包括税源采集和纳税申报两个主要环节 [5][9] 税源信息采集步骤 - 在电子税务局勾选增加"环境保护税"申报税种,点击【税源采集】进入采集界面 [5] - 填写环境保护税税源明细表,包括纳税人识别号、纳税人名称、申报类型(按次/按期)、排污许可证编号(如有)、污染物类别等 [6] - 污染物类别分为大气污染物、水污染物、固体废物、噪声,可单选或多选 [6] - 选择生产经营所在区划和对应的生态环境主管部门 [6] - 录入税源信息,污染物排放量计算方法勾选"抽样测算",填写排放口编号、名称、有效期等 [7][8] - 施工扬尘环保税纳税人需按照《建筑工程施工许可证》填写排放口编号和名称 [7] - 确认无误后点击【保存】,系统自动赋予排放口独立税源编号 [8] 纳税申报步骤 - 在税源采集界面点击【申报计算】进入申报计算及减免信息录入界面 [9] - 判断是否"按次申报"及确认税款所属期间,填写特征指标、特征单位、特征指标数量等 [10] - 堆场扬尘和施工扬尘纳税人需按照浙江省相关测算方法填写特征指标数量和特征系数 [11][12] - 系统自动填写污染当量值和单位税额 [13][14] - 确认无误后点击【提交申报】,在信息确认界面选中"真、实、责、任"后完成申报 [15] 特殊行业申报规则 - 施工扬尘环保税纳税人需注意:2023年7月1日前已开工工程,"有效期起"填写为2023年7月1日;之后开工的按实际开工时间填写 [7] - 堆场扬尘纳税人需按"堆场类型+堆存物名称+环节"格式填写排放口名称 [7] - 施工扬尘纳税人需按照《建筑工程施工许可证》填写工程名称 [7]
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
机器之心· 2025-05-24 11:13
核心观点 - 文章深入分析了Kimi k1.5、OpenReasonerZero、DAPO和Dr. GRPO四篇论文的创新点,重点探讨了GRPO及其改进算法在推理模型中的应用 [1][3][10] - 当前AI领域推理和强化学习成为热门,但GRPO并非特殊算法,与其他RL算法关系密切 [6][8][11] - 行业正从价值函数转向直接估计优势值,强化学习范式进化是主要推动力 [20] Kimi k1.5 - Kimi k1.5是Kimi团队最新多模态大语言模型,采用强化学习训练,论文长达25页但未开放模型权重 [17][19] - 模型采用简单有效的强化学习框架,无需依赖蒙特卡洛树搜索等复杂技术 [17] - 团队强调提示策划的重要性,采用基于模型的方法评估提示难度 [22] - 训练方案包含SFT预热、长思维链和拒绝采样,后期使用在线策略镜像下降变体 [24] - 研究发现较大模型在token效率方面表现更好,但小模型通过长思维链也能达到相当性能 [29][31] OpenReasonerZero - 这是首篇展示在基础模型上通过RL取得出色结果的研究 [34] - 使用Qwen-32B基座模型达到DeepSeek论文中提到的Qwen-32B RL模型性能 [38] - 研究发现GRPO对其不起作用,使用带GAE的PPO算法效果更好 [42] - 移除KL惩罚能实现最优训练稳定性和最终性能 [44][45] DAPO - DAPO是对GRPO的改进算法,包括分离裁剪超参数、动态采样等创新点 [54][55][56] - 改进包括:两个不同裁剪超参数、移除平坦奖励样本、使用token级损失、管理过长生成 [54][55][56][57] - 建议从GRPO中移除KL散度惩罚以帮助学习 [59] - 通过消融实验显示模型保持更高熵(探索/随机性) [62] Dr. GRPO - 论文提出修改GRPO以改善学习动态,使生成长度增加较少情况下实现更强性能 [76][79] - 核心修改涉及GRPO实现中的常见做法,调整token优势分配方式 [80] - 移除问题级难度偏置,避免对高方差问题的惩罚 [81] - 比较Qwen 2.5、Llama 3.1和DeepSeek基础模型在数学问题上的表现 [85][86] 行业趋势 - 当前所有RL算法在实现层面高度相似,GRPO虽流行但变革聚焦核心维度 [15][16] - 业界逐渐转向直接估计优势值而非价值函数建模 [20] - 数据分布对强化学习效果起关键作用,提示策划和难度评估成为重点 [22][41] - 模型大小与性能关系显示大模型token效率更高,但小模型通过优化也能达到相当效果 [29][31]
哪些老街最能吸引外省游客?| SAE逛吃指数之“老街”八方客
经济观察报· 2025-05-24 10:57
外省游客吸引力排名 - 厦门鼓浪屿街区外省游客占比最高达76.3% [1] - 南京总统府街区外省游客占比75%排名第二 [1] - 北京东华门大街外省游客占比74.3%排名第三 [1] - 共有28条街区外省游客占比高于本地游客 [1] 街区吸引力均衡度分析 - 武汉昙华林街区吸引力最均衡排名第一 [2] - 青岛八大关和信号山街区分别排名第二和第三 [2] - 标准差越小表明街区对外省游客吸引力越广泛 [2] 代表性街区文化价值 - 武汉昙华林街区聚集52处百年历史建筑 [3] - 青岛八大关区域有200多栋建筑包含20多个国家风格 [3] - 苏州怡园吸收苏州古典园林精华独树一帜 [4] - 丽江束河古镇和大研古城将文化元素融入整个街区 [5] 北京街区独特优势 - 北京东交民巷等国子监等入围前十 [4] - 北京游客具有四面八方属性是首都优势 [4] 丽江旅游特色 - 丽江1997年被列为世界文化遗产 [5] - 丽江集自然风光历史底蕴和民族风情于一体 [5] - 丽江成为热门旅居城市吸引多元化人群 [5]
书评丨当代码学会呼吸
21世纪经济报道· 2025-05-24 00:44
人机沟通与认知革命 - 波士顿动力Atlas机器人完成第37次情绪识别算法升级,显示机器已具备理解人类表情的能力,但人类尚未形成与机器平等对话的能力[1] - 人机沟通存在单向解码风险:当机器学习人类沟通密码时,人类可能面临被反向解码的哲学命题[1] - MIT研究显示对话系统在语用层达到人类自然交流63%匹配度时,人类对智能机器的信任度出现指数级跃升[6] 计算机与人工智能发展史 - "computer"一词最初指用铅笔和纸从事计算工作的人,AI思想与实践始终伴随计算机发展[3] - 图灵1950年论文提出AI测试标准,AI术语1956年出现,当前进步依赖GPU计算能力加速[3] - 计算机bug概念源自20世纪40年代格蕾丝·霍珀发现的电子管硬件故障飞蛾事件[4] 机器智能的边界与局限 - 机器在重复计算(如递归算法)方面远超人类,但面对模糊目标或数据缺失领域仍束手无策[4][5] - 当前AI无法具备人类情感、情绪和潜意识,可能放大人类偏见(0.03%训练数据偏见经2000次迭代可形成17%系统性歧视)[5][6] - 数学理论可讨论N维空间而计算机能模拟,但人类自然认知边界局限在三维空间加时间维度[4] 人机协作的范式变革 - 人类沟通包含语法层、语义层、语用层三维度,AI在多模态模型支持下已实现前两个层次的深入沟通[6] - 机器模仿人类语言行为将引发跨越物种的沟通变革,可能重新定义"何以为人"[6] - 未来很长时间人类仍是机器老师,需干预机器放大社会不平衡的风险[5]
恒宝股份(002104) - 002104恒宝股份投资者关系管理信息20250523
2025-05-23 19:14
公司业绩 - 2024 年度公司实现营业收入 90,279.41 万元,实现归属于上市公司股东的净利润 9,501.87 万元 [2] - 2024 年度海外业务收入为 9,362.43 万元,占公司总营收的 10.37% [8] 未来发展 - 2025 年继续聚焦核心业务,结合国家数字化发展契机,面向新兴领域实现技术突破和产品创新 [2][3] - 深耕智能卡嵌入式产品等业务,深化产品能力转型,加大在安全产品领域开发创新投入,参与数字化社会运营 [4] - 把握数字人民币发展契机,完善数字人民币产品及服务体系,加大数字人民币服务创新和投入 [4][5] 行业前景 - 公司处于技术革命与政策红利交汇的产业拐点,行业形成“技术融合 + 政策共振”的立体化变革格局 [3][7] - 2024 年度所处行业总体市场需求有所下降,行业内竞争加剧 [6] 资金运用 - 利用闲置自有资金进行现金管理和证券投资,提高资金使用效率和整体效益,为股东谋取更多回报 [3] 股东相关 - 需准备股东账号卡及持股明细与公司证券部联系核实后可查询其他时间段股东人数 [4] - 董事长减持股份用于面向契合国家战略和公司未来发展方向的新兴产品和技术投资 [5] 合作与布局 - 积极寻求与各类优秀企业合作机会,具体客户及产品合作涉及商业保密条款不便告知 [5] - 设立江苏镇江云宝科技产业发展有限公司,优化战略布局,提升综合实力与市场竞争优势 [6] - 上海阳明守仁科技有限公司正处在建设期,尚未对业绩产生明显成效 [7] - 不会并购恒神,未来会考虑与公司发展方向高度匹配的优质资产 [7] 海外业务 - 继续响应一带一路战略方针,挖掘海外客户需求,加大对外宣传推广力度,推动业务出海 [8] - 参加 2025 中东金融盛会展示产品与解决方案,与海外客户积极交流,具体合作待商洽 [8] 股价与回购 - 股票价格受多重因素影响,具有不确定性,公司管理层对发展有信心,后续加强市值管理 [5] - 未来如有回购股份计划,将及时履行信息披露义务 [7]
瑞德智能(301135):深化产学研战略合作,加码人形机器人赛道构筑技术新壁垒 —— 聚焦千亿级场景技术储备,突出长期发展动能
新浪财经· 2025-05-23 18:30
5月23日晚间,广东瑞德智能科技股份有限公司(股票代码:301135,下称"瑞德智能")宣布与顺德职 业技术学院达成战略合作,双方将围绕人形机器人、AI算法、光伏逆变、汽车电子、电机电动、智能 家居等科技前沿领域展开深度技术攻关。此次合作不仅是瑞德智能深化"技术+场景"战略的关键一步, 更标志着公司逐步切入人形机器人这一千亿级赛道,借助顺德职业技术学院的机器人智能感控系统重点 实验室及其他科研平台、学术积累和人才团队,加速构建从技术研发到商业化落地的全链条竞争力。 据了解,顺德职业技术学院是经国家教育部批准成立、广东省人民政府领导管理、省市共建、顺德区政 府投资兴建的高等职业技术院校,同时,教育部已于2025年5月22日发布拟同意设置本科高等学校的公 示,公示期后顺德职业技术学院即将升级为顺德职业技术大学。此外,顺德职业技术学院已与佛山市科 技局共同建立了佛山市机器人智能感控系统重点实验室,并且在人工智能机器人领域开展创新研究。目 前,已取得省级科研项目1项,市厅级项目8项,申请专利19项,并持续向中车集团、美的库卡、海格利 德等行业龙头企业输出技术服务,成功推进机器人智能感控系统的产业化应用。 业内人士指出 ...