ZIP
搜索文档
超越ZIP的无损压缩来了,华盛顿大学让大模型成为无损文本压缩器
36氪· 2025-10-11 18:47
核心技术原理 - 利用大型语言模型作为强大的概率预测引擎,将自然语言的高维分布转换为结构化的概率信息以实现高效压缩[5] - 核心方法为基于排序的编码,即存储目标词元在LLM预测的概率排序列表中的排名,而非词元本身[6] - 解压时使用相同的LLM和上下文重现概率分布,通过存储的排名准确选择对应词元,实现无损文本恢复[6] 性能表现 - 在维基百科、小说文本和科学摘要等多种数据集上,其压缩率均优于传统压缩工具如ZIP和LZMA[2] - 与其他以LLM为基础的闭源压缩系统相比,表现出同等甚至更优的性能[2] 项目发展与现状 - 项目灵感源于实验室内部讨论,随着业界在确定性LLM推理方面取得突破,研究团队快速构建了原型并证明可行性[5] - 该项目已经开源,主要作者是来自上海交通大学ACM班的本科生Yi Pan,目前正在华盛顿大学实习[4] 当前挑战与局限 - 存在效率问题,LLM推理的计算复杂度与序列长度成二次方关系,长序列推理受内存带宽限制[7] - 采用分块处理文本策略以提高GPU利用率并降低计算开销[7] - 处理速度因严重依赖大规模模型推理而远低于传统压缩算法[7] - 当前实现主要针对自然语言,如何扩展到图像、视频或二进制数据等其他模态是未来探索方向[9]
宠物食品和宠物医疗标的梳理
2025-05-21 23:14
纪要涉及的行业和公司 - **行业**:宠物食品、宠物医疗 - **公司**:乖宝宠物、中宠股份、佩蒂股份、瑞普生物、科前生物、回盛生物、白纱科技、生物股份、中牧股份、普莱柯 纪要提到的核心观点和论据 宠物食品赛道 - **乖宝宠物**:国内自主品牌表现强劲,弗列加特去年保持 30%以上增速,高端猫粮增速达 100%,今年一季度仍保持 100%增速 [1][3][4] - **中宠股份**:国内自主品牌增速显著上升,顽皮、领先和 ZIP 三个品牌去年总收入 14 亿,顽皮增速 40%,领先增速 70%;海外业务表现突出,去年出海业务收入 2.5 亿,今年目标 4 亿,并保持 50%增速 [1][5] - **佩蒂股份**:海外业务占比较高,订单主要出口至美国;去年国内收入 2.9 亿元,今年目标 4 - 4.5 亿元;计划二三季度推出新的烘焙粮产品 [1][8] 宠物医疗赛道 - **行业前景**:市场规模庞大,2025 年预计达八九百亿,仅次于宠物食品;国内犬猫数量约 1.24 亿只,行业复合增速保持在 10%左右,医疗需求刚性 [1][10] - **竞争格局**:国内尚无绝对龙头企业,药品和疫苗领域外资品牌主导,进口替代空间巨大;诊疗端本土企业掌握主动权,但连锁化率低,未来发展空间大 [3][11][12] - **推荐标的** - **瑞普生物**:国内动保企业中布局最完善,实现全产业链布局,宠物业务收入占比超 20%;参股瑞泰宠物医院,持有中源华普股份,推动与医院端融合 [3][13][14] - **科前生物**:主要集中在宠物疫苗和宠物医院,产品有防犬疫苗、猫三联疫苗和犬四联疫苗,营收约 2000 万元;未来在疫苗、单抗和药品研发创新发力 [3][15][16] - **回盛生物**:深耕宠物药品赛道,旗下万达宠物业绩良好,拥有约 20 家医院并计划扩张;今年一季度财报及去年四季度表现显示主业强劲增长,预计今年持续超预期修复 [17] 其他重要但是可能被忽略的内容 - **乖宝宠物**:2023 年自主品牌营收约 35 亿,占整体营收近 70%,净利率达 12%;中长期有望成为营收接近 250 亿、净利润接近 50 亿、市值超 1000 亿的龙头企业 [1][4] - **中宠股份**:去年从底部爬升增长接近 200% - 300%;顽皮、领先和 ZIP 三个品牌中,顽皮占比 55%,领先占 15%,ZIP 占 10%;北美子公司净利率高达 15% - 20%;近年来净利润水平相对稳定,海外子公司业务降低出口业务风险,未来两到三年有望量利齐增 [5][6][7] - **佩蒂股份**:处于发展早期阶段,过去以零食出口为主;新西兰工厂开工后一季度业绩未达预期,产生 1000 多万元亏损及折旧费用;若今年国内收入达目标,将减亏并在明年达盈亏平衡点;预计今年国内收入同比增长 40%以上,新西兰罐头厂代工厂预计增加近两亿产值 [8][9] - **其他公司**:推荐关注白纱科技、生物股份、中牧股份等企业,普莱柯涉及药品、保健品和宠物医院,生物股份、中牧股份更多从产品端布局 [18]