Workflow
股票名称相似度
icon
搜索文档
上市公司股票名称相似度文本数据1990-2025
搜狐财经· 2025-04-05 10:48
股票名称相似度研究 核心观点 - 股票名称相似度通过量化分析名称的文本相似性,评估其在结构、语义、行业关联等方面的接近程度,涵盖字面拼写、行业关键词、地域特征及企业属性等维度 [1] - 该指标具有三大科研价值:监控市场异常行为(如2015年匹凸匹改名事件)、识别投资者认知偏差、评估股价合理性 [1] - 采用Levenshtein距离和Jaccard距离计算非ST上市公司名称相似度,并将结果映射为0-100范围的系数 [1] 数据来源与范围 - 数据源自国泰安金融数据库(CSMAR),经人工整理,覆盖上交所、深交所、京交所A股非ST公司 [2][3] - 时间跨度为1990-2025年,数据格式为Excel,包含证券代码、简称及两种距离相关系数 [3] 数据指标示例 - **平安银行**:Levenshtein系数50,Jaccard系数31.28 [4] - **万科A**:Levenshtein系数64.29,Jaccard系数33.15 [4] - **深粮控股**:Levenshtein系数78.32(最高),Jaccard系数61.87 [4] - **深科技**:Jaccard系数66.12(最高),Levenshtein系数46.53 [4] 学术支持 - 研究引用《股票名称相似度与股价信息损失效应》论文,验证名称相似度对股价的影响机制 [5]