归纳

搜索文档
最大的开源GraphRag:知识图谱完全自主构建|港科大&华为
量子位· 2025-06-12 09:37
知识图谱技术突破 - AutoSchemaKG框架实现无需预定义模式的完全自主知识图谱构建 利用大型语言模型直接从文本提取知识三元组并动态归纳模式 显著提升可扩展性和领域适应性[1][7] - 实验证实该系统模式归纳与人类设计模式达到95%语义对齐 已构建ATLAS知识图谱系列包含超9亿节点和59亿边[2][17] - 创新性采用概念化方法 将实体/事件泛化为语义类别 建立跨领域语义桥梁 支持零样本推理并减少知识稀疏性[7][8] 技术实现路径 - 采用三阶段流水线提取实体-实体 实体-事件 事件-事件关系 支持多种大型语言模型并优化GPU加速[9] - 模式归纳阶段通过LLM生成抽象概念短语 整合邻近节点上下文信息增强语义理解 实现自动化类型泛化[11][12] - 计算资源消耗巨大 构建最大规模ATLAS-CC图谱需52,300GPU小时 处理9.373亿节点和59.6亿边[19][20] 性能验证 - 三元组提取质量优异 在ATLAS-Wiki上实体-实体关系F1达94.09% 事件-事件关系F1达96.01%[21][22] - 事件建模效果显著 多项选择题测试中事件级三元组准确率超95% 比实体级保留更丰富信息[23][24] - 多跳问答任务表现突出 与HippoRAG2集成后性能比传统检索方法高12-18% 在MuSiQue数据集EM达31.8%[28][29] 应用优势 - 领域适应性强 ATLAS-Wiki在宗教/哲学领域优势明显 ATLAS-Pes2o在医学/社会科学表现更佳[35] - 法律领域性能提升显著 比无检索基线高4个百分点 远超Freebase等传统知识图谱方法[32][35] - 学术资源转化高效 ATLAS-Pes2o基于Semantic Scholar摘要构建 在技术类任务中验证学术知识迁移价值[17][18]
培训资料:如何做研究与投资?从四个逻辑分析几个大类行业
材料汇· 2025-05-26 22:10
研究与投资方法论 - 时间管理是研究工作的核心资产,应聚焦大问题、大方向、大概率事件,把握产业与企业宏观趋势[3] - 研究需在正确路径上持续积累,建立科学方法论并优化思维框架,避免在错误方向消耗精力[4] - 分析框架应包含四个维度:宏观逻辑(社会思潮/政经关系)、产业逻辑(核心驱动因素)、业务逻辑(战略布局)、财务逻辑(经营验证)[5][6] - 把握产业本质需识别三类特征:经济学属性(如水电行业类似杠杆利率产品)、核心驱动要素(如消费品的产品力)、关键拐点变化(如TMT流量红利结束)[7][8] - 企业评估三维模型:时间维度(商业模式持久性)、空间维度(规模经济边界)、人的维度(企业家精神与治理结构)[9][10][11] 行业分析框架 消费品行业 - 人口红利消失导致大单品增长时代终结,结构升级与品类创新成为主要机会[12] - 消费者主导权增强,厂商需建立高效互动机制,利用IT技术实现精准营销与供应链优化[12] - 品牌价值分化加剧,优质产品力更易获得市场份额,渠道价值被压缩[13] 服务业 - 体验消费占比提升符合人均GDP增长规律,服务与产品融合趋势显著[14] - 关键指标包括:付费用户数、续单率/流失率、ARPU值、客户推荐率(NPS)[15] - 传统服务业呈线性增长,互联网服务业呈现指数级增长与赢者通吃特征[17] 制造业 - 中国制造业仍具全球竞争力,工程师红利与本土市场优势支撑升级[18] - 技术变革推动非标品规模化(如定制家具),突破"规模是敌人"的传统限制[19] - 评估重点:产能扩张的边际利润率、长期竞争力(核心技术/品牌溢价)[19] TMT行业 - 技术进步导致行业集中度加速提升,技术路径选择错误成本极高[21] - 财务特征非线性:研发型企业体现为"人员费用→收入→利润"滞后链条[22] - 当前处于技术曲线转换期,需关注AI/AR/VR等下一代终端形态创新[21] 研究流程与能力建设 - 研究三环节:归纳(信息结构化)、演绎(假设构建)、实证(验证假设)[24][25] - 优秀研究员三大特质:求知欲(无压力驱动力)、诚实(纠错能力)、独立(原创思维)[26][27][28][29][30] - 能力培养需1万小时专业训练,资深者需保持"经验清零"心态应对技术变革[31] - 日常工作建议:建立专家智慧圈(每个领域3名专家)、广泛跨学科阅读、构建个性化研究体系[33][34][35][36] - 文档管理采用结构化EXCEL底稿,持续沉淀研究数据便于复盘[37] 时间分配与机会把握 - 70-80%精力投入重要问题,用排除法筛选标的(如长期趋势向下/团队无变革的行业)[39][40] - 深度研究5家公司的价值远高于泛泛研究20家公司,确定性比覆盖率更重要[41][42] - 机会选择标准:代表社会经济发展方向的关键变化,不追求全覆盖但避免重大遗漏[43] - 估值判断应基于长期自由现金流贴现,而非静态PE/PB指标[45] - 新机会发掘源于持续产业交流与前瞻性阅读,非被动等待[46][47]