Workflow
拓尔思(300229) - 2024 Q4 - 年度财报
拓尔思拓尔思(SZ:300229)2025-04-17 21:35

公司基本信息 - 公司股票代码为300229,法定代表人为李渝勤[18] - 公司注册地址为北京市海淀区建枫路(南延)6号院3号楼1至7层101[18] - 公司董事会秘书为李党生,证券事务代表为毛文仪[19] - 公司聘请的会计师事务所为立信会计师事务所(特殊普通合伙)[21] - 公司聘请的报告期内履行持续督导职责的保荐机构为中信建投证券股份有限公司[22] - 保荐代表人张苏、黄亚颖的持续督导期间为2024年10月29日至2026年12月31日[22] 公司整体财务数据关键指标变化 - 2024年公司实现营业总收入77,703.45万元,较上年同期下降0.59%[4] - 2024年公司实现归属于上市公司股东的净利润-9,414.56万元,较上年同期下降358.17%[4] - 2024年公司实现归属于上市公司股东的扣除非经常性损益的净利润-17,053.32万元,较上年同期下降7,121.78%[4] - 2024年营业收入777,034,453.08元,较2023年减少0.59%[23] - 2024年归属于上市公司股东的净利润为 -94,145,629.80元,较2023年减少358.17%[23] - 2024年经营活动产生的现金流量净额为69,459,171.56元,较2023年增长51.19%[23] - 2024年末资产总额4,481,824,962.63元,较2023年末增长19.64%[23] - 2024年末归属于上市公司股东的净资产4,125,239,803.11元,较2023年末增长23.06%[23] - 2024年非经常性损益合计76,387,613.13元[30] - 2024年公司营业收入扣除金额122,999,665.90元,2023年为28,539,015.60元[24] - 2013年营业收入为759,552,672元,2012年为728,301,635元[107] - 2013年营业成本为116,096,306元,2012年为140,075,206元[107] - 达产年外购原材料费18730万元,占总成本费用的60.33% [107] - 达产年外购燃料及动力费412万元,占总成本费用的1.33% [107] - 达产年工资及福利费312万元,占总成本费用的1.00% [107] 公司分红计划 - 公司计划2024年不派发现金红利,不送红股,不以公积金转增股本[6] 行业数据情况 - 2024年我国软件业务收入137,276亿元,同比增长10.0%;利润总额16,953亿元,同比增长8.7%[34] - 我国人工智能核心产业规模预计到2025年达9,800亿元,年均复合增长率保持20%以上[35] - 全国政府网站2024年信息发布总数达3212.3万条,全国政务新媒体账号总数为88826个[163] - 2024年国家及省级、市级层面出台近350个数字政府相关政策文件[162] 拓天大模型项目落地情况 - 2024年拓天大模型在多领域成功落地超40个项目[36] - 2024年拓天大模型及智能体已成功应用于9大垂直领域40多个项目[44] - 拓天·政务大模型智能问答应用已在自然资源部、贵州、广西、深圳等政府落地[48] - 拓天·政务大模型政策解读应用已在自然资源部、贵州、广西、深圳等政府单位及国网能源研究院、院校等机构落地[49] - 拓天·政务大模型智能办公应用已在海关落地[51] - 拓天·舆情大模型已在公司网察大数据服务平台运行超一年,服务数百个订阅用户,并在国家发改委等权威单位落地[55] - 拓天·开源情报大模型已在多个防务部门及国防大学等机构落地[59] - 拓天·媒体大模型的创新应用已在人民日报等多家权威单位落地[63] - 智能审校应用已在人民日报社等权威机构成功落地[65] - 拓天·公安大模型已在多个地市公安局成功落地,赋能公安多业务场景[69] - 拓天·金融大模型信贷风控应用已在平安银行等落地,提升风控预警信号准确率[71] - 拓天·金融大模型内容审查应用已在兴业银行等落地,助力银行营销合规开展[73] - 拓天·金融大模型智能消费者保护应用已在招商银行等多家金融机构落地[76] - 拓天·金融大模型产业投研和对公营销应用在公司产业大脑平台运行超一年,服务数百订阅用户,也在中国 银行浙江分行落地[78] - 拓天·智库大模型已在中国医学科学院医学信息研究所等单位落地,提升决策效率[81] 拓天大模型技术相关情况 - 2024年公司率先接入DeepSeek作为拓天大模型的基础模型,实现从传统语言模型向智能体的跨越转变[44] - 2024年4月公司接入DeepSeek作为基础模型并完成拓天大模型一体化平台升级[85] - 预训练数据规模达360G,用于知识增强与多样性[87] - 强化训练数据有80万条,借助RLHF机制优化模型[88] - SFT训练数据达1000万条,注重特定场景模拟[88] - Tuotian-34b-Chat在C-Eval(0-shot)评测中成绩为80.10,CMMLU为72.23,LongBench为53.23[89] - Tuotian-72b-Chat在Anti-LIM索引RAG准确度为92.0,媒体/舆情/政务答案质量为52.1,媒体/舆情/政务apicall准确度为96.05,SQL生成为80.42,长文本性能为128K[90] - 公司从模型、硬件、算法层面提升大模型推理速度[91] - 拓天14B模型在多项评测指标上优于开源Qwen2.5大模型[92] - 公司运用基于Merge的减小微调灾难遗忘方案提升训练效率[93] - 公司通过多种技术手段精进各领域大模型专业能力[96] - 拓天模型在通用版面专业评测中Precision为95.52%,Recall为96.61%,F1为95.82%,较优化前分别提升12.63%、2.44%、8.75%[104] - YOLO无线表格识别模型AP50为0.973,Precision为0.908,Recall为0.950 [105] - DETR无线表格识别模型AP50为0.970,Precision为0.902,Recall为0.935 [105] - 优化前公安场景OCR整体推理吞吐量为11.7fps,32并发端到端100片推理耗时30 - 60秒[108] - 优化前公安场景OCR检测模型Hmean为93.84%,识别模型Hmean为91.50%[108] - 视频人像识别优化后帧率达19.5fps,识别准确率达99.8%(LFW数据集),优化效果方面帧率提升66.67%,识别准确率提升3.95%[109] - 重排模型优化后,在自建业务测试集上准确率从开源基础模型的0.7841提升至自研拓天损失函数微调后的0.9166[109] 拓天链智能体平台相关情况 - 报告期内公司推出拓天链智能体平台,由智能Agent大脑、规划技能、记忆、工具使用四部分组成[110][112] - 企业可通过拓天链构建业务创新所需的专属Agent中心,支持多Agent模式[114] - 公司基于拓天链智能体平台进行多项关键技术优化,包括检索增强、图表生成、自动规划等技术改进[116][118] - 拓天链智能体平台已成功应用于10多个场景,如中国日报、浦发银行等[120] 拓思数据平台相关情况 - 报告期内公司研发拓思数据平台,定位为企业级数据资产智能中枢,构建“采 - 存 - 治 - 用”全链路赋能体系[121] - 数据资源应用场景涵盖媒体、企业、公共安全、金融、政府、人工智能训练语料等领域[124] - 数据来源主要是公开互联网平台,通过海蜘智能化采集平台合规采集[125] - 采集数据类型包括网页文本、图片、音视频、附件及卫星遥感等特种数据[127] - 截至2024年12月31日,累计采集数据总量超5000亿条[128] - 每日新增数据采集量平均约5亿条以上[128] - 每年新增文本与图片超1500亿条,短视频约400亿个[128] - 每年经处理后的文字与索引存储300TB以上[128] - 公司对采集数据拥有合法使用权,经自研平台加工处理实现数据资源化[129] - 数据质量管理遵循DCMM数据管理能力成熟度稳健级(3级)认证标准[130] - 采集任务线程总数9,可用线程9,任务总数83,已完成任务0;另一组线观总数1,可使用线程1,任务总数17,已完成任务17[126] - 实时性要求高的数据更新频率为分钟级或秒级,其他数据更新频率为5分钟、10分钟、30分钟、60分钟,周期性数据更新周期为每日、每周或每月[132] - 公司建立7层梯度清洗体系加工数据资源[134] - 去噪清理层设计1000余种清洗规则[137] - 公司采用“模板化采集+智能监测+人工校验”机制确保数据完整性[131] - 公司遵循统一标准对数据进行归一化处理确保一致性[131] - 公司严格筛选数据来源确保权威性,主要来源于官方媒体、政府机构和权威行业组织[132] - 公司通过标准化平台提供数据服务,支持API接口、数据下载和在线查询等访问方式[133] - 公司采用国密加密、访问控制和数据备份等技术保障数据安全[143] - 公司将OCR识别、审校大模型等技术应用于数据平台,拓天大模型应用于数据场景服务产品[146] - 数据采集岗位人员数为15人,数据治理岗位为5人,产品研发岗位为25人,产品运营岗位为21人[146] 各业务线财务数据关键指标变化 - 数字企业本年度营业收入为3.66亿元,同比增长17.02%,已成功服务32家中央企业,占全国央企版图的32%,企业客户存留率达85%,比去年提升4.9%[156][157] - 开源情报本年度母公司营业收入约2489万元,同比增长111.89%,国家海外利益保护相关数据服务收入超1300万,同比增长550%,防务类新客户拓展90家,93%为开源情报数据和知识服务客户[160][161] - 数字政府本年度营业收入为1.74亿元,同比增长1.74%,项目数量同比增长13%,公司服务80%的中央和国务院机构,64%的省级政府,52%的地市政府以及400多家地方金融监管单位[162] - 融媒体本年度营业收入为7647万元,相较于去年同比下滑21.78%[164] - 本年度公司融媒体的数据服务营业收入为1959万元,同比增长20%[165] - 本年度产业数据服务的营业收入为1250万元,同比增长342%[170] - 本年度公司公安版块营业收入为1.10亿元,同比下降27.67%;剔除天行网安公安业务调整因素后,母公司公安业务板块营业收入4375万元,同比增长26.26%[172] - 本年度网信业务板块合同金额达2924万元,同比增幅达23.38%[173] - 报告期内公司海外营业收入达924万元,同比增长55.04%[174] 各业务线其他数据关键指标变化 - “上证鹰”自2024年10月16日发布以来,已开通试用帐号100多个,正式转化用户32个,50%以上为上市公司[157] - 企业新型智库创新应用场景新签项目5个[159] - 公司全球开源情报数据覆盖196个国家与地区,数据总量超5000亿条,支持130多种语言[160] - 公司融媒体用户覆盖72%的中央媒体,61%的省级媒体,40%的行业媒体[167] - 公司金融用户覆盖5大国有银行、3大政策性银行、92%的股份制商业银行以及中国证监会等[170] - 公司网信业务新增2家省级网信用户和16家市级网信用户[173] - 公司依托香港子公司立足香港辐射全球,为中东、东南亚、拉美及一带一路国家的政府、企业等提供服务,还针对中企出海提供数据安全等服务,并与香港某纪律部队续签二期合同[175] 公司产品相关情况 - Tate - A - Tate是面向全球用户的智能体在线开发平台,支持无代码创建AI Agent,通过订阅盈利,支持多平台发布[175][179] - Global Insight全球资讯洞察平台于2024年12月正式发布上线,面向东南亚、中东、拉美等地区,助力B端G端用户把握全球政经态势与行业趋势[180] - 拓天一体机由拓尔思与华为联合推出,以昇腾算力一体机为载体,内置双引擎模型及常用算法,适用于机房部署[183] - 智拓人工智能平台迭代,自主研发容器化分布式计算框架,统一全生命周期技术规范,优化产品功能与性能[186] - 事件分析平台完善大模型推荐等功能,新增精确地点预测和事件征兆分析功能,开发多语种版本[188] - 自动校对服务有通用型校对模式、大模型校对模式和大模型事件核查系统三种模式[189] - 智眼平台优化OCR、多模态、视频智能识别等功能,实现轨迹识别和预测,适配华为NPU平台和RK3588平台[191] - 大数据中台接数据从3分钟1张表提升到5分钟整个库(几百张表),流处理启动速度从分钟级到秒级,批处理治理效率提升90%,全链路监控吞吐量提升10倍,入库速度突破1亿条/小时[193] - 天目开源情报平台进行新版开发与升级,增强大模型功能、开源情报专题运营和实体治理[200] 大模型应用效果 - 大模型风控数据生成上线,降低50%人工成本,提升200%信号覆盖度,产业大脑应用大模型企业上链,提升200%准确率[155] - 2024年4月公司率先接入DeepSeek作为拓天·金融大模型的基础模型,产业与企业数据上链质量准确率提升200%[170] - 拓天·开源情报大模型使开源情报分析响应时间降低50%,跨语言情报准确率提高30%[60] - 拓天·开源情报大模型有100万专业开源情报报告训练语料[60] - 拓天·开源情报大模型的10