收入和利润同比下降 - 营业收入为2.06亿元,同比下降11.53%[24] - 归属于上市公司股东的净利润为3160.54万元,同比下降61.49%[24] - 归属于上市公司股东的扣除非经常性损益的净利润为2106.74万元,同比下降71.15%[24] - 营业收入20,647.65万元,同比下降11.53%[26] - 归属于上市公司股东的净利润3,160.54万元,同比下降61.49%[26] - 扣除非经常性损益的净利润2,106.74万元,同比下降71.15%[26] - 公司2021年营业收入为2.064765亿元,同比下降11.53%[39] - 归属于母公司所有者的净利润为3160.54万元,同比下降61.49%[39] - 归属于母公司所有者的扣除非经常性净利润为2106.74万元,同比下降71.15%[39] - 营业收入20647.65万元同比下降11.53%[155][156] - 归属于母公司所有者的净利润3160.54万元同比下降61.49%[155] - 扣除非经常性损益净利润2106.74万元同比下降71.15%[155] - 公司营业收入20647.65万元同比下降11.53%[159] - 基本每股收益0.89元/股,同比下降65.23%[25][27] - 加权平均净资产收益率5.59%,同比下降15.09个百分点[25][27] - 2021年公司整体营业收入出现下滑[142] 资产和净资产同比增长 - 归属于上市公司股东的净资产为8.06亿元,同比增长84.02%[24] - 总资产为8.41亿元,同比增长76.11%[24] - 总资产84,066.34万元,较上年末增加76.11%[26] - 归属于上市公司股东的净资产80,590.84万元,较上年末增加84.02%[26] - 公司总资产为8.406634亿元,较上年末增长76.11%[39] - 归属于母公司的所有者权益为8.059084亿元,较上年末增长84.02%[39] 现金流量净额同比下降 - 经营活动产生的现金流量净额为-1554.83万元,同比下降130.38%[24] - 经营活动产生的现金流量净额-1,554.83万元,同比下降130.38%[26] - 经营活动现金流量净额为-1554.83万元同比下降130.38%[156] 成本和费用变化 - 营业成本7431.19万元同比下降1.41%[159] - 销售费用1452.34万元同比上升30.45%[156] - 研发费用6052.09万元同比上升39.14%[156] - 研发投入占营业收入比例29.31%,同比增加10.67个百分点[25][27] - 研发费用为6052.09万元,占营业收入29.31%,同比增长39.14%[40] - 研发投入总额为60,520,933.71元,同比增长39.14%[114] - 研发投入占营业收入比例为29.31%,较上年增加10.67个百分点[114] - 研发费用同比增长39.14%至6052.09万元,因加大AI技术投入[177] - 数据服务费成本同比下降0.11%至6012.67万元,占总成本比例80.91%[170][171] - 职工薪酬成本同比上升18.39%至1270.39万元,主要因扩大技术团队规模[170][171] - 差旅费成本同比下降48.25%至22.62万元,受疫情影响转为远程办公[170][171] - 其他成本同比下降80.68%至63.02万元,因疫情导致场地租赁费减少[170][171] - 智能语音业务成本下降1.07%,其中职工薪酬增长28.09%至763.79万元[170] - 计算机视觉业务成本下降17.26%,数据服务费下降21.34%至811.87万元[170] - 自然语言业务数据服务费增长52.45%至789.81万元,职工薪酬增长75.43%[170] 业务线收入表现 - 智能语音业务收入14934.82万元同比下降17.53%[161] - 计算机视觉业务收入2382.68万元同比下降8.03%[161] - 自然语言业务收入2514.94万元同比增长52.91%[161] - 智能驾驶业务营收接近2,000万元,同比增长166%[49] 地区市场表现 - 境外业务收入5729.72万元同比下降31.53%[163] - 境外业务成本上升34.43%[163] - 境外收入占比27.75%其中美国市场占比10.53%[152] 毛利率变化 - 综合毛利率为64.01%[96] - 综合毛利率64.01%较去年同期下降3.69个百分点[161][166] - 训练数据应用服务业务毛利率75.26%同比上升13.64个百分点[161] - 境内业务毛利率56.75%同比上升2.24个百分点[163] 研发投入与人员 - 研发人员数量增至77人,同比增长75%[40] - 研发人员数量为77人,同比增长75%[132][134] - 研发人员薪酬合计2724.94万元人民币[132] - 研发人员平均薪酬39.51万元人民币[132] - 研发人员占总员工比例31.43%[132] - 研发投入总额为6040万元人民币[129] 客户与市场 - 客户总数达695家,2021年新增145家,为近五年单年新增最多[51] - 公司客户累计数量695家覆盖科技互联网社交IoT智能驾驶智慧金融等领域的主流企业[56] - 老客户收入占比达81.62%[147] - 前五名客户销售额占比41.52%,总额8571.94万元,无关联交易[173][175] - 智能驾驶客户数量超过25家[49] - 截至2021年底企业服务客户数量达695家[94] - 公司在中国AI基础数据服务行业市场占有率为12.9%[95] - 公司市场份额在中国AI基础数据服务行业排名第二[98] 产品与技术能力 - 自有知识产权训练数据产品储备超过930个[45] - 标准化训练数据集产品储备从2020年末762个增至2021年末932个,增长22.3%[45] - 累计提供超4,000次/个定制或标准化训练数据集[45] - 覆盖170余个语种/方言,积累超100个语种/方言发音词典,词条数超1,000万条[46][47] - 公司训练数据产品覆盖智能语音计算机视觉自然语言处理三大AI核心领域[58] - 智能语音业务包含语音识别ASR和语音合成TTS两大技术方向[58] - 计算机视觉业务应用于智能家居手机安防设备及自动驾驶等场景[59] - 自然语言处理业务涵盖语义理解信息提取情感分析等应用[60][61] - 公司拥有930余个自有知识产权训练数据标准化产品集[94] - 语种/方言覆盖能力达170余个[95] - 公司的产品和服务可以覆盖超过170个语种/方言[99] - 公司形成了12项核心技术覆盖基础研究、平台工具、训练数据生产三个层次[106] - 公司核心技术中有5项具备较高技术壁垒[106] - 多语种OCR文字识别算法支持超过10个主流语言的预识别能力[108] - 一体化数据处理平台覆盖设计、采集、加工、质检全环节[108] - 智能驾驶3D点云标注效率明显提升[108] - 中文方言身份识别平台支持并发量为2000QPS[122] - 语音合成中文非标准词识别软件识别范围覆盖3200+非标准词量[122] - 多语种特殊符号检测软件支持58种语言,错误率低于99%,特殊字符累计支持量超过1200个[122] 财务投资与资产构成 - 交易性金融资产期末余额为4.1801103699亿元,当期变动8692.16万元[36] - 交易性金融资产对当期利润影响金额为1126.96万元[36] - 货币资金同比激增589.71%至2.78亿元,占总资产比例33.03%[183] - 交易性金融资产增长26.25%至4.18亿元,占总资产49.72%[183] - 应收账款同比增长43.66%至9019.65万元[183] - 存货同比大幅增长173.07%至854.55万元[183] - 合同资产激增271.19%至510.29万元[183] - 应付职工薪酬增长50.25%至1459.61万元[184] - 境外资产193.61万元,占总资产0.23%[185] - 科创板上市募集资金总额39,525.80万元,净额33,635.69万元[52] - 投资收益同比增长35.19%至1134.8万元[180] - 公允价值变动收益同比下降107.20%至-7.84万元[180] 采购与供应商 - 数据服务费占采购总额比重82.28%[147] - 前五名供应商采购额占比75.94%,总额8387.3万元[175][176] - 数据服务采购为公司最主要采购类别[68] 行业与市场前景 - 中国AI基础数据服务市场预计2025年突破120亿元,近5年复合年增长率47%[38] - 全球人工智能市场规模2021年达885.7亿美元 预计2025年将达2,218.7亿美元 年复合增长率26.2%[76] - 中国人工智能市场规模预计2025年达184.3亿美元 年复合增长率24.4%[78] - 72%受访者认为需超10万条训练数据保证模型有效性 96%受访者遇到训练数据质量不佳或数量不足问题[80] - 约1/3算法模型每月至少更新一次 约1/4算法模型每日至少更新一次[75] - ImageNet数据集含超1,400万张训练图片和1,000余种分类[72] - 训练数据需求类型增加及服务标准提升推动行业规模扩大[82] - 2025年中国人工智能市场规模预计达到184.3亿美元(约1200亿元人民币)[83] - 中国AI基础数据服务市场近5年复合年增长率47% 2025年规模预计突破120亿元占AI市场支出10%[83] - 2025年全球人工智能市场规模预计达到2218.7亿美元[83] - 高级别自动驾驶市场规模预计达万亿元级别[86] - 高速城际物流市场预计规模3.3万亿元[86] - 自动驾驶出行服务市场预计规模近1.7万亿元[86] - 矿区无人驾驶市场预计规模近6700亿元[86] - 无人末端配送市场预计规模达1700亿元[86] - 国家政策明确数据要素为数字经济核心引擎(《"十四五"数字经济发展规划》)[89] - 数据安全与合规成为行业重点(《数据安全法》《个人信息保护法》等)[88][89] 公司治理与基本信息 - 公司代码为688787[1] - 公司简称为海天瑞声[1] - 报告期为2021年1月1日至2021年12月31日[12] - 公司负责人为贺琳[5] - 主管会计工作负责人为吕思遥[5] - 审计机构为信永中和会计师事务所[5] - 公司注册地址及办公地址为北京市海淀区成府路28号4-801[15] - 公司股票简称为海天瑞声,股票代码为688787[20] - 公司法定代表人及董事会秘书分别为贺琳和吕思遥[15][17] - 公司聘请的会计师事务所为信永中和会计师事务所(特殊普通合伙)[21] - 公司所属行业为软件和信息技术服务业 行业代码I65[71] - 公司上市时未盈利且尚未实现盈利[4] - 公司总股本为42,800,000股[6] - 拟派发现金红利总额为10,700,000元[6] - 现金分红总额占合并报表归属于上市公司股东净利润的33.85%[6] - 公司员工数量为245人[95] - 拥有156项计算机软件著作权[95] - 公司及其子公司共拥有计算机软件著作权156项[99] - 公司连续多年被评为国家高新技术企业、国家规划布局内重点软件企业[100] - 公司2021年获批北京市企业技术中心[100] - 公司获评工信部新一代人工智能产业创新重点任务揭榜优胜单位[100] - 公司荣膺工信部国家专精特新小巨人企业[100] - 公司在综合毛利率、净利率方面均优于Appen[98] - 税收优惠影响利润总额比例达42.98%[152] - 公司通过ISO/IEC 27001和ISO27701体系认证[139] - 全资子公司在美国设立INFINITY AI CORPORATION,注册资本2万美元[189] 研发项目与创新 - 新申请发明专利4项,获得发明专利授权2项[111] - 新申请并获得软件著作权23项,累计软件著作权156项[111] - 公司共获得专利授权26项,其中发明专利累计获得24项[111] - 在研项目"海天瑞声OCR在线生产平台二期"总投资规模4,000,000元,本期投入3,528,334.43元[117] - 在研项目"海天瑞声多模态训练数据标注平台"总投资规模4,800,000元,本期投入2,564,160.99元[117] - 基于端到端语音识别技术研究项目预算360万元,实际投入251.68万元,新增56个语种和方言覆盖[118] - 支持无人车场景的语义分割平台项目预算420万元,实际投入224.04万元,已支持多种语义分割功能并上线流程管理模块[118] - 在线点云3D标注平台三期项目预算420万元,实际投入219.3万元,初步完成2D图像中伪3D框构建及可视化功能[118] - 手写体训练数据采集软件项目预算300万元,实际投入210.88万元,兼容iOS和安卓系统并支持全球化采集[119] - 计算机视觉通用领域2D图像标注平台项目预算330万元,实际投入173.1万元,新增点、多边形等标注工具及配置模块[119] - 移动端及多通道语音采集软件项目预算230万元,实际投入201.88万元,完成移动端语音采集模块升级并支持多系统兼容[119] - 语音数据库语料标注在线平台项目预算200万元,实际投入174.9万元,上线全流程管理功能并支持多种语料标注场景[119][121] - 面向NLP特定领域事件理解平台项目预算180万元,实际投入156.91万元,支持20余类业务场景并具备至少10种标注场景覆盖[121] - 面向NLP特定领域实体理解平台项目预算160万元,实际投入138.92万元,支持10余类业务场景并覆盖特定领域实体词标注[121] - 电子文件管理软件研发投入814,558.11元[123] - 智慧城市管理业务协同软件研发投入570,190.66元[123] - 多系统集中授权管理软件已为10+不同类型产品提供授权服务[123] - 机器人流程自动化(RPA)研发投入366,045.88元[123] - 无人车场景的图形图像处理平台研发投入3,010,405.90元[125] - 中文多音字标注平台研发投入290万元人民币[127] - OCR在线生产平台研发投入220万元人民币[127] - 手写体在线生产平台研发投入180万元人民币[128] - 一体化数据处理平台系统升级二期投入260万元人民币[128] - 在线点云3D标注平台升级投入200万元人民币[128] - 公司自有知识产权训练数据产品储备超过930个[136] - 报告期内公司新增研发百余个训练数据集产品[136] - 公司拥有170余个语种/方言的覆盖能力[138] - 公司积累超过100个语种/方言的发音词典[138] - 累计词条数超过1000万条[138] 生产与业务模式 - 公司生产模式通过设计数据架构组织采集加工原料数据形成最终数据集[65] - 公司盈利模式分为定制服务标准化产品和训练数据应用服务三类[64] - 定制服务模式中公司仅收取服务费不享有训练数据知识产权[64] - 标准化产品模式通过多次销售训练数据集使用授权获取收入[64] - 训练数据应用服务以软件授权或软硬件一体化形式交付[64] - 公司训练数据生产含设计/采集/加工/质检四环节[67] - 公司采用直销模式进行营销[70] 未来发展规划 - 公司计划大规模研发多语种、多场景下的语音识别、语音合成、计算机视觉及自然语言训练数据[199] - 公司升级一体化数据处理平台并扩建研发中心以提升研发效率[199] - 公司扩大语言学家团队覆盖西亚、南亚、中东欧及非洲有文字的语言[195][198] - 公司筹备建设智能驾驶业务事业部并升级智能驾驶数据平台[198] - 公司投入研发更多应用场景下的智能语音和计算机视觉训练数据[198] - 公司计划覆盖更多计算机视觉和自然语言细分领域及应用场景[195] - 公司通过训练数据服务赋能算法与应用的落地结合[197] - 公司协助客户实现语音识别应用的场景拓展[198] - 公司计划合作/聘请更多人工智能技术专家及数据安全技术专家[199] - 公司拓展与科技互联网、IoT、智能驾驶及工业互联网等机构的合作[199] 人员与组织扩张 - 全年新增人员94名,同比增幅62.25%[53] 风险因素 - 公司面临业绩大幅下滑或亏损风险[142] - 新冠肺炎疫情对公司境外业务发展带来较大影响[142] - 行业新进入企业数量快速增长导致市场竞争加剧[142]
海天瑞声(688787) - 2021 Q4 - 年度财报