首页 > 文章中心 > 正文

水文数据库入库数据质量控制探析

前言:本站为你精心整理了水文数据库入库数据质量控制探析范文,希望能为你的创作提供参考价值,我们的客服老师可以帮助你提供个性化的参考范文,欢迎咨询。

水文数据库入库数据质量控制探析

水文数据库建设在持续发展过程中变得越来越智能化和网络化了,如此对水文数据在生产中的有效应用带来了很大的影响。因为以往录入的水文数据资料较多,数据资料复杂,同时质量也有所不同,诸多原始水文年鉴有着不准确的现象。在水文数据库建库阶段,一般是由工作人员手动录入数据信息资料的,该工作量繁重,还无法保证数据质量。所以,需要在水文数据库入库数据展开质量检查,从而保障水文数据库入库数据完整、合理且一致,这是提升水文数据库入库数据质量的核心。

一、水文数据库入库数据质量概述

(一)数据作用。我国基础信息资源中相当重要的一个方面是水文数据信息,水文数据信息牵涉到大量的政治与经济因素,水文数据作用不但表现在经济层面,同时也表现在环境保护与我国正当防卫等方面。于环境与财产保护上,水文数据信息不但能够预测旱灾与洪涝灾害,还可以按照有关数据信息在第一时间制定出应对举措,甚而能够对将来经济建设与基础建设进行合理且科学的规划,发展成保障安全的数据防护网络。

(二)数据质量。数据通常来说,数据质量是被一部分学者界定为适合采用的数据,简言之,采集起来的数据信息是可以满足相关用户对信息使用的需求的。而另一部分学者表示,数据质量为一个信息系统里面的数据模式和实例相互间彼此一致的程度,同时可以让数据保持一致性,更加合理和完整。以上所言,依照水文数据库应用范围、采集、处理数据等经验看来,入库数据质量水平量化标准理应从如下方面展开:1.合理性。数据描述和属性界定相符合与否,涵盖语法合理性与语义合理性。2.完整性。描述为处理问题所取得的数据深度与广度等的完整性,涵盖了列表结构与整体完整性等。3.一致性。描述关系表之中的元组间或者文件记录之间,数据元素相互之间有没有语义规则矛盾或者冲突,涵盖库表结构、内容更新、字段逻辑与异构数据库数据源彼此之间的一致性。

(三)质量问题。水文数据库入库数据质量方面的问题,需要根据数据来源及其模式层面看,一般可以分为四种类型,具体来说就是单源模式层与实例层、多源模式层与实例层质量问题。而数据质量评估是水文数据库入库数据质量提升的前提条件,其可以对数据整体质量情况给出科学的度量,继而助力数据用户掌握系统数据质量水平,与此同时使用对应的处理过程增强数据质量。数据质量评估划分成两种方式,一个是定量方式;另一个是定性方式。前者使用百分制分别计算出各个质量维度的分数,给人们提供客观的数量分析方式;后者依托评判人员主观意识进行判断。水文数据库中入库数据质量评估使用频率较高的当属定量方式,经过探究数据质量评估模式及其框架文献,依照数据库入库数据质量评估需求,创建数据质量评价模型。如下:M={P,D,R,W},该式子里面,P表示数据质量评估角度,水文数据库入库数据质量评估角度有过去录入的数据与系统重新录入的数据;D代表了数据质量评估维度;R表示数据质量评估基本规则;W表示不一样的评估维度与规则的权重。而定量评估方式一般使用属性加权算法,通过分数评估衡量数据质量高低。其中分数评估就是指没有质量问题的记录数与整体记录数之间的比值。

二、入库数据质量控制方法分析

(一)合理性。如若要严格把控数据库入库水文数据质量,就应当积极使用合理性控制方式,该种方式是判断数据库里面的不同表格和资料信息之间的逻辑关系准确与否。在进行水文数据库构建过程中,数据信息的录入是交由相关工作人员手动进行的,如此一来就无法避免会出现数据录入不准确的情况,譬如数据信息少录了,字符录入错误等,继而致使水文数据信息产生不合理的情况,给用户采用水文数据信息造成不好的影响。故而,需要科学采用合理性控制方法,这是入库数据质控的重点之所在。合理性控制覆盖了单站及综合合理性控制,前者实则是对多种不一样的水文信息加以合理性查看,譬如水位、降水量等,继而将不合理的信息资料修正过来;而对于对各测站则需要选择使用综合合理性控制方式。通常而言,紧邻的测站水文要素在数值层面有规律可循,应当严格按照记录要素变化持续性和有关要素间关系的合理性进行检查,譬如水位过程线持续性等,最简单的方式就是于同一坐标系里面绘出各个测站水文要素变化过程线,比较分析其合理性,严格把控整编错误。

(二)完整性。水文数据库入库数据质量控制需要使用完整性控制方法严格把控数据质量。完整性就是说数据整合成果完整性,充分反映出数据总体可利用程度,涵盖数据项与数据记录完整性。水文数据理应具备持续性的特点,这样一来可以综合反映出水文变化过程,对研究客观存在的规律是百利而无一害的,同时还可以给水文管理与治理等应用提供重要的参考依据。在现实情况中,因为这样或者那样的因素,致使一些年份数据信息表丢失,造成数据项缺失,给水文数据信息的合理运用带来了很大的麻烦。而完整性控制方法刚好可以弥补该缺陷与不足,此为水文数据库入库数据质控的重要环节。基础方式就是经过查看数据库里面的数据表,分析与记录空白项目,同时按照有关资料展开补录。比如一些年份降水量资料没有建立日表,可是摘录表里面编制了日降水量表,此时则应当按照有关资料重编日表且录入库内。

(三)一致性。科学把控水文数据库入库数据质量,应当积极使用一致性控制方式,这种控制方式目的是观察数据表计算出来的水文特征值一不一致。从事相关行业的工作人员均知道,数据信息的一致性是入库数据质控的核心部分,是类型多样化的水文数据内在关联性的关键表现。在录入数据时,人为因素等可能导致不一样的数据表里面的有关数据不符合数据之间的内在逻辑关系,需要严格按照数据之间的关系展开一致性检查,排查且修正错误。比如,对于实测流量成果表于输沙率成果表,需要按照施测号查看对应表内相应的流量记录纸有没有一一对应。除此以外,流域于省级节点水文信息和中央节点对应信息需要同时更新,给水利信息化构建与共享服务提供有效的保障。

三、积极探索水文数据库入库数据质量控制实现方法

(一)实现合理性控制方法。通常而言,所谓的合理性把控实则是对相关工作人员所录入数据库里面的数据加以整编查看,一项一项对全部项目展开合理性查看,全面记录不合理的信息资料,处理好数据库里面数据信息重复记录的问题。经过创建的质量评估标准,认真查看有关表计算特征值和水文要素值合理与否,还有相同对象的有关属性项在相应的表内是不是一致的。一般而言需要查看这些方面的内容:1.各个水文要素日均值需要介于对应月统计表最小值与最大值之间。2.全面分析摘录时间合理性,也就是查看日表里面日期有没有和对应年份所对应的月表里面的日期一致,记录不合理日期。3.按照录入的面积、流量与水面宽度计算平均流速与水的深度,查看这一平均值介于最小以及最大流速和水深之间与否。

(二)实现完整性控制方法。水文数据库入库数据质量控制需要合理使用完整性控制方法,如此才可以确保别的质控工作顺利进行。运用完整性控制方法能够确保入库数据信息保持完整性,不会出现缺失数据的问题,给用户提供优质数据奠定扎实的基础。采用完整性控制基本原则,严格根据水文数据特征科学拟定质控方案。1.全面查看给出来的开始年份与结束年份之中,降水量和水位、蒸发量和流量等在日表内是不是进行了完整记录。2.仔细查看流量和含沙量、输沙率和降雨量等在日表里面的要素值与最值完整性,同时查看月降水量表主要字段空值状况。关键查看月降水量表最大日降水量及其天数,年降水量表降水天数,流量表与含沙量表等所对应的平均值、最低值以及最高值。3.按照给定的水文要素,查看有关表完整与否,是否存在缺失数据表,比如降雨量有没有日、月、年降雨量摘录表等。

(三)实现一致性控制方法。在开展水文数据库入库数据质控的过程中,需要相关工作人员严格比照水文资料整编规范要求,对以往的信息资料加以全面审核,同时根据当前规范统一化,保证入库数据信息资料是一致的。再者,还需要按照相同记录要素之间有关联系加以计算,与此同时和对应表内的录入值仔细对比,将不一致的数据整理出来交给相关工作人员全面审核,继而将错误的数据信息修正过来。通常需要查看的内容就是:1.按照日均值,涵盖日降水量,日均水位与流量、输沙率与含沙量,计算出月、年、旬平均值,和录入的各种平均值做对比,检查一致与否。2.按照录入的日均输沙率与流量,准确计算出日均含沙量,查看其和录入的日均含沙量一致与否。3.需要仔细查看降雨量和水位等年表里面录入的最值,观察其和月表里面的年份最值是不是一致的。4.应当主动按照录入的实际日降水量,精准计算出日降水量以及月降水量,同时还需要仔细查看降水量和录入的最大日降水和月降水量一致性。

四、结束语

总的来说,在开展水文数据库构建阶段,必须要严格把控好数据库入库数据信息质量,防止数据信息出现不准确的现象,从而影响到水文信息的使用率。而控制好入库数据质量,应当积极采取多种质量控制方法,比如合理性与一致性控制等方法,借此实现入库数据信息完整性、合理性和一致性,保证数据信息得到有效应用,从而为水文质量检测提供高水准。此次研究仅仅阐述了一部分,还存在着诸多不足之处,需要相关研究人员持续分析与探索,从而为水文数据库入库数据质量控制提供保障。

参考文献

[1]张明哲,王静,凌燕.衡水冀16井水位观测数据质量分析[J].地震地磁观测与研究,2020,41(04):136-142.

[2]虞兰兰,张海宁,虞洋.海冰观测数据质量控制方法研究及北海区冰情分析[J].海洋信息,2017(04):36-42.

[3]汤丹丹,程习锋,万定生.连续型水文数据质量控制方法研究与应用[J].信息技术,2017(04):8-12+16.

[4]任毅.安徽省基础水文数据建库控制方法研究应用[J].江淮水利科技,2017(01):41-42.

[5]刘立杰.辽宁省水文数据库质量管理和控制研究[J].水资源开发与管理,2016(01):61-64.

作者:刘国霖 单位:安徽省宿州水文水资源局