什么是大数据测验?大数据测验完成进程有哪些?
大数据测验
测验大数据运用程序多的是验证其数据处理,而不是测验软件产品的个别功用。当触及到大数据测验时,功用和功用测验是要害。
在大数据测验中,QA工程师运用集群和其他组件来验证对TB级数据的成功处理。因为处理快,所以它需求水平高的测验技能。
大数据运用程序的测验多的是去验证其数据处理而不是验证其单一的功用特征。当然在大数据测验时,功用测验和功用测验是相同很要害的。关于大数据测验工程师而言,怎么正确的验证经过大数据东西/结构成功处理过的至少多万兆字节的数据。因为大数据高的处理测验速度,它要求测软件工程师具有水平高的测验技能才干应对大数据测验。
大数据处理的三个特性:
1)大批量
2)实时性
3)可交互。
别的,数据质量也相同是大数据测验的一个重要维度。
因而在进行运用程序测验之前,要保障数据质量,而且考虑把数据质量作为数据库测验的一部分。触及数据的各特性的查验,例如一样、重复性、连贯性、及完好性等等。
大数据运用测验大体可以分为三进程:
进程一:数据阶段验证
大数据测验的一步,也称作pre-hadoop阶段该进程包含如下验证:
1)来自各方面的数据资源应该被验证,来保障正确的数据被加载进体系。
2)将源数据与推送到Hadoop体系中的数据进行比较,以保障它们匹配。
3)验证正确的数据被提取并被加载到HDFS正确的位置。
该阶段可以运用东西Talend或Datameer,进行数据阶段验证。贵州软件造价
进程二:"MapReduce"验证
大数据测验的第二步是MapReduce的验证。在这个阶段,测验者在每个节点上进职事务逻辑验证,然后在运转多个节点后验证它们,保障如下操作的正确性:
1)Map与Reduce进程正常作业。
2)在数据上施行数据聚合或隔规矩。
3)生成键值对。
4)在履行Map和Reduce进程后验证数据。
进程三:输出阶段验证
大数据测验的后或第三阶段是输出验证进程。生成输出数据文件,一同把文件移到一个EDW(Enterprise Data Warehouse:企业数据仓库)中或着把文件移动到其他依据需求的体系中。在第三阶段的活动包含:
1)查看转化(Transformation)规矩被正确运用。
2)查看数据完好性和成功的数据加载到方针体系中。
3)经过将方针数据与HDFS文件体系数据进行比较来查看没有数据损坏。

(文章内容来源于网络,如有侵权请联系删除)