ETL的定义:
将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程
使分析和事务处理不冲突
(参考https://blog.csdn.net/Trigl/article/details/68944434
HDFS:Hadoop分布式文件系统
单位时间内服务器处理的请求数来描述其并发处理能力。称之为吞吐率(Throughput)
吞吐量,是指在一次性能测试过程中网络上传输的数据量的总和。
TPS (Transaction Per second)
每秒钟系统能够处理事务或交易的数量,它是衡量系统处理能力的重要指标。
(参考https://ruby-china.org/topics/26221
流式数据
https://blog.csdn.net/HeatDeath/article/details/78986025
map reduce
原文:https://www.cnblogs.com/zorazheng/p/10713999.html