Hive之count函数的特别用法

时间：2021-05-21 18:16:14 阅读：25 评论：0 收藏：0 [点我收藏+]

1.准备表结构和数据

create table test_middle_data.spe_count_test(
    name string,
    sex  string,
    is_valid string
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,‘;


insert into test_middle_data.spe_count_test values(‘jack01‘,‘man‘,‘N‘);
insert into test_middle_data.spe_count_test values(‘jack02‘,‘woman‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack03‘,‘man‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack04‘,‘woman‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack05‘,‘man‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack06‘,‘woman‘,‘N‘);
insert into test_middle_data.spe_count_test values(‘jack07‘,‘man‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack08‘,‘man‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack09‘,‘man‘,‘N‘);
insert into test_middle_data.spe_count_test values(‘jack10‘,‘woman‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack11‘,‘man‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack12‘,‘man‘,‘Y‘);
insert into test_middle_data.spe_count_test values(‘jack13‘,‘woman‘,‘N‘);

2. 需求是根据sex分组，并统计有效的个数和总个数

我发现有人会这样写

select a.sex,a.is_valid_y,b.total_num
FROM(
    SELECT sex,count(1) is_valid_y
    FROM test_middle_data.spe_count_test
    where is_valid = ‘Y‘
    group by sex
) a
inner join (
    SELECT sex, count(1) total_num
    FROM test_middle_data.spe_count_test
    group by sex
) b 
on a.sex = b.sex

结果：

技术分享图片

这种两张表做关联查询影响性能，我们可以优化

3. 使用count的特点优化

count（1）或者count(*)都是计算总行数包括字段为NULL，但是count（字段名）是不会统计字段为NULL的数据，我们利用这个特点完成需求

select sex,count(case when is_valid = ‘Y‘ then is_valid else NULL end) is_valid_y,
       count(1)total_num
FROM test_middle_data.spe_count_test
group by sex

结果也和第二步的sql一样

Hive之count函数的特别用法

原文：https://www.cnblogs.com/yangji0202/p/14794400.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)