首页 > 其他 > 详细

我为什么学习hive窗口分析函数

时间:2016-03-01 18:40:31      阅读:209      评论:0      收藏:0      [点我收藏+]

1. 窗口函数

  LEAD(column_name, n, default_value),用于统计窗口内往下第n行的值,

  LAG(column_name, n, default_value),用于统计窗口内往上第n行的值。

  FIRST_VALUE(column_name),分组窗口排序后,截止到当前行的第一个值;

  LAST_VALUE(column_name),分组窗口排序后,截止当前航的最后一个值;

2. OVER语句

  SUM/COUNT/MIN/MAX/AVG(column_name) OVER(PARTITION BY c1, c2 ORDER BY c3, c4  ROWS_CLUSTER),

  其中,ROWS_CLUSTER为:

    a. ROWS CURRENT ROW

    b. ROWS BETWEEN n PRECEDING AND n FOLLOWING

    c. ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNED FOLLOWING

  UNBOUNDED和n可以互相替换。

3. 分析函数

  ROW_NUMBER() OVER(PARTITION BY c1, c2 ORDER BY c3, c4),以及另外一些,此处不再赘述。

4. 示例:

  略。

我为什么学习hive窗口分析函数

原文:http://www.cnblogs.com/qupeng/p/5231960.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!