首页 > 其他 > 详细

基于Hive及Sqoop的每日PV、UV、IP定时分析

时间:2015-05-24 17:32:14      阅读:202      评论:0      收藏:0      [点我收藏+]

[Author]: kwu 

基于Hive及Sqoop的每日PV、UV、IP定时分析

1、创建pvuvip的hive表

hive -e "
use stage;
CREATE  EXTERNAL  TABLE pvuvip(
	day string,
	pv int,
	uv int,
	ipcnt int

)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '
LOCATION '/dw/stage/pvuvip/';"


2、创建mysql关系库的表

CREATE TABLE
    pvuvip
    (
        id INT NOT NULL AUTO_INCREMENT,
        DAY VARCHAR(50),
        pv INT,
        uv INT,
        ipcnt INT,
        PRIMARY KEY (id)
    )
    ENGINE=MyISAM DEFAULT CHARSET=latin1



3、每日定时执行的自动化脚本

#!/bin/sh
# upload logs to hdfs

yesterday=`date --date='1 days ago' +%Y%m%d`

hive -e "
use stage;
insert overwrite table pvuvip select day,count(*) pv, count(distinct cookieid) uv , count(distinct ip) ipcnt from ods.tracklog where day='${yesterday}' group by day;"


sqoop export  --connect jdbc:mysql://localhost:3306/charts  --username root --password 123456 --table pvuvip --fields-terminated-by ' ' --columns "day,pv,uv,ipcnt" --export-dir /dw/stage/pvuvip/;

4、在crontab中增加定时任务

18  06 * * * /opt/bin/sqoop_opt/pvuvip.opt

5、刷新定时任务

/sbin/service crond reload



基于Hive及Sqoop的每日PV、UV、IP定时分析

原文:http://blog.csdn.net/bdchome/article/details/45952415

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!