网站用户行为分析

  1. 步骤

1.1 本地数据集上传到数据仓库Hive

  1. 数据集下载与查看
  2. 数据集预处理
  3. 把数据集导入HDFS中
  4. 在Hive上创建数据库

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.2 Hive数据分析

  1. 给出数据分析需求
  2. 用select语句实现数据分析
  3. 数据分析结果查看与保存 

1.3 Hive、MySQL、HBase数据互导 

  1. Hive数据分析结果(如用户购买与浏览比例),从Hive传输到MySQL中。
  2. Hive数据分析结果(如用户购买与浏览比例),从MySQL传输到Hbase中。
  3. 参照博客步骤,依次将user_action传入Hive、MySQL、HBase中。
    http://dblab.xmu.edu.cn/blog/1059-2/

 

 

 

 

 

 

 

 

 

 

 

 

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

    分析步骤

  • 语句:select count(*) from bigdata_user where visit_date >\’2014-12-10\’ and visit_date <\’2014-12-13\’ and behavior_type=\’4\’ limit 10;
  • 结果截图:运行或存为表格后的查询显示

 

 

 

(2)用户行为分析需求:分析每月1-31号购买情况

  • 语句:代码:select count(distinct uid),month(visit_date) from bigdata_user where behavior_type=\’4\’ group by month(visit_date) limit 10;
  • 结果截图:运行或存为表格后的查询

 

 

 

 

 

 

 

(3)按某一特殊日期(如双12)进行用户行为分析

  1. 各省份购买商品数量
  2. 商品购买与浏览比例
  3. 用户活跃度分析
  4. 购买5件以上商品的用户

 

 

 

 

 

 

 

 

(4)用户购买与浏览比例。

1.计算拥护购买数与浏览数的比值。

2.创建表格保存结果

 

 

 

版权声明:本文为shawncs原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/shawncs/p/14211825.html