Spark微博人口流动分析(1)
- 思路
新浪微博API接口提供了获取附近位置的微博用户的API接口,因此尝试通过分析春节期间全国用户各地微博用户分布情况,再结合用户注册地信息,粗略分析人口流动情况。
- 数据获取
0:新浪微博API接口
NearbyUser:http://open.weibo.com/wiki/2/place/nearby/users
城市代码:http://open.weibo.com/wiki/%E7%9C%81%E4%BB%BD%E5%9F%8E%E5%B8%82%E7%BC%96%E7%A0%81%E8%A1%A8
1:时间戳
2016年1月10日至2016年2月20日(包含整个春节前后)
2:全国采集点数据
以地级市为单位,以10000米为栅格单位,采集时范围为sqrt(2)/2*c,并以地级市为单位去重
3:程序
采用CSharp语言,Source Code:https://github.com/gaufung/WeiboDataMing
(未完待续)