基于Wi-Fi的室内定位在美团总部的实践和应用
作者:张小美
室内定位技术的商业化必将带来一波创新高潮,尤其是在 O2O 领域,各种基于此技术的应用将出现在我们的面前。我们可以想象一些比较常见的应用场景,比如在大型商场里面借助室内导航快速找到目标商铺,商店根据用户的具体位置向用户推送更多关于商品的介绍等等,这些应用会极好的服务于 O2O,提高用户体验。
目前室内定位技术有很多,如A-GPS、蓝牙、超声,红外、信标、射频、Wi-Fi、计算机视觉等,这些技术综合比较,其中以基于 Wi-Fi 的室内定位技术最为突出,无论从硬件投入、软件投入、实施难度、可控性,还是定位效果方面考察,都是有优势的。
本文描述了作者在美团总部从零开始构建基于 Wi-Fi 的室内定位系统的过程,具有广泛的借鉴意义。
基于 Wi-Fi 的室内定位原理
- 为提供 Wi-Fi 服务,室内会部署有热点(AP),每一个无线 AP 都有一个全球唯一的 MAC 地址,并且一般来说无线 AP 在一段时间内是不会改变的。
- 设备可以程序控制扫描并收集周围的 AP 信号,无论是否加密,是否已连接,甚至信号强度不足以显示在无线信号列表中,都可以获取到 AP 广播出来的 MAC 地址。
- 对应每个 AP,这里有两个重要数据,AP 的 MAC 地址和信号强度,MAC 地址可以决定是哪个 AP;信号强度理论上是和 AP 之间的距离有函数关系的,就是根据信号强度可以算出和 AP 的距离。
- 设备将这些数据发送到位置服务器,服务器就可以用一个算法计算出设备的地理位置并返回到用户设备。
- 定位的精度取决于 AP 的个数,信号的稳定程度,以及算法的选择。
美团总部 Wi-Fi 部署情况
美团总部于 2014 年 1 月搬入了望京科技园 3 期,新的办公室地上共 4 层,建筑面积一万多平米,共部署有 86 台无线 AP,覆盖很充分,没有死角,这为良好的定位效果打下了基础。
无线 AP 使用的是,ArubA AP-135,这是一款优秀的商用无线路由器,2.4-GHz/5-GHz 双频。
基础数据测绘
第一步,建立 AP 的基础数据库是关键,至少需要如下信息:
- AP 的 MAC 地址,这里是双频的 AP,就是有 2 个无线 MAC 地址
- AP 的物理位置
关于 AP 的物理位置,这里因为范围太小,加之无法找到足够精度的参考点,所以 AP 的物理位置无法使用 GPS 坐标,只能使用自定义坐标系。
这里有 2 种选择:
- 以建筑的东南角为参考点(坐标原点),这样就可以测绘 AP 相对原点的坐标,包含Z轴,单位是米
- 以测绘图的图片为参考,以 AP 在图中的像素位置为坐标,单位是 1 像素点
这里选用了后一种方法,因为后一种方法容易测绘,大部分工作在电脑上操作即可;前一种方法需要更多的实地测绘工作。
关于 AP 的 MAC 地址,从 IT 那里要到了一个列表,如图所示:
但是很不幸,这里的 MAC 地址是路由器的 WAN 口的 MAC 地址,而我们需要的是两个无线模块的 MAC 地址。
这里只能自己测绘了,我写了一小段 android 程序,可以排序出最近的 AP 的 MAC 地址,然后挨个跑到各个 AP 下,运行程序,记下两个 MAC 地址;同时记录下 AP 的真实物理位置。
WifiManager wm = (WifiManager) getSystemService (Context.WIFI_SERVICE); wm.startScan (); //开始扫描 AP //等待一段时间,时间可长可短 List<ScanResult> results = wm.getScanResults ();
//拿到扫描的结果
Collections.sort (results,this); //this 是个 Comparator,按照 level 排序 //去掉非 sankuai 的 SSID //在 UI 线程中,显示到界面上 int max=Math.min (30,results.size ()); for(int i=0;i<max;i++) { ScanResult one = results.get (i); text1.append ("\n"+one.BSSID+"\t\t"+one.level); }
图中信号最强的就是当前 AP 的 MAC 地址,然后地址与它相近的是这个 AP 另一个频段的 MAC 地址,两个 MAC 地址都是 0 结尾,尾数相差1,容易辨认。
MAC 地址后面的数字是信号强度,单位是 dBm,是个负数。
然后在底图中标注好 AP 的准确的物理位置,图中红色圆点即是 AP 位置,其圆心的像素坐标当作 AP 的坐标。
测绘的数据应该存入数据库,这里设计了一个 POJO,服务器端程序可以使用:
public class MtApLoc { private int id; //数字 ID 人工定,有一定含义
private String id1; //字符串 ID 从 IT 给表中来
private String mac1; //WAN MAC 地址,有线口的
private String sn; //AP 的 SN 从 IT 给表中来
private String sku; //资产编号 N 从 IT 给表中来
private String mac2; //无线 MAC 1 ,测绘得来
private String mac3; //无线 MAC 2 ,测绘得来
private int pn; //图号 对应楼层
private float x; //物理坐标 x 自定义坐标系中
private float y; //物理坐标 y 自定义坐标系中 }
然后将测绘的数据录入数据库,最后得到的数据如:
其中的x,y是此 AP 在对应楼层的测绘图的图片中的坐标。
MAC2 和 MAC3 是 AP 的两个 MAC 地址(这里没有区分 2.4G 和 5G),和上面的测绘客户端的截图比较,能看出当时我是站在 AP7 下的。
把所有 86 个 AP 的物理位置和 MAC 地址测绘收集全后,测绘过程完成。
android 客户端示例
这里写了一个 Demo 用的 android 客户端,来测试定位结果,先看客户端运行截图:
点击定位按钮,系统会扫描 AP,然后把结果请求到服务器。
HttpPost post = new HttpPost (BaseUrl + "/gar/locate/ap-locate.html"); List<NameValuePair> parameters = new ArrayList<NameValuePair>(); for (ScanResult result : results) { parameters.add (new BasicNameValuePair ("mac", result.BSSID.toUpperCase ())); parameters.add (new BasicNameValuePair ("rssi", String.valueOf (result.level))); } post.setEntity (new UrlEncodedFormEntity (parameters, "UTF-8")); String res; synchronized (hc) { HttpResponse response = hc.execute (post); res = EntityUtils.toString (response.getEntity (), "UTF-8") .trim (); } Log.w (TAG, res);
服务器返回其所在位置,是一个 JSON 字符串
{"accuracy":0.0,"message":"ok Least Squares","pn":1,"status":0,"x":237.97249473061038,"y":1241.8270604002646}
然后客户端显示 pn 对应的底图,然后在底图的x,y位置上显示定位到的标志,即图中跳动的红心。
客户端大部分代码都是 UI 相关代码,这里不贴出了。
定位算法
常见的室内定位的算法主要分为两类:基于测距技术的定位算法和距离无关的算法。基于测距技术的算法一般是通过节点之间的距离或者角度来计算出未知节点的位置,实际运用中常见的有:基于接收信号强度指示算法(RSSI)、到达角度算法(AOA)、到达时间算法(TOA)等。距离无关的算法有:质心法、APIT 算法、凸规划算法等。这些算法都是利用节点之间的邻近关系实现定位的。一般来说,基于测距技术的算法比无需测距的精度要高,这里适合采用。
首先确定一个信号强度和距离之间的关系,这需要了解电波传播模型。在自由空间环境中,不考虑阻挡和多径传播,设发射端与接收端的距离为d,则接收端的接收功率Pr可表示为:
其中Pt为发射功率;Gt和Gr分别为发射和接收天线增益;λ为电波波长;Pt和Pr的单位是瓦特;Gt和Gr无量纲。由上式可以看出,在自由空间中,接收功率与距离d2成反比。
在实际环境中,由于存在多径、障碍物、绕射等随机因素,无线电传播损耗与上式相比还是有较大变化。此时,常采用对数-常态分布模型更为合理:
其中Pr单位为 dBm ,d0一般取1。在一般室内定位中,考虑到环境、成本、定位精度要求等因素,所使用的 RSSI 测距信号衰减模型进一步简化为:
d 为定位节点与参考点之间的距离,单位m;A为定位节点与参考点之间的距离d为 1m 时测得的 RSSI 值;n为信号衰减因子,范围一般为2~4。
在美团的环境中,我们取A为-50,n为 2.1。
这样根据信号强度,就能估算设备和 AP 之间的距离。
定位方法一般是根据几何模型建立方程,然后求解方程得到节点坐标。
只有一个 AP 的情况:
这里目标点坐标只能取 AP 的坐标,精度取半径
两个 AP 的情况:
这里取 AB 的中间位置,精度取 AB 的长度。
三个 AP 的情况:
这里取三个圆的一个共同交点。
不过实际没有这么简单,因为距离都有误差,两个 AP 时,可能是这种情况:
三个 AP 可能是这种情况
甚至这种:
这只是三个 AP,有更多 AP 时怎么办?
这里考虑一般的情况:
考虑一般的情况,设有n个 AP,AP1,AP2,…,APn,坐标是(xi,yi)。目标点到这n个 AP 的距离是di。
设目标点的坐标是(X,Y),则可列一个方程组,有n个等式:
大家都减第一个等式,就消去了二次项,得到另一个方程组,有n-1 个等式:
常数项换个名字,得到:
等式除以X的系数ai,变量换个名字,得到:
等式有n-1 个,现在问题变成了:已知一组点(ui,vi)满足p+uq=v,求最合适的系数p,q,这是典型的最小二乘法
Java 里可以用 Apache Commons Math3 这个 library 来解决最小二乘法,文档见SimpleRegression
这里还有一个问题,AP 的坐标(xi,yi)是像素坐标,那di相应的需要是像素距离,需要做一个比例尺变换
比例很容易算,相关代码:
public double getPicLen (double rssi) { double f=(-rssi-50)/22.0; return 41.785*Math.pow (10,f); }
服务器端代码示例
通过上面的描述,服务器端代码就很容易写了,这里给出主要代码:
private String[] macs; //输入 mac 地址
private float[] rssis; //输入信号强度
private int pn; //输出,楼层
private double x,y,accuracy; //输出,定位到的坐标和精度 List<MtApLoc> aps=new ArrayList<>(map.keySet ()); MtApLoc first=aps.get (0); //信号最强的那个 ap for (MtApLoc one : aps) {
//以信号最强的 ap 的楼层作为最终楼层,因为可能搜到其它楼层的信号
if(one.getPn ()!=first.getPn ()) { //干掉其它楼层的 ap
map.remove (one); } } aps.clear (); aps.addAll (map.keySet ()); size=aps.size (); this.pn=first.getPn (); if(size==1) { setStatus (0); setMessage ("ok one point"); this.x=first.getX (); this.y=first.getY (); this.accuracy=getPicLen (map.get (first) .floatValue ()); return JSON; } else if(size==2) { setStatus (3); setMessage ("to impl"); } else { float minRssi=-65; //信号强大要达到 -65 才参与运算
int min=4; //至少需要 4 个 ap,这个条件比上个条件优先 size=0; for(Iterator<MtApLoc> it = aps.iterator ();it.hasNext ();) { MtApLoc ap = it.next (); if(map.get (ap) .floatValue ()<minRssi && size>=min) { it.remove (); } else { size++; } } //map 的 key 之前是信号强度,现在变为像素距离
aps.forEach (ap -> map.put (ap,getPicLen (map.get (ap) .floatValue ()))); double[][] ps=new double[size-1][4]; //看 size-1
double r1=map.get (first) .doubleValue (); r1=r1*r1; double r2=first.getX ()*first.getX () +first.getY ()*first.getY (); int n=0; for (MtApLoc ap : aps) { //生成数据 if(ap!=first) { ps[n][0]=ap.getX ()*ap.getX () +ap.getY ()*ap.getY ()-r2; ps[n][1]=2*(first.getX ()-ap.getX ()); ps[n][2]=2*(first.getY ()-ap.getY ()); double r=map.get (ap) .doubleValue (); ps[n][3]=r*r-r1; n++; } } assert n==(size-1); for(int i=0;i<n;i++) { //生成数据 double k=ps[i][1]; ps[i][1]=(ps[i][3]-ps[i][0])/k; ps[i][0]=ps[i][2]/k; } SimpleRegression reg=new SimpleRegression (true); //最小二乘法
reg.addData (ps); setStatus (0); setMessage ("ok Least Squares"); this.x=reg.getIntercept (); this.y=reg.getSlope (); }
效果检验
系统完成了,这里需要检验一下定位效果。为了简化过程,我是这样操作的:
我选择了一个固定点,就是我的座位(上面客户端截图中跳动的红心所在的位置),然后用手机客户端做 100 次定位操作,同时服务器做 log 记录下 100 次的定位结果,然后做分析。
我座位这个点被 3 个 AP 包围着,定位效果应该不错,所以结论可能会偏乐观,实际应该选择不同的点。
不过选择不同的点要记录真实的点的坐标,稍显麻烦。后面做进一步改进和测试时,可以选择不同的点做测试,这算作一个 todo。
然后就得到 100 个定位结果,然后可以计算和真实点的偏差,结果如:
其中x、y是定位到的坐标,单位是像素坐标,diff 是计算出的偏差,单位是米。
然后按距离排序,得到如下表,是全部数据:
从这个表可以大致分析定位效果:
- 100 个点中,误差小于 1 米的有 4 个点
- 大部分点误差在 1 米到 4 米,有 93 个点,大致呈均匀分布态势
- 误差大于 4 米的有 3 个点,而且误差极大,明显属于失败的噪声点
去掉 3 个失败的点,剩下的 97 个点,可以用 excel 画一个分布图:
分析上面数据,以及实际测试过程,能发现,这个系统应该有一个系统误差。就是测试中,定位结果总是分布在距我大概 2 米处的某一点周围,应该是系统编码某个地方缺陷造成的。
这是待改进的 todo,预计找到问题解决后,重复上面的测试过程,定位效果能达到 95% 的点误差小于 2 米的水平。
另外上面我选的点应该属于定位效果较好的点,一般情况的点的定位精度,得进一步详细测试得出。这里我拍脑袋估计,系统应该在 90% 的点误差小于 5 米的水平。
进一步工作,改进与设想
整个系统正在应用到移动组开发的一个找会议室的手机应用“会议室”中,为其增加定位自身的功能。
为了完善系统,现在能想到的改进有:
- 找到并改进上面说到的系统误差
- 完善后,做进一步的评测
- 考虑 2.4G 和 5G 信号的定位差别,目前是不区分的
- 信号强度和距离的公式的系数做进一步精确
- 核心定位算法目前采用的是最小二乘法,目前在考虑用更智能的一个方法,叫“位置指纹”,这个算法预计效果更好,也容易实施
- 目前坐标系统用的自定义的坐标系,这个不利于使用者使用,考虑用更好的坐标系
- 光有定位接口是不够的,还应该有坐标和地址相互转换的接口;还应该有导航的接口
- 推广应用到更多实际的系统中
这些改进,会逐步完善,敬请期待本系列的(下)篇。