[LBS] 腾讯 - 构建大规模基于wifi的室内定位系统经验分享

论文标题.png

1. 摘要&引言

  • 基于GPS的室外定位当前被广泛使用,但是很少的室内定位系统被部署和使用。本篇论文作者分享了5年的经验关于如何部署和评估一个大规模的基于wifi的室内定位系统。本系统当前在1469个商场、393个办公楼、35个医院部署覆盖了35座城市,系统每天给几百万的用户提供定位服务。作者发布了相关的数据集,包括1469个商场和一个办公楼相关的指纹数据。系统整体架构见下图所示。。 相关数据集可以在github中看到:https://github.com/IndoorFingerprint/IndoorFingerprintData
  • 室内定位常使用的技术包括:wifi、蓝牙、UWB等。蓝牙、UWB定位需要专门的硬件部署,不太适合大规模的部署。所以本文考虑使用wifi进行室内定位,因为在大多数商场、办公楼等区域都会有wifi的部署,不需要额外部署专门的设备。基于Wifi的室内定位技术大致可以分为三类:angle-based(AOA)、time-based(TOA)、fingerprint-based。AOA和TOA的wifi定位技术对WIFI设备有极高的要求,AOA定位技术要求有精确的角度测量、TOA技术要求有精确的时间测量。基于指纹的定位技术包括:CSI和RSSI。CSI的获取只有某一些WIFI卡才能获取比如Inter 5300卡和Atheros AR系列卡。因此最终采用基于RSSI测量的指纹定位技术,RSSI值可以在大多数的WIFI设备上获取。
系统整体架构.png

2. 指纹收集

  • 指纹收集是非常费时费力的,人工收集指纹的方式不太适合大规模的部署室内定位系统,因此本文提出了一种基于众包的方法收集指纹数据。本文提出了一个通过两阶段的方式是的大规模的指纹收集成为可能,首先第一个阶段获取WIFI AP数据的粗略的位置,通过这种方式获取初始的指纹库数据。然后我们通过用户的反馈迭代更新我们的指纹库数据,通过这种方式获取更高质量的指纹库数据。

2.1 WIFI AP位置估计

  • WIFI AP的位置估计分为两个阶段:第一个阶段我们通过名称匹配的方式获取一些AP的位置,这些AP的名称通常和POI名称有一定的关联,在楼层指引的帮助下我们能够获取这些AP的较准确的物理位置。第二个阶段我们使用推测出的AP位置,去推测剩余AP的位置信息。

  • 第一阶段:使用名称信息估计AP的位置。 为了匹配Wifi AP的名称和POI,我们采用NLP工具(Spacy,https://spacy.io/)处理AP名称,并且我们考虑名称缩写的相似性。最终我们采用Google的wide&deep模型匹配AP的名称和POI的名称。在所有的4百万的AP库能够通过名称匹配的WIFI AP占比约为19.63%。其中商场、办公楼、医院中能够通过名称匹配获取位置占比分别为:38.23%、13.50%、7.65%。为了评估名称匹配模型的准确率,人工收集8000个AP的真值,最终计算得到模型匹配的准确率为98.4%。

  • 第二阶段:估计剩余AP的位置。 要估计剩余AP的位置,首先需要计算剩余AP与已估计位置AP的相似度。
    本文首先想到的是通过计算AP之间的共现次数,来计算两个AP之间的相似度,计算公式见公式(1)。其中N表示AP_xAP_k被同一台手机扫描到的次数,M表示扫描到AP_x或者AP_k的次数之和。但是公式(1)中没有考虑到扫描的信号强度值,因此在公式(1)的基础之上加上了信号强度信息得到公式(2)。注意公式(2)中分子项需要对分子、分母都归一化到0-1之间。

Prox(AP_x, AP_k) = \frac{N}{M} \qquad (1)
Prox(AP_x, AP_k) = \frac{\sum_{i=1}^N \frac{Mean(RSSI_{xi}, RSSI_{ki})}{|RSSI_{xi} - RSSI_{ki}|}}{M} \qquad (2)

  • 在估计AP的位置之前,我们首先需要估计AP的楼层信息。如果与AP_x最相似的N_f个AP都在同一层,则AP_x的楼层信息可以被立马确定,否则将这个AP的楼层信息放在之后的迭代中预测。 为了平衡准确率和迭代次数,论文中将N_f的值设置为3。得到AP的楼层信息之后,AP的位置信息通过同楼层的AP位置加权得到,具体计算公式见公式(3)。当AP的位置被估计之后,则可以将这个AP加入已知位置的AP库中。
AP位置估计.png
  • 在商场、办公楼、医院三个场景下被估计出位置的AP占比分别为:91.10%,91.40%,86.87%。为了评估AP位置估计的准确率,我们人工收集8000个AP位置真值,最终误差估计的中位数在三个环境中分别为:5.16米、8.65米、23.61米。

2.2 指纹收集

  • 指纹收集过程分为两步:初始化阶段和更新阶段;指纹的两个重要组成部分是:位置(Location)和这个位置相关的特征(unique features associated with this location)。 传统的基于wifi的指纹仅仅使用AP的信号强度作为唯一的特征,本文中加入了位置的请求次数作为额外的特征。
室内指纹收集.png
  • 位置指纹初始化: 本文采用基于迭代的方式更新指纹数据,首先通过众包的方式初始化指纹库数据,然后通过用户的反馈删除那些不正确的指纹数据。每次请求的时候,根据用户手机接收到的AP及其信号强度我们可以粗略估计用户的位置,具体计算公式见公式(4)。我们能够通过众包的方式很快的收集到很多的指纹数据。1469个商场平均需要花费6.6天的时间收集到87.4%位置的指纹数据。剩下的位置用户很少到访,因此对于定位服务影响不大。
粗略用户位置.png
  • 位置指纹更新: 通过指纹的初始化可以获取很多指纹数据,但是可能不是很正确。因此本文继续通过大量的用户反馈修正初始指纹库数据。通过一些奖励机制获取用户反馈,比如给用户发一些优惠券等。大约可以获取5%的用户反馈,反馈的形式就是让用户给系统定位结果进行打分(1~5分)。只有当我们接收的用户得分与之前的得分相等或者更高的时候,我们才更新我们的指纹库数据,否则我们使用最新的AP数据获取位置的最新指纹数据。对于商场场景平均经历6天的时间,所有的指纹库数据都会获得5分的评分。
指纹库更新.png

3. 数据处理

3.1 基于多特征的定位

  • 本文的指纹定位使用的特征包括:RSSI和请求次数特征。为了计算数据库中网格的RSSI列表和在线收集的RSSI列表相似度,我们首先要定位两个列表的共同AP,然后计算RSSI列表相似度。计算的指标包括:euclidean distance, rank distance, distribute distance, reverse-pair rate。 如果共同的AP数量少于3,则这个网格将排除不考虑。本文还引入了请求次数作为另外一个指纹特征,请求次数特征能够告诉我们当用户发起定位的时候哪个位置更受欢迎。作者发现发起定位请求的地方大多数在某个POI的入口,比如饭店的入口。
  • 为了比较好的将两种特征结合起来,我们使用熟知的LambdaRank模型。LambdaRank模型将网格的特征作为输入,对网格进行排序,排在最前面的网格就是最终估计的位置。本文将用户反馈的数据训练LambdaRank模型。
指纹定位过程.png

3.2 现实世界中的挑战

  • 室内外边界检测: 边界检测对于精确定位至关重要,比如当一个用户进入到一个商场,如果仍然使用GPS服务,则会产生较大的定位误差。目前常用的方法是使用智能手机的传感器比如亮度和大气压传感器,用来判别室内外。本文仅仅使用GPS和WiFi的信号强度分布用于室内外的判别,其基本原理是:WIFI在室内外信号强度分布有明显差异,室内环境强于室外环境,然而GPS信号强度在室外环境强于室内环境。下图5展示了室内外WiFi和GPS信号强度分布,作者在不同的位置收集了WiFi和GPS信号强度分布训练了室内外判别模,模型获得的准确率为98.7%。注意室内外判别跟具体的某个AP没有关系,只跟采集到的AP信号强度分布有关。
室内外WiFi和GPS信号强度分布.png
  • 建筑中的中空区域: 在中空区域(例如电梯口或者室内桥)中,我们发现会出现大量的楼层识别错误。并且我们发现在中空区域边缘的AP信号强度分布出现了两个波峰,而其他区域的AP信号强度分布没有这样的表现,只出现一个波峰。最终在楼层定位的时候,我们将中空区域的AP删除因为引入它们将产生较大误差。
商场中的中空区域.png

AP信号强度分布(中空区域vs其他区域).png

4. 大规模系统实验

4.1 商场定位

  • 本文提出的室内定位系统部署在1469个商场中,所有的WiFi AP都是第三方部署的。并且作者发布了商场的指纹库数据,数据采集是基于5mx5m的网格。室内定位系统每天可以收到8810万的定位请求。 本文提出的定位系统获得了4.56的评分基于41500个投票结果,投票的时间范围是从2020年1月到2022年3月。为了评估模型的效果作者手动收集4个商场的groundtruth,包括大中小各种类型的商场。并且选择一个大型和一个中型的商场,跟苹果比较室内的定位结果。 最终总共收集了31140个参考点进行定位评估(参考点的位置,通过激光测距仪测量当前位置与墙等位置的距离,进而通过楼层平面图推测参考点位置),其中大商场包括20300个,中型商场5230个,小型和特殊形状的商场分别2510个和3100个。并且对比了不同系列的Iphone手机和不同品牌的Android手机,商场定位效果如图9所示。

  • 从下图9可以看出,在大型和中型的商场本文提出的室内定位系统可以获得6.12米和6.43米中等误差定位精度。本文提出的系统获得了与苹果通过人工收集指纹方式(苹果室内定位:https://register.apple.com/resources/indoor/Apple-Indoor-Maps-Program.pdf)差不多的定位精度。在小型和特定形状的商场,苹果没有指纹采集的情况下,定位效果显著下降但是本文提出的室内定位系统没有出现显著的下降。

    本文室内定位系统与iPhone手机定位效果对比.png

  • 下图10展示了不同品牌手机的定位效果对比,从下图可以看出不同品牌的手机定位效果没有显著的差异。


    不同品牌手机的定位结果.png
  • AP位置估计: 在4个商场中通过名称匹配的方式,分别可以获取1592,288,101和176个AP的位置,分别各自占比52.8%,51.33%,47.64%,39.82%,将这种AP使用绿色点表示。进一步通过近似估计的方案,可以估计出1251,237,84和230个AP的位置,把这些AP标记为红色。最终有位置的AP的占比分别为94.38%,93.58%,87.26%,91.85%,还有一些没有估计出位置的AP标记为灰色。

不同类型商场的平面图.png
  • 中空区域的处理: 通过使用本文提出的中空区域处理策略,楼层定位准确率有了显著的提升:55.63% -> 98.92%, 56.12% -> 99.31%, 56.75% -> 99.53%, 53.82% -> 98.25%。对应四个商场楼层识别混淆矩阵如下图11所示。
楼层识别混淆矩阵.png
  • AP物理位置改变: 在我们长期对两个大型商场评估的过程中,我们发现经过一年大约19.1%的AP会发生移动,如果不更新指纹库数据的话会导致很大的定位误差。通过我们提出的用户反馈的指纹库更新策略,能够很好的解决这样的问题。从下图12可以看出如果长期不更新指纹库数据,会导致非常大的定位误差。
指纹库更新对定位效果的影响.png
  • 多路径效应影响: 本文对工作日和非工作日,不同时间段的定位误差做了一个详细的对比分析。从图13我们可以发现,对于不同时间段工作日和非工作日定位误差差距不是很大。
不同时间段的定位误差.png

4.2 办公楼定位

  • 虽然本文的定位系统在商场获得了比较好的定位精度(平均约6.82米),但是在办公楼定位精度较差。主要的原因还是办公楼的AP部署比较稀疏,为了进一步提高定位精度,本文在办公楼定位结合了wifi定位和IMU传感器数据。一般来说信号强度的采集频率很低在0.0167Hz ~ 0.5Hz之间,但是IMU数据的采集频率一般在100Hz左右。利用加速度计、陀螺仪和地磁器的传感器数据和PDR算法,可以大致估计用户的行走速度、方向和位移。为了测试融合后的模型效果,本文测试了10条不同的轨迹,长度范围从50米到150米。50个志愿者分别去走这10条轨迹,最终的整体表现如图15a所示。从图15a我们可以看到使用IMU数据,中位数误差从9.13米下降到3.79米。并且作者也测试了不同RSSI采集频率对定位误差的影响,从图15b我们可以看出中位数误差大概在7.37米,4.76米,3.79米,3.26米和2.55米,分别对应不同的采样频率。
办公楼定位:结合wifi指纹和IMU数据.png

4.3 医院定位

  • 医院定位和商场定位有很大的不同之处:医院部署的AP一般比较少,并且大部分AP都不能通过名字和POI进行关联。但是医院通常会有一些收银台,并且还有自助打印机供患者打印检查报告。为了保证更好的支付和服务通常会部署WIFI ap在附近。最终医院的中位数定位误差在11.85米。
某个医院第一层平面图.png

5.结论

  • 应用和服务: 本文的室内定位系统可以提供基于位置的广告、打车、外卖服务。但是在停车场这种场景下,如何提供室内定位服务具有很大的挑战,因为Wifi AP部署的非常少。使用方式: 本文提出的室内定位系统,提出了三种方式使用定位服务:包括App, SDK, Web RESTful API。

参考资料

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容