TraSS: Efficient Trajectory Similarity Search Based on Key-Value Data Stores

摘要: 近年来,相似性搜索已成为许多轨迹数据分析任务的重要组成部分。随着轨迹数量的增加,我们必须在大量轨迹中找到类似的轨迹,需要一个可扩展和有效的框架。通常,大量的轨迹数据可以通过键值数据存储来管理。然而,现有的键值数据存储的工作使用粗糙表示来存储轨迹数据。此外,它们不能提供有效的查询处理来搜索相似的轨迹为此,本文提出了一种高效的键值数据存储轨道相似度搜索框架——TraSS。我们提出了一种新的空间索引,XZ*,它利用不规则形状和大小的细粒度索引空间来精细地表示轨迹。进一步,我们设计了一个从XZ*的索引空间到连续整数的双目标函数,该函数简单而有效。为了提高相似度搜索的效率,我们采用两步对不同轨迹进行修剪:(1)全局修剪。它利用XZ*索引删除没有类似于查询轨迹轨迹的索引空间。我们的全局剪枝只能挑选出与查询轨迹大小和形状相似的索引空间。与最先进的索引相比,我们的全局剪枝在查询处理期间减少了66.4%的I/O开销;(2)当地的过滤。它以一种低复杂度的方式过滤不同的轨迹。我们利用道格拉斯-佩克算法从轨迹中提取的几个代表性特征来加速局部滤波。我们在一个流行的键值数据存储上实现了一个开源工具包(TraSS)。大量实验表明,TraSS的性能优于最先进的解决方案

面临的问题:

1)它们以粗表示的方式存储轨迹,(2)缺乏搜索相似轨迹的高效查询处理。

表示:轨迹由多维点组成,但键值数据存储使用一维键值对存储对象。因此,我们必须为轨迹分配一个适当的键。

查询:计算两个轨迹的相似度是耗时的,因为相似度的度量往往相当复杂。因此,必须提前修剪尽可能多的不同轨迹,以避免在查询处理期间产生不必要的I/O开销和计算。因此,经常采用两个步骤来提高查询效率:(1)全局删除 可以避免访问不相关的存储区域 (2)局部滤波以低复杂度的方式快速去除每个数据区域内的不同轨迹

方案:

1)我们提出了一种高效的基于键值数据存储的轨迹相似度搜索框架TraSS。(Representation).我们提出XZ*索引来表示同一索引空间内尽可能多的相似轨迹。具体来说,它将xz - order的每个放大元素划分为四个相等的子四边形,并将子四边形的组合作为索引空间。较大的索引空间用于覆盖较大的轨迹,而较小的索引空间用于覆盖较小的轨迹。此外,相似大小的轨迹可以通过它们的空间形状来区分。

2)(Query processing). (Global pruning). 因为我们的索引可以精确地描述轨迹的大小和形状,所以我们只访问与查询轨迹Q相似的几个索引空间,避免访问与Q不同的索引空间覆盖的轨迹。(Local filtering).我们使用DP (Douglas-Peucker)算法从轨迹中提取代表点。它利用很少的点来近似轨迹的空间形状。



疑惑点:1)文中提出的(Representation)轨迹表示方法令人感到奇怪,将空间划分为更小的部分,或者说是四叉树的方式,用空间表示轨迹。我的理解是利用最小外界矩阵(MBR)来表示要查询的轨迹,但是文中没有提到如何有效的切分轨迹。

         2)整个框架图,看到后很迷惑。尤其在文中query部分。全局删除部分完成后,剩下相似部分,但是文中是怎么实现全局删除部分和representation关联的,在图中看不到相互之间存在的关联性。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354

推荐阅读更多精彩内容