SDK数据采集那点事

文章已发布微信公众号:知识点梳理:聊聊iOSSDK数据采集那点事儿

1. 背景

随着互联网的发展,我们无时无刻不在主动或被动接收着大量的信息,早晚上下班坐公交、挤地铁,行色匆匆、各行各业的精英分子都不忘打开手机浏览新闻动态,追看喜爱的电影、电视剧,网上购物,浏览各种订阅号,打打小游戏等等,当然还有些同学阅读纸质书籍或使用kindle阅读。

通过上面的观察可以发现,移动电子设备占用了我们大量的时间,不论购物、吃饭、出行、租赁等等,而移动设备主要通过App来操作,比如购物会使用淘宝、京东等,出行会使用滴滴、摩拜,美食会使用饿了么、美团等。

那么为了更好为自己的用户提供更优质、更加人性化的服务,企业或公司往往都会采集用户的一些信息,以便以后简化用户操作或方便营销等。比如记录登录用户经常购买某个品牌的化妆品,购买价格通常在300-500元区间,那么企业可能会将该品牌在这个区间的化妆品放到App最明显的位置;还比如公司做活动,但由于活动页面比较深,导致用户很难发现,因此触发次数特别少,没有起到营销效果,那么企业可能就会根据采集回的数据信息进行实时调整,将该模块放到明显位置、或减少操作路径等等。

SDK数据采集的作用就在于此,既能方便用户操作,又能起到帮助企业自我调整的作用。

2. SDK 具备的“素质”

image.png

上图为一款SDK本身及所采集数据需要具备的一些基本“素质”,下面将对每个模块逐一介绍。

2.1 SDK 本身具备的“素质”

2.1.1 稳定性

作为App重要的组成部分,稳定性是SDK的重中之重,因为一款SDK可能会被多个App使用,而每个App又有N个用户在使用,如果某行代码出现crash,后果将可想而知。
对于可能出现crash的代码适当添加try catch进行异常捕获,对于常用的NSMutableDictionary/NSMutableArray等控件在插入或访问时经常出现数组越界、nil数据插入等,可使用Category添加自定义安全方法,也可以在Category中使用方法交换,先调用自定义方法进行数据校验,校验无误再执行系统方法。

  • try catch异常捕获

    image.png

  • Category方法交换

image.png
image.png

2.1.2 安全性

安全性目前主要使用代码混淆方式,为防止他人通过class-dump(下载后将文件复制到/usr/local/bin目录下)反编译后,根据源代码中的方法名就可以推断出其功能。

  • 特定标识方法混淆
    对工程中所有方法使用特定标识开头,将所有带有标识的方法都使用随机生成字符串方式替换。具体使用方式可参考:HSKConfuse

运行程序后,找到工程 Products -> Show in Finder -->显示包内容 找到工程执行文件,使用以下命令反编译文件:

class-dump -H 执行文件路径 -o 导出的.h文件存放文件夹路径

可发现反编译后的.h文件的方法名称已被混淆。

2.1.3 易用性

易用性主要是指用户在使用时只需要部分代码即可完成相应功能。

易观SDK对外提供了页面自动跟踪功能、页面自定义采集、事件采集、通用属性配置、用户属性、消息推送跟踪及Hybrid混合页面等模块化的接口,用户可根据需要自行选择,并且接口均为类方法,可以简便的调用。同时还提供了React NativeWeexPhoneGap三个跨平台移动应用开发框架的接口文件,开发者无需再次进行封装。

2.1.4 扩展性

对于程序来讲扩展性无疑非常重要,不能因某个小小需求的改变而导致代码重构,不仅浪费人力、物力,更重要的浪费了时间,而时间可能导致商机的流失。

在易观SDK初始化方法中使用了配置类,可以方便的扩展未知的配置信息:


image.png

为了方便用户对自定义信息的扩展,部分接口也预留了自定义信息,如购买商品时后期可能需要分析品牌、价格、购买时间段等,那么开发者可通过track:properties:方法将数据放到properties字典中。

2.2 数据应具备的“素质”

2.2.1 准确性

数据采集的准确性是为后续数据的处理提供基础保障。

其中可能需要用户参与,传入明确需要计算或统计的指标以对其进行精准分析;为保证数据及时上传到服务器,数据上传至少触发一次,若发生网络中断、服务器无响应等特殊情况,SDK需要建立起重试机制,保证数据准确送达;由于数据产生先后顺序会影响前端的展现和分析,因此在SDK中我们会使用数据处理串行队列及网络上传队列,确保数据先触发先到达。

image.png

2.2.2 安全性

数据安全性主要体现在存储和网络传输过程中。

SDK采集的数据将首先存储到本地数据库中,为了防止用户篡改数据,需要对数据进行保护;为了增加数据的安全性,在数据上传时需要对数据进行加密处理,常用的加密方式有:Base64加密、MD5加密、AES加密、RSA加密等。目前易观SDK使用前三种结合的方式对数据进行了加密,每次上传的数据都会根据一定的算法产生不同的加密key,以保证数据的安全性。

2.2.3 合法性

作为数据采集模块,每天都会有大量数据上传服务端,其中必然有部分数据是不合法的,比如某些页面无网络状态下无法获取商品信息,由于疏忽导致购买按钮可能触发,但数据信息无法获取,导致调用SDK的数据为无效数据,这些数据可以称为“垃圾数据”,不仅对后期分析无用,还会增加清洗数据的时间,浪费了磁盘空间。

因此SDK中单独抽出校验层,对数据进行合法性校验。如:SDK本身预定义一部分保留字段,$platform(iOS/Android/java等)、$lib_version(SDK版本号)、$debug(debug/release)等,为防止用户覆盖,也是为了后期数据分析时更明确、更具有针对性,对传入参数进行校验;常用的字符串长度校验,防止输入字符串过长;自定义属性多层嵌套校验,层次嵌套过多可能导致分析效率下降,增加复杂性;属性总个数校验等等。

2.2.4 可控性

作为SDK更新频率可能没有App那么高,所以对SDK需要一定的策略控制。我们在SDK中加入了策略控制模块,优先级从高到低依次为:服务器策略>用户设置策略>默认策略。

对正在使用的SDK主要采取服务器控制策略,比如:服务器端可以控制数据上传累积条数及数据上传间隔时间;延迟一段时间后SDK再进行数据上传;更改数据上传服务器地址;数据上传失败后的重试次数以及达到最大次数后下次数据上传的时间等等,都可进行灵活控制。

3. 总结

由于SDK模块很少涉及UI部分,所以基本结构如下如所示:


image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,313评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,369评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,916评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,333评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,425评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,481评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,491评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,268评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,719评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,004评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,179评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,832评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,510评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,153评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,402评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,045评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,071评论 2 352

推荐阅读更多精彩内容