微信聊天记录统计

任务:获取自己和朋友A的全部微信聊天记录,并做简单的数据分析统计(如下图所示的一些数据)


根据聊天内容生成的词云

每个小时段的消息个数分布,可见夜里微信消息过多,熬夜的元凶找到了

每个月的消息个数

任务分析

整体任务分为两个大步骤,获取聊天记录和数据统计。数据统计比较容易,毕竟网上有很多教程可以借鉴。最麻烦的是第一步——获取聊天记录。

微信官方不提供聊天记录的文本导出方法。我们要想获取聊天记录,最直接的方法就是一条条复制到txt文档里,但这个方法太笨,不适合聊天记录特别多的情形。在网上一番检索,踩过一些坑后,终于成功导出。在这里把过程记录一下。

思路是这样的:手机端的微信会把消息记录存在一个数据库文件(EnMicroMsg.db)中。但这个文件加了密,需要密码才打得开。幸运的是,密码能够被计算出来。

密码的计算需要两个号码:一个是微信所用手机的串号IMEI(15-17位数字),另一个是微信的用户信息号(也就是uin,一般8-10位数字)。这两个号码按先IMEI后uin的顺序首尾拼在一起(中间不加任何字符)形成一个23~27位数字。对这长串数字做32位的MD5,得到的结果取前七位,就获得了数据库文件的密码。

注意:这里有个坑,网上都没有说,这七位中的大写字母一定要转化成小写字母才行!


获取微信聊天记录

从前面分析可知,要获取微信聊天记录,需要集齐三大法器: 数据库文件(EnMicroMsg.db)、手机IMEI和微信uin。但手机没有root的话,这三个法器也没法直接获取,只能借助手机模拟器才行。这里采用蓝叠模拟器来说明整个步骤。

  1. 借助PC微信客户端将聊天记录导入模拟器

    • 备份聊天记录到PC
      先打开PC微信客户端,将需要获取的聊天记录备份到PC上


      备份聊天记录至电脑

      备份聊天记录至电脑
    • 恢复聊天记录至模拟器的微信app
      打开蓝叠模拟器,安装微信app,然后登陆自己的账号,导入聊天记录,这样蓝叠就有了完整的聊天记录数据库文件


      导入聊天记录
  2. 打开模拟器root权限


    获取Root权限,这样才能获得上面三个信息
  1. 获取数据库文件EnMicroMsg.db
    • 打开文件管理器


      re.png
    • 数据库的文件路径


      数据库就在这个都是数字的文件夹里

      数据库文件
    • 复制数据库到自己的PC


      蓝叠模拟器中,将文件复制到sdcard下,然后点击上面的Export to Windows即可复制到自己的PC
  1. 获取模拟的串号IMEI
    网上很多方法都不靠谱,最简单有效的一招就是在模拟器上安装获取IMEI的app,打开这个app就能知道IMEI
  1. 获取uin
    在这个文件下,好多文件里都会有uin,例如下面这个文件,里面有个uin_id的8-10位数字,记录下来


    打开这个文件,能够找到uin
  1. 计算密码
    打开密码计算小工具,将IMEI和uin输入左侧方框,中间不要有任何字符,中间选择32位小,右侧得到结果的前七位就是密码

    md5一定要小写的才行

  2. 读取数据库的小工具
    有了数据库和密码,还需要安装一个读取数据库的工具——sqlcipher.

  3. 导出聊天记录
    用sqlcipher打开EnMicroMsg.db,会提示输入密码,然后就能看到数据库内容


    导出聊天记录

    表选择message
  4. 导入excel,导出xlsx
    上面生成的csv文件,如果直接用python读取的话,会有很多问题(可能是编码格式的问题),我是先用excel打开csv,另存为.xlsx文档,这样方便后面python读取


数据分析

这一部分就不多讲了,词云是借用了词云生成方法的代码。聊天时间分布统计利用了pandas库,这个我也是第一次用,拙劣的代码如下

import datetime
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker

excel_path = 'wx.xlsx' #上面第9步,生成的excel文件
dateparse = lambda x: datetime.datetime.fromtimestamp(int(x)/1000) if x else None # 导出来的时间戳比正常的多了3个0,这点要注意
df = pd.read_excel(excel_path, parse_dates=['createTime'], date_parser=dateparse)
fc = df['content'].groupby(df['createTime'].dt.hour).count() # hour 表明按照小时 统计聊天频率
fc.index = fc.index.astype('int') #将横坐标转化为整数型

############  绘图 ###################
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.rcParams['font.size']=23
plt.figure(figsize=(20, 10))
ax = fc.plot(kind='bar',color='#66cccc')
ax.set_facecolor('#eeeeee')
ax.grid(True, linestyle='-.')
ax.tick_params(axis='x',labelcolor='#66cccc', labelsize='large', width=3)
ax.tick_params(axis='y',labelcolor='#66cccc', labelsize='large', width=3)
ax.set_xlabel(u"小时",color='#66cccc')
ax.set_ylabel(u"微信消息个数",color='#66cccc')
ax.set_title(u'微信聊天数据统计',color='#66cccc')
plt.show()

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容