用python进行简单的处理和绘图分析-上网用户群体分析

某个网站/服务器上,请求链接的用户信息。资料集中有电脑类型、浏览器链接等。用python进行简单的处理和绘图分析。

资料集链接

# INPUT uses python 3.6 
import json
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

path = 'usagov_bitly_data2012-03-16-1331923249.txt'
records = [json.loads(line) for line in open(path)]
frame = pd.DataFrame(records)
results = pd.Series([x.split()[0] for x in frame.a.dropna()])
# print(results[:5])
cframe = frame[frame.a.notnull()]

operating_systems = np.where(cframe['a'].str.contains('Windows'),
                             'Windows','Not Windows')

by_tz_os = cframe.groupby(['tz',operating_systems])
agg_counts = by_tz_os.size().unstack().fillna(0)

indexer = agg_counts.sum(1).argsort()

count_subset = agg_counts.take(indexer)[-10:]


normed_subset = count_subset.div(count_subset.sum(1),axis = 0)
normed_subset.plot(kind='barh',stacked = True)
plt.show()
# OUT 
                     Not Windows  Windows
tz                                       
America/Sao_Paulo           13.0     20.0
Europe/Madrid               16.0     19.0
Pacific/Honolulu             0.0     36.0
Asia/Tokyo                   2.0     35.0
Europe/London               43.0     31.0
America/Denver             132.0     59.0
America/Los_Angeles        130.0    252.0
America/Chicago            115.0    285.0
                           245.0    276.0
America/New_York           339.0    912.0
operating_char.png

2018.7.16

学习笔记《用python进行数据分析》,非原创,仅作学习存档用途。 在草稿箱放太久有点忘了。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,689评论 6 427
  • 《夜色》 夜黑风高,荒郊野岭,小木屋里。 男:“来了?” 女:“来了。” 男:“来?” 女:“来!” 男:“来了么...
    8a5bc35c564a阅读 897评论 0 0
  • 我是一个典型的追求完美主义的人。比如,看剧看书一定要一秒不落、一字不落地从头看到尾,从来不会快进或者略读,...
    贝壳0714阅读 4,675评论 0 50
  • 死亡,在很多时候,真是一件近乎日常的琐事。你上班的路上,邂逅车轮下的一摊血;你下班回来,看见家属院门口邻居的一张讣...
    相逢一笑阅读 2,586评论 2 1