在命令提行输入 jupyter notebook
我 是在 pip的 安装目录里面输入。
第一步清洗数据
第二步 更新数据库
第三步 数据可视化
还是先导入数据库, 按一下tab 键可以自动提醒。
shift + 回车, 执行 cell 代码。
小插曲 之前在 no connection to kernel ,是因为 杀毒软件的原因。
连接数据库
client = pymongo.MongoClient('localhost',27017)
ceshi = client['ceshi']
item_info = ceshi['item_infox']
在每一行代码需要依次 先执行一遍, 不然会报错。
for i in item_info.find():
if i['area']:
area = [i for i in i['area'] if i not in punctuation]
else:
area = ['不明']
item_info.update({'_id':i['_id']},{'$set':{'area':area}})
下一步 跟新数据库
两个参数
例子
下一步 数据可视化
依赖的库是 charts
series = [
{
'name': 'OS X',
'data': [11],
'type': 'column'
}, {
'name': 'Ubuntu',
'data': [8],
'type': 'column',
'color':'#ff0066'
}, {
'name': 'Windows',
'data': [12],
'type': 'column'
}, {
'name': 'Others',
'data': [29],
'type': 'column'
}
]
series2 = [{'name': 'John','data': [5],'type': 'column'},{'name': 'John','data': [5],'type': 'column'}]
charts.plot(series, show='inline')
# options=dict(title=dict(text='Charts are AWESOME!!!'))
area_list = [] #创建空列表
for i in item_info.find():
area_list.append(i['area'][0]) # 每个地址的第一个大地址加入列表
area_index = list(set(area_list)) # 先将列表里面的 元素 变成集合 这样去除 重复, 然后在变成列表
print(area_index)
37分钟之后没看懂