venus番外:利用python生成一百万模拟用户数据

1. 目的

venus商城的项目,为了更加贴近真实场景,计划模拟1百万的虚拟用户数据。这是一个宏大计划的第一步,千里之行,始于足下,在这个项目中,希望可以将我所掌握的东西融汇贯通,并进一步扩展;在这个项目规划中,包括了分布式相关的技术、流式处理、大数据分析、以及前端、小程序等等。虽然连我自己都觉得这是在吹牛,是不可能实现的,但是话先放出去,万一将来真做成了呢!

2. 用户表相关

先从简单开始,电商项目的用户表,只要包含用户姓名、手机号、证件号、地址等信息就可以了,后续根据需要进行扩展。

// 用户表

{"userName":"李靖",

"sex":"M",

"phone":"16866668888",

"idNo":"120103xxxxxxxxxxxx",

"passwd":"uhng2343",

"address": {"province":"天津市","tag":"家","city":"天津市","district":"河西区","street_address":"陈塘关李府"},

"create_time":"2020.10.31 12:11:30"

}

3. python中的Faker库介绍

为了让模拟的数据更接近真实数据,这里引入一个python的库,Faker,地址:https://pypi.org/project/Faker/ 。使用它可以生成身份证号,手机号,地址,姓名等等,

关于这个库的详细教程,可以参照以下这篇文章:

https://zhuanlan.zhihu.com/p/87203290

以下是python使用Faker生成用户的方法(初学python,如果代码写的有毛病欢迎大家指正:) ):


4. 用户表数据库存储

这个项目的第一张表是用户表,但是我没打算使用mysql做数据存储,我选择mongoDB。在很多人眼中,mongoDB更多是一个非关系型数据库,不可能成为一个项目的核心存储库,就像redis,es等一样,只能用来辅助。但是mongoDB其实在最新的版本中已经具备了承担核心库任务的条件:

mongoDB4.2以后的版本,不仅优化了性能,而且提供了关键的事务支持。相对mysql,mongoDB在功能上已经差异不大。

mongoDB的数据结构是json形式的,数据的存储更接近代码中的实体类对象,而且表结构的扩展简单,想像一下mysql中对千万级别的表增加字段是一个多个漫长的过程?!json可以嵌套,这样在mysql中需要多张表存储的数据,mongoDB只要一张就可以了。

下面定义一个方法,将用户表的数据写入mongoDB

import pymongo

def insert_user():

       client = pymongo.MongoClient('mongodb://flnn:flnn1110@192.168.3.152:27017')   

       database = client['venus']foriinrange(100):       

       user = generate_user()       

       database['user'].insert_one(user)

下面就是执行了:

insert_user()

5. 效率提升

原本设想得很美好,我只要将上面for循环中的100改为100万,然后静静地等待它执行完就可以了,但是实际结果是程序跑了近5个小时,数据库中才插入了30多万的数据,这个效率实在是。。。(想我以前使用java往mongoDB中插入数据的时候,可是能够一个小时插入1千万的呀)

那么考虑下python的多线程吧,我的电脑是4核8线程的, 将程序改成多线程执行:


注意这里的target参数的值不要写成insert_user(),加上括号之后,就变成了将insert_user的执行结果传递给target了,那是完全不对的。

不过上面多线程的执行效率,经过对比,似乎也没有提升8倍速度,不过总算有些效果。python程序如何提升执行效率,目前能想到的就是这个手段了,其他的也许可以从mongoDB的插入方法上改进一下,比如逐条插入修改为批量插入。

万里长征的第一步总算走出去了,下一步,就是构建程序主体啦。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,172评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,346评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,788评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,299评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,409评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,467评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,476评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,262评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,699评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,994评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,167评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,499评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,149评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,387评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,028评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,055评论 2 352

推荐阅读更多精彩内容