爬虫笔记(4)并发多进程

在python中,多线程并不能利用CPU的多核性能。为进一步提高爬虫性能,使用多进程是有必要的。多进程要比多线程要复杂一些,难点主要在进程间通讯的问题。系统将会分成服务器和客户端,服务器负责与各个进程进行通讯、存储数据以及分配任务。客户端负责从服务器接收任务,将采集的数据传送到服务器。

1.multiprocessing使用入门

python多进程模块multiprocessing,与多线程模块threading类似。

  • 创建一个简单的进程
from multiprocessing import Process
def subprocess(name):
    print name
def main():
    p = Process(target=subprocess,args=('hello',))
    p.start() #启动进程
    p.join() #等待进程结束
if __main__=='__main__':
    main()
  • 进程之间数据交换
    进程之间数据交换主要采用队列或者管道来实现,当然也可以采用共享内存来实现。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 目录 一、开启线程的两种方式 在python中开启线程要导入threading,它与开启进程所需要导入的模块mul...
    CaiGuangyin阅读 2,431评论 1 16
  • @(python)[笔记] 目录 一、什么是进程 1.1 进程的概念 进程的概念起源于操作系统,是操作系统最核心的...
    CaiGuangyin阅读 1,274评论 0 9
  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,568评论 6 427
  • 最近大圣归来热播中,想着过几天也去电影院看看,然后今天画画时回忆起小时候齐天大圣在我脑中的印象:聪慧,灵动,重情重...
    Gigi熊阅读 369评论 0 3
  • 《你为什么而工作》作者巴里·施瓦茨是美国宾夕法尼亚州斯沃斯莫尔学院的心理学教授,被认为是继诺贝尔经济学奖获得者丹尼...
    ShineLau阅读 439评论 0 0