如何拯救疫情下的中小企业——临时用RPA替代人工实践篇(二)

公司背景

深圳某人力资源公司,通过RPA自动实现刷简历,根据设定条件筛选候选人,打招呼、简单沟通、索要简历等


screencap.gif

开发技术

Python+Selenium

开发步骤

  1. 录入职位
age=27
salary=20
company=平安,腾讯,华为,阿里巴巴...
work_time=3
degree=本科,硕士,博士
keyword=JavaScript,HTML5,CSS,Vue,Angular,React,Hybrid,Web,Android,iOS,App
post=qd,资深前端工程师
day_greet_limit=50,100
day_scan_limit=100,200

将这份职位及筛选条件保存为txt文件,供程序读取,包含内容有年龄、薪资、公司、工作年限、学历、关键词等

  1. 创建状态机
class StateType(Enum):
    null = 0
    idle = 1
    start = 2
    login = 3
    waiting = 4
    init = 5
    select_account = 6
    check_chat = 7
    collect_chat = 8
    select_post = 9
    collect_info = 10
    parse_online_resume = 11
    parse_chat = 12
    parse_attach_resume = 13
    save_data = 14
    traverse_chat = 15
    monitor_message = 16
    finish = 99

用状态机的好处是既能保持各个状态独立运行,又能数据共享,如果某个状态出错,可以重新尝试,如果修改逻辑还能热加载无须已执行过程重复执行,状态之间可以任意切换

  1. 创建浏览器控制驱动
class Chrome(Browser):
    """Chrome Browser"""
    def __init__(self, name=None, home_page=None, wap=True):
        super(Chrome, self).__init__(name, home_page, wap)

    def init_play(self):
        """init virtual display"""
        super(Chrome, self).init_play()

    def init_profile(self):
        """init the Chrome profile object"""
        super(Chrome, self).init_profile()
        self.profile = webdriver.ChromeOptions()
        self.profile.add_argument('lang=zh_CN.UTF-8')
        self.profile.add_argument('disable-infobars')
        # prefs = {"profile.managed_default_content_settings.images":2}
        # self.profile.add_experimental_option("prefs", prefs)

    def init_agent(self):
        super(Chrome, self).init_agent()
        self.profile.add_argument('--ignore-certificate-errors')
        self.profile.add_argument('--ignore-ssl-errors')
        user_agent = self.get_user_agent()
        self.profile.add_argument('user-agent="%s"'%user_agent)
        try:
            ip_proxy = self.get_proxy_ip()
            if ip_proxy != None:
                # self.profile.add_extension(self.get_chrome_proxy_extension(proxy=ip_proxy))
                self.profile.add_argument("--proxy-server=%s"%ip_proxy)
        except Exception as e:
            logger.error(e)
        
    def init_driver(self):
        """init web driver"""
        super(Chrome, self).init_driver()
        self.driver = webdriver.Chrome(chrome_options = self.profile)
        self.driver.set_page_load_timeout(300)
        self.driver.set_script_timeout(60)

做一些浏览器的初始化工作,设置选项参数,比如是否加载图片等

  1. 注册心跳
    def tick(self, dt):
        self.last_state_time += dt

        if StateType.null.value == self.curr_state.value:
            self.change_state(StateType.idle)
        elif StateType.idle.value == self.curr_state.value:
            self.change_state(StateType.start)
        elif StateType.start.value == self.curr_state.value:
            self.on_start()
        elif StateType.login.value == self.curr_state.value:
            self.on_login()
        elif StateType.waiting.value == self.curr_state.value:
            self.on_waiting()
        elif StateType.init.value == self.curr_state.value:
            self.on_init()
        elif StateType.select_account.value == self.curr_state.value:
            self.on_select_account()
        elif StateType.check_chat.value == self.curr_state.value:
            self.on_check_chat()
        elif StateType.collect_chat.value == self.curr_state.value:
            self.on_collect_chat()
        elif StateType.parse_online_resume.value == self.curr_state.value:
            self.on_parse_online_resume()
        elif StateType.parse_chat.value == self.curr_state.value:
            self.on_parse_chat()
        elif StateType.parse_attach_resume.value == self.curr_state.value:
            self.on_parse_attach_resume()
        elif StateType.save_data.value == self.curr_state.value:
            self.on_save_data()
        elif StateType.select_post.value == self.curr_state.value:
            self.on_select_post()
        elif StateType.collect_info.value == self.curr_state.value:
            self.on_collect_info()
        elif StateType.traverse_chat.value == self.curr_state.value:
            self.on_traverse_chat()
        elif StateType.monitor_message.value == self.curr_state.value:
            self.on_monitor_message()
        elif StateType.finish.value == self.curr_state.value:
            self.on_finish()

心跳就如同发动机的传输带,让不同的齿轮带动不同的轮子转动

  1. 实现具体逻辑
    以某直聘网站为例,创建逻辑类继承状态机基类,实现每个状态的具体逻辑即可,最终效果如开头图片所示,不过只是其中一个逻辑类。

最后,面对疫情,从容应对,做好自己该做的事情,就是对社会的最大支持!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,204评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,091评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,548评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,657评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,689评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,554评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,302评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,216评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,661评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,851评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,977评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,697评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,306评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,898评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,019评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,138评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,927评论 2 355

推荐阅读更多精彩内容

  • 公司背景 某电子产品供应链公司,为了准备上市,需要财务部核对最近三年的购销合同与增值税发票金额、打印出纸质发票 合...
    tucao2020阅读 727评论 0 1
  • 死党王宁 教练刘曼 明天开启企业感召善款行动。意向强烈。完整计划。迫切行动。 截止到今天晚上感召资金累积数额接龙...
    All_Fine阅读 244评论 0 1
  • 在云南22天,今天回家了。 早上7点起床,运动洗漱完,7点50出出房间,到前台退房。然后在外面吃早餐,不敢吃辣的,...
    清晰思考者阅读 50评论 0 1
  • title: taking into accountdate: 2019-01-20 21:21:29NO_sen...
    董八七阅读 414评论 0 4
  • 说句实在话,打小我就有演戏的天赋,在家一个套路,去了学校又一个套路。直到后来上了大学,去了外地,这套路才固定下来。...
    莫夜戎阅读 113评论 0 0