爬虫实现力扣(LeetCode)本地刷题的快捷工具

相信大家都在力扣上刷过题,力扣上虽然能在线写题,但在线编译运行的速度先对于本地运行还是比较慢,且一些自动补全的功能也不如自己的IDE优秀,因此,我们一般会在本地建个小项目解题,解完后再复制到力扣上提交。为了方便我们在本地快速搭建起力扣的解题环境,我写了一个小工具帮助我们把力扣的题目描述爬取到本地,并生成基础的代码,这样我们就能快速地专注于解题本身了。接下来我将展示一下工具的使用效果,并向大家提供源代码及部署方式。

未经允许请勿转载! 文章首发于爬虫实现力扣(LeetCode)本地刷题的快捷工具 | MakerHu的博客

效果演示

  1. 复制路径中的题目英文名
路径中的题目英文名
  1. 运行打包好的jar包

    运行打包好的jar包
  2. 打开本地项目

    打开本地项目
  3. 开始本地专注解题

    本地解题

是不是非常地方便快捷😁

如果你也想拥有一个这样的工具就接着往下看吧,二十分钟之内你也能实现上述的效果哈!

项目部署与打包

准备

环境要求:

  • jdk1.8(最好是1.8,其他版本我没有试过)
  • Maven
  • git
  • IDEA(当然也能用你喜欢的集成开发环境)
  • IDEA安装markdown插件(为的是能够有上述题目在本地的显示效果,否则可能显示的是纯文本)

具体的环境搭建我就不教学了,网上的教程非常多且详细,相信大家都能搭建起来。

克隆项目到本地

项目地址:

MakerHu/LeetCodeSpiderJava: 爬取力扣的题目并在本地生成基础的项目文件 (github.com)

  1. 打开IDEA,点击Git->Clone

    点击Git->Clone
  2. 点击上方的项目地址,复制仓库的url

    image
  3. 将url粘贴到刚刚打开的Clone窗口中,并选择项目位置,点击Clone

    把项目克隆到本地
  4. 稍等一会儿,等项目依赖自动配置完后点击启动类中的运行

    运行项目
  5. 若显示下面的运行结果则说明项目运行成功了

    项目运行成功

创建本地刷题项目

我们把刷题和爬取题目的项目分离开来,为的是解耦,也方便之后的迁移与重用。

这里我将演示创建一个基础的java项目,当然你也可以创建Maven项目等,因为爬虫工具的原理是在某个文件夹下创建文件夹,并将题目内容markdown文件及基础代码创建到该文件夹下。

  1. 创建一个基础的java项目

    image
    image
    image

在爬虫项目的配置文件中配置基本信息

打开爬虫项目的配置文件

image

配置文件settings.properties

# Java项目中要存放解题的根文件夹,如 E:/LeetCode/src/com/leetcode
question_location = E:/000_collection/myLeetCode/src/com/leetcode

# 解题所在的包 如:com.leetcode 若没有(也就是放在src文件夹下)则为空
base_package = com.leetcode

# 解题文件夹名称的前缀(可以是任意字符串)
folder.prefix = p
# 解题文件夹是否包含力扣题目名(true 或 false)
folder.include_question_name = true
# 解题文件夹是否按照时间分类(true 或 false)
sort_by_time = true

# 用来存储题目信息的markdown文件的前缀(可以是任意字符串)
question_markdown_filename.prefix = p
# 用来存储题目信息的markdown文件名是否包含题目编号(true 或 false)
question_markdown_filename.include_question_id = true

# 用来存储题目信息的markdown文件名是否包含题目名以及是否用中文题目名命名(true 或 false)
question_markdown_filename.include_question_name = true
question_markdown_filename.zh_cn = true

配置基本路径及基础包

基本路径:question_location

在settings.proterties配置文件中的属性question_location表示解题的根路径,爬虫创建的文件夹将会放到该路径下。

以上面示例中的question_location = E:/000_collection/myLeetCode/src为例,比如说爬取了题号为22的题目,则会在E:/000_collection/myLeetCode/src文件夹下创建p22文件夹,最终得到E:/000_collection/myLeetCode/src/p22

注意:配置的路径中的斜杠必须是正斜杠/,别写成反斜杠了!!!

基础包:base_package

在settings.proterties配置文件中的属性base_package表示解题所在的包,这要与基本路径question_locationsrc之后的路径对应,否则会出错。

示例1:

若 question_location = E:/000_collection/myLeetCode/src
则 base_package =
没错,base_package就等于空,因为question_location中的src就是包的根位置

示例2:

若 question_location = E:/000_collection/myLeetCode/src/com/leetcode
则 base_package = com.leetcode

对于上述的两个示例的情况,我分别实际演示一下如何配置。

示例1:将题目爬取到src

  1. 打开刚刚创建的解题项目,右键src->Copy Path->Absloute Path,也就是复制src的本地绝对路径,也可以直接到资源管理器中复制

    复制路径
    复制路径
  2. 将刚复制的路径粘贴到爬虫项目的settings.properties配置文件中的question_location

    # Java项目中要存放解题的根文件夹,如 E:/LeetCode/src/com/leetcode
    question_location = E:\000_collection\myLeetCode\src
    

    注意,此时的路径为反斜杠,将其都改为斜杠/

    修改后:

    # Java项目中要存放解题的根文件夹,如 E:/LeetCode/src/com/leetcode
    question_location = E:/000_collection/myLeetCode/src
    
  3. 爬虫项目的settings.properties配置文件中的base_package属性等号之后置为空

    # 解题所在的包 如:com.leetcode 若没有(也就是放在src文件夹下)则为空
    base_package = 
    

示例2:将题目爬取到指定的包下

假设我的解题项目中存在包com.leetcode,我要将题目爬取到这个包下。

  1. 打开解题项目,右键leetcode->Copy Path->Absloute Path,也就是复制leetcode的本地绝对路径,也可以直接到资源管理器中复制

    复制路径
  2. 将刚复制的路径粘贴到爬虫项目的settings.properties配置文件中的question_location

    # Java项目中要存放解题的根文件夹,如 E:/LeetCode/src/com/leetcode
    question_location = E:\000_collection\myLeetCode\src\com\leetcode
    

    注意,此时的路径为反斜杠,将其都改为斜杠/

    修改后:

    # Java项目中要存放解题的根文件夹,如 E:/LeetCode/src/com/leetcode
    question_location = E:/000_collection/myLeetCode/src/com/leetcode
    
  3. 爬虫项目的settings.properties配置文件中的base_package属性设置为刚刚选择的包,也就是将src之后的路径中的斜杠改为点,或者你可以在刚刚选择的包(leetcode)中随便创建一个类,看一下第一行的package是什么就复制过来,别带分号就行。

    # 解题所在的包 如:com.leetcode 若没有(也就是放在src文件夹下)则为空
    base_package = com.leetcode
    

    不确定的话就随便在这个包下创建一个类,看一下第一行是啥,然后再把这个类删了

    查看包

配置其他属性

除了question_locationbase_package的配置比较重要外,其他的配置都是与文件夹命名方式或文件命名方式有关的配置,使用默认的也挺好的。具体可以看配置文件中的注释尝试修改修改,并看看爬取后的效果,这里就不做详细的解释了,相信大家都看懂或者试出差别。这里就再把配置文件放出来吧。

settings.properties文件:

# Java项目中要存放解题的根文件夹,如 E:/LeetCode/src/com/leetcode
question_location = E:/000_collection/myLeetCode/src/com/leetcode

# 解题所在的包 如:com.leetcode 若没有(也就是放在src文件夹下)则为空
base_package = com.leetcode

# 解题文件夹名称的前缀(可以是任意字符串)
folder.prefix = p
# 解题文件夹是否包含力扣题目名(true 或 false)
folder.include_question_name = true
# 解题文件夹是否按照时间分类(true 或 false)
sort_by_time = true

# 用来存储题目信息的markdown文件的前缀(可以是任意字符串)
question_markdown_filename.prefix = p
# 用来存储题目信息的markdown文件名是否包含题目编号(true 或 false)
question_markdown_filename.include_question_id = true

# 用来存储题目信息的markdown文件名是否包含题目名以及是否用中文题目名命名(true 或 false)
question_markdown_filename.include_question_name = true
question_markdown_filename.zh_cn = true

爬取题目到本地

直接运行爬虫项目爬取

  1. 运行项目

    运行爬虫
  2. 输入力扣中题目的英文名(地址栏中的),回车

    image
    输入题目英文名
  3. 完成

    题目生成完毕

将项目打成jar包后爬取

通过上面的方式已经能实现我们要的功能了,但是有个缺点就是每次都要打开项目运行,相对比较麻烦。我们可以将该项目打包成jar包,之后只要运行jar包就能运行了,且配置文件会从jar包中分离出来,可以随时修改配置,非常方便。

  1. 回到爬虫项目中,首先双击右侧的Maven->Lifecycle->clean当运行结束后,再双击Maven->Lifecycle->package

    打包项目
  2. 此时左侧会出现target文件夹,将打好的jar包(SNAPSHOT结尾的)复制出来,放到任意一个空文件夹里

    复制打好的jar包
  3. 可以先将复制出来的jar包重命名个短点的名字,然后打开jar包所在的文件夹,在地址栏中输入cmd

    打开命令行窗口
  4. 输入命令java -jar 包名.jar,因为我的包名重命名为LeetCodesSpider所以我输入的命令就是java -jar LeetCodeSpider.jar

    此时会报错,系统找不到指定的路径,因为我将配置文件从jar包中分离出来了,但我们还没将配置文件放到指定的位置,所以找不到。

    E:\000_collection\LeetCodeTool>java -jar LeetCodeSpider.jar
    java.io.FileNotFoundException: src\main\resources\settings.properties (系统找不到指定的路径。)
            at java.io.FileInputStream.open0(Native Method)
            at java.io.FileInputStream.open(Unknown Source)
            at java.io.FileInputStream.<init>(Unknown Source)
            at java.io.FileInputStream.<init>(Unknown Source)
            at config.Settings.<init>(Settings.java:14)
            at SpiderApplication.main(SpiderApplication.java:15)
            at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
            at sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)
            at sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)
            at java.lang.reflect.Method.invoke(Unknown Source)
            at org.springframework.boot.loader.MainMethodRunner.run(MainMethodRunner.java:48)
            at org.springframework.boot.loader.Launcher.launch(Launcher.java:87)
            at org.springframework.boot.loader.Launcher.launch(Launcher.java:51)
            at org.springframework.boot.loader.JarLauncher.main(JarLauncher.java:52)
    请输入LeetCode中题目的英文名(见浏览器路径,不带斜杠):
    

    既然找不到,我们就创建对应文件夹并把配置文件放到里面去就行了。

    将报错中的src\main\resources复制下来。重新打开jar包所在的文件夹,在地址栏中输入cmd,之后输入命令创建文件夹

    mkdir src\main\resources

    现在打开jar包所在的文件夹我们就能看到刚创建好的文件夹了。

    image

    接着我们将爬虫项目中的settings.properties文件复制到src\main\resources文件夹下

    复制配置文件到指定文件夹

    到这里还没有结束。由于我们爬取题目后会生成一些基础的代码,包括Main.javaSolution.java,而这两个文件是根据两个模板文件生成的,因此我们也要将两个模板文件放到src\main\resources中。

    进入爬虫项目,复制resources文件夹下的整个template文件夹,将其粘贴到刚刚在jar包同级目录中创建的src\main\resources文件夹下。

    复制template文件夹
    放到与settings.properties同级目录中

    再次在jar包所在目录打开cmd输入命令java -jar 包名.jar就能正常使用了!

  5. 编辑配置文件

    由于配置文件与jar包分离,所以只要源代码没变,要想修改什么配置直接在jar包所在目录下的配置文件src\main\resources\settings.properties中修改配置属性就行了,可以用记事本vscode等任意你喜欢的文本编辑器打开修改。

常见问题

  1. 解题时题目图片显示不出来,可能是IDEA开了代理,关了就行

    File->settings->Appearance & Behavior->System Settings->HTTP Proxy

    关闭代理
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容