crontab介绍
Linux crontab是用来定期执行程序的命令,当安装完成操作系统之后,默认便会启动此任务调度命令,所以我们可以将一些需要定期完成的操作放在crontab中,来达到自动化执行任务脚本的目的。
crond 命令每分钟会定期检查是否有要执行的工作,如果有要执行的工作便会自动执行该工作。
而linux任务调度的工作主要分为以下两类:
-
系统执行的工作:系统周期性所要执行的工作,如:备份系统数据、清理缓存
crontab [ -u user ] file
-
个人执行的工作:某个用户定期要做的工作,例如每隔10分钟检查邮件服务器是否有新信,这些工作可由每个用户自行设置
crontab [ -u user ] { -l | -r | -e }
命令解释:
crontab 是用来让使用者在固定时间或固定间隔执行程序之用,换句话说,也就是类似使用者的时程表。
-u user 是指设定指定 user 的时程表,这个前提是你必须要有其权限(比如说是 root)才能够指定他人的时程表。如果不使用 -u user 的话,就是表示设定自己的时程表。
参数说明:
-e
: 执行文字编辑器来设定时程表,内定的文字编辑器是 VI,如果你想用别的文字编辑器,则请先设定 VISUAL 环境变数来指定使用那个文字编辑器(比如说 setenv VISUAL joe)-r
: 删除目前的时程表-
-l
: 列出目前的时程表时程表的格式如下:
f1 f2 f3 f4 f5 program
其中 f1 是表示分钟,f2 表示小时,f3 表示一个月份中的第几日,f4 表示月份,f5 表示一个星期中的第几天。program 表示要执行的程序。
当 f1 为 * 时表示每分钟都要执行 program,f2 为 * 时表示每小时都要执行程序,其余类推
当 f1 为 a-b 时表示从第 a 分钟到第 b 分钟这段时间内要执行,f2 为 a-b 时表示从第 a 到第 b 小时都要执行,其余类推
当 f1 为 */n 时表示每 n 分钟个时间间隔执行一次,f2 为 */n 表示每 n 小时个时间间隔执行一次,其余类推
当 f1 为 a, b, c,... 时表示第 a, b, c,... 分钟要执行,f2 为 a, b, c,... 时表示第 a, b, c...个小时要执行,其余类推
使用者也可以将所有的设定先存放在文件中,用 crontab file 的方式来设定时程表。
使用定时任务的例子:
编辑定时任务文件:crontab -e
# 每两个小时重启一次apache
0 */2 * * * /sbin/service httpd restart
# 每天7:50开启ssh服务
50 7 * * * /sbin/service sshd start
# 每天22:50关闭ssh服务
50 22 * * * /sbin/service sshd stop
定时运行hadoop脚本
在/home/zhangyu/目录下创建一个auto_hadoop.sh文件,并在其中写入一下内容
#!/bin/bash
date >> /tmp/1.txt
hadoop jar /apps/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.4.5.jar pi 10 100 >> /tmp/1.txt
定时执行hadoop
任务脚本文件:
crontab -e
将以下内容写入定时任务脚本中:
* * * * * sh /home/zhangyu/auto_hadoop.sh