什么是git仓库?
让我们来重温一下三个区域的概念:
git有三个工作区域:工作目录(Working Directory),暂存区(Staging Area)和git仓库(.git directory)(Repository)。
在每个git项目的根目录下,都会有一个.git
目录,这个目录就是git仓库。暂存区是git仓库中的一个文件(index
文件),它保存着下次要提交到git仓库的文件列表。
作为分布式版本控制系统,git中的git仓库被保存在每一份项目文件中,而没有中央服务仓库。
我们平时工作的地方,也就是项目的文件夹,叫做工作目录。
一个git仓库包括:
- 一系列提交对象(commit objects).
- 一系列指向这些提交对象的索引,叫做heads。
一个提交对象(commit objects)包括:
- 一系列文件在某个时间的快照。
- 一系列指向父提交对象的索引。
- 一个SHA-1名字,这个名字40个字符长,是独一无二的。
- 作者的姓名和邮箱,以及提交时对提交的描述。
用户在修改完版本A后提交得到版本B,版本A就是版本B的父提交对象。一个提交对象可以有多个父提交对象。
整个项目中的第一个提交对象没有父提交对象。
总的来说,git仓库包含很多提交对象,并且每个提交对象都指向自己的父提交对象,直到第一个提交对象。
head与HEAD
head只是一个指向提交对象的索引,每一个head都有一个名字。git默认有一个叫做master
的head。一个git仓库可以有多个head。
在任何时候,当前使用的head的别名叫作HEAD。
每一次提交之后,HEAD都会自动地从父提交对象指向本次提交对象。
综上所述,git仓库的示意图如下:
在提交之后,会生成新的提交对象,并且HEAD会指向新的提交对象。
修改了什么?git diff [--staged]
现在将README.txt
文件中的最后一行Git is very fast.
修改为Git is very fast and convenient.
可以得到如下结果:
$ git diff
diff --git a/README.txt b/README.txt
index f3401b9..a695b86 100644
--- a/README.txt
+++ b/README.txt
@@ -1,3 +1,4 @@
Hi, Git!
Git is a free and open source distributed version control system.
Git is very easy to learn.
+Git is very fast and convenient.
$ git add README.txt
$ git diff
$
可见,git diff
将工作目录中现在的文件状态同暂存区中的文件相比较。如果要比较暂存区中下次要提交文件同已提交文件的更改,可以使用git diff --staged
命令,这个命令会比较HEAD指向的文件版本与暂存区中的版本的区别(git diff --cached
是此命令的老用法):
$ git diff --staged
diff --git a/README.txt b/README.txt
index f14261d..a695b86 100644
--- a/README.txt
+++ b/README.txt
@@ -1,2 +1,4 @@
Hi, Git!
Git is a free and open source distributed version control system.
+Git is very easy to learn.
+Git is very fast and convenient.
就像之前所说,HEAD指向当前的提交对象,因此git diff HEAD -- README.txt
可以比较当前git仓库中的文件版本和工作目录中的文件版本。
移除文件 git rm [-f | --cached]
如果要从已被跟踪的文件列表中删除某个文件,可以使用git rm
命令,它会同时删除工作目录中的文件。如果文件已经被修改并且纳入暂存区,那么需要使用-f
选项。下面是一个例子,省略了部分输出:
$ touch a.txt
$ git add a.txt
$ git commit -m "add a.txt"
$ ls
a.txt README.txt
$ git status
On branch master
Changes to be committed:
(use "git reset HEAD <file>..." to unstage)
deleted: a.txt
$ git commit -m "delete a.txt"
$ ls
README.txt
如果仍然需要在工作目录中使用该文件,而不想被跟踪,可以使用--cached
选项。
$ touch b.txt
$ git add b.txt
$ git commit -m "add b.txt"
$ git rm --cached b.txt
$ git commit -m "delete cached b.txt"
$ git status
On branch master
Untracked files:
(use "git add <file>..." to include in what will be committed)
b.txt
nothing added to commit but untracked files present (use "git add" to track)
重命名文件 git mv
使用git mv
命令对文件进行重命名:
$ git mv README.txt README.md
$ git status
On branch master
Changes to be committed:
(use "git reset HEAD <file>..." to unstage)
renamed: README.txt -> README.md
忽略文件 .gitignore
项目中可能有一些文件不需要,或者不应该被git跟踪,比如私人配置文件、日志文件、临时文件等。这时候就用到了.gitignore
文件,最好在项目一开始就配置好这个文件,以免将来错误的提交此类文件。.gitignore
文件中记录的文件列表不会被git跟踪。
现在以a.txt
为例,将它加到.gitignore
文件中:
$ echo "a.txt" >> .gitignore
$ git add .gitignore ; git commit -m "add a.txt to .gitignore"
$ touch a.txt
$ git status
On branch master
nothing to commit, working directory clean
可见,虽然a.txt
是新的文件,但是git却现实工作目录是干净的,原因就是a.txt
被加到了.gitignore
中。
.gitignore
文件的语法如下:
-
#
开头的行表示注释,都会被 Git 忽略。 - 可以使用标准的 glob 模式匹配。
- 匹配模式可以以(
/
)开头防止递归。 - 匹配模式可以以(
/
)结尾指定目录。 - 要忽略指定模式以外的文件或目录,可以在模式前加上惊叹号(
!
)取反。
标准的glob模式指的是:
-
*
表示匹配零或者任意多个任意字符; -
[abc]
表示匹配括号中的任意一个字符,此例表示比配一个a,或者一个b,或者一个c。 -
?
表示匹配任意一个字符; - 方括号中用短线表示断线两端内的字符会被匹配,
[0-9]
表示会匹配0至9之间的数字。 -
**
表示任意中间目录,比如a/**/z
匹配a目录中的z文件,中间可以有零至多级目录。
下面的例子来自《Pro Git》(written by Scott Chacon and Ben Straub and published by Apress)书籍,2.2节,遵循Creative Commons Attribution Non Commercial Share Alike 3.0 license协议。本文遵循相同协议。我对原本例子进行了翻译。这是一个.gitignore
文件的例子:
# 忽略 .a 文件
*.a
# 跟踪 lib.a, 即使在上一句中已经忽略了 .a 文件
!lib.a
# 仅仅忽略本目录的 TODO,不要忽略子目录的 TODO
/TODO
# 忽略 build 目录中的所有文件
build/
# 忽略 doc/notes.txt, 但会跟踪 doc/server/arch.txt
doc/*.txt
# 忽略所有的 doc/ 目录中的 .pdf 文件
doc/**/*.pdf
GitHub上有数十种语言的.gitignore
文件,请移步 https://github.com/github/gitignore。