Git 仓库瘦身方法

仓库瘦身方法

问题

  • 为什么瘦身?
    • 由于每个人都必须下载文件,因此获取代码库的速度变慢。
    • 它们占用服务器上的大量存储空间。
    • 会达到Git仓库的存储限制。
    • 个人电脑硬盘空间有限,仓库较多时,占用了大量存储空间。
  • 为什么二进制大文件是个问题?
    • 在 git 中,所有和你共用一个库的人,当他们把库下载下来时,他们会得到你这个项目的完整历史记录。一般情况下这没什么问题——真正的代码只占很少体积,但拥有完整的历史记录使你能够实施分布式的合作、快速得到 diff 结果以及更多的便利——但项目的历史记录会慢慢膨胀。如果你提交了大文件——比如 100MB 以上——你仓库的体积会飞速增长,并且当其他人 clone 这个仓库的时候,他们要下载的数据就更多了。最终你会意识到你犯了一个错误,但是就算你决定要通过一个 commit 来删除这些文件,它们其实还在那儿,在你的历史数据中,下载整个仓库所花的时间不会有任何变化

方案

  • Git 命令
  • BFG Repo-Cleaner
    • git-filter-branch 的替代品 用 Scala 写 BFG Repo-Cleaner ,Scala 很适合去处理 git 的不可变数据结构,并且能利用并行开发的优势。
    • 速度更快
      • 在 git 中,所有文件和文件夹的数据都只存储一次,并且每个都会有一个独一无二的 id——git-id。如果大量的 commit 都没有修改某个文件,那么这个文件只会被保存一次。如果这个文件有两个版本,并且需要在两个版本间来回切换,这个文件只会存储两次,每个版本各一次。所以,如果一个文件只存储一次,因为它出现在 100 个 commit 中,就要对它清理 100 次,这肯定是不现实的。BFG 只对 git 库中的每个对象清理一次,然后记住它的 git-id,以后遇到它,不把它计算在内就行了。我们对功能做了限制——git-filter-branch 能让你做任何事,而 BFG 不行——以此换来性能上的巨大改进。
        速度的提升还受益于没有进程间的切换(JVM 会搞定一切,不需要在 C 代码和 bash 代码间来回切),以及能充分利用你的多核电脑。我很高兴看到 BFG 会使你所有的处理器核发烫,每个核都在尽其所能地删除文件和目录——但是很不幸 git-filter-branch 只能串行处理工作,一个接一个地处理 commit——前一个处理完之前,无法开始下一个。BFG 的速度明显是一大优势。

实现(选择BFG Repo-Cleane 操作简单 速度更快)

  • BFG Repo-Cleaner (https://rtyley.github.io/bfg-repo-cleaner/
    1. 首先删除不想要文件 并提交
      rm file-to-delete
      git commit -m "删除大文件"
      git push"
    2. 下载官网的程序包。例如我这里下载的为bfg-1.14.0.jar,之后将程序包放到一个项目文件夹里,重命名为bfg.jar 。这是一个Java程序,使用的话需要安装Java运行环境(https://www.java.com/en/download/manual.jsp)。
    3. clone自己的git repo,使用--mirror参数。
      git clone --mirror git@github.com:12134/XXXX.git
    4. 清除大文件、文件夹和检索大文件 命令
      java -jar bfg.jar --delete-files 123.png XXXX.git (删除文件)
      java -jar bfg.jar --delete-folders Pods XXXX.git (删除文件夹)
      java -jar bfg.jar --strip-blobs-bigger-than 100M XXXX.git(大于100M文件)
    5. 执行完 有一个问题,这种情况bfg会保护当前版本(HEAD所指的版本),不去清理。提示如下。
      These are your protected commits, and so their contents will NOT be altered: commit ******* (protected by 'HEAD')
      如果说当前版本已经没有问题,那么这么使用没有问题。
      但是我的当前版本也是有需要删除的文件的,在谷歌搜索了一下,找到了解决方法。
      在命令行下加入--no-blob-protection命令,可以解除保护。使用的命令如下。
      java -jar bfg.jar --delete-files 123.png XXXX.git --no-blob-protection
      java -jar bfg.jar --delete-folders Pods XXXX.git --no-blob-protection
  1. 在完成上面的指令后,实际上这些数据/文件并没有被直接删除,这时候需要使用git gc指令来清除。
    cd XXXX.git
    git reflog expire --expire=now --all && git gc --prune=now --aggressive
  2. 最后,更新完本地仓库后,将数据推送到GitHub远程仓库。按照官网描述,由于之前使用了--mirror参数,推送时会推送所有内容。(push完成之后放弃旧存储库副本重新clone)
    git push

实现结果

需要测试请上码云建仓库测试
GitHub会报下面的错
[remote rejected] refs/pull/1/head -> refs/pull/1/head (deny updating a hidden ref)
问题详情(https://stackoverflow.com/questions/34265266/remote-rejected-errors-after-mirroring-a-git-repository
GitHub所有已清除的拉请求历史记录都没有被清除。如果希望你的拉请求,以及它们引用的所有提交/历史记录都删除,那么在GitHub上的总回购大小可以缩小(除了已经缩小的默认克隆的大小之外),需要联系GitHub支持

WechatIMG219.png

WechatIMG221.png
WechatIMG222.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容