网上有很多教程关于如何从Google Drive下载文档,但是它的url构造和Google Docs似乎不一样,研究了一下怎么用命令行下载Google Docs开头的URL的文档。
一个谷歌文档的地址形如
https://docs.google.com/spreadsheets/d/1Ma8dm_rdtdfNp8ONUG5ykFHwrEg1GFC3ObOMualMVBM/edit#gid=0
可以直接下载的地址需要变更为
https://docs.google.com/spreadsheets/d/1Ma8dm_rdtdfNp8ONUG5ykFHwrEg1GFC3ObOMualMVBM/export?format=csv
其中format=csv
用于设置需要下载的格式。
之后用wget
命令下载即可
wget "https://docs.google.com/spreadsheets/d/1Ma8dm_rdtdfNp8ONUG5ykFHwrEg1GFC3ObOMualMVBM/export?format=csv" -O coe_bidding.csv
如果想使用Python下载,可以参考以下代码
import urllib.request
url = "https://docs.google.com/spreadsheets/d/1Ma8dm_rdtdfNp8ONUG5ykFHwrEg1GFC3ObOMualMVBM/export?format=csv"
urllib.request.urlretrieve(url, './data/coe_bidding.csv')
print('Successfully download data.')
之后可以通过查看文件最后修改时间来检查文档是否成功下载
t = os.path.getmtime('./data/coe_bidding.csv')
print("Last modified time:", time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(t)))
扩展阅读:
Simple URL Tricks for Google Drive You Should Know
使用gdrive在命令行中与Google Drive进行交互