Python操作Azure Storage Blob经验

本文不同于官网的HelloWorld式入门,它没考虑账号安全和数据量等实际应用情况

本文经验并不全面,因为一般会使用StorageExplorer和AzCopyV10,Python只是用于做下脚本操作;

搭建

  • 默认已安装好Python,已拥有Azure存储账号;
  • 安装依赖项( Git SDK地址):
pip install azure-storage-blob

创建

不应该

block_blob_service = BlockBlobService(account_name = 'accountname', account_key = 'accountkey') 

而应该

block_blob_service = BlockBlobService(account_name = 'accountname', sas_token= '连接字符串') 

使用经验:代码应尽可能不放置密钥,而是使用账号+SAS(shared access signature)的方式;官方文档的SDK说明都是使用账号+密钥的连接字符串方式,其实听危险的。应该为不同的容器获取不同的SAS,设置合理的过期时间和操作权限,做好管理工作;

遍历(list)

#可以视为“目录路径”,一般不会要列出一整个container的文件
path_preffix = "blob_path1/blob_path2"
marker = None
while True:
    generator = block_blob_service.list_blob_names(container_name, path_preffix, num_results=100, marker=marker)
#返回的是一个生成器
    for blob_name in generator:
        print(blob_name)
        marker=generator.next_marker
        if not marker:
            break
  • list_blob_names和list_blobs主要参数相同,只是返回不同,如果只是遍历操作,自然是选择IO和耗时更小的list_blob_names
  • path_preffix是路径前缀,因为不是文件系统,目录都是假的;实际影响是:1)不可能创建一个空目录,上传空目录也是非法的;2)list返回的只有blob文件,带有路径前缀的文件,不像Linux有目录文件;
  • num_results 返回结果数,类似分页,数据量大时需要分页获取,配合next_marker 可以获取全部结果

上传

block_blob_service.create_blob_from_path(container_name, local_file_name, full_path_to_file)

下载

block_blob_service.get_blob_to_path(container_name, local_file_name, full_path_to_file)

没有实际使用,所以不详述了;有需要可以了解下AzCopy的sync命令

读取文件

content = block_blob_service.get_blob_to_text(container_name, blob_name).content
  • get_blob_to_text其实也是下载的一种,同类操作有:get_blob_to_path(下载为文件),get_blob_to_byte(二进制),get_blob_to_stream(读取为流);上传create_blob_也有这四种方式;
  • blob_name是完整路径加文件名,只适合读取小文本文件;

复制

这里我希望做个操作:将一个blob文件重命名复制到另一个位置,不用下载本地修改后再上传;

copy_opt = block_blob_service.copy_blob(container_name, "target_blod_name", "source_file_url")
  • target_blod_name是要复制到的文件路径
    source_file_url是复制的Azure存储源文件的地址,https格式的url;此处需要加SAS,使用带连接字符串的URL,因为上方我是使用账号+SAS的方式连接,无法自动判断是同一个账号下的资源。哪怕加了连接字符串,但实际也是云内的操作,速度有保证
  • copy_blob会返回一个操作对象,可以查看状态;操作默认是异步的,可以通过requires_sync参数改为同步;

删除

#你真的需要删除吗?

如果对你有帮助,希望能点个关注,或者点个喜欢

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,822评论 0 10
  • ORA-00001: 违反唯一约束条件 (.) 错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。 O...
    我想起个好名字阅读 5,451评论 0 9
  • feisky云计算、虚拟化与Linux技术笔记posts - 1014, comments - 298, trac...
    不排版阅读 3,926评论 0 5
  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,467评论 0 5
  • 2017/9/5 23:04 晚上和高中同桌聊微信,我说起想开一个公众号来写写自己的小心情,他随即给我安利...
    honeyDoris阅读 452评论 0 0