文件上传

当Django在处理文件上传的时候,文件数据被保存request.FILES 。这篇文档阐述文件如何上传到内存和硬盘,以及如何自定义默认的行为。

基本的文件上传

假设一个表达中有一个FileField

from django import forms
class UploadFileForm(forms.Form):
    title = forms.CharField(max_length=50)
    file = forms.FileField()

处理这个表单的视图会在request中接收到上传文件的数据。FILES是个字典,它包含每个FileField(或者 [ImageField,FileField的子类)。这样的话就可以用request.FILES['file']来存放表单中的这些数据了。注意request.FILES 只有在请求方法为POST,并且发送请求的<form>拥有enctype="multipart/form-data"属性时,才会包含数据。否则request.FILES为空。

from django.http import HttpResponseRedirect
from django.shortcuts import render
from .forms import UploadFileForm
from somewhere import handle_uploaded_file  #处理上传文件的函数
def upload_file(request):
    if request.method == 'POST':
        form = UploadFileForm(request.POST, request.FILES)  #注意我们必须向表单的构造器中传递request.FILES这是文件数据绑定到表单的方法。
        if form.is_valid():
            handle_uploaded_file(request.FILES['file'])
            return HttpResponseRedirect('/success/url/')
    else:
        form = UploadFileForm()
    return render(request, 'upload.html', {'form': form})

下面是通常处理上传文件的方法

def handle_uploaded_file(f):
    with open('some/file/name.txt', 'wb+') as destination:
        for chunk in f.chunks():
            destination.write(chunk)
>>>遍历UploadedFile.chunks(),而不是使用read(),能确保大文件并不会占用系统过多的内存。

使用模型处理上传文件

如果你Model上使用FileField保存文件,使用ModelForm可以让这个操作更加容易。调用form.save()的时候,文件对象会保存在相应的FileField的upload_to参数指定的地方。

class MyModel(models.Model):  #用模型处理上传文件
    # file will be uploaded to MEDIA_ROOT/uploads
    upload = models.FileField(upload_to='uploads/')
    # file will be saved to MEDIA_ROOT/uploads/2015/01/30
    upload = models.FileField(upload_to='uploads/%Y/%m/%d/')
from django.http import HttpResponseRedirect
from django.shortcuts import render
from .forms import ModelFormWithFileField
def upload_file(request):
    if request.method == 'POST':
        form = ModelFormWithFileField(request.POST, request.FILES) #表单对象 与相应的model绑定
        if form.is_valid():
            # file is saved
            form.save()
            return HttpResponseRedirect('/success/url/')
    else:
        form = ModelFormWithFileField()
    return render(request, 'upload.html', {'form': form})

如果你手动构造一个对象,你可以简单地把文件对象从request.FILE赋值给模型:

from django.http import HttpResponseRedirect
from django.shortcuts import render
from .forms import UploadFileForm
from .models import ModelWithFileField
def upload_file(request):
    if request.method == 'POST':
        form = UploadFileForm(request.POST, request.FILES)  #表单对象,可能没有与model绑定
        if form.is_valid():
            instance = ModelWithFileField(file_field=request.FILES['file']) #文件model。与普通的从form中取出数据不同,form.cleaned_data['字段']
            instance.save()
            return HttpResponseRedirect('/success/url/')
    else:
        form = UploadFileForm()
    return render(request, 'upload.html', {'form': form})

上传多份文件

用一个form field上传多个文件,则需要在相应的form的field中设置multiple属性

from django import forms
class FileFieldForm(forms.Form):
    file_field = forms.FileField(widget=forms.ClearableFileInput(attrs={'multiple': True}))
继承内置View
from django.views.generic.edit import FormView
from .forms import FileFieldForm
class FileFieldView(FormView):
    form_class = FileFieldForm
    template_name = 'upload.html'  # Replace with your template.
    success_url = '...'  # Replace with your URL or reverse().
    def post(self, request, *args, **kwargs):
        form_class = self.get_form_class()
        form = self.get_form(form_class)
        files = request.FILES.getlist('file_field')  #获取多个文件的方法
        if form.is_valid():
            for f in files:
                ...  # Do something with each file.
            return self.form_valid(form)
        else:
            return self.form_invalid(form)

上传处理器

当用户上传一个文件的时候,Django会把文件数据传递给上传处理器 – 一个小型的类,会在文件数据上传时处理它。上传处理器在FILE_UPLOAD_HANDLERS中定义,默认为:

["django.core.files.uploadhandler.MemoryFileUploadHandler",
 "django.core.files.uploadhandler.TemporaryFileUploadHandler"]

MemoryFileUploadHandler和TemporaryFileUploadHandler一起提供了Django的默认文件上传行为,将小文件读取到内存中,大文件放置在磁盘中。你可以编写自定义的处理器,来定制Django如何处理文件。例如,你可以使用自定义处理器来限制用户级别的配额,在运行中压缩数据,渲染进度条,甚至是向另一个储存位置直接发送数据,而不把它存到本地。关于如何自定义或者完全替换处理器的行为,详见编写自定义的上传处理器

上传数据在哪里储存

在你保存上传文件之前,数据需要储存在某个地方。通常,如果上传文件小于2.5MB,Django会把整个内容存到内存。这意味着,文件的保存仅仅涉及到从内存读取和写到磁盘,所以非常快。但是,如果上传的文件很大,Django会把它写入一个临时文件,储存在你系统的临时目录中。在类Unix的平台下,你可以认为Django生成了一个文件,名称类似于/tmp/tmpzfp6I6.upload。如果上传的文件足够大,你可以观察到文件大小的增长,由于Django向磁盘写入数据。这些特定值 – 2.5 MB,/tmp,以及其它 -- 都仅仅是"合理的默值"。

更改上传处理器的行为

Django的文件上传处理器的行为由一些设置控制。详见文件上传设置

DEFAULT_FILE_STORAGE
FILE_CHARSET
FILE_UPLOAD_HANDLERS
FILE_UPLOAD_MAX_MEMORY_SIZE
FILE_UPLOAD_PERMISSIONS
FILE_UPLOAD_TEMP_DIR
MEDIA_ROOT
MEDIA_URL
在运行中更改上传处理器

有时候一些特定的视图需要不同的上传处理器。在这种情况下,你可以通过修改request.upload_handlers,为每个请求覆盖上传处理器。通常,这个列表会包含FILE_UPLOAD_HANDLERS提供的上传处理器,但是你可以把它修改为其它列表。例如,假设你编写了ProgressBarUploadHandler,它会在上传过程中向某类AJAX控件提供反馈。你可以像这样将它添加到你的上传处理器中:

request.upload_handlers.insert(0, ProgressBarUploadHandler(request))

在这种情况下你可能想要使用list.insert()(而不是append()),因为进度条处理器需要在任何其他处理器 之前执行。要记住,多个上传处理器是按顺序执行的。
如果你想要完全替换上传处理器,你可以赋值一个新的列表:

request.upload_handlers = [ProgressBarUploadHandler()]

你只可以在访问request.POST或者request.FILES之前修改上传处理器-- 在上传处理工作执行之后再修改上传处理就毫无意义了。
如果你在读取request.FILES之后尝试修request.upload_handlers,Django会抛出异常。所以,你应该在你的视图中尽早修改上传处理器。CsrfViewMiddleware也会访问request.POST,它是默认开启的。这意味着你需要在你的视图中使用csrf_exempt()来允许你修改上传处理器。然后你需要在真正处理请求的函数上使用csrf_protect()注意这意味着处理器可能会在CSRF验证完成之前开始接收上传文件。例如:

from django.views.decorators.csrf import csrf_exempt, csrf_protect
@csrf_exempt
def upload_file_view(request):
    request.upload_handlers.insert(0, ProgressBarUploadHandler(request))
    return _upload_file_view(request)
@csrf_protect
def _upload_file_view(request):
    ... # Process request

上传文件与上传文件处理过程

class UploadedFile
在文件上传期间,实际文件数据存储在request.FILES中。此字典中的每个条目都是UploadedFile对象(或子类) - 上传文件的简单包装器。您通常会使用以下方法之一访问上传的内容:

<li> UploadedFile.read()
从文件中读取整个上传的数据。如果上传的文件是巨大的,如果你尝试读取它到内存中,它可以压倒你的系统。
<li> UploadedFile.multiple_chunks(chunk_size=None)
如果上传的文件足够大,需要在多个块中读取,则返回True。默认情况下,这将是任何大于2.5兆字节的文件,但这是可配置的
<li> UploadedFile.chunks(chunk_size=None)
一个生成器返回文件的块。如果multiple_chunks()是True,您应该在循环中使用此方法,而不是read()。在实践中,通常最简单的是使用chunks()。在chunks()上循环,而不是使用read()确保大文件不会超过系统内存
<li> UploadedFile.name
已上传文件的名称(例如my_file.txt)
<li> UploadedFile.size
上传文件的大小(以字节为单位)
<li> UploadedFile.content_type
随文件上传的内容类型标题(例如text / plain或application / pdf)。与用户提供的任何数据一样,您不应该相信上传的文件实际上是此类型。您仍然需要验证该文件包含内容类型标题声明的内容 - “信任但验证”。
<li> UploadedFile.content_type_extra
包含传递到content-type标头的额外参数的字典。这通常由服务(例如Google App Engine)提供,代表您拦截和处理文件上传。因此,您的处理程序可能不会收到上传的文件内容,而是一个URL或其他指向文件的指针。
<li> UploadedFile.charset
对于text / *内容类型,字符集(即,utf8)。再次,“信任,但验证”是这里的最好的政策

UploadedFile的子类

*class *TemporaryUploadedFile()
上传到临时位置的文件流到磁盘)。此类由TemporaryFileUploadHandler使用。除了来自UploadedFile的方法,它还有一个额外的方法:

TemporaryUploadedFile.temporary_file_path()
返回临时上传文件的完整路径。

*class *InMemoryUploadedFile
上传到存储器中的文件(即,流到存储器)。此类MemoryFileUploadHandler使用。

内置上传处理器

MemoryFileUploadHandler和TemporaryFileUploadHandler一起提供Django的默认文件上传行为,将小文件读入内存,大文件读入磁盘。它们位于django.core.files.uploadhandler中。
*class *MemoryFileUploadHandler
文件上传处理程序将流上传到内存(用于小文件)。
*class *TemporaryFileUploadHandler
使用TemporaryUploadedFile将数据流传输到临时文件的上传处理程序。

编写自定义上传处理器

*class *FileUploadHandler所有文件上传处理程序应该是django.core.files.uploadhandler.FileUploadHandler的子类。你可以定义上传处理程序,无论你想要什么。

必须实现的方法

<li>FileUploadHandler.receive_data_chunk(raw_data, start)
从文件上传接收一个“数据块”的数据。
raw_data是包含上传数据的字节字符串。
start是文件中raw_data块开始的位置。
您返回的数据将送入后续的上传处理程序的receive_data_chunk方法。这样,一个处理程序可以是用于其他处理程序的“过滤器”。
从receive_data_chunk返回None,以便让剩余的上传处理程序获取此块。如果您自己存储上传的数据,并且不希望未来的处理程序存储数据副本,那么此功能非常有用。如果您产生StopUpload或SkipFile异常,上传将中止或文件将被完全跳过。

<li>FileUploadHandler.file_complete(file_size)
文件完成上传时调用。处理程序应返回将存储在request.FILES中的UploadedFile对象。处理程序也可以返回None以指示UploadedFile
对象应来自后续的上传处理程序。

可选方法

自定义上传处理程序还可以定义以下任何可选方法或属性:
<li>FileUploadHandler.chunk_size
Django应该存储到内存并馈入处理程序的“块”的大小(以字节为单位)。也就是说,此属性控制送入FileUploadHandler.receive_data_chunk的块的大小。
为了获得最佳性能,块大小应可由4整除,且大小不应超过2 GB(2 31字节)。当有多个处理程序提供多个块大小时,Django将使用任何处理程序定义的最小块大小。默认值为64 * 2 10字节,或64 KB。
<li>FileUploadHandler.new_file(field_name, file_name, content_type, content_length, charset, content_type_extra)
回调信号表示新文件上传正在开始。这在任何数据被馈送到任何上传处理程序之前被调用。

field_name是文件<input>字段的字符串名称。

file_name是浏览器提供的unicode文件名。

content_type是浏览器提供的MIME类型,例如'image/jpeg'。

content_length是浏览器给出的图像的长度。有时这将不提供,将None。

charset是字符集(即utf8)。像content_length,有时不会提供。

content_type_extra是来自content-type标头的有关文件的额外信息。

<li>FileUploadHandler.upload_complete()
回调信号表示整个上传(所有文件)已完成。

<li>FileUploadHandler.handle_raw_input
(input_data, META, content_length, boundary, encoding)允许处理程序完全覆盖原始HTTP输入的解析。
input_data是支持read()的类文件对象。
META与request.META具有相同的对象。
content_length是input_data中数据的长度。不要从input_data读取超过content_length个字节。
boundary是此请求的MIME边界。
encoding是请求的编码。
如果您想要继续上传处理,或返回(POST, FILES)的元组,请返回None以直接返回适合该请求的新数据结构。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,542评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,596评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,021评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,682评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,792评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,985评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,107评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,845评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,299评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,612评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,747评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,441评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,072评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,828评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,069评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,545评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,658评论 2 350

推荐阅读更多精彩内容