Python实现搜索关键字定位文件02

上一篇已经介绍了如何通过终端命令检索出包含关键字的文件和所处段落内容,但终端模式毕竟不符合用户习惯,所以基于Django框架快速构建一个网站来实现该功能。



Django是一个开放源代码的Web应用框架,由Python写成。Django是一个基于MVC构造的框架。但是在Django中,控制器接受用户输入的部分由框架自行处理,所以 Django 里更关注的是模型(Model)、模板(Template)和视图(Views),称为 MTV模式。它们各自的职责如下:

层次 职责
模型(Model),即数据存取层 处理与数据相关的所有事务: 如何存取、如何验证有效性、包含哪些行为以及数据之间的关系等。
模板(Template),即表现层 处理与表现相关的决定: 如何在页面或其他类型文档中进行显示。
视图(View),即业务逻辑层 存取模型及调取恰当模板的相关逻辑。模型与模板的桥梁。

想要深入了解Django,可以进入Django文档学习,这里就不做详细介绍了。由于没有用到数据库,我们用不到Model,主要是View、Template和配置路由urls。
1、编写view代码
这里我新建项目名称为myword、app名称为findwords。目录结构如下:


还是基于上一篇思想方法,将获取文件内容以及检索文件的逻辑写进views.py文件中:

#-*- coding: UTF-8 -*-
from django.shortcuts import render
from django.template.loader import get_template
from django.http import HttpResponse, JsonResponse
from django.utils import timezone
from django.views.decorators.csrf import csrf_exempt
from     import Document
import os,sys,datetime
import logging
import json

logging = logging.getLogger('reso_logger')
# Create your views here.

# 解决datetime、date格式数据无法json序列化问题
class DateEncoder(json.JSONEncoder):  
    def default(self, obj):  
        if isinstance(obj, datetime.datetime):  
            return obj.strftime('%Y-%m-%d %H:%M:%S')
        elif isinstance(obj, datetime.date):
            return obj.strftime("%Y-%m-%d")  
        else:  
            return json.JSONEncoder.default(self, obj) 

def index(request):
    return HttpResponse("Hello, world. You're at the findwords index.")

def search_string(filename,string):
    #打开文档
    document = Document(filename)
    # document = Document(r'C:\Users\Cheng\Desktop\kword\words\wind.docx')
    print filename
    #读取每段资料
    l = [ paragraph.text for paragraph in document.paragraphs];
    # l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
    #输出并观察结果,也可以通过其他手段处理文本即可
    fileword = []
    for i in l:
        i=i.strip()
        # print i
        if i.find(string)!=-1:
            changetime = datetime.datetime.fromtimestamp(os.path.getmtime(filename)).strftime('%Y-%m-%d %H:%M:%S')
            logging.info(changetime)
            # print filename, i
            fword = filename+">>>>>"+changetime+">>>>>"+i
            fileword.append(fword)
    # logging.info(fileword)
    return fileword

#遍历该目录下的所有文件,返回‘目录+文件名’列表
def get_process_files(root_dir):
    """process all files in directory"""
    cur_dir=os.path.abspath(root_dir)
    file_list = []
    for file in os.listdir(cur_dir):
        u_file = file.decode('gbk')
        file_list.append(u_file)
    logging.info(file_list)
    process_list=[]
    for file in file_list:
        fullfile=cur_dir+"\\"+file
        if os.path.isfile(fullfile):
            process_list.append(fullfile)
        elif os.path.isdir(fullfile):
            dir_extra_list=get_process_files(fullfile)
            if len(dir_extra_list)!=0:
                for x in dir_extra_list:
                    process_list.append(x)
    # print process_list
    return process_list

def count_files(root_dir,string):
    process_list=get_process_files(root_dir)
    logging.info(process_list)
    f_result = []
    for files in process_list:
        f_result.append(search_string(files, string))
    return f_result

def findwords(requset):
    return render(requset, 'findwords/search.html')

def searchwords(request):
    return render(request, 'findwords/findwords.html', locals())

@csrf_exempt
def searesult(request):
    if request.method == 'POST':
        try:
            word = request.POST.get('keyword')
            logging.info(word)
            root_dir="..\\words" #目录
            string = word #要搜索的字符串
            try:
                f_result = count_files(root_dir,string)
                logging.info(f_result)
                f_result_list = []
                for result in f_result:
                    for res in result:
                        result_list = res.split('>>>>>')
                        result_dict = {"filename":result_list[0],"checktime":result_list[1],"contents":result_list[2]}
                        # logging.info(result_dict)
                        f_result_list.append(result_dict)
                logging.info(f_result_list)
                json_data = json.dumps(f_result_list, cls=DateEncoder, ensure_ascii=False)
                return HttpResponse(json_data, content_type="application/json")
            except:
                return render(request, 'findwords/findwords.html', locals())
        except:
            return render(request, 'findwords/findwords.html', locals())
    else:
        return render(request, 'findwords/findwords.html', locals())

这里的root_dir="..\\words"设置了读取的目录为项目根目录下的words文件夹内的.docx文件,我们可以新建一个文件测试。
2、编写路由
编写根目录主路由urls.py

from django.conf.urls import url,include
from django.contrib import admin

urlpatterns = [
    url(r'^admin/', admin.site.urls),
    url(r'^find/', include('findwords.urls')),
]

编写app路由urls.py

from django.conf.urls import url
from . import views

urlpatterns = [
    url(r'^$', views.index, name='index'),
    url(r'^findwords$', views.findwords, name='findwords'),
    url(r'^searchwords$', views.searchwords, name='searchwords'),
    url(r'^searesult$', views.searesult, name='searesult'),
]

3、编写相应的HTML文件
编写搜索界面search.html

<!doctype html> {%load staticfiles%}
<html lang="zh">

<head>
    <meta charset="UTF-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">
    <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
    <title>Find世界</title>
    <link rel="stylesheet" type="text/css" href="{% static 'css/default.css'%}">
    <link rel="stylesheet" type="text/css" href="{% static 'css/search-form.css'%}">
    <script type="text/javascript" src="{%static 'js/jquery-3.2.1.min.js'%}"></script>
</head>
<style type="text/css">
.comments {
    width: 95%;
    /*自动适应父布局宽度*/
    height: 400px;
    overflow: auto;
    word-break: break-all;
    /*在ie中解决断行问题(防止自动变为在一行显示,主要解决ie兼容问题,ie8中当设宽度为100%时,文本域类容超过一行时,  
当我们双击文本内容就会自动变为一行显示,所以只能用ie的专有断行属性“word-break或word-wrap”控制其断行)*/
}
</style>

<body>
    <form onsubmit="submitFn(this, event);">
        <div class="search-wrapper">
            <div class="input-holder">
                <input type="text" class="search-input" placeholder="Search words !" />
                <button class="search-icon" onclick="searchToggle(this, event);"><span></span></button>
            </div>
            <span class="close" onclick="searchToggle(this, event);"></span>
            <div class="result-container">
                <span></span>
            </div>
            <div id='s_result' class="comments">
            </div>
        </div>
    </form>
    <div style="text-align:center;margin:50px 0; font:normal 14px/24px 'MicroSoft YaHei';">
    </div>
</body>
<script type="text/javascript">
function searchToggle(obj, evt) {
    var container = $(obj).closest('.search-wrapper');

    if (!container.hasClass('active')) {
        container.addClass('active');
        evt.preventDefault();
    } else if (container.hasClass('active') && $(obj).closest('.input-holder').length == 0) {
        container.removeClass('active');
        // clear input
        container.find('.search-input').val('');
        // clear and hide result container when we press close
        container.find('.result-container').fadeOut(100, function() {
            $(this).empty();
        });
    }
}

function submitFn(obj, evt) {
    value = $(obj).find('.search-input').val().trim();
    var url = '/find/result';
    var word = value
    console.log(word)
    $.get(
        url, {
            word: word
        },
        function(data) {
            $('#s_result').html(data);
        }
    );
    evt.preventDefault();
}
</script>

</html>

这里我用到了Layui框架使界面简洁美观点,为了测试默认显示两段内容,效果如下:



编写搜索结果展示界面findwords.html

<!DOCTYPE html> {% load staticfiles %}
<html>

<head>
    <meta charset="utf-8">
    <title>FindWorld</title>
    <meta name="renderer" content="webkit">
    <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">
    <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">
    <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="format-detection" content="telephone=no">
    <link rel="stylesheet" type="text/css" href="{% static 'layui/css/layui.css' %}" media="all" />
    <link rel="stylesheet" href="{% static 'css/public.css' %}" media="all" />
</head>

<body class="childrenBody">
    <form class="layui-form">
        <br>
        <blockquote class="layui-elem-quote quoteBox">
            <div class="layui-row">
                <div class="layui-col-md3">
                    <div class="grid-demo grid-demo-bg1">&nbsp;</div>
                </div>
                <div class="layui-col-md6">
                    <form class="layui-form">
                        <div class="layui-row grid-demo grid-demo-bg1">
                            <div class="layui-col-md9">
                                <div class="layui-block">
                                    <input type="text" name="keyword" id="keyword" lay-verify="title" autocomplete="off" placeholder="请输入搜索的关键字" class="layui-input searchVal">
                                </div>
                            </div>
                            <div class="layui-col-md3">
                                <!-- <a class="layui-btn search_btn" type="button" data-type="reload" lay-submit="" id="search_btn" lay-filter="search_btn">搜索</a> -->
                                <button class="layui-btn" lay-submit lay-filter="search_btn" id="search_btn">搜索</button>
                                <a class="layui-btn layui-btn-normal dir_btn" type="button" >目录</a>
                            </div>
                        </div>
                    </form>
                </div>
                <div class="layui-col-md3">
                    <div class="grid-demo">&nbsp;</div>
                </div>
            </div>
        </blockquote>
        <hr>
        <table id="userList" lay-filter="userList"></table>
        <!--操作-->
        <script type="text/html" id="userListBar">
            <a class="layui-btn layui-btn-xs" lay-event="look" type="button" >详细</a>
            <a class="layui-btn layui-btn-xs layui-btn-danger" lay-event="del" type="button" >删除</a>
        </script>
    </form>
    <div id="lookResult" style="padding: 40px; line-height: 15px; font-weight: 300; display:none; ">
        <form class="layui-form">
            <div class="layui-form-item layui-row layui-col-xs12">
                <label class="layui-form-label">文件名称:</label>
                <div class="layui-input-block">
                    <input type="text" class="layui-input" id="logsort" placeholder="请输入操作类型" readonly />
                </div>
            </div>
            <div class="layui-form-item layui-row layui-col-xs12">
                <label class="layui-form-label">修改时间:</label>
                <div class="layui-input-block">
                    <input type="text" class="layui-input" id="lookedate" readonly />
                </div>
            </div>
            <div class="layui-form-item layui-row layui-col-xs12">
                <label class="layui-form-label">搜索结果:</label>
                <div class="layui-input-block">
                    <textarea placeholder="请输入日志内容" style="min-height: 170px;" class="layui-textarea userDesc" name="pcloudcontent" id="pcloudcontent" readonly></textarea>
                </div>
            </div>
        </form>
    </div>
    <script type="text/javascript" src="{% static 'layui/layui.js' %}"></script>
    <script type="text/javascript" src="{% static 'js/userList.js' %}"></script>
    <script type="text/javascript" src="{% static 'js/jquery-3.2.1.min.js' %}"></script>
    <script type="text/javascript">
    var json_data = {{ json_data | safe }};
    console.log(json_data);
    </script>
</body>

</html>

4、我们来测试一下效果
我在words文件夹里新建了一个测试文件“倚天屠龙记.docx”,下面我搜索两个关键词‘张无忌’、‘张三丰’,结果如下:



几乎是秒搜索,点击详情还可以看到整段内容

经过大量测试,可以支持二三十个文件关键字检索,后续还需进行优化。

如果你喜欢本文章,还请点个关注和喜欢,我会为大家不断地带来Python学习笔记。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,313评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,369评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,916评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,333评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,425评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,481评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,491评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,268评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,719评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,004评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,179评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,832评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,510评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,153评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,402评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,045评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,071评论 2 352

推荐阅读更多精彩内容

  • PythonWeb框架要点、Django介绍、工程搭建、配置、静态文件与路由 1.Python Web 框架要点 ...
    Cestine阅读 1,471评论 0 6
  • Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资...
    Clemente阅读 3,265评论 0 54
  • Python 资源大全中文版 awesome-python[https://github.com/vinta/aw...
    万色星辰阅读 9,763评论 0 256
  • Django的来历:python开发的! long long long years ago!劳伦斯出版集团新闻 网...
    JAguys阅读 341评论 0 0
  • 演唱:寄明 作词作曲:李星月 镜花水月拂袖而逝 辞别昔年已做往事 渡口前离别的影子 到迟暮之年来追忆 恍若昨日是非...
    觉智师兄阅读 625评论 -1 0