Django+haystack+whoosh+jieba实现全局搜索和关键词高亮--简单包会

引言

最近要做一个项目,要用到Django了,才发现自己已经忘了好多Django的相关知识了,这次趁着这个项目也复习一下,本篇文章主要是django+haystack+whoosh实现全文检索及关键字高亮,话不多说,我们这就开始。

Django

Django是一个开放源代码的Web应用框架,由Python写成。采用了MTV的框架模式,即模型M,视图V和模版T。它最初是被开发来用于管理劳伦斯出版集团旗下的一些以新闻内容为主的网站的,即是CMS(内容管理系统)软件。目前Django 3. 0已经发布了,但是为了照顾到大多数的同学,本次项目还是Django 2.2 版本,当然原理什么的都是相同的,至于Django安装和美化大家请移步我的另外一篇博客,Django后台不好看?变美只需一步,这里就不再详细介绍了。

Haystack

现在搜索是一个日益流行的话题,虽然Django的admin也有自带的搜索功能,但是由于其可定制化的程度太低等原因,大家还是更愿意来进行自定义,这就导致了Haystack等工具的产生,Haystack试图整合自定义搜索,使开发者们可以尽可能简单的灵活和强大到足以处理更高级的用例。另外haystack支持多种搜索引擎,不仅仅是whoosh,使用solr、elastic search等搜索,也可通过haystack,而且直接切换引擎即可,甚至无需修改搜索代码。

whoosh

一个由纯Python编写的全文搜索引擎,虽然性能比不上sphinx、Xapian、Elasticsearch等,但是whoosh无二进制包,程序不会莫名其妙的崩溃,对于小型的站点,whoosh已经足够使用。

jieba

一款中文分词词库

安装

说是haystack,但是安装的时候安装的是Django-haystack,如果安装haystack是会报错的,如果你不小心装错了请记得卸载它。下面给出pip安装代码,如果还不会pip配置国内镜像的可以评论或私信,我再出一篇文章。

pip install django-haystack
pip install whoosh
pip install jieba

配置

首先在installed app里面添加haystack。

INSTALLED_APPS = [
    'simpleui',
    'haystack',
    'Drug',
    'django.contrib.admin',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sessions',
    'django.contrib.messages',
    'django.contrib.staticfiles',
]

然后同样在settings.py中继续配置Haystack。

HAYSTACK_CONNECTIONS = {
    'default': {
        # 设置haystack的搜索引擎
        'ENGINE': 'Drug.whoosh_cn_backend.WhooshEngine',
        # 设置索引文件的位置
        'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
    }
}
HAYSTACK_SEARCH_RESULTS_PER_PAGE = 20
# 自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

注意我的搜索引擎那里设置的是whoosh_cn_backend.WhooshEngine,这个在下面会提到,现在先这么写就行。

代码

首先就是在你的应用目录(即要设为检索关键字的应用目录下)下新建一个search_indexes.py文件(名字是固定的不能改,改了就不能用)。如下可作参考。
[图片上传失败...(image-aaf997-1595385034186)]
search_index.py的内容如下,一般也是不需要变动的。

class MedicineIndex(indexes.SearchIndex,indexes.Indexable):
    text = indexes.CharField(document=True,use_template=True)

    def get_model(self):
        return Medicine

    def index_queryset(self, using=None):
        return self.get_model().objects.all()

当然类名需要根据自己的类来命名。
再然后根据参考下图在templates文件夹下新建几层文件,如templates/search/indexes/应用名/model名_text.txt,如下图所示。
[图片上传失败...(image-a5d5c7-1595385034186)]
txt文件的内容就是你想进行搜索的字段名,参考如下格式。

txt文件内容

之后就是配置urls中的地址。

from django.urls import path, include

urlpatterns = [
    # 其它path设置
    
    path(r'search/', include('haystack.urls')),
    # django小于 2.0版本的用以下的url
    # url(r'^search/', include('haystack.urls')),
]

再然后就是创建用来显示的html文件,这个是需要自己定制的,下面给出我的来参考一下,这个是加入了高亮关键词和一些样式的最终版本。有关高亮关键词的部分,几句话就可以完成。
首先是要在文件头写上{% load highlight %}
然后就是在你要高亮的那个字段写上{% highlight result.object.source with query max_length 1000 %}。
那个max_length是最大长度,但是在DJango3.0好像不能用,大家有知道为什么的可以评论或者私信讨论一下。

<!DOCTYPE html>
<html>
{% load highlight %}
{#{% highlight result.summary with query html_tag "div" css_class "highlighted" %}#}
<head>
    <title>test</title>
    {#搜索框样式#}
    <style>
    span.highlighted {
        color: red;
        font-size: x-large;
    }
</style>

<style type="text/css">
    input{
        width: 200px;
        border: 1px solid #e2e2e2;
        height: 30px;
        float: left;
        background-repeat: no-repeat;
        background-size: 25px;
        background-position:5px center;
        padding:0 0 0 40px;
    }
    #search{
        width: 78px;
        height: 32px;
        float: left;
        background: black;
        color: white;

        text-align: left;
        line-height: 32px;
        cursor: pointer;
    }

</style>
</head>
{#<link rel = “stylesheet”  type = “text/css”  href = “style.css”  />#}
<body>

{% load highlight %}
<form method='get' action="/search" target="_self"  style="vertical-align: middle">
    <p><input type="text" name="q" placeholder="请输入关键字"  style="width:300px; height:38px; vertical-align:middle; bordercolor:#1E90FF; "/></p>
    <p><input type="submit"  value="查询" id="search"  style="background:#1E90FF; color:#FFFFFF; border:none;
     width:100px; height:40px; margin-left:-5px; vertical-align:middle;"/> </p>
    <br>
</form>
{% if query %}
    {% load highlight %}
{#        {% highlight result.object.title with query %}#}
{#    {% highlight result.object.body with query %}#}

    {% for result in page.object_list %}
        <a href="/{{ result.object.id }}/">
        <div class="media">
             <div class="media-left">

                        </div>
        <div class="media-body" >

                   <p>
            <h4 class="list-group-item-heading">{% highlight result.object.name with query %}</h4></p>
                    <p class="list-group-item-text">source:{% highlight result.object.source with query max_length 1000 %}</p>
                    <p class="list-group-item-text">type:{% highlight result.object.type with query max_length 1000 %}</p>
                    <p class="list-group-item-text">include:{% highlight result.object.include with query max_length 1000 %}</p>
                    <p class="list-group-item-text">function:{% highlight result.object.function with query max_length 1000 %}</p>
                    <p class="list-group-item-text">focus:{% highlight result.object.focus with query max_length 1000 %}</p>
                </div>
            </a><br/>
    {% empty %}
        <p>不存在符合的搜索结果</p>
    {% endfor %}

    {% if page.has_previous or page.has_next %}
        <div>
            {% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}">{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}
        |
            {% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}">{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}
        </div>
    {% endif %}
{% endif %}

</body>
</html>

注意到我在代码那个大标题上面加粗的话,如果你看了其他的相关文章应该会发现不一样,我的好像少了一些东西,其实是我简化了一些,直接在你的应用文件夹下面新建whoosh_cn_backend.py文件即可,文件的内容如下。额,文件实在太长了,为了不影响大家的阅读体验和赚点积分,大家可以到这下载

写在最后

到这里就以及全部完成了,是不是就像我说的那么简单,如果还有不太明白的地方,大家一起交流哈。
因为是好久没有碰过Django了,所以这次写的东西估计也有很多不太完善的地方,还希望大家多多批评指正,谢谢大家

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,711评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,079评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,194评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,089评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,197评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,306评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,338评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,119评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,541评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,846评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,014评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,694评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,322评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,026评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,257评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,863评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,895评论 2 351