Django之whoosh搜索引擎

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Django之whoosh搜索引擎，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3878字，纯文字阅读大概需要6分钟。

内容图文

一:搜索引擎简介

一:搜索引擎介绍

django是python语言后台web开发的一个框架,配合一些插件可为web网站实现很方便的搜索功能

django搜索引擎使用whoosh是一个纯python开发的全文搜索引擎,小巧简单

二:搜索引擎作用

搜索引擎可以在表中针对某些关键进行全文分析,根据关键词建立索引数据 mu

索引类似于新华字典的目录,可以快速搜索数据

            #
             例如
            
MacBook:商品1,商品2,商品3

二:搜索引擎框架(haystack)

一:作用

直接在django项目中使用whoosh需要关注一些基础细节问题，而通过haystack这一搜索框架，可以方便地在django中直接添加搜索功能，无需关注索引建立、搜索解析等细节问题。

haystack支持多种搜索引擎,whoosh,solr,elasticsearch等虽然whoosh性能相比elasticsearch较低,但是其无二进制包程序不会莫名其妙崩溃,在中小型网站完全适用

二:图解

技术分享图片

三:whoosh使用方式

一:安装依赖包

pip install django-haystack # 安装haystack框架
pip install whoosh         # 安装whoosh搜索引擎

二:settings配置文件

一:注册haystack框架

INSTALLED_APPS = [
     # 注册haystack框架‘haystack‘
]

二:配置搜索引擎

HAYSTACK_CONNECTIONS = {
    ‘default‘: {
        ‘ENGINE‘: ‘haystack.backends.whoosh_backend.WhooshEngine‘,
        ‘PATH‘: os.path.join(BASE_DIR, ‘whoosh_index‘),  # whoosh_index 文件夹不需要自己手动创建 会自动创建    }
}
# 添加此项，当数据库改变时，会自动更新索引，非常方便
HAYSTACK_SIGNAL_PROCESSOR = ‘haystack.signals.RealtimeSignalProcessor‘

三:全局添加url路由

urlpatterns = [
    ...
    url(r‘^search/‘, include(‘haystack.urls‘)),
]

四:应用目录下创建search_indexes.py文件(固定名称)

技术分享图片

search_indexes代码

            from haystack import indexes  # 导入索引from . import models   # 导入模型表class GoodsIndex(indexes.SearchIndex,indexes.Indexable):

    text = indexes.CharField(document=True,use_template=True)
    ‘‘‘
    document:指定了将模型类中的哪些字段建立索引
    use_template:在模板文件夹中创建文件夹指明具体的字段建立索引
    ‘‘‘def get_model(self):
        # 为那个模型表建立索引return models.GoodInfo

    def index_queryset(self, using=None):
        return self.get_model().objects.all()

五:模板文件夹创建如下文件

技术分享图片

_text.txt指定模型表中那些字段建立索引

            #
             指定那些字段建立索引 
{{object.name}}   # 商品名称建立索引
{{object.desc}}   # 商品简介建立索引

六:生成索引文件

python manage.py rebuild_index

技术分享图片

七:在templates/search下建立search.html文件

搜索出结果后，haystack会把搜索出的结果传递给templates/search目录下的search.html，传递的上下文包括：

query：搜索关键字

page：当前页的page对象 –>遍历page对象，获取到的是SearchResult类的实例对象，对象的属性object才是模型类的对象。

paginator：分页paginator对象

            <
            form 
            action
            ="/search"
             method
            ="get"
            >
            <
            p
            >商品搜索:<input type="text" name="q"></p><p>提交:<input type="submit"></p></form><p>搜索关键字:{{ query }}</p><p>当前页page对象:{{ page }}</p><p>分页对象:{{ paginator }}</p><ul>
    {% for item in page %}
      <li> {{ item.object.name }}</li><li> {{ item.object.desc }}</li>
    {% endfor %}
</ul>

技术分享图片

通过HAYSTACK_SEARCH_RESULTS_PER_PAGE 可以控制每页显示数量。

四:jieba

一:安装

pip install jieba

二:作用

whoosh不能很好的进行分词而使用jieba可以很好的分词

二:使用方式

            import
             jieba


split_data = ‘很好吃的草莓‘# 要被切割的数据
res = jieba.cut(split_data,cut_all=True)

print(res)  # <generator object Tokenizer.cut at 0x0000000009EA27D8> 拿到一个生成器for value in res:
    print(value)

三:Haystack使用方式

一:在haystack的安装文件夹下,例如D:\Softwares\python3.6\Lib\site-packages\haystack\backends(每个人安装目录不一样根据自己的安装目录创建)建立ChineseAnalyzer.py文件

            import
             jieba

            from whoosh.analysis import Tokenizer, Token


class ChineseTokenizer(Tokenizer):
    def__call__(self, value, positions=False, chars=False,
                 keeporiginal=False, removestops=True,
                 start_pos=0, start_char=0, mode=‘‘, **kwargs):
        t = Token(positions, chars, removestops=removestops, mode=mode,
                  **kwargs)
        seglist = jieba.cut(value, cut_all=True)
        for w in seglist:
            t.original = t.text = w
            t.boost = 1.0
            if positions:
                t.pos = start_pos + value.find(w)
            if chars:
                t.startchar = start_char + value.find(w)
                t.endchar = start_char + value.find(w) + len(w)
            yield t


def ChineseAnalyzer():
    return ChineseTokenizer()

二:将上面backends目录中的whoosh_backend.py文件，复制一份命名为whoosh_cn_backend.py，然后打开此文件进行替换：

            #
             顶部引入刚才添加的中文分词
            from .ChineseAnalyzer import ChineseAnalyzer 

# 在整个py文件中，查找 替换
analyzer=StemmingAnalyzer()

analyzer=ChineseAnalyzer()

三: 修改settings.py文件中的配置项。

HAYSTACK_CONNECTIONS = {
    ‘default‘: {
        # ‘ENGINE‘: ‘haystack.backends.whoosh_backend.WhooshEngine‘,  # 原来的默认的‘ENGINE‘: ‘haystack.backends.whoosh_cn_backend.WhooshEngine‘, # jieba搜索‘PATH‘: os.path.join(BASE_DIR, ‘whoosh_index‘),  # whoosh_index 文件夹不需要自己手动创建 会自动创建    }
}

四:重新生成索引文件

python manage.py rebuild_index

技术分享图片

原文：https://www.cnblogs.com/SR-Program/p/12535309.html

内容总结

以上是互联网集市为您收集整理的Django之whoosh搜索引擎全部内容，希望文章能够帮你解决Django之whoosh搜索引擎所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1333059.html

来源：【匿名】

【下一篇】php和golang的区别是什么？

更多 ►

【Django之whoosh搜索引擎】教程文章相关的互联网学习教程文章

一:搜索引擎简介一:搜索引擎介绍django是python语言后台web开发的一个框架,配合一些插件可为web网站实现很方便的搜索功能django搜索引擎使用whoosh是一个纯python开发的全文搜索引擎,小巧简单二:搜索引擎作用搜索引擎可以在表中针对某些关键进行全文分析,根据关键词建立索引数据 mu索引类似于新华字典的目录,可以快速搜索数据# 例如 MacBook:商品1,商品2,商品3二:搜索引擎框架(haystack)一:作用直接在django项目中使用whoosh需要关...

django开发经验（天天生鲜）

首先，django开发前要配置虚拟环境（相当于将原django环境复制一遍进行操作，不影响原django环境，也适用于同时开发不同项目）在虚拟环境里下载包用“pip install 包名”，这样是对本虚拟环境下载，如果用“sudo pip install 包名”是对原django环境操作原文：https://www.cnblogs.com/itheone/p/12024956.html

django有什么CMS比较好用?哪个好?【图】

这个网站有目前在电子商务领域流行的django cms的横向对比表格，可以看看https://djangopackages.org/grids/g/ecommerce/从结果上来看，django-oscar是star最多的。内容来源：http://www.talebook.org/blog/page/25.html原文：https://www.cnblogs.com/seozed/p/12197334.html

django基础4--django模板变量的使用【代码】【图】

第一步在views中创建变量[root@localhost myblog_rocky]# vihomepage/views.py650) this.width=650;" src="/upload/getfiles/default/2022/11/18/20221118094720318.jpg" title="1.png" />代码如下from django.shortcuts importrender_to_response user =("name":"rocky","age":"22","constellation user =("name":"rocky","age":"22","constellation":"Taurus #from django.http import HttpResponse from django.shortcuts impor...

Django（二）【代码】

Model到目前为止，当我们的程序涉及到数据库相关操作时，我们一般都会这么搞：创建数据库，设计表结构和字段使用 MySQLdb 来连接数据库，并编写数据访问层代码业务逻辑层去调用数据访问层执行数据库操作import MySQLdbdef GetList(sql):db = MySQLdb.connect(user=‘root‘, db=‘wupeiqidb‘, passwd=‘1234‘, host=‘localhost‘)cursor = db.cursor()cursor.execute(sql)data = cursor.fetchall()db.close()return datadef Get...

Django 中使用 logging 配置 logger 自定义日志输出

在使用 django 开发过程中，默认的日志输出是不能满足我们去排查问题的，往往需要自定义的日志输出，帮助我们去排查程序BUG，定位问题原因。在使用 django 的开发过程中，我使用的是 python 内置日志模块 logginglogging 的详细使用讲解我就不多说了，度娘一抓一大抓；我只记录下我在 django settings 中的 logger 配置。方便以后使用以下在我在 settings 中定义的 logger:# Custom output logLOGGING = {‘version‘: 1,‘disabl...

Django讲解【代码】【图】

什么是Django？Django是一个开放源代码的Web应用框架，由Python写成。采用了MVC的框架模式，即模型M，视图V和控制器C。Django框架介绍：Django 项目是一个python定制框架，它源自一个在线新闻 Web 站点，于 2005 年以开源的形式被释放出来。Django 框架的核心组件有：用于创建模型的对象关系映射为最终用户设计的完美管理界面一流的 URL 设计设计者友好的模板语言缓存系统。创建Djiano项目：首先安装Djiano：pip3 install django 创...

Django-orm操作的基础认识【代码】

ORM简介在使用Django 框架开发web应用的过程中,不可避免的会涉及到数据的管理操作,如增删改查,使用的数据库管理软件有mysql.oracle,Microsoft SQL Server等.编写sql语句的时候,直接编写原生sql语句会存在几个方面的问题,严重的影响了开发效率,''' 1. sql语句执行效率低,程序员需要耗费精力去优化sql语句 2.数据库迁移:针对mysql开发的sql语句没法直接应用到oracle数据库上,只要需要迁移数据库,就要考虑平台问题'''所以为了解决这两...

python下install django

windows平台：　　1.cmd路径指向**/python27/Script　　2.输入 easy_install.py pip　　3.pip django　　4.验证安装shell下 import django　　5.环境变量将**/python/Script增加进去原文：http://www.cnblogs.com/paullyblog/p/4749065.html

Django框架基础（一）【代码】

Python的WEB框架有Django、Tornado、Flask 等多种，Django相较与其他WEB框架其优势为：大而全，框架本身集成了ORM、模型绑定、模板引擎、缓存、Session等诸多功能。1 安装1pip3 install django 2# 创建Django程序 3 django-admin startproject mysite 4# 进入程序目录 5 cd mysite 6 # 启动socket服务端，等待用户发送请求 7 python manage.py runserver 127.0.0.1:8080View Code2 配置配置模板路径：1 TEMPLATES=[‘DIRS‘:...

Python django实现简单的邮件系统发送邮件功能【代码】

Python django实现简单的邮件系统发送邮件功能本文实例讲述了Python django实现简单的邮件系统发送邮件功能。django邮件系统Django发送邮件官方中文文档总结如下：1、首先这份文档看三两遍是不行的，很多东西再看一遍就通顺了。2、send_mail()、send_mass_mail()都是对EmailMessage类使用方式的一个轻度封装，所以要关注底层的EmailMessage。3、异常处理防止邮件头注入。4、一定要弄懂Email backends 邮件发送后端5、多线程的邮件发...

[python]django关闭debug【图】

1.版本申明python3.6.5django2.0.62.打开项目-setting setting.py中DEBUG默认是等于True，这样的话当访问接口存在错误会直接展示项目的所有配置信息，那么如果我们部署在正式环境，这样过于危险所以部署到正式环境，需要DEBUG改成False,ALLOWED_HOSTS=[]也需要修改ALLOWED_HOSTS=[‘*‘]这样访问报错就不会直接暴露环境信息如下: 4.ALLOWED_HOSTS=[‘*‘]这个设置是接口请求的url中ip或域名可以访问，不设置为*，直接用ip，或...

Django(一)【代码】【图】

一什么是web框架？框架，即framework，特指为解决一个开放性问题而设计的具有一定约束性的支撑结构，使用框架可以帮你快速开发特定的系统，简单地说，就是你用别人搭建好的舞台来做表演。对于所有的Web应用，本质上其实就是一个socket服务端，用户的浏览器其实就是一个socket客户端。import socketdef handle_request(client):buf = client.recv(1024)client.send("HTTP/1.1 200 OK\r\n\r\n".encode("utf8"))client.send("<h1 sty...

Django1.0与2.0区别【代码】

django1.0与django2.0之间的区别虚拟环境给不同的项目配置不同的python解释器1.0与2.0的区别django2.0里面的path第一个参数不支持正则，你写什么就匹配什么，100%精准匹配django2.0里面的re_path对应django1.0中的url虽然django2.0里面的path不支持正则表达式，但是它提供了5个默认的转换器? str,匹配除了路径分隔符（/）之外的非空字符串，这是默认的形式 ? int,匹配正整数，包含0。 ? slug,匹配字母、数字以及横杠、下划线组成的...

Django框架下在URLconf中指定视图缓存的方法【代码】

将视图与缓存系统进行了耦合，从几个方面来说并不理想。例如，你可能想在某个无缓存的站点中重用该视图函数，或者你可能想将该视图发布给那些不想通过缓存使用它们的人。解决这些问题的方法是在 URLconf 中指定视图缓存，而不是紧挨着这些视图函数本身来指定。完成这项工作非常简单：在 URLconf 中用到这些视图函数的时候简单地包裹一个 cache_page 。以下是刚才用到过的 URLconf : 这是之前的URLconf： urlpatterns = (‘‘,(r...

DJANGO - 相关标签

GO - 最热教程

Go语言（Golang）密码加密存储（数据库...Android的APP怎样制作LOGO的尺寸 SQLSERVER中GO的作用详解 goland: 从0到1创建一个hello word工程 go语言学习日记 - go语言环境配置 Golang http.Client设置超时 golang实现mysql数据库备份的操作方法 Go 字符串——遍历及切片 golang 性能优化分析：benchmark 结合 ...交互式编程之Golang基本配置（Jupyter-...

首页 / GO / Django之whoosh搜索引擎

Django之whoosh搜索引擎

内容导读

内容图文

一:搜索引擎简介

一:搜索引擎介绍

二:搜索引擎作用

二:搜索引擎框架(haystack)

一:作用

二:图解

三:whoosh使用方式

一:安装依赖包

二:settings配置文件

三:全局添加url路由

四:应用目录下创建search_indexes.py文件(固定名称)

五:模板文件夹创建如下文件

六:生成索引文件

七:在templates/search下建立search.html文件

四:jieba

一:安装

二:作用

二:使用方式

三:Haystack使用方式

内容总结

内容备注

内容手机端

【Django之whoosh搜索引擎】教程文章相关的互联网学习教程文章

DJANGO - 相关标签

索引 - 相关标签

GO - 最新教程

GO - 最热教程