SPHINX - 技术教程文章

Sphinx+MySQL全文检索架构与安装(1)_MySQL

前言:本文阐述的是一款经过生产环境检验的千万级数据全文检索(搜索引擎)架构。本文只列出前几章的内容节选,不提供全文内容。在DELL PowerEdge 6850服务器(四颗64 位Inter Xeon MP 7110N处理器 / 8GB内存)、RedHat AS4 Linux操作系统、MySQL 5.1.26、MyISAM存储引擎、key_buffer=1024M环境下实测,单表1000万条记录的数据量(这张MySQL表拥有int、datetime、varchar、text等类型的10多个字段,只有主键,无其它索引),用主键...

Sphinx/MySQL协议支持与SphinxQL应用实例_MySQL

bitsCN.com Sphinx的searchd守护程序从版本0.9.9-rc2开始支持MySQL二进制网络协议,并且能够通过标准的MySQL API访问。例如,“mysql”命令行程序可以很好地工作。以下是用MySQL客户端对Sphinx进行查询的例子:$ mysql -P 9306Welcome to the MySQL monitor. Commands end with ; or /g.Your MySQL connection id is 1Server version: 0.9.9-dev (r1734)Type help; or /h for help. Type /c to clear the buffer.mysql> SELECT * ...

mysql中使用sphinx搜索子域名需注意的问题_MySQL

bitsCN.com 搜索子域名比如搜索bitsCN.com会把www.bitsCN.com、bitsCN.com、host.bitsCN.com等都搜索出来。如果使用mysql用like的话效率是非常低的,几百万甚至上千万的数据那是没有办法使用的,于是采取sphinx来做。在使用的过程中发现了诸多问题,这里将其总结起来,也让不知道的朋友注意下这些字符。分析:sphinx是全文索引,它搜索的是包含的记录。首先如果我们不做任何设置的话,搜索bitsCN.com会出现把aabitsCN.com、jb51.a....

sphinxql如何得到结果数及showmeta的详细说明_MySQL

bitsCN.com mysql:select count(*) from main_index;但是这个在这里却报语法错误。第一种方法:查文档得:Aggregate functions (AVG(), MIN(), MAX(), SUM()) in column list clause are supported. Arguments to aggregate functions can be either plain attributes or arbitrary expressions. COUNT(*) is implicitly supported as using GROUP BY will add @count column to result set. Explicit support might be added in ...

sphinx教程1__mysqlsphinx引擎插件式热安装_MySQL

在企业引入搜索功能的时候,很多情况下都能用上sphinx引擎mysql来处理,通常这个时候Mysql已经在线上了,没办法重新编译安装然后上线,这个时候就需要通过插件的方式来热安装sphinx环境linux+mysql5.5.32+sphinx-2.1.61、查看当前运行的mysql版本 mysqldump --version我的Mysql版本5.5.322、下载对应的mysql 5.5.32 (版本号一定不能错,要不安装不成功)源码,并解压下载地址:http://downloads.mysql.com/archives/community/3、...

在MySQL中使用Sphinx实现多线程搜索的方法_MySQL

MySQL、Sphinx及许多数据库和搜索引擎中的查询是单线程的。比如说,在一台32个CPU核心、16个磁盘的R910服务器上执行一个查询,它最多只会用到一个核心和一个磁盘。没错,只会使用一个。 如果查询是CPU密集型作业,那么会使用大约3%的整机CPU能力(以上述32核机器为例)。如果是磁盘密集型,则大约会使用6%的整机IO能力(也是与上例同样的配置,16个磁盘组成RAID10或RAID0)。 我再换个说法吧。如果你在一台单核单磁盘的机器上执行了某个...

Sphinx+MySQL5.1x+SphinxSE+mmseg中文分词_MySQL

什么是SphinxSphinx 是一个全文检索引擎,一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)。Sphinx的特性 高速的建立索引(在当代CPU上,峰值...

在MySQL中使用Sphinx实现多线程搜索的方法

MySQL、Sphinx及许多数据库和搜索引擎中的查询是单线程的。比如说,在一台32个CPU核心、16个磁盘的R910服务器上执行一个查询,它最多只会用到一个核心和一个磁盘。没错,只会使用一个。 如果查询是CPU密集型作业,那么会使用大约3%的整机CPU能力(以上述32核机器为例)。如果是磁盘密集型,则大约会使用6%的整机IO能力(也是与上例同样的配置,16个磁盘组成RAID10或RAID0)。 我再换个说法吧。如果你在一台单核单磁盘的机器上执行了某个...

php7安装sphinx遇到的坑【图】

首先按照网上这个方法安装前半部分没有任何问题: 地址:https://www.cnblogs.com/xi-jie/articles/10476860.html ? [root@centos7-2 ~]# cd /usr/local/src [root@centos7-2 src]# wget http://sphinxsearch.com/files/sphinx-2.2.10-release.tar.gz [root@centos7-2 src]# tar -zxvf sphinx-2.2.10-release.tar.gz [root@centos7-2 src]# cd sphinx-2.2.10-release [root@centos7-2 sphinx-2.2.10-release]# ./configure --pref...

python-sphinx:格式化多行文档字符串【代码】

使用sphinx autodoc,是否可以通过特殊方式格式化多行文档字符串的第一行? 考虑:def whatever():"""This function does something.This really should have a full function definition, but I am too lazy.Some more stuff."""生成的html代码:<dd> <p>This function does something.</p> <p>This really should have a full function definition, but I am too lazy. Some more stuff.</p> </dd>我希望它是这样的:<dd> <p clas...

python-Sphinx使用旧的模块代码

我使用Sphinx记录我的代码,该代码是Python模块的集合.通过清理我的源代码制作的自动生成的文档很好,但是当我单击直接链接到包含Sphinx生成的包含包源代码的HTML页面的“代码”链接时,将显示我的代码的较旧版本. 我试图删除我的Sphinx生成的文档,从自己的site-packages文件夹中卸载该软件包,并删除build文件夹中的所有内容.我找不到与Sphinx输出匹配的文件-它很旧,而且我不确定它来自哪里.有人知道如何让Sphinx将我的新代码放入文档...

python-使用Sphinx记录烧瓶应用程序

我将Flask与应用程序工厂模式一起使用,因此我的整个应用程序都包含在一个函数中. 这就产生了一个问题,因为Sphinx在工厂中“隐藏”在我的视图和方法中,所以我没有在其中记录我的视图和方法. 想解决这个问题? (除了“将所有视图放入蓝图中”的想法,尽管这是一种很好的模块化方法)解决方法:如果您不想使用蓝图,则可以将所有视图功能移到应用程序工厂功能之外,而只需使用Flask.add_url_rule()在工厂中完成路由即可.这样,视图功能将是外...

python-检查Sphinx文档是否调用了脚本【代码】

我目前正在尝试为使用ArcGIS arcpy库的脚本生成sphinx文档. 当sphinx在生成文档时尝试运行脚本时,我遇到了一个问题,因为arcpy脚本从arcgis gui中获取输入参数.由于sphinx在不使用gui的情况下调用脚本,因此这些参数为空,并导致回溯,例如:C:\VersionControl\PythonScripts\Source\src\_build\script_export_pdf.rst:4: WARNING: autodoc: failed to import module u'gis.scripts.script_export_pdf'; the following exception w...

python-将setUp和tearDown unittest方法保留在Sphinx文档之外【代码】

我正在使用docstrings和autodoc使用Sphinx为我的项目构建文档.我喜欢在文档中包含测试类和实际测试用例的描述,但是我想省略setUp和tearDown.我尝试在.rst文件中指定它,但是我没有用(不是我真的期望它,我敢肯定,undoc成员仅适用于顶级构造-全局函数和类)API.tests.test_MSSQLTools module --------------------------------.. automodule:: API.tests.test_MSSQLTools:members::undoc-members: setUp, tearDown:show-inheritance:有...

java-CMUSphinx实时语音识别太慢了吗?【代码】

CMU Sphinix识别实时语音的速度太慢.我不知道您是否有任何增强语音的想法? 这是我的配置:configuration.setAcousticModelPath("WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz"); configuration.setDictionaryPath("cmudict.0.6d"); configuration.setLanguageModelPath("en-us.lm.dmp");解决方法:我们目前正在努力提高速度,但目前sphinx4对于大词汇量来说并不是实时的.实际上,这不是一件简单的任务. 如果您想要快速但不太准确的转录,可...

python-sphinx:通过raw :: latex包含.tex文件【代码】

我想在狮身人面像中包含乳胶文档. sphinx html构建不包括使用.. raw :: latex指令链接的乳胶文件.我有 这是我的目录结构docs/source/importlatex.rstindex.rstbuild/tex/texfile.texindex.rst看起来像Welcome to documentation! =========================Contents:.. toctree:::maxdepth: 2icnludelatexand-other-stufficnludelatex.rst看起来像:Include Latex =============.. raw:: latex:file: ../tex/texfile.texthis refere...

python-Sphinx搜索索引警告

我在狮身人面像中收到此警告:WARNING: search index couldn’t be loaded, but not all documents willbe built: the index will be incomplete.但据我所知,它很好地构建了文档,包括搜索索引. 该错误消息实际上是什么意思,以及如何解决? 从答案中注意到:当前调用是sphinx-build -W -n docs / docs / html * .rst.解决方法:错误消息是从这里: https://bitbucket.org/birkenfeld/sphinx/src/ef3092d458cc00c4b74dd342ea05ba1059a...

使用Sphinx记录python脚本条目(__name__ ==’__main__’)【代码】

有没有一种方法,最好使用autodoc,使sphinx记录Python脚本?我要记录的脚本部分是受以下部分保护的部分:if __name__ == '__main__':即仅在模块用作脚本而不是导入时才运行的位.解决方法:您应该使用该文档字符串将该块中的代码提取到函数中,然后从该块中调用该函数.

python-Sphinx-自定义主题不起作用【代码】

我已经设置了狮身人面像文档,并且想要使用自定义主题.我已经阅读了狮身人面像网站上的主题说明:http://www.sphinx-doc.org/en/stable/theming.html,但是它不起作用. 我的主题名称与conf.py文件中的主题名称相同,并且位于同一目录的zip文件夹中,但是我不断收到以下错误消息:Theme error: no theme named 'tera' found (missing theme.conf?) make: *** [html] Error 2我的conf.py代码是:html_theme = "tera"html_theme_options =...

使用带有哨兵对象默认参数的Sphinx python方法进行文档记录?【代码】

如果要允许人们使用“无”调用某些方法,则在定义方法时必须使用sentinel object._sentinel = object()def foo(param1=_sentinel):...这将使您能够调用foo(param1 = None)并能够在类似foo()的调用之间进行区分. 问题是,当Sphinx确实记录了该方法时,它将编写如下内容mymodule.foo(param1=<object object at 0x108c1a520>)如何说服Sphinx为这些功能提供用户友好的输出? 注意,想象一下如果使用哨兵方法有3-4个参数,文档的外观.解决方法...

python-Sphinx:模块中的功能列表【代码】

我有一些python模块,主要包含函数和一些类.每个文件都使用sphinx-autodoc在单独的rst中记录.我想做的是在每个页面的顶部创建表或模块内容的列表,例如,mymodule.py是def first():'First function'def second():'Second function'而mymodule.rst是Page Contents -------------:create_page_contents_list:Members -------.. automodule:: mymodule:members:然后,输出应如下所示:Page Contents -------------first secondMembers ---...

java – 为什么PocketSphinx Android演示需要cygwin

我正在尝试在android中开发语音识别程序,到目前为止,我已经看到最流行的选项似乎是CMU sphinx,其中pocketsphinx用于android.据我所知,CMU Sphinx的源代码已经在Java中提供,可以在计算机上运行,??因此不会直接在Android手机上运行.所以我首先要将CMu sphinx代码编译成一种类型的库(如果我在C中工作,就像创建一个我需要共享的代码的dll),然后在android中构建一个接口并从cmusphinx调用类.所以我发现每个人都指的是this post和this tu...

Python Sphinx Autosummary:成员函数的自动列表【代码】

如何判断自动扩展扩展不仅列出单个类,还列出所有类的成员? 如果我使用:.. autosummary::MyClass在生成的html文件中,只有一个简短的摘要,如: MyClass(var1,var2,….)我的自定义类来做奇特的事情…… 我真正想要的是: MyClass(var1,var2,….)我的自定义类来做奇特的事情…… MyClass.doA(var1,var2,…)做得很好 MyClass.doB(var1,var2,…)B更好 我如何配置autosummary指令才能得到这个(除了在autosummary指令中自己命名所有函数)...

python – Sphinx apidoc – 不打印包和模块的完整路径【代码】

我对sphinx很新,我正在尝试将它用作我项目的API参考.也许在那之后作为项目文档. 我使用这两个命令生成它sphinx-apidoc -e -o doc/api tracer sphinx-build -b dirhtml doc/ build/doc/dirhtml它存在生成此目录的问题- tracer package- tracer.lang package- tracer.lang.en module- tracer.packageManagers package- tracer.packageManagers.dnf module- tracer.packageManagers.dpkg module- tracer.packageManagers.portage modu...

python – 在Sphinx文档中显示字典数据【代码】

我在Python项目源代码中有一个字典,它描述了默认的配置值.字典很冗长.除了“查看源代码”之外,我还希望以其他格式查看Sphinx文档中的字典,以便人们可以快速检查默认值. 当与Sphinx autodoc一起使用时,Sphinx是否提供格式化字典变量的选项以用于人类可读的格式?我目前正在使用.. automodule ::来转储整个模块,我将字典作为文档中的一个长字符串转储(没有新行,漂亮的打印,任何东西),基本上是不可读的. > Sphinx是否提供了打印单个源...

python – 自定义sphinxdoc主题【代码】

有没有一种简单的方法来定制现有的sphinxdoc主题?对于默认主题,有许多主题属性,但在sphinxdoc中,我甚至无法设置徽标或更改某些颜色? 或者你能推荐一个我可以学习如何修改主题的网站吗?解决方法:我只想在我的sphinx doc中添加ReST strikethrough.我是这样做的:$cd my-sphinx-dir $mkdir -p theme/static $touch theme/theme.conf $touch theme/static/style.css在theme / theme.conf中:[theme] inherit = default stylesheet =...

使用带有多个索引的PHP的Sphinx【代码】

我问过几个类似的问题,但可能没有提供所需的全部信息. 我已经设置了最新版本的Sphinx – 并创建了索引(虽然我不是100%我已经优化了这个配置)(请参阅底部的pastebin链接以获取此配置) 下面是连接到Sphinx API的脚本,其中包含我想要执行搜索的字符串’teaching’ – 目前我有四个索引(请参阅此处的配置 – http://pastebin.com/DGgheqYm)我需要能够确定哪个每个结果来自的索引,因为这将确定我需要执行查询的表 例如..// {$table}/...

python – Sphinx会使用不能很好导入的代码吗?

Sphinx文档引擎是否会成功生成不能导入良好的项目的文档?特别是我的项目具有异国情调.我不希望文档生成依赖于此依赖项. Sphinx是否需要导入我的模块并使用内省或解析?解决方法:如果您正在使用autodoc扩展,那么是的,您的项目必须是可导入的.但有时可以在conf.py中模拟出依赖关系(因为,可能在导入时,仅在名称中需要依赖关系).阅读文档文档的示例为how to do this.

php – sphinx api基本设置【代码】

其实我的问题似乎很基础. >我正在使用sphinx版本2.3.1 beta>我无法设置它来搜索我的数据库.>我正在使用带有1.57 GB数据的mysql DB,这是在我的服务器localhost上.>我想用php使用sphinxapi. 就像我想的那样,我必须告诉狮身人面像 >在哪里寻找数据>如何处理它>存储索引的位置 好吧,我不知道应该更改哪个文件. 我在sphinx文件夹中找到了一个名为configure的文件,我尝试了这个,然后我更改了sphinx.conf.in但我仍然不能使用sphinx. 如果你...

php – 如何在sphinx中截断RT索引表【代码】

是否可以在sphinx中截断RT索引表.如果是的话,我们怎么做呢解决方法:现在它可用:TRUNCATE RTINDEX rt;http://sphinxsearch.com/docs/current.html#sphinxql-truncate-rtindex