java – Elasticsearch:从点击中学习(搜索结果排名)
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了java – Elasticsearch:从点击中学习(搜索结果排名),小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1766字,纯文字阅读大概需要3分钟。
内容图文
![java – Elasticsearch:从点击中学习(搜索结果排名)](/upload/InfoBanner/zyjiaocheng/808/cac849cfd1dd45a88f3e664b8559660e.jpg)
我已经阅读了Programming Collective Intelligence书中的“从点击中学习”一章,并且喜欢这个想法:搜索引擎在那里了解用户点击了哪些结果并使用这些信息来提高结果的排名.
我认为如果我可以从用户点击中学习,它将在我的Java / Elasticsearch应用程序中大大提高搜索排名的质量.
在本书中,他们构建了一个multiplayer perceptron (MLP) network,即使对于新的搜索短语,也可以使用学到的信息.他们使用Python和SQL数据库来计算搜索排名.
有没有人已经使用Elasticsearch实现了这样的东西或知道一个示例项目?
如果我可以直接在Elasticsearch中管理点击信息而不需要额外的SQL数据库,那就太棒了.
解决方法:
在信息检索领域(搜索和推荐的一般学术领域),这通常被称为Learning to Rank.无论是点击,转换还是其他形式的搜索关键字搜索的“好”或“坏”结果学习排名使用分类器或回归过程来了解查询和文档的哪些特征与相关性相关.
点击?
对于具体的点击,有理由怀疑优化点击是理想的.微软研究院的一篇论文我试图挖掘出这样的说法,即在他们的情况下,点击率与相关性只有45%相关.点击停留通常是一个更有用的通用相关指标.
当我谈到in this blog article时,搜索中还存在自我强化偏见的风险.如果你已经显示用户平庸的结果,并且他们不断点击那些平庸的结果,你最终会加强搜索到继续向用户展示平庸的结果.
除了点击之外,通常会针对您应该衡量的内容进行特定于域的考虑.例如,在电子商务中,转换很重要.也许导致这种购买的搜索结果点击应该更多.当你观看5分钟的电影并回到菜单30分钟后退出时,Netflix就会试图说出它意味着什么.一些搜索用例是信息性的:当您在研究和点击许多搜索结果时,与您购买单个项目时相比,点击可能意味着不同.
很遗憾地说这不是一颗银弹.我听说过许多成功和不成功的学习排名的尝试,它主要归结为你在衡量用户认为相关的方面取得的成功.这个问题的难度让很多人感到惊讶
对于Elasticsearch ……
特别是对于Elasticsearch,有this plugin(免责声明我是作者).这是documented here.一旦你弄清楚如何为特定查询“评分”文档(无论是点击还是更多),你就可以训练一个模型,然后通过这个插件将其输入Elasticsearch进行排名.
内容总结
以上是互联网集市为您收集整理的java – Elasticsearch:从点击中学习(搜索结果排名)全部内容,希望文章能够帮你解决java – Elasticsearch:从点击中学习(搜索结果排名)所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。