lucene_Tag标签_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
当前位置:程序员俱乐部 >>Tag标签 >> lucene >>列表
之前做去转盘网的时候,我已经公开了非全文搜索的代码,需要的朋友希望能够前去阅读我的博客。本文主要讨论如何进行全文搜索,由于本人花了很长时间设计了新作:观点,观点对全文搜索的要求还是很高的,所以我又花了不少时间研究全文搜索,你可以先体验下:点我搜索。废话也不多说了,直接上代码:publicMap<String,Object>articleSearchAlgorithms(SearchConditioncondition,IndexSearchersearcher... 查看全文
· 【转】jieba.NET与Lucene.Net的集成发布时间:2017-10-20
首先声明:我对Lucene.Net并不熟悉,但搜索确实是分词的一个重要应用,所以这里还是尝试将两者集成起来,也许对你有一参考。看到了两个中文分词与Lucene.Net的集成项目:Lucene.Net.Analysis.PanGu和Lucene.Net.Analysis.MMSeg,参考其中的代码实现了最简单的集成:jiebaForLuceneNet。下面给出简单的介绍。1、JiebaTokenizer主要的集成点是自定义一个Tokenizer的子类... 查看全文
最近我们搜易站内搜索系统的一个客户需要一个无限级分类和分类统计功能,要实现的效果如下:但由于搜易站内搜索系统是基于Lucene.net2.0开发的,并没有内置的分类统计搜索功能,于是乎只能自己实现了,考虑到客户的总数据量和搜索量不是特别大,于是用了简单有效的方式来实现:因为涉及到分类的操作,但是每个站点的分类体系还是有些不一样的,本文主要提供思路和部分演示代码,给有需要的童鞋参考:思路:首先想到Lucene搜索出来的结果是一个Hits对象,Hits其实就是一个搜索结果文档的集合对象... 查看全文
实现效果:上一篇文章有附全文搜索结果的设计图,下面截一张开发完成上线后的实图:基本风格是模仿的百度搜索结果,绿色的分页略显小清新。目前已采集并创建索引的文章约3W多篇,索引文件不算太大,查询速度非常棒。刀不磨要生锈,人不学要落后。每天都要学一些新东西。基本技术介绍:还记得上一次做全文搜索是在2013年,主要核心设计与代码均是当时的架构师写的,自己只能算是全程参与。当时使用的是经典搭配:盘古分词+Lucene.net。前几篇文章有说到,盘古分词已经很多年不更新了... 查看全文
我想只要是学过数据库的孩纸,不管是mysql,还是sqlsever,一提到查找,本能的想到的便是like关键字,其实去转盘网(分类模式)之前也是采用这种算法,但我可以告诉大家一个很不幸的事情,like匹配其实会浪费大量的有用资源,原因这里不说了请自己想一想,我们还是直接摆事实验证。现在用去转盘网搜:hello找个单词,如下:http://www.quzhuanpan.com/source/search.action?q=hello&... 查看全文
· 使用Lucene.NET实现站内搜索发布时间:2015-04-28
使用Lucene.NET实现站内搜索导入Lucene.NET开发包Lucene是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene.Net是.NET版的Lucene。你可以在这里下载到最新的Lucene.NET创建索引、更新索引、删除索引搜索... 查看全文
前言首先,关于Lucene.Net的文章已经很多了。我这次决定写出来只是为了练练手,虽然在别人看来没什么用,但是自己确实是手动实践了一把。我个人觉得还是有意义的。爱折腾、敢于实践、才能有所收获,才能发现问题。不要怕自己写的东西有问题,有问题才更好呢,可以让更多的人看见,提意见的当然是好,鄙视的……我也接受,给自己动力去思考。想让自己时刻保持着这种程序员-->代码心态、人都是带有惰性的,一旦玩起来呵呵...效果显示进入主题相信大家对于LuceneNet并不陌生了... 查看全文
· Lucene查询条数限制发布时间:2015-04-01
运用Lucene进行索引,在查询的时候是有条数限制的1publicvirtualTopFieldDocsSearch(Queryquery,Filterfilter,intn,Sortsort);可以看到第三个参数是int类型,所以返回的条数为int最大值。因为Lucene为索引查询,所以不需要返回全部的数据,根据关键词返回匹配的数据,按照分值排序,int大小的数据足够筛选出匹配的正确数据。在运用Lucene查询的是否不易返回过多条数,这样会影响性能,一般1000条左右就够了。... 查看全文
· lucene4.9初体验发布时间:2015-01-28
1.入门代码importjava.io.File;importjava.io.IOException;importorg.apache.lucene.analysis.Analyzer;importorg.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document... 查看全文
· lucene4.9之analyzer发布时间:2015-01-28
查看分词器分出的词组importjava.io.IOException;importorg.apache.lucene.analysis.Analyzer;importorg.apache.lucene.analysis.TokenStream;importorg.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;importorg.apache.lucene.analysis.standard.StandardAnalyzer... 查看全文
· lucene4.9之Query发布时间:2015-01-28
测试Query类型importjava.io.File;importorg.apache.lucene.document.Document;importorg.apache.lucene.index.DirectoryReader;importorg.apache.lucene.index.IndexReader;importorg.apache.lucene.index.Term;importorg.apache.lucene.search.BooleanQuery;importorg... 查看全文
· lucene4.9之highlight发布时间:2015-01-28
测试高亮importjava.io.File;importorg.apache.lucene.analysis.Analyzer;importorg.apache.lucene.analysis.TokenStream;importorg.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache... 查看全文
· Lucene(Lucence)建立索引(字段)发布时间:2014-11-21
Lucene,这是官方称谓,也有许多人叫它Lucence,做搜索和分词用的工具包.也有人说是Java下的搜索引擎框架库,见仁见智的说法罢了.不管叫什么,确实非常有用,比如做全站的搜索,其实它的用处远大于此,但凡涉及到文本搜索的地方就能用到它.我们就以做全站搜索为例,演示一下如何应用Lucene建立索引.... 查看全文
Lucene简介Lucene是apache软件基金会4jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene.net简介Lucene.net是Lucene的.net移植版本... 查看全文
· Lucene.net初探发布时间:2014-08-28
引言在分析同事开发的客户端搜索项目时注意到,搜索的关键是索引,而提到索引就不得不提Lucene.net,思路就是将需要搜索内容写入索引,客户端自己或局域网其他机器搜索时直接搜索索引,从而查看到你共享的信息。初探Lucene.net时关注了几个关键类:a):IndexReader索引读取。b):IndexWriter创建索引。c):StandardAnalyzer分词解析,这个应用就比较多了,他解析英文和中文时会拆成单个的字母或者汉字,如果使用PanGuAnalyzer【盘古分析解析... 查看全文
在上一篇中,我们初步理解了索引的增删改查基本操作。本文着重介绍一下常用的搜索,以及搜索结果的排序和分页。本文的搜索主要是基于前一篇介绍的文本文件的索引,建议下载最后改进的demo对照着看阅读本文,同时大家可以自己动手创建一些测试文本,然后建立索引并搜索试试看。一、初步认识搜索先从上一篇示例代码中我们摘录一段代码看看搜索的简单实现:1234567891011121314151617181920212223privateTopDocsSearch(stringkeyword,stringfield... 查看全文
· Lucene五分钟教程发布时间:2014-08-19
英文原文:Lucenein5minutes更新:下面的代码使用Lucene4.0版本!Lucene大大简化了在应用中集成全文搜索的功能。但实际上Lucene十分简单,我可以在五分钟之内向你展示如何使用Lucene。1.建立索引为了简单起见,我们下面为一些字符串创建内存索引:StandardAnalyzeranalyzer=newStandardAnalyzer(Version.LUCENE_40);Directoryindex=newRAMDirectory()... 查看全文
1、索引的管理//指定索引库文件存放文件位置FSDirectorydirectory=FSDirectory.Open(newDirectoryInfo(this.IndexDataDir),newNativeFSLockFactory());//判断索引文件目录是否存在boolisExist=IndexReader.IndexExists(directory);if(isExist){if(IndexWriter.IsLocked(directory)){IndexWriter.Unlock... 查看全文
lucene在doc.add(newField("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED));Field有两个属性可选:存储和索引。通过存储属性你可以控制是否对这个Field进行存储;通过索引属性你可以控制是否对该Field进行索引。事实上对这两个属性的正确组合很重要。Field.IndexField.Store说明TOKENIZED(分词... 查看全文
ApacheLucene?和Solr?是强大的开源搜索技术,使组织能够轻松地显著增强数据访问。借助4.x版的Lucene和Solr,向数据驱动应用程序中添加可扩展的搜索功能变得比以往更加轻松。Lucene和Solr提交者GrantIngersoll介绍了与相关性、分布式搜索和分面(facet)相关的最新Lucene和Solr功能。本文将学习如何利用这些功能构建快速、高效、可扩展的下一代数据驱动应用程序。0评论:GrantIngersoll,资深技术人员... 查看全文