电子书:《自己动手写分布式搜索引擎》《自己动手写分布式搜索引擎》

电子书:《自己动手写分布式搜索引擎》《自己动手写分布式搜索引擎》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《自己动手写分布式搜索引擎》《自己动手写分布式搜索引擎》

111

内容简介:

内容简介本书介绍了分布式搜索引繁开发的原理与java实现.主要包括全文检索的原理与实现、分布式算法与代码实现、 solrcloud和 elasticsearch的使用与原理等内容.井着重介绍了一种实现分布式中文搜索引的方法本书适合有java程序设计基础的开发人员或者对分布式搜素引技术感兴趣的从业人员使用本书封面贴有清华大学出版社防伪标签.无标签者不得销售版权所有.侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(cip)数据自己动手写分布式搜索引/罗刚.崔智杰編著.一北京:清华大学出版社.2017isbn978-7-302-47708-21.①自….①罗…②崔….①搜素引一程序设计v.tp391.3中guo版本图书馆cip数据核字(2017)第162194号责任编辑:杨作梅质任校对:张彦彬责任印制:李红英出版发行:清华大学出版社网址:htp:/ww.up.com.cn.htip/www.abook.com地址:北京清华大学学研大厦a座邮编:100084社总机:010-6270175邮购:010-62786544投稿与读者服务:010-62776969. c-serviceratup. tsinghua.edu.cn质量反馈:010-62772015.zhiliang(@tup.tsinghua.edu.cn印装者:三河市金元印装有限公司经销:全guo新华书店开本:185mmx260mm印张:26.7字数:650千字版次:2017年9月第1版e印数:1~3000定价:59.00元产品编号:075226-01前言搜索引擎成为人们获取信息不可或缺的工具。大数据技术的发展推动了多机集群的分布式搜索引擎技术走向成熟。普通的机器就可以搭建分布式搜索引。一些开源的分布式搜素引系统在数据存储、数据分析等方面的功能越来越强大。本书希望用通俗易懂的语言.让任何对分布式搜索引擎技术感兴趣的读者都能够有所收获本书的很多内容来源于搜索引擎、自然语言处理、金融等领域的项目开发和教学实践在此感谢开源软件的开发者们.他们无私的工作丰富了本书的内容本书的第1章介绍开发分布式搜索引所需要的基本算法;第2章介绍如何从头开始自己动手写一个简单的全文检索软件包:第3章介绍 lucene的基本使用方法及其原理;第4章介绍使用jsp或者 struts2开发搜素引擘用户界面.以及用户界面常用的 taglib:第5章介绍sol实现分布式搜索引的解决方案 solrcloud.以及它对sol查询的支持;第6章介绍如何使用基于 lucene的 elasticsearch实现分布式搜索引鉴于 elasticsearch处于快速发展中些新版本的具体使用情况可以加入.q.q.群.46040545.进行讨论本书配套的光盘中提供了相关的源代码.有的来源于猎兔搜索多年的开发经验积累有的是经典算法实现。其中很多源代码都可以直接用于项目实践本书适合需要具体实现搜索引擎的程序员使用.对于信息检索等相关领域的研究人也有一定的参考价值.同时猎兔搜索技术团队已经开发出以本书为基础的专门培训课程和商业软件。目前的一些分布式搜索引攣软件仍然有很多功能有待完善.作者真诚地希望通过本书把读者带入分布式搜索引摹开发的大门并认识更多的朋友感谢早期合著者、合作伙伴、员工、学员的支持.给我们提供了良好的工作基础。在将来.希望我们的分布式搜索引擎代码和技术能够像雨后春算一样快速生长本书由罗刚、崔智杰编著.另外参与本书编写的还有张晓斐、石天盈、张继红、张进威、刘宇、何淑琴、任通通、高丹丹、徐友峰、孙宽.在此一并表示感谢编者目录第1章搜索引擎3.2创建和维护索引库搜素引擎基本模块3.2.1设计索引库结构3.2.2创建索引库7781.2开发环境3搜索引繁工作原理3.2.3向素引库中添加索引文档..401.3.1网络爬虫3.2.4删除素引库中的索引文档.432全文素引3.25更新素引库中的素引文档1.3.3搜索用户界面2.6关闭索引库3.4分布式计算3.27素引的优化与合并书563.5文本挖掘3..2.8灵活索引1.4算法基础3.2.9索引文件格式1.4.1折半查找3.2.10定制素引存储结构1.4.2排序3.2.11写素引集成到爬虫4.3最小生成树3.2.12多线程写索引1.5软件工具3.2.13分发索引946811.6单元测试2.14修复索引1.7本章小结3.3查找索引库1.8术语表3.31查询过程第2章自己动手写全文检索3.3.2常用查询92353.3.3基本词查询2.1构建索引.3.3.4模糊匹配2.2生成索引文件3.3.5布尔查询2.3读入索引文件3.3.6短语查询66712.4查询3.3.7跨度查询2.5有限状态机3.3.8 fieldscorequery2.5.1运算3.3.9排序2.52编辑距离有限状态机3.3.10使用 filter筛选搜索结果.812.6本章小结第3章 lucene的原理与应用20233.3.11使用 collector t选搜素3.3.12遍历索引库3.1 lucene快速入门3.3.13关键词高亮是3.1.1创建素引88g3.1.2查询索引库3.3.15关联内容( blockjoinquery).923.13创建文档素引3.3.16查询大容量索引3.1.4查询文档索引3.4读写并发己动手写分布式搜索ら5 lucene深入介绍.3.5.1整体结构3.10.4 vsencoding.3.5.2素引原理3.10.5前缀压缩3.5.3文档值3.10.6差分编码3.10.7静态索引裁剪3.6查询语法与解析3.11搜索中文3.1. lucene切分原理3.6.2生成一个查询解析器3.112 lucene中的 analyzer3.63简单的查询解析器.143.113自己写 analyzer3.6.4灵活的查询解析器3.11.4 lietu中文分词3.7检索模型3.11.5字词混合索引3.7.1向量空间模型3.12搜索英文3.7.2dfr3.12.1英文分词3.7.3bm25概率模型..1303.12.2词性标注1993.7.4bm25f概率模型3.12.3原型化2017.5统计语言模型..1383.13素引数据库中的文本3.14优化使用 lucene7.7隐含语义索引3.14.1系统优化3.14.2查询优化7.9查询与相关度3.14.3实现时间加权排序3.7.10使用 payload调整相关性.1423.14.4词性标注.8查询原理.03.14.5个性化搜索3.8.1布尔匹配3.15实时搜索3.8.2短语查询3.16语义搜索3.83索引统计3.16.1发现同义3.162垂直領域同义词3.16.3同义词扩.9分析文本3.16.4语义标注3.9.1 analyzer…3.17本章小结2mm3.18术语表3.9.3定制 tokenizer3.9.4重用 tokenizer16第4章搜索引擎用户界面3.9.5有限状态转换实现 lucene搜素3.9.6索引数值列4.1.1测试搜索功能3.9.7检素结果排序1714.1.2加载索引3.9.8处理价格4.2搜索页面设计3.10 lucene中的压缩算法4.2.1 struts2实现的搜索界面10.1变长压縮2.2用于显示搜索结果的3.10.2 gammataglib0《4.23实现翻页4.1.1部署到wcb服.务.器.24.3实现搜素接口4.12防止_攻.击_4.3.1编码识别4.12手机搜索界面.294.3.2布尔搜索4.13本章小结4.33指定范围搜索.241第5章sor分布式搜索引4.3.4搜索结果排序.3.5素引缓存与更新5.1solr简介4.4实现分类统计视图2sol基本用法4.4.1单值列分类统52.1solr服.务.器端的配置与中文4.4.2侧钻4.5实现相似文档搜索5.2.2数据类型4.6实现aax搜索联想词5.2.3解析器0m4.6.1估计查询词的文档频率.255.2.4把数据放进solr4.62搜索联想词总体结构5..2.5删除数据4.6.3服.务.器端处理5.2.6查询语法4.6.4浏览器端处理5.3使用solr4.6.5拼音提示5.3.1solr客.户.端与搜索界面4.6.6部署总结2675.32solr素引库的查找4.7推荐搜索词5.3.3分类统计4.71挖掘相关搜素词5.3.4高亮4.72使用多线程计算相关535同义词322搜索词5.3.6嵌入式solr4.8查询意图理解5.3.7 spring实现的搜索界面3234.8.1拼音搜素.2715.3.8索引分发4.8.2无结果处理2725.3.9solr搜素优化4.9集成其他功能4从 fast search移植到 solr4.9.1拼写检查5.5solr扩展与定制5.5.1献省查询4.9.3相关搜素3384.9.4再次查找5.5.3solr中字词混合索4.9.5搜索ri志4.10查询分析5.5.5搜索结果去重4.10.1历史搜索词记录5.5.6定制输入输出4.10.2ri志信息过速5.7聚类5.5.8分布式搜索4.10.4挖掘ri志信息5.5.9分布式索引4.10.5查询词意图分析.2905.5.10solr查询分析器4.11部署网站5.5.11扩展 sorj

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/222838.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录