电子书《驾驭文本:文本的发现组织和处理》《驾驭文本:文本的发现组织和处理》

电子书《驾驭文本:文本的发现组织和处理》《驾驭文本:文本的发现组织和处理》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书《驾驭文本:文本的发现组织和处理》《驾驭文本:文本的发现组织和处理》

111

内容简介:

grant s. ingersoll-位工程师、讲师相培训师.也? lucene代码的提交者以及机器学习项目 mahout的联合始人thomas s. morton是 opennlp和maximum entropy(最大)的主要开andrew l. farris是一位技术顾问、软件开发人员及 mahout、 lucene和sor的贡献者驾驭文本文本的发现、组织和处理laminatexthow to find. organize. and manipulate itgrant s. ingersoll美] thomas s. morton著andrew l. faris王斌译電子工掌出版社publishing house of electronics industry北京· beuing内容简介文本处理是目前互联网内容应用(如搜索引、推荐引撃)的关键技术。本书函盖了文本处理概念和技术的多个方面.包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本书的特点在于通过实例来理解文本处理的这些概念和技术.读者利用现有的开源工具就可以自己实现这些实例。本书适合互联网文本内容处理领域的开发人员阅读.也适合有志于加入这一领域的学生、从业人员阅读。即使对于己经从事多年文本处理研究和开发工作的人员来说.本书也不失为一种有益的补充性读物onginal english language edition published by manning publications. usa. copyright 02013 bymanning publications. simplified chinese-language edition copyright (@2015 by publishing house ofelectronics industry. all rights reserved本书简体中文版专有出版权由 manning publications投予电子工业出版社。未经许可.不得以任何方式复制或抄袭本书的任何部分。专有出版权受法律保护版权贸易合同登记号图字:01-2014-57图书在版编目(cip)数据驾文本:文本的发現、组织和处理(美)英格索尔( ingersoll.g.s.).(美)莫顿(mtom.ts.)(美)法里斯( farris.a.l)著:王斌译.一北京:电子工业出版社.2015.7书名原文: taming text how to find. organize. and manipulate itisbn9787-121-25230-31.①驾“i.①英…②莫…③法…④王….①自然语言处理一研究n.otp391中guo版本图书馆cip数据核字(2014)第302750号策划辑:符隆美责任编辑:徐津平印刷:北京天宇星印刷厂装订:北京天宇星印刷出版发行:电子工业出版社北京市海淀区万寿路173信箱郎编:100036开本:787×9801/16印张:21.25字数:350千字版次:2015年7月第1版印次:2016年9月第2次印刷定价:79.007凡所购买电子工业出版社图书有缺损问题.请向购买书店调换。若书店售缺.请与本社发行部联系.联系及郎购电话010)88254888.882588。质量投诉请发郎件至zits(aphei.com.cn.盗版侵权举报请发郎件至dbqq(aphei.com.cn本书咨询联系方式:010-5126088-819faq(@phei.com.cn译者序不知不觉.我进入信息内容处理这个领域已经有近20年了。这些年中.我的研究涉及机器醐译、web搜索、跨语言检索、垃圾邮件过滤、问答、推荐、文本分类聚类、情感分析等诸多技术或应用.也开发了多个原型以及实用系统。我十分高兴能够在这个有趣的领域不断地学习新技术.了解并开发新应用。与此同时.我也亲眼目睹了很多优秀的技术书籍不断涌现。完全出于兴趣爱好以及与大家分享的个人追求.我先后翻译了《信息检索导论》、《大数据:互联网大规模数据挖掘与分布式处理》、《机器学习实战》、《 mahout实战》等教材或技术书籍。现在.我又推荐给大家手边的这本《驾取文本》文本处理是很多应用的基本技术.包括上面提到的搜索、推荐、问答应用都离不开文本处理。“驾驭”文本对于这些系统至关重要。然而.文本特别是自然语言文本本身的情况十分复杂.处理起来十分烦琐.难度很大。如何利用已有开源工具高效地“驾驭”文本是本书的目标。很显然.对于文本处理开发人员来说.这本书能够提供支撑。当然.由于自然语言文本固有的歧义性.文本处理技术特别是深层理解”技术还远未成熟.研究人员还在不断努力.全方面真正“驾驭”文本是所有文本处理工作人员的终极梦想本书介绍了文本搜索、模糊字符串匹配、命名实体识别、文本聚类分类标注等多种文本处理关键技术.并通过融合上述技术构建了一个简单的事实型问答系统所有的单项技术都有可供下载使用的数据集和相应的运行代码.读者可以下载这些驾取文本:文本的发现、组织和处理代码和数据进行尝试.以便能够更加深人地理解这些技术本书作者都是开源社区的重要贡献者.他们在文本处理领域具有丰富的开发经验。这些经验也都体现在本书的内容写作中。感谢出版社和编辑部的辛勤工作.感谢实验室领导、同事以及译者家人对翻译本书的支持因本人各方面水平有限.现有译文中肯定存在许多不足。希望读者能够和我进行联系.以便能够不断改进。来信请联系[email protected]年3月15ri于中关村

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/224588.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录