nutch搜索引擎高级视频教程.19.第十九套:nutch搜索引擎高级视频教程
资源详情
课程目录01-概述、运行方式、连接hadoop、分析nutch脚本.mp402-nutch-default.xml配置项、常用命令.mp403-详解nutch的存储文件夹data、crawldbsegmentslinkdb命令.mp404-深入分析nutch的抓取周期、3大merge和3大read命令阐释、反转链接、解析页面.mp405-域统计、webgraph.mp406-注入分值、轻量级抓取.mp407-indexchecker、安装配置solr、运行solr并提交索引、使用luke工具查看索引、给solr配置分词器mmseg4j.mp408-指定luke工具的分词器、运行solr并提交索引.mp409-安装windows上的nutch运行环境cygwin、运行nutch.mp410-hadoop单机本地模式、hadoop单机伪分布式模式、执行nutch的crawl命令.mp411-配置cygwin支持无密码ssh登录、windows上的hadoop单机伪分布式、执行wordcount命令.mp412-hadoop多机完全分布式模式.mp413-改变机器负载、secondarynamenode、启用回收站.mp414-动态增加datanode节点和tasktracker节点.mp415-限制hadoop节点连接、动态删除datanode节点和tasktracker节点.mp416-运行基准测试.mp417-配置服务端、配置客户端、访问页面、集成hadoop.mp418-压缩数据、以不同压缩方法注入url、hadoop配置snappy压缩.mp419-ganglia以组播或单播方式监控同一个网段中的多个集群、ganglia监控不同网段中的多个集群.mp420-ganglia以单播方式监控跨多个网段的单一集群、配置hadoop集群使用单播地址、扩展集群让其节点分别位于3个不同网段、配置host138.mp4