执行./nutch 命令后出现的nutch脚本用法解读

2024-06-23 17:38

本文主要是介绍执行./nutch 命令后出现的nutch脚本用法解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


Usage: nutch COMMAND  

where COMMAND is one of:  
inject        inject new urls into the database  :注入新的url到数据库中
hostinject    creates or updates an existing host table from a text file :从一个文本文件中创建或更新现有主机表
generate      generate new batches to fetch from crawl db: 生成新的批次从db爬取
fetch         fetch URLs marked during generate:获取url标记中生成
updatedb      update web table after parsing:解析后更新网络表
updatehostdb  update host table after parsing:解析后更新主机表
readdb        read/dump records from page database:从页面数据库中读取和转储记录
readhostdb    display entries from the hostDB:从主机数据库中显示实体
elasticindex  run the elasticsearch indexer:运行elasticsearch索引器
solrindex     run the solr indexer on parsed batches:在解析批次时运行solr索引器
solrdedup     remove duplicates from solr:从solr中移出多重记录(副本、去重!)
parsechecker  check the parser for a given url:对于一个给定的url检查解析
indexchecker  check the indexing filters for a given url:对于一个给定的过滤器,检查索引过滤器
plugin        load a plugin and run one of its classes main():加载插件和运行它的主类
nutchserver   run a (local) Nutch server on a user defined port:在用户定义端口上运行一个本地nutch服务器
junit         runs the given JUnit test:运行一个给定的junit单元测试
or
CLASSNAME     run the class named CLASSNAME:运行类命名的类名
Most commands print help when invoked w/o parameters:大多数命令在调用时打印帮助参数。

cat nutch|wc -l:此行命令的作用是:统计nutch脚本的行数,结果是244行

这篇关于执行./nutch 命令后出现的nutch脚本用法解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087831

相关文章

nginx启动命令和默认配置文件的使用

《nginx启动命令和默认配置文件的使用》:本文主要介绍nginx启动命令和默认配置文件的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录常见命令nginx.conf配置文件location匹配规则图片服务器总结常见命令# 默认配置文件启动./nginx

mysql中insert into的基本用法和一些示例

《mysql中insertinto的基本用法和一些示例》INSERTINTO用于向MySQL表插入新行,支持单行/多行及部分列插入,下面给大家介绍mysql中insertinto的基本用法和一些示例... 目录基本语法插入单行数据插入多行数据插入部分列的数据插入默认值注意事项在mysql中,INSERT I

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

mapstruct中的@Mapper注解的基本用法

《mapstruct中的@Mapper注解的基本用法》在MapStruct中,@Mapper注解是核心注解之一,用于标记一个接口或抽象类为MapStruct的映射器(Mapper),本文给大家介绍ma... 目录1. 基本用法2. 常用属性3. 高级用法4. 注意事项5. 总结6. 编译异常处理在MapSt

基于Python实现一个Windows Tree命令工具

《基于Python实现一个WindowsTree命令工具》今天想要在Windows平台的CMD命令终端窗口中使用像Linux下的tree命令,打印一下目录结构层级树,然而还真有tree命令,但是发现... 目录引言实现代码使用说明可用选项示例用法功能特点添加到环境变量方法一:创建批处理文件并添加到PATH1

java中long的一些常见用法

《java中long的一些常见用法》在Java中,long是一种基本数据类型,用于表示长整型数值,接下来通过本文给大家介绍java中long的一些常见用法,感兴趣的朋友一起看看吧... 在Java中,long是一种基本数据类型,用于表示长整型数值。它的取值范围比int更大,从-922337203685477

MyBatis ResultMap 的基本用法示例详解

《MyBatisResultMap的基本用法示例详解》在MyBatis中,resultMap用于定义数据库查询结果到Java对象属性的映射关系,本文给大家介绍MyBatisResultMap的基本... 目录MyBATis 中的 resultMap1. resultMap 的基本语法2. 简单的 resul

Python主动抛出异常的各种用法和场景分析

《Python主动抛出异常的各种用法和场景分析》在Python中,我们不仅可以捕获和处理异常,还可以主动抛出异常,也就是以类的方式自定义错误的类型和提示信息,这在编程中非常有用,下面我将详细解释主动抛... 目录一、为什么要主动抛出异常?二、基本语法:raise关键字基本示例三、raise的多种用法1. 抛

java中Optional的核心用法和最佳实践

《java中Optional的核心用法和最佳实践》Java8中Optional用于处理可能为null的值,减少空指针异常,:本文主要介绍java中Optional核心用法和最佳实践的相关资料,文中... 目录前言1. 创建 Optional 对象1.1 常规创建方式2. 访问 Optional 中的值2.1

Nacos注册中心和配置中心的底层原理全面解读

《Nacos注册中心和配置中心的底层原理全面解读》:本文主要介绍Nacos注册中心和配置中心的底层原理的全面解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录临时实例和永久实例为什么 Nacos 要将服务实例分为临时实例和永久实例?1.x 版本和2.x版本的区别