执行./nutch 命令后出现的nutch脚本用法解读

2024-06-23 17:38

本文主要是介绍执行./nutch 命令后出现的nutch脚本用法解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


Usage: nutch COMMAND  

where COMMAND is one of:  
inject        inject new urls into the database  :注入新的url到数据库中
hostinject    creates or updates an existing host table from a text file :从一个文本文件中创建或更新现有主机表
generate      generate new batches to fetch from crawl db: 生成新的批次从db爬取
fetch         fetch URLs marked during generate:获取url标记中生成
updatedb      update web table after parsing:解析后更新网络表
updatehostdb  update host table after parsing:解析后更新主机表
readdb        read/dump records from page database:从页面数据库中读取和转储记录
readhostdb    display entries from the hostDB:从主机数据库中显示实体
elasticindex  run the elasticsearch indexer:运行elasticsearch索引器
solrindex     run the solr indexer on parsed batches:在解析批次时运行solr索引器
solrdedup     remove duplicates from solr:从solr中移出多重记录(副本、去重!)
parsechecker  check the parser for a given url:对于一个给定的url检查解析
indexchecker  check the indexing filters for a given url:对于一个给定的过滤器,检查索引过滤器
plugin        load a plugin and run one of its classes main():加载插件和运行它的主类
nutchserver   run a (local) Nutch server on a user defined port:在用户定义端口上运行一个本地nutch服务器
junit         runs the given JUnit test:运行一个给定的junit单元测试
or
CLASSNAME     run the class named CLASSNAME:运行类命名的类名
Most commands print help when invoked w/o parameters:大多数命令在调用时打印帮助参数。

cat nutch|wc -l:此行命令的作用是:统计nutch脚本的行数,结果是244行

这篇关于执行./nutch 命令后出现的nutch脚本用法解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087831

相关文章

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

JDK21对虚拟线程的几种用法实践指南

《JDK21对虚拟线程的几种用法实践指南》虚拟线程是Java中的一种轻量级线程,由JVM管理,特别适合于I/O密集型任务,:本文主要介绍JDK21对虚拟线程的几种用法,文中通过代码介绍的非常详细,... 目录一、参考官方文档二、什么是虚拟线程三、几种用法1、Thread.ofVirtual().start(

Java8 Collectors.toMap() 的两种用法

《Java8Collectors.toMap()的两种用法》Collectors.toMap():JDK8中提供,用于将Stream流转换为Map,本文给大家介绍Java8Collector... 目录一、简单介绍用法1:根据某一属性,对对象的实例或属性做映射用法2:根据某一属性,对对象集合进行去重二、Du

java中ssh2执行多条命令的四种方法

《java中ssh2执行多条命令的四种方法》本文主要介绍了java中ssh2执行多条命令的四种方法,包括分号分隔、管道分隔、EOF块、脚本调用,可确保环境配置生效,提升操作效率,具有一定的参考价值,感... 目录1 使用分号隔开2 使用管道符号隔开3 使用写EOF的方式4 使用脚本的方式大家平时有没有遇到自

mybatis直接执行完整sql及踩坑解决

《mybatis直接执行完整sql及踩坑解决》MyBatis可通过select标签执行动态SQL,DQL用ListLinkedHashMap接收结果,DML用int处理,注意防御SQL注入,优先使用#... 目录myBATiFBNZQs直接执行完整sql及踩坑select语句采用count、insert、u

MySQL之搜索引擎使用解读

《MySQL之搜索引擎使用解读》MySQL存储引擎是数据存储和管理的核心组件,不同引擎(如InnoDB、MyISAM)采用不同机制,InnoDB支持事务与行锁,适合高并发场景;MyISAM不支持事务,... 目录mysql的存储引擎是什么MySQL存储引擎的功能MySQL的存储引擎的分类查看存储引擎1.命令

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

Linux命令rm如何删除名字以“-”开头的文件

《Linux命令rm如何删除名字以“-”开头的文件》Linux中,命令的解析机制非常灵活,它会根据命令的开头字符来判断是否需要执行命令选项,对于文件操作命令(如rm、ls等),系统默认会将命令开头的某... 目录先搞懂:为啥“-”开头的文件删不掉?两种超简单的删除方法(小白也能学会)方法1:用“--”分隔命