我敢打赌,看完这些Linux文本查找技巧,提高你80%工作效率!

2024-03-16 04:08

本文主要是介绍我敢打赌,看完这些Linux文本查找技巧,提高你80%工作效率!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=jpeg

作者:守望先生

公众号:编程珠玑

前言

之前介绍过很多linux下查找相关的命令,而对文件内容搜索的命令似乎还没有涉及,因此本文介绍文本搜索命令--grep。

常见用法

我们会经常结合管道符(|)来使用它,即在前面命令执行的结果中查找包含相关字符串的内容。例如:

$ ps -ef|grep redis

ps -ef用于查看系统进程情况,但是它列出的结果很多,如果我们只想看到自己需要的,则通过管道符,用grep进行过滤搜索,例如搜索redis相关的进程,最后它只会列出和redis相关的进程了:

$  ps -ef|grep redis
root     10748 10733  0 21:14 pts/21   00:00:00 redis-server *:6379
root     10754 10733  0 21:14 pts/21   00:00:00 grep --color=auto redis

那么如果要排除某些不相关信息呢?我们可以使用-v参数

$ ps -ef|grep redis |grep -v auto
root     10748 10733  0 21:14 pts/21   00:00:00 redis-server *:6379

这样一来,包含auto相关的结果就不会出现在最终结果里了。

如果只想统计结果数量呢?我们可以结合-c(count)参数:

$ ps -ef|grep redis -c
2

文件内容搜索

好了,说完了最常见的用法,我们来看看如何搜索文件内容。实际上awk和sed在这方面也颇有经验,不过本文的主角是grep,所以另外两个命令暂时不涉及。我们来看几个实例。

在指定文件中查找指定关键字

例如,要在linux_command_debug.md文件中,查找test字符串:

$  grep "test" aaa/bbb/linux_command_debug.md
int test(int a,int b)test(a,b);

如果想要显示指定关键字的行号,可以使用-n参数,例如:

$  grep -n "test" aaa/bbb/linux_command_debug.md
18:int test(int a,int b)
27:    test(a,b);
搜索时指定或排除多个文件

前面提到了对一个文件内容进行搜索,如果是多个呢?或者不想从某些文件里搜索呢?

如果想对文件进行指定也是可以的,例如搜索所有的md结尾的文件:

$  grep -n "test" *.md

或者可以使用--exclude参数来排除某些文件,例如,查找包含test,但是排除txt文件:

$ grep -rn "test" --exclude=*.txt

搜索时就会忽略.txt结尾的文件了。

如果要排除的条件比较多,可以将要排除的条件存储在另外一个文件里:

$ grep -rn "test" --exclude-from=skip.txt

skip.txt的内容可以是模式匹配的文件名或者具体文件名:

*.txt
test.md

这样,以.txt结尾,以及test.md文件都不会搜索了。

除此之外,还可以排除指定目录,它需要用到--exclude-dir参数:

$ grep -rn "test" --exclude-dir=aaa

它在搜索时将会跳过aaa目录下的文件。

查找包含指定关键字的文件

如果要在当前目录下所有文件查找包含“int main(void)”字符串的文件:

$ grep -rn "int main(void)"
aaa/bbb/c_main_func.md:49:int main(void)
aaa/bbb/c_main_func.md:71:int main(void) { /* ... */ }
aaa/bbb/c_array.md:104:int main(void)
aaa/bbb/c_array.md:129:int main(void)
aaa/bbb/pc-lint.md:42:int main(void)
aaa/bbb/pc-lint.md:128:int main(void)

这可能是最实用的使用方法之一了。这里-r参数表示递归查找当前目录的文件,-n会显示查找位置的行号,如果只想显示包含该指定关键字的文件名,可使用-l(--file-with-matches)参数:

$ grep -rln "int main(void)"
aaa/bbb/c_main_func.md
aaa/bbb/c_array.md
aaa/bbb/pc-lint.md

如果你尝试一下就会发现,如果不带-r参数,它会暂停,等待你从控制台输入,例如:

$ grep -n "test"
test
1:test

所以使用时记得带上相关参数奥!

查找不包含指定关键字的文件

前面提到了如何查找包含某个关键字的文件,如果要找的是不包含该关键字的文件呢?

$ grep -rLn "int main(void)"
(这里会显示不包含指定关键字内容的文件名)
搜索时忽略大小写

使用-i(--ignore-case)参数即可:

$ grep -rni "int MAIN(void)"
aaa/bbb/c_main_func.md:49:int main(void)
aaa/bbb/c_main_func.md:71:int main(void) { /* ... */ }
aaa/bbb/c_array.md:104:int main(void)
aaa/bbb/c_array.md:129:int main(void)
aaa/bbb/pc-lint.md:42:int main(void)
aaa/bbb/pc-lint.md:128:int main(void)
搜索显示不包含指定关键字的行

前面的大部分例子都是显示符合条件的行,如果要显示不符合条件的行呢?可以用我们前面提到的-v参数:

$ grep -rnv "int main(void)"
(内容较多,未显示)

从结果中就会发现,它会展示出包含指定关键字的文件,但是展示的是不包含该关键字的行。

显示指定关键字前后内容

假如你需要查看包含指定关键字行附近的行,前面的方式是没有办法看到的,不过我们可以用-A(--after-context=)和-B(--before-context=)参数来显示前后的行:

$ grep -rn "int main(void)" -A 1 -B 1
aaa/bbb/c_array.md-103-}
aaa/bbb/c_array.md:104:int main(void)
aaa/bbb/c_array.md-105-{
(其他内容省略)

通过最后加上-A和-B参数,显示了指定关键字前后的行,这在日志搜索分析时非常有用。

指定规则文件进行搜索

如果有多个搜索关键字怎么处理呢?我们可以把关键字写在一个文件,搜索时指定文件即可,例如规则文件为key.txt:

int main(void)
test

从指定文件中搜索上面的关键字:

$ cat filename |grep -f key.txt

这样结果就会显示匹配key.txt文件中所有关键字的行,非常适合用于多个条件的搜索。

正则表达式搜索

看完前面的内容,是不是还没有感受到grep的强大?grep的另一个强大之处是,它的搜索支持正则表达式,例如查找文本行以t开头,以t结尾的文件:

$ grep -rn ^t.*t$
key.txt:2:test
aaa/bbb/c_operate_redis_start.md:68:typedef struct Stu_Info_Struct
aaa/bbb/c_operate_redis_start.md:101:typedef struct Stu_Info_Struct

其中^t,表明以t开头,t$表明以t结尾,如果需要使用扩展的正则表达式进行搜索,可使用egrep命令。关于正则表达式的写法,本文不做详细介绍。

总结

在内容搜索方面,grep常常能够助我们一臂之力,因此掌握grep的使用也是linux学习不可缺少的一部分,当然我们不需要完全记住每个参数的作用,但我们至少知道有这样的参数,并且在需要时能够快速查询到。本文常用参数如下:

  • -v #显示不包含匹配关键字的所有行。

  • -l #显示包含匹配关键字的文件

  • -L #显示不包含匹配关键字的文件

  • -r #递归搜索

  • -i #忽略大小写

  • -n #显示关键字所在行号

  • -A n #显示关键字后n行

  • -B n #显示关键字前n行

  • --exclude #搜索时排除某些文件

  • --exclude-dir #搜索时排除某些目录

  • -f #指定规则文件进行搜索

推荐阅读:

第四期人工智能 NLP / CV 课 培训招生

必会的 24 道 Shell 脚本面试题

你是一直认为 count(1) 比 count(*) 效率高么?

640?wx_fmt=jpeg

这篇关于我敢打赌,看完这些Linux文本查找技巧,提高你80%工作效率!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/814249

相关文章

qt5cored.dll报错怎么解决? 电脑qt5cored.dll文件丢失修复技巧

《qt5cored.dll报错怎么解决?电脑qt5cored.dll文件丢失修复技巧》在进行软件安装或运行程序时,有时会遇到由于找不到qt5core.dll,无法继续执行代码,这个问题可能是由于该文... 遇到qt5cored.dll文件错误时,可能会导致基于 Qt 开发的应用程序无法正常运行或启动。这种错

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

mtu设置多少网速最快? 路由器MTU设置最佳网速的技巧

《mtu设置多少网速最快?路由器MTU设置最佳网速的技巧》mtu设置多少网速最快?想要通过设置路由器mtu获得最佳网速,该怎么设置呢?下面我们就来看看路由器MTU设置最佳网速的技巧... 答:1500 MTU值指的是在网络传输中数据包的最大值,合理的设置MTU 值可以让网络更快!mtu设置可以优化不同的网

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

MySQL JSON 查询中的对象与数组技巧及查询示例

《MySQLJSON查询中的对象与数组技巧及查询示例》MySQL中JSON对象和JSON数组查询的详细介绍及带有WHERE条件的查询示例,本文给大家介绍的非常详细,mysqljson查询示例相关知... 目录jsON 对象查询1. JSON_CONTAINS2. JSON_EXTRACT3. JSON_TA

C++作用域和标识符查找规则详解

《C++作用域和标识符查找规则详解》在C++中,作用域(Scope)和标识符查找(IdentifierLookup)是理解代码行为的重要概念,本文将详细介绍这些规则,并通过实例来说明它们的工作原理,需... 目录作用域标识符查找规则1. 普通查找(Ordinary Lookup)2. 限定查找(Qualif

Linux链表操作方式

《Linux链表操作方式》:本文主要介绍Linux链表操作方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、链表基础概念与内核链表优势二、内核链表结构与宏解析三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势六、典型应用场景七、调试技巧与

详解Linux中常见环境变量的特点与设置

《详解Linux中常见环境变量的特点与设置》环境变量是操作系统和用户设置的一些动态键值对,为运行的程序提供配置信息,理解环境变量对于系统管理、软件开发都很重要,下面小编就为大家详细介绍一下吧... 目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断