Linux 文件管理命令Lawk wc comm join fmt

2024-05-01 19:52

本文主要是介绍Linux 文件管理命令Lawk wc comm join fmt,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 2.Linux 文件管理命令
    • 2.44 awk:模式匹配语言
      • 1.变量
      • 2.运算符
      • 3.awk 的正则
      • 4.字符串函数
      • 5.数学函数
      • 案例练习
    • 2.45 wc:输出文件中的行数、单词数、字节数
    • 案例练习
    • 2.46 comm:比较排序文件
      • 案例练习
    • 2.47 join:将两个文件中指定栏位内容相同的行连接起来
    • 2.48 fmt:编排文本文件

2.Linux 文件管理命令

2.44 awk:模式匹配语言

  • 作用:利用一组用户提供的命令来将一组文件和用户提供的扩展正则表达式进行比较,一 次一行,然后在任何与扩展正则表达式匹配的行上执行操作。

  • 用法:

    awk [options] 'script' var=value file(s)

    awk [options] -f scriptfile var=value file(s)

主要选项如下:

命令描述
-F fs or --field-separator fs指定输入文件的分隔符,fs 是一个字符串或是一个正则表达式,如-F:。
-v var=value or --asign var=value赋值一个用户定义变量。
-f scripfile or --file scriptfile从脚本文件中读取 awk 命令。
-mf nnn and -mr nnn对 nnn 值设置内在限制,-mf 选项限制分配给 nnn 的最大块数目;-mr 选项限制记录的最大数目。这两个功能是 Bell 实验室版 awk 的扩展功能,在标准 awk中不适用。
-W compact or --compat, -W traditional or –traditional在兼容模式下运行 awk。所以 gawk的行为和标准的 awk 完全一样,所有的 awk 扩展都被忽略。
-W copyleft or --copyleft, -W copyright or –copyright打印简短的版权信息。
-W help or --help, -W usage or –usage打印全部 awk 选项和每个选项的简短说明。
-W lint or –lint打印不能向传统 UNIX 平台移植的结构的警告。
-W lint-old or --lint-old打印关于不能向传统 UNIX 平台移植的结构的警告。
-W posix打开兼容模式。但有以下限制,不识别\x、函数关键字、func、换码序列;当 fs 是一个空格时,将新行作为一个域分隔符;操作符=不能代替=;fflush无效。
-W re-interval or --re-inerval允许间隔正则表达式的使用,参考 grep 中的 POSIX 字符类,如括号表达式[[:alpha:]]。
-W source program-text or --source program-text使用 program-text 作为源代码,可与-f命令混用。

awk 脚本是由模式和操作组成的,即 pattern {action},如$ awk ‘/root/’ test,$ awk ‘$3 < 100’ test。二者是可选的,如果没有模式,则 action 应用到全部记录;如果没有 action,则输出匹配 全部记录。在默认情况下,每一个输入行都是一条记录,但用户可通过 RS 变量指定不同的分 隔符进行分隔。

说明 awk 命令的模式搜索比 grep 命令的搜索更常用,且它允许用户在输入文本行上执 行多个操作。awk 命令编程语言不需要编译,并允许用户使用变量、数字函数、字符 串函数和逻辑运算符。awk 命令受到 LANG、LC_ALL、PATH 等环境变量的影响。

awk 是 Linux 下的一个命令,它对其他命令的输出、对文件的处理都十分强大。其实它更 像一门编程语言,可以自定义变量,有条件语句,有循环,有数组,有正则,有函数等。它读 取输出或者文件的方式是一行一行地读,根据用户给出的条件进行查找,并在找出的行中进行 操作,感觉它的设计思想真的很简单,但是结合实际情况,具体操作起来就没有那么简单了。 它有 3 种形式:awk,gawk,nawk,平时所说的 awk 其实就是 gawk。

1.变量

变量及其描述如表
在这里插入图片描述

2.运算符

运算符及其描述如表

在这里插入图片描述

3.awk 的正则

匹配符及其描述如表

在这里插入图片描述

4.字符串函数

字符串函数及其描述如表

在这里插入图片描述

5.数学函数

数学函数及其返回值如表

在这里插入图片描述

案例练习

(1)显示文件 hello.c 中的行号和第三字段。

#awk '{printf"%03d%s\n",NR,$1}' hello.c 
001/* 
002#include 
003int 
004{ 
005printf("Hello, 
006return 
007}

(2)显示长于 7 个字符的文件的行。

# awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) printf("Hello, Linux programming world!\n"); return 0;

(3)以相反顺序打印前两个字段。

awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) printf("Hello, Linux programming world!\n");return 0; 
[root@localhost tmp]# awk '{ print $2, $1 }' hello.c 
hello.c /* 
<stdio.h> #include 
main(void) int 
{ 
Linux printf("Hello, 
0; return 
}

2.45 wc:输出文件中的行数、单词数、字节数

  • 作用:对每个文件输出行、单词和字节统计数,如果指定了多于一个文件,则还有一个行数的总计。如果指定的文件是“-”,则读取标准输入。

  • 用法:wc [选项]…[文件]

  • 主要选项如下。

    主要选项如下:

    命令描述
    -c, --bytes, --chars输出字节统计数。
    -l, --lines输出换行符统计数
    -L, --max-line-length输出最长的行的长度
    -w, --words输出单词统计数。

    案例练习

    显示文件 hello.c 中的单词数。

    # wc -w hello.c 
    20 hello.c
    

2.46 comm:比较排序文件

  • 作用:逐行比较两个已排序的文件。

  • 用法:comm [选项]...文件 1 文件 2

  • 主要选项如下

如果不附带选项,程序会生成三列输出。第一列包含文件 1 特有的行,第二列包含文件 2 特有的行,而第三列包含两个文件共有的行。

命令描述
-1不输出文件 1 特有的行。
-2不输出文件 2 特有的行。
-3不输出两个文件共有的行。
--check-order检查输入是否被正确排序,即使所有输入行均成对。
--nocheck-order不检查输入是否被正确排序。
--output-delimiter=STR依照 STR 分列
--help显示此帮助信息并退出。
--version显示版本信息并退出。

案例练习

比较排序 FILE1 和 FILE2,共有部分不显示。

comm -3 FILE1 FILE2 
SSSS 
222 

2.47 join:将两个文件中指定栏位内容相同的行连接起来

  • 作用:找出两个文件中指定栏位内容相同的行并加以合并,再输出到标准输出设备。
  • 用法:join [选项]文件 1 文件 2
  • 主要选项如下

针对每一对具有相同内容的输入行,整合为一行写到标准输出,默认的内容连接区块是由 第一个空白符代表的分界符号。当文件 1 或文件 2 都被指定为“-”时,程序将从标准输入读 取数据。

命令描述
-a 文件编号文件编号的值可以是 1 或 2,分别对应文件 1 和文件 2。此选项用于根据指定文件编号输出不成对的行目。
-e 字符将缺失的输入区块替换为指定字符。
-i,--ignore-case比较时忽略大小写。
-j 域等于“-1 域-2 域”。
-o 格式按照指定格式构造输出行。
-t 字符使用指定字符作为输入和输出的分隔符。
-v 文件编号类似-a 文件编号,但禁止组合输出行。
-1 域在文件 1 的此域组合。
-2 域在文件 2 的此域组合。
--check-order检查输入行是否正确排序,即使所有输入行均是成对的。
--nocheck-order不检查输入是否正确排序。
--header将首行视作域的头部,直接输出而不对其进行匹配。
--help显示此帮助信息并退出。
--version显示版本信息并退出。

2.48 fmt:编排文本文件

  • 作用:从指定的文件里读取内容,将其按照指定格式重新编排后,输出到标准输出设备。

    若指定的文件名为“-”,则 fmt 命令会从标准输入设备读取数据。

  • 用法:fmt [-宽度] [选项]… [文件]…

    重新格式化文件中的每个段落并输出到标准输出。

    选项“-宽度”是“–width=数字”的缩写。

  • 主要选项如下。

    长选项必须使用的参数对于短选项也是必须使用的。

    命令描述
    -c --crown-margin保持前两行的缩进。
    -p,–prefix=字符串只对以指定字符串开头的行重新格式化,将前缀重新附着到被重新格式化的行上。
    -s,–split-only分割过长的行,但不自动补足。
    -t,–tagged-paragraph缩进首行以使其不同于第二行。
    -u,–uniform-spacing每两个单词间保留一个空格,每句之后保留两个空格。
    -w,–width=宽度最大行宽(默认为 75 列宽度)。
    –help显示此帮助信息并退出。
    –version显示版本信息并退出。

    应用实例如下。

    重新排版 hello.c 文件。

    # fmt hello.c 
    /* hello.c - Canonical "Hello, World!" program */ #include <stdio.h> 
    int main(void) { printf("Hello, Linux programming world!\n"); return 0; 
    } 
    

这篇关于Linux 文件管理命令Lawk wc comm join fmt的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/952536

相关文章

Linux之systemV共享内存方式

《Linux之systemV共享内存方式》:本文主要介绍Linux之systemV共享内存方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、工作原理二、系统调用接口1、申请共享内存(一)key的获取(二)共享内存的申请2、将共享内存段连接到进程地址空间3、将

快速修复一个Panic的Linux内核的技巧

《快速修复一个Panic的Linux内核的技巧》Linux系统中运行了不当的mkinitcpio操作导致内核文件不能正常工作,重启的时候,内核启动中止于Panic状态,该怎么解决这个问题呢?下面我们就... 感谢China编程(www.chinasem.cn)网友 鸢一雨音 的投稿写这篇文章是有原因的。为了配置完

HTML5中的Microdata与历史记录管理详解

《HTML5中的Microdata与历史记录管理详解》Microdata作为HTML5新增的一个特性,它允许开发者在HTML文档中添加更多的语义信息,以便于搜索引擎和浏览器更好地理解页面内容,本文将探... 目录html5中的Mijscrodata与历史记录管理背景简介html5中的Microdata使用M

Linux命令之firewalld的用法

《Linux命令之firewalld的用法》:本文主要介绍Linux命令之firewalld的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux命令之firewalld1、程序包2、启动firewalld3、配置文件4、firewalld规则定义的九大

Spring 基于XML配置 bean管理 Bean-IOC的方法

《Spring基于XML配置bean管理Bean-IOC的方法》:本文主要介绍Spring基于XML配置bean管理Bean-IOC的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一... 目录一. spring学习的核心内容二. 基于 XML 配置 bean1. 通过类型来获取 bean2. 通过

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

python uv包管理小结

《pythonuv包管理小结》uv是一个高性能的Python包管理工具,它不仅能够高效地处理包管理和依赖解析,还提供了对Python版本管理的支持,本文主要介绍了pythonuv包管理小结,具有一... 目录安装 uv使用 uv 管理 python 版本安装指定版本的 Python查看已安装的 Python

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、