Linux 文件类信息统计指令(grep、awk、sort、uniq)

2024-04-07 12:18

本文主要是介绍Linux 文件类信息统计指令(grep、awk、sort、uniq),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • grep过滤关键字
    • cat 查看文件
      • cat 配合awk筛选文件中某一列
      • cat配合awk、sort、uniq做数据统计
      • cat配合grep、awk、sort、uniq做数据统计

grep过滤关键字

cat file |grep -o word |wc -l 统计file文件中word这个关键字出现的个数cat file |grep  word |wc -l 统计file文件中word这个关键字出现的行数

在这里插入图片描述

cat 查看文件

cat --help

在这里插入图片描述

cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 97
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 257
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 105
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 105
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 257
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 257
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 588
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 223
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 78
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 76
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 156
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 211
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 85
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 588
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 211
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 588
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 85
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 88
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 105
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 97
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 209
.........................
................
.......

cat 配合awk筛选文件中某一列

cat 文件名 |awk -F'按照什么切分'  '显示内容'
cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log |awk -F' '  '{print $7}'xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 209

按照空格切分后分成如下几部分

>xxx.xxx.xxx.xx
>-
>-
>[22/Jan/2020:15:08:12
>+0800]
>"POST
>/cfg/service/getHosParam
>HTTP/1.1"
>200
>209

cat配合awk、sort、uniq做数据统计

cat 文件名 |awk -F'按照什么切分'  '显示内容'
sort 排序指令
uniq 可检查文本文件中重复出现的行列
cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log |awk -F' '  '{print $7}'|sort -n|uniq -c|sort -nr

在这里插入图片描述

cat配合grep、awk、sort、uniq做数据统计

cat 文件名 |grep word|awk -F'按照什么切分'  '显示内容'
grep 过滤
sort 排序指令
uniq 可检查文本文件中重复出现的行列
cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log |grep Enum|awk -F' '  '{print $7}'|sort -n|uniq -c|sort -nr

在这里插入图片描述

这篇关于Linux 文件类信息统计指令(grep、awk、sort、uniq)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/882584

相关文章

基于Linux的ffmpeg python的关键帧抽取

《基于Linux的ffmpegpython的关键帧抽取》本文主要介绍了基于Linux的ffmpegpython的关键帧抽取,实现以按帧或时间间隔抽取关键帧,文中通过示例代码介绍的非常详细,对大家的学... 目录1.FFmpeg的环境配置1) 创建一个虚拟环境envjavascript2) ffmpeg-py

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

Python包管理工具核心指令uvx举例详细解析

《Python包管理工具核心指令uvx举例详细解析》:本文主要介绍Python包管理工具核心指令uvx的相关资料,uvx是uv工具链中用于临时运行Python命令行工具的高效执行器,依托Rust实... 目录一、uvx 的定位与核心功能二、uvx 的典型应用场景三、uvx 与传统工具对比四、uvx 的技术实

Linux链表操作方式

《Linux链表操作方式》:本文主要介绍Linux链表操作方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、链表基础概念与内核链表优势二、内核链表结构与宏解析三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势六、典型应用场景七、调试技巧与

详解Linux中常见环境变量的特点与设置

《详解Linux中常见环境变量的特点与设置》环境变量是操作系统和用户设置的一些动态键值对,为运行的程序提供配置信息,理解环境变量对于系统管理、软件开发都很重要,下面小编就为大家详细介绍一下吧... 目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断

Linux实现线程同步的多种方式汇总

《Linux实现线程同步的多种方式汇总》本文详细介绍了Linux下线程同步的多种方法,包括互斥锁、自旋锁、信号量以及它们的使用示例,通过这些同步机制,可以解决线程安全问题,防止资源竞争导致的错误,示例... 目录什么是线程同步?一、互斥锁(单人洗手间规则)适用场景:特点:二、条件变量(咖啡厅取餐系统)工作流

Linux中修改Apache HTTP Server(httpd)默认端口的完整指南

《Linux中修改ApacheHTTPServer(httpd)默认端口的完整指南》ApacheHTTPServer(简称httpd)是Linux系统中最常用的Web服务器之一,本文将详细介绍如何... 目录一、修改 httpd 默认端口的步骤1. 查找 httpd 配置文件路径2. 编辑配置文件3. 保存

Linux使用scp进行远程目录文件复制的详细步骤和示例

《Linux使用scp进行远程目录文件复制的详细步骤和示例》在Linux系统中,scp(安全复制协议)是一个使用SSH(安全外壳协议)进行文件和目录安全传输的命令,它允许在远程主机之间复制文件和目录,... 目录1. 什么是scp?2. 语法3. 示例示例 1: 复制本地目录到远程主机示例 2: 复制远程主

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可