016 文件处理

2024-01-30 21:12
文章标签 处理 016

本文主要是介绍016 文件处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 打开文件
    • 关闭文件
    • 读取文件
      • 方法1
      • 方法2
      • 方法3
      • 方法4
    • 写入文件
      • 方法1
      • 方法2
    • with操作
    • 读写缓冲区
    • 文件偏移量
    • os模块
      • 获取文件大小
      • 查看文件列表
      • 判断文件是否存在
      • 删除文件

文件
文件是保存在持久化存储设备上的一段数据
文件分类
文本文件:打开后会自动解码为字符
二进制文件:内部编码为二进制码,无法通过文字编码解析

byte1 = b'hello' #英文字符字节串
byte2 = "你好".encode
str2 = byte2.decode

读:从文件中获取内容
写:修改文件中的内容

打开文件

参数:file_name 文件名
access_mode 打开文件的方式,如果不写默认为’r’
buffering 1表示有行缓冲,默认则表示使用系统默认提供的缓冲机制
encoding=‘UTF-8’ 设置打开文件的编码方式,一般Linux下不需要

返回值:成功返回文件操作对象

#打开文件
file_object = open(file_name, access_mode='r', buffering=-1, encoding=None)
功能:打开一个文件,返回一个文件对象。
打开模式效果
r以读方式打开,文件必须存在
w以写方式打开,文件不存在则创建,存在清空原有内容
a以追加模式打开,文件不存在则创建,存在则继续写操作
r+以读写模式打开 文件必须存在
w+以读写模式打开 不存在则创建,存在清空原有内容
a+追加并可读模式,文件不存在则创建,存在则继续写操作
rb以二进制读模式打开 同r
wb以二进制写模式打开 同w
ab以二进制追加模式打开 同a
rb+以二进制读写模式打开 同r+
wb+以二进制读写模式打开 同w+
ab+以二进制读写模式打开 同a+

关闭文件

file.close()

读取文件

1.open后每次读取都是从上次结束的位置继续读
2.读取到文件结尾后,如果继续读返回值是空字串

方法1

read([size])
功能:来直接读取文件中字符
参数:如果没有给定size参数(默认值为-1)或者size值为负,文件
将被读取直至末尾,给定size最多读取给定数目个字符(字节)
返回值:返回读取到的内容

while True:data = f.read(1)#if data == "":if not data:break#当读取到结尾,data为空字串的时候结束循环print(data,end="")

方法2

一次读取结束时机:遇到换行会结束,遇到指定字符(字节)个数会结束

readline([size])
功能: 用来读取文件中一行
参数: 如果没有给定size参数(默认值为-1)或者size值为负
表示读取一行,给定size表示最多读取制定的字符(字节)
返回值: 返回读取到的内容

方法3

如果读到"\n"自动返回下一行

readlines([size])
功能: 读取文件中的每一行作为列表中的一项
参数: 如果没有给定size参数(默认值为-1)或者size值为负
文件将被读取直至末尾
给定size表示读取到size字符所在行为止。
返回值:返回读取到的内容列表

方法4

文件对象本身也是一个可迭代对象,在for循环中可以迭代文件的每一行。

def query_word1(word):fr = open("dict.txt")# 读打开#逐行读取n = len(word)for line in fr:if line[:n] == word and line[n] == " ":return linedef query_word2(word):fr = open("dict.txt")# 读打开#逐行读取for line in fr:tmp = line.split(' ')#按照空格分割if tmp[0] > word:breakelif tmp[0] == word:return line

写入文件

方法1

write(data)
功能: 把文本数据或二进制数据块的字符(节)串写入到文件中去
参数: 要写入的内容
返回值: 写入的字符(节)个数
如果需要换行要在写入内容中添加\n

方法2

writelines(str_list)
功能: 接受一个字符串列表作为参数,将它们写入文件。
参数: 要写入的内容列表

def copy(filename,dir):fr = open(filename,'rb')fname = filename.split('\\')[-1]fw = open(dir+'/'+fname,'wb')while True:data = fr.read(1024)if not data:breakfw.write(data)fr.close()fw.close()#copy("C:\\Users\\xxx\\Desktop\\xx.png",".")
copy(r"C:\Users\xxx\Desktop\xx.png",".")"""
def copy(filename,dir):fr = open(filename,'rb')fname = filename.split('/')[-1]fw = open(dir+'/'+fname,'wb')while True:data = fr.read(1024)if not data:breakfw.write(data)fr.close()fw.close()copy("C:/Users/xxx/Desktop/xx.png",".")
"""

with操作

python中的with语句也可以用于访问文件,在语句块结束后会自动释放资源。
with语句格式

with context_expression [as obj]:with-body

with访问文件

with open('file','r+') as f:f.read()

注意: with语句块结束后会自动释放f所以不再需要close()

读写缓冲区

定义

系统自动的在内存中为每一个正在使用的文件开辟一个空间,在对文件读写时都是先将文件内容加载到缓冲区,再进行读写

作用:减少和硬盘的交互次数,提高读写效率

刷新缓冲区条件

1缓冲区被写满
2程序执行结束或者文件对象被关闭
3程序中调用flush()函数

缓冲区设置

类型设置方法注意事项
系统自定义buffering=-1
行缓冲buffering=1当遇到\n时会刷新缓冲
指定缓冲区大小buffering>1必须以二进制方式打开
fw = open("file.txt","wb",buffering=10)
while True:msg = input(">>")if not msg:breakfw.write(msg.encode())fw.close()

文件偏移量

定义
打开一个文件进行操作时系统会自动生成一个记录,
记录每次读写操作时所处的文件位置,每次文件的读写操作都是从这个位置开始进行的。

1r或者w方式打开,文件偏移量在文件开始位置
2a方式打开,文件偏移量在文件结尾位置

tell()

seek(offset[,whence])
功能: 移动文件偏移量位置
参数: offset 代表相对于某个位置移动的字节数。负数表示向前移动,正数表示向后移动。
whence是基准位置的默认值为0,代表从文件开头算起,1代表从当前位置算起,2代表文件末尾算起
注意:必须以二进制方式打开文件时,基准位置才能是1或者2

import timelog = open("my.log","a+",buffering=1)
#文件偏移量放开头
log.seek(0,0)
#n = 1
#for line in log:
#    n += 1
n = len(log.readlines()) + 1
while True:msg = "%d. %s\n"%(n,time.ctime())log.write(msg)time.sleep(2)n += 1

os模块

os模块是Python标准库函数,包含了大量的文件处理函数

获取文件大小

os.path.getsize(file)
功能: 获取文件大小
参数: 指定文件
返回值: 文件大小

查看文件列表

os.listdir(dir)
功能: 查看文件列表
参数: 指定目录
返回值: 目录中的文件名列表

判断文件是否存在

os.path.exists(file)
功能: 判断文件是否存在
参数: 指定文件
返回值: 布尔值

删除文件

os.remove(file)
功能: 删除文件
参数: 指定文件

这篇关于016 文件处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/661576

相关文章

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

Spring Boot 中的默认异常处理机制及执行流程

《SpringBoot中的默认异常处理机制及执行流程》SpringBoot内置BasicErrorController,自动处理异常并生成HTML/JSON响应,支持自定义错误路径、配置及扩展,如... 目录Spring Boot 异常处理机制详解默认错误页面功能自动异常转换机制错误属性配置选项默认错误处理

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Java堆转储文件之1.6G大文件处理完整指南

《Java堆转储文件之1.6G大文件处理完整指南》堆转储文件是优化、分析内存消耗的重要工具,:本文主要介绍Java堆转储文件之1.6G大文件处理的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言文件为什么这么大?如何处理这个文件?分析文件内容(推荐)删除文件(如果不需要)查看错误来源如何避

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处

Java docx4j高效处理Word文档的实战指南

《Javadocx4j高效处理Word文档的实战指南》对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择,下面我们就来看看docx4j的具体使用... 目录引言一、环境准备与基础配置1.1 Maven依赖配置1.2 初始化测试类二、增强版文档操作示例2.

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SpringBoot结合Docker进行容器化处理指南

《SpringBoot结合Docker进行容器化处理指南》在当今快速发展的软件工程领域,SpringBoot和Docker已经成为现代Java开发者的必备工具,本文将深入讲解如何将一个SpringBo... 目录前言一、为什么选择 Spring Bootjavascript + docker1. 快速部署与

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Spring Boot @RestControllerAdvice全局异常处理最佳实践

《SpringBoot@RestControllerAdvice全局异常处理最佳实践》本文详解SpringBoot中通过@RestControllerAdvice实现全局异常处理,强调代码复用、统... 目录前言一、为什么要使用全局异常处理?二、核心注解解析1. @RestControllerAdvice2