python-文件操作,文件指针,buffering:缓冲区,编码描述符及其读写,以及上下文管理.一站式详解

本文主要是介绍python-文件操作,文件指针,buffering:缓冲区,编码描述符及其读写,以及上下文管理.一站式详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录标题

  • 冯诺依曼体系架构
  • 文件IO常用操作
  • 打开操作
    • open的参数
      • r模式
      • w模式:**没有文件**-进行创建;**有文件**-进行覆盖
      • x模式:**有文件**-直接抛异常;**没有文件**-创建,只写打开
      • a模式:**有文件**-只写打开,进行追加;**没有文件**-创建
      • rb模式:只读二进制
      • wb模式-只写二进制
      • - r+/w+增加缺失能力
  • 文件指针,指向当前字节位置
    • seek偏移的是字符还是字节?
    • 文本模式下
    • 二进制模式下
  • buffering:缓存区
    • 简介
    • 缓冲和缓存的区别?
      • 缓冲数据结构:
      • 缓存数据结构:
      • 缓冲的目的是:
      • 缓存的目的是:
    • open()方法的buffering参数设置
  • 参数编码描述符encoding
    • encoding:编码,仅文本模式使用
    • 其他参数
      • errors
      • newline
  • read
  • 行读取
    • readline(size=-1)
    • readlines()
    • 注意事项
  • write写入
  • close
  • 其他(返回类型都是布尔值)
  • 上下文管理
    • 引子
    • 为了解决上述问题这里就需要使用"上下文管理"格式:
    • 使用上下注意事项:
  • 练习:指定一个源文件,事项copy到目录
  • 练习:有一个文件,对其进行单词统计,不区分大小写,计算单词重复最多的10个单词

冯诺依曼体系架构

在这里插入图片描述
一般说IO操作,指的是文件IO,如果指的是网络IO,都会直接说网络IO

文件IO常用操作

文件操作无非就是读和写

open 打开
在这里插入图片描述
read 读取
write 写入
close 关闭
readline 行读取
readlines 多行读取
seek 文件指针操作
tell 指针位置

打开操作

f = open("test") # 返回的是文件对象 file object
print(f.read())
f.close() # 用完就关闭

open的参数

file:
打开或者要创建的文件名.如果不指定,默认是当前路径
mode模式:
在这里插入图片描述

r模式

f = open("test","r") # 只读
f.read()
f.write("abc") # 抛出错误
f.close()

w模式:没有文件-进行创建;有文件-进行覆盖

f = open("test","w") # 只写 
f.write("abc")
f.close()

x模式:有文件-直接抛异常;没有文件-创建,只写打开

f = open("test2","x")

运行结果
在这里插入图片描述

a模式:有文件-只写打开,进行追加;没有文件-创建

f = open("test","a")
f.write("abc")

rb模式:只读二进制

f = open("test","rb")
print(f.read())
f.close()

运行结果
在这里插入图片描述

wb模式-只写二进制

f = open("test","wb")
f.write("啊".encode(encoding="gbk")) # 把中文转化bytes用encode()
f.close()

- r+/w+增加缺失能力

f = open("test1","r+")

运行结果
在这里插入图片描述
可以观察到,r+增加缺失能力,但是没有改变r的特性,r的特性是要求文件必须存在,才能打开成功.

文件指针,指向当前字节位置

mode = r,指针起始在0
mode = a,指针起始在末尾

f.tell()显示指针当前位置
f.seek(offset[,whence])移动文件指针位置.offest偏移多少字节,whence从哪里开始

seek偏移的是字符还是字节?

seek偏移的是字节

文本模式下

whence 0 缺失值,表示从头开始,正数
whence 1 表示从当前位置,offset只能用0
whence 2 表示从末尾,offset只能用0

二进制模式下

whence 0 缺失值,表示从头开始,offset正数
whence 1 表示从当前位置,offset可正可负
whence 2 表示从末尾,offset可正可负
注意:
向后seek可以越界,越界返回空字符;但是向前seek不能越界,否则抛异常

f = open("test","rb+")
f.write(b"addffg")
f.seek(50) # 向后
f.read() # 返回''空
f.seek(-20,2) # 向前
f.read() # OSError

buffering:缓存区

简介

缓冲区是一个内存空间,一般是使用一个FIFO队列(先进先出),到缓冲区满了或者到阀值了,数据会被flush到磁盘上.

缓冲和缓存的区别?

缓冲数据结构:

是一个列表或者是队列

缓存数据结构:

是一个字典

缓冲的目的是:

一堆数据排个队放哪暂存数据,减缓数据进入磁盘的速度.

缓存的目的是:

暂时性存储数据(掉电即失),使用字典数据结构为了最快速度的找到自己存储的内容,帮助硬件更快的运行

open()方法的buffering参数设置

  • -1缺省buffer大小:默认是8192个字节,8192/1024 = 8k
  • 0只在二进制模式使用,表示关buffer,文本下不支持
  • 1只在文本模式使用,表示行缓冲.意思就是见到换行符就flush
    在二进制下表示就1个字节
  • 大于1:二进制下,表示指定大小,文本下指定大小还依旧表示为默认值
  • flush()将缓冲区数据写入磁盘
  • close()关闭前会调用flush()

为方便记忆以上总结为:
文本就默认,二进制可以指定大小.一般情况下默认是个比较好的选择,除非你明确知道你在做什么,否则不调整他

参数编码描述符encoding

encoding:编码,仅文本模式使用

Npne表示使用缺省编码,依赖操作系统
在这里插入图片描述

其他参数

errors

不设置,直接默认

newline

一般不设定
在这里插入图片描述
系统分隔符os.linesep -->\r\n回车换行
\n换行
\r回车
当写时,None表示所有的"\n换行"都会被替换成为->\r\n回车换行,当遇见\r时候就不进行替换

read

read(size=-1)
size表示读取的多少个字符或字节;负数或者None表示读取到结尾

行读取

readline(size=-1)

一行行读取文件内容.size设置一次能读取行内几个字符或字节

readlines()

读取所有行的列表.

注意事项

行读取内容以后基本不推荐使用,直接使用,以下方式:

f = open("file","r+") # 返回一个可迭代对象
for line in f:print(line)  #file文件内容,一行行打印出来f.close()

write写入

write(s),把字符串s写入到文件中并返回字符的个数
writelines(lines),将字符串列表写入文件

close

释放文件对象,flus并关闭文件对象

其他(返回类型都是布尔值)

f.seekable()是否可seek
f.radable()是否可读
f.writable()是否可写
closed是否已经关闭

上下文管理

引子

在这里插入图片描述
当出现上述问题时我们怎么解决那??

为了解决上述问题这里就需要使用"上下文管理"格式:

with open(“test”) as f:
f.read()

使用上下注意事项:

1.上下文管理的语句块并不会开启新的作用域
2.with语句块执行完的时候,会自动关闭文件对象

上下文管理内部实现的内部原理源码详解

练习:指定一个源文件,事项copy到目录

def copyFile(src,dst):with open(src) as f1:with open(dst,"w+") as f2:f2.write(f1.read())
copyFile("file","file2")         

练习:有一个文件,对其进行单词统计,不区分大小写,计算单词重复最多的10个单词

这篇关于python-文件操作,文件指针,buffering:缓冲区,编码描述符及其读写,以及上下文管理.一站式详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212535

相关文章

Redis 的 SUBSCRIBE命令详解

《Redis的SUBSCRIBE命令详解》Redis的SUBSCRIBE命令用于订阅一个或多个频道,以便接收发送到这些频道的消息,本文给大家介绍Redis的SUBSCRIBE命令,感兴趣的朋友跟随... 目录基本语法工作原理示例消息格式相关命令python 示例Redis 的 SUBSCRIBE 命令用于订

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

Python中logging模块用法示例总结

《Python中logging模块用法示例总结》在Python中logging模块是一个强大的日志记录工具,它允许用户将程序运行期间产生的日志信息输出到控制台或者写入到文件中,:本文主要介绍Pyt... 目录前言一. 基本使用1. 五种日志等级2.  设置报告等级3. 自定义格式4. C语言风格的格式化方法

Python实现精确小数计算的完全指南

《Python实现精确小数计算的完全指南》在金融计算、科学实验和工程领域,浮点数精度问题一直是开发者面临的重大挑战,本文将深入解析Python精确小数计算技术体系,感兴趣的小伙伴可以了解一下... 目录引言:小数精度问题的核心挑战一、浮点数精度问题分析1.1 浮点数精度陷阱1.2 浮点数误差来源二、基础解决

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

SpringBoot日志级别与日志分组详解

《SpringBoot日志级别与日志分组详解》文章介绍了日志级别(ALL至OFF)及其作用,说明SpringBoot默认日志级别为INFO,可通过application.properties调整全局或... 目录日志级别1、级别内容2、调整日志级别调整默认日志级别调整指定类的日志级别项目开发过程中,利用日志

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有