Go 秒读32GB大文件

2024-05-23 21:12
文章标签 go 32gb

本文主要是介绍Go 秒读32GB大文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在Go中,处理大文件时,一般采用分块读取的方式,以避免一次性加载整个文件到内存中。

1、打开文件

使用os.Open打开文件 

package mainimport ("log""os"
)func main() {file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()
}

2、获取文件信息

使用file.Stat获取文件的基本信息,包括文件大小

package mainimport ("fmt""log""os"
)func main() {file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)
}

3、设置缓冲区大小

为了提高读取效率,使用合适大小的缓冲区

package mainimport ("fmt""io""log""os"
)func main() {//1、打开文件file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()//2、获取文件信息fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)//3、设置缓冲区大小bufferSize := 8192 // 8KB 缓冲区大小buffer := make([]byte, bufferSize)
}

4、循环读取文件内容

使用file.Read循环读取文件内容 

package mainimport ("fmt""io""log""os"
)func main() {//1、打开文件file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()//2、获取文件信息fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)//3、设置缓冲区大小bufferSize := 8192 // 8KB 缓冲区大小buffer := make([]byte, bufferSize)//4、循环读取文件内容for {bytesRead, err := file.Read(buffer)if err == io.EOF {// 文件读取完毕break}if err != nil {log.Fatal(err)}// 处理读取的数据,例如输出到控制台fmt.Print(string(buffer[:bytesRead]))}
}

5、 关闭文件

package mainimport ("fmt""io""log""os"
)func main() {//1、打开文件file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()//关闭//2、获取文件信息fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)//3、设置缓冲区大小bufferSize := 8192 // 8KB 缓冲区大小buffer := make([]byte, bufferSize)//4、循环读取文件内容for {bytesRead, err := file.Read(buffer)if err == io.EOF {// 文件读取完毕break}if err != nil {log.Fatal(err)}// 处理读取的数据,例如输出到控制台fmt.Print(string(buffer[:bytesRead]))}
}

 6、案例

package mainimport ("bufio""fmt""log""os""strings"
)func main() {file, err := os.Open("large_file.txt")if err != nil {log.Fatal(err)}defer file.Close()const maxScanTokenSize = 64 * 1024 * 1024 // 64MBbuf := make([]byte, maxScanTokenSize)scanner := bufio.NewScanner(file)scanner.Buffer(buf, maxScanTokenSize)for scanner.Scan() {line := scanner.Text()// 处理每一行的逻辑fmt.Println(line) //打印每一行fields := strings.Split(line, ",") // 假设使用逗号分隔// 处理fields中的每个字段for _, field := range fields {fmt.Println(field)// 可以添加更多处理逻辑}}if err := scanner.Err(); err != nil {log.Fatal(err)}
}

这篇关于Go 秒读32GB大文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/996430

相关文章

Go语言中使用JWT进行身份验证的几种方式

《Go语言中使用JWT进行身份验证的几种方式》本文主要介绍了Go语言中使用JWT进行身份验证的几种方式,包括dgrijalva/jwt-go、golang-jwt/jwt、lestrrat-go/jw... 目录简介1. github.com/dgrijalva/jwt-go安装:使用示例:解释:2. gi

go rate 原生标准限速库的使用

《gorate原生标准限速库的使用》本文主要介绍了Go标准库golang.org/x/time/rate实现限流,采用令牌桶算法控制请求速率,提供Allow/Reserve/Wait方法,具有一定... 目录介绍安装API介绍rate.NewLimiter:创建限流器limiter.Allow():请求是否

Go 语言中的 Struct Tag 的用法详解

《Go语言中的StructTag的用法详解》在Go语言中,结构体字段标签(StructTag)是一种用于给字段添加元信息(metadata)的机制,常用于序列化(如JSON、XML)、ORM映... 目录一、结构体标签的基本语法二、json:"token"的具体含义三、常见的标签格式变体四、使用示例五、使用

Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题

《Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题》:本文主要介绍Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未... 目录一、前言二、系统架构检测三、卸载旧版 Go四、下载并安装正确版本五、配置环境变量六、验证安装七、常见

Go语言使用slices包轻松实现排序功能

《Go语言使用slices包轻松实现排序功能》在Go语言开发中,对数据进行排序是常见的需求,Go1.18版本引入的slices包提供了简洁高效的排序解决方案,支持内置类型和用户自定义类型的排序操作,本... 目录一、内置类型排序:字符串与整数的应用1. 字符串切片排序2. 整数切片排序二、检查切片排序状态:

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

go 指针接收者和值接收者的区别小结

《go指针接收者和值接收者的区别小结》在Go语言中,值接收者和指针接收者是方法定义中的两种接收者类型,本文主要介绍了go指针接收者和值接收者的区别小结,文中通过示例代码介绍的非常详细,需要的朋友们下... 目录go 指针接收者和值接收者的区别易错点辨析go 指针接收者和值接收者的区别指针接收者和值接收者的

Go 语言中的select语句详解及工作原理

《Go语言中的select语句详解及工作原理》在Go语言中,select语句是用于处理多个通道(channel)操作的一种控制结构,它类似于switch语句,本文给大家介绍Go语言中的select语... 目录Go 语言中的 select 是做什么的基本功能语法工作原理示例示例 1:监听多个通道示例 2:带

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO