词频统计(一):C++使用Vector做词频统计

2024-06-06 05:48
文章标签 c++ 统计 使用 vector 词频

本文主要是介绍词频统计(一):C++使用Vector做词频统计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

统计圣经中每个单词出现的次数。

#include <iostream>
#include <vector>
#include <fstream>
#include <string>
#include <string.h>
#include <sstream>struct Record
{std::string word;int freq;
};class WordStatic
{
public://1,传引用,减少开销 2.const修饰,防止修改void read_file(const std::string & filename);void write_file(const std::string &  filename);
private:std::vector<Record> vec;
};void WordStatic::read_file(const std::string &filename)
{//逐行读取,将行读入字符串std::ifstream ifs(filename.c_str());std::string str;if(ifs.good() == 0){std::cout << "open readfile failed" << std::endl;return;}while(getline(ifs,str)){std::stringstream ss(str);std::string word;while(ss >> word){//std::cout<< word << std::endl;std::vector<Record>::iterator it;for(it = vec.begin(); it !=vec.end(); ++it){//string 重载了等号if(word == (*it).word){(*it).freq +=1;break;}}if(it == vec.end()){Record newRe;newRe.word = word;newRe.freq = 1;vec.push_back(newRe);}}}ifs.close();
}void WordStatic::write_file(const std::string & filename)
{//从流中写数据std::vector<Record>::iterator it;std::ofstream ofs(filename);if(ofs.good() == 0){std::cout << "open write_file failed" << std::endl;}for(it = vec.begin(); it != vec.end(); ++it){ofs << (*it).word << " " << (*it).freq << std::endl;//std::cout << (*it).word << " " << (*it).freq << std::endl;}ofs.close();
}
int main(void)
{WordStatic wd;wd.read_file("The_Holy_Bible.txt");wd.write_file("statics.txt");return 0;
}

The_Holy_Bible.txt文件可以从下面下载
https://github.com/Senvenno27/Word-Frequency-staticstics

这篇关于词频统计(一):C++使用Vector做词频统计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1035252

相关文章

C++中RAII资源获取即初始化

《C++中RAII资源获取即初始化》RAII通过构造/析构自动管理资源生命周期,确保安全释放,本文就来介绍一下C++中的RAII技术及其应用,具有一定的参考价值,感兴趣的可以了解一下... 目录一、核心原理与机制二、标准库中的RAII实现三、自定义RAII类设计原则四、常见应用场景1. 内存管理2. 文件操

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Python中help()和dir()函数的使用

《Python中help()和dir()函数的使用》我们经常需要查看某个对象(如模块、类、函数等)的属性和方法,Python提供了两个内置函数help()和dir(),它们可以帮助我们快速了解代... 目录1. 引言2. help() 函数2.1 作用2.2 使用方法2.3 示例(1) 查看内置函数的帮助(

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

Java使用HttpClient实现图片下载与本地保存功能

《Java使用HttpClient实现图片下载与本地保存功能》在当今数字化时代,网络资源的获取与处理已成为软件开发中的常见需求,其中,图片作为网络上最常见的资源之一,其下载与保存功能在许多应用场景中都... 目录引言一、Apache HttpClient简介二、技术栈与环境准备三、实现图片下载与保存功能1.

Python中使用uv创建环境及原理举例详解

《Python中使用uv创建环境及原理举例详解》uv是Astral团队开发的高性能Python工具,整合包管理、虚拟环境、Python版本控制等功能,:本文主要介绍Python中使用uv创建环境及... 目录一、uv工具简介核心特点:二、安装uv1. 通过pip安装2. 通过脚本安装验证安装:配置镜像源(可

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五