目录

完整源码分享【需要自取】


首先,需要准备好一个words.txt(英文文章)放置于工程目录下

单词提取大致思路如下:

1.打开文件

2.读取每一行

3.找到特殊的标点符号的位置,进行删除。

4.根据空格截取单词 find(" ");

5.将拿到的每一个单词放在链表中

1. 读取一行,去除该行标点符号

#include<iostream>
using namespace std;
#include<fstream>
#include<string>
#include<list>
void test_word_split();int main()
{test_word_split();return 0;
}void test_word_split()
{fstream fs;char filename[20] = {0};cout<<"请输入打开的文件名:";cin>>filename;//打开文件fs.open(filename);cout<<"打开成功"<<filename<<endl;char buf[1024] = {0};fs.getline(buf,1024);//读取每一行cout<<buf<<endl;size_t pos;   //找到位置string line;  //接替buf职责line = buf;pos = line.find_first_of(",.;:'?!()/\"");  //找特殊的标点符号while(pos!=string::npos){   //删除单个字符line.erase(pos,1);//再找下一个单个的字符pos = line.find_first_of(",.;:'?!()/\""); }cout<<line.c_str()<<endl; //string 转char
}

2. 截取单词

#include<iostream>
using namespace std;
#include<fstream>
#include<string>
#include<list>
void test_word_split();int main()
{test_word_split();return 0;
}void test_word_split()
{fstream fs;char filename[20] = {0};cout<<"请输入打开的文件名:";cin>>filename;//打开文件fs.open(filename);cout<<"打开成功"<<filename<<endl;char buf[1024] = {0};fs.getline(buf,1024);//读取每一行cout<<buf<<endl;size_t pos;string line,word;line = buf;pos = line.find_first_of(",.;:'?!()/\"");  //找特殊的标点符号while(pos!=string::npos){   //删除单个字符line.erase(pos,1);   //从什么位置开始删除多长的字符//再找下一个单个的字符pos = line.find_first_of(",.;:'?!()/\""); }cout<<line.c_str()<<endl; //string 转char//根据空格截取单词 find("")  111 222 333pos = line.find(" ");while(pos!=string::npos){//截取单词word = line.substr(0,pos);//从0开始,一直截到空格所在位置cout<<word<<endl;     //把第一个单词以及空格删除line.erase(0,pos+1);  //从什么位置开始删除多长的字符(如删111 )因此pos+1pos = line.find(" "); //寻找下一个空格}
}

3. 将拿到的每一个单词都放在链表中

完整源码分享【需要自取】

#include<iostream>
using namespace std;
#include<fstream>
#include<string>
#include<list>
void test_word_split();int main()
{test_word_split();return 0;
}void test_word_split()
{list<string> wordList;//链表fstream fs;char filename[20] = {0};cout<<"请输入打开的文件名:";cin>>filename;fs.open(filename);cout<<"打开成功"<<filename<<endl;char buf[1024] = {0};string line,word;  //初始化定义while(fs.getline(buf, 1024))//读取每一行{size_t pos;  //找到位置line = buf;  //接替buf职责pos = line.find_first_of(",.;:'?!()/\"");while(pos!=string::npos)//!=npos就找到{line.erase(pos,1);  //从什么位置开始删除多长字符pos = line.find_first_of(",.;:'?!()/\"");//寻找下一个标点符号}pos = line.find(" ");  //寻找空格所在位置while(pos!=string::npos){word = line.substr(0,pos);//从0开始,一直截到空格所在位置wordList.push_back(word); //拿到的单词放在链表中//把第一个单词以及空格删除line.erase(0, pos+1);//从什么位置开始删除多长的字符(如删111 )因此pos+1pos = line.find(" ");//寻找下一个空格}}cout<<"验证一下"<<endl;list<string>::iterator it;for(it = wordList.begin();it!=wordList.end();it++){cout<<(*it).c_str()<<endl;}cout<<"总的个数:"<<wordList.size();fs.close();
}

实现效果如下:

【C++】 文件提取英文单词相关推荐

  1. python读取xml标注坐标_遍历文件 创建XML对象 方法 python解析XML文件 提取坐标计存入文件...

    XML文件??? xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. 里面的标签都是可以随心所欲的按照他的命名规则来定义的,文件名为roi.xm ...

  2. 深度学习和目标检测系列教程 8-300:目标检测常见的标注工具LabelImg和将xml文件提取图像信息

    @Author:Runsen 图像标注主要用于创建数据集进行图片的标注.本篇博客将推荐一款非常实用的图片标注工具LabelImg,重点介绍其安装使用过程.如果想简单点,请直接下载打包版(下载地址见结尾 ...

  3. 用C语言写的迅雷看看XV文件提取器及C语言源代码

    tfref 如果你没用过迅雷看看, 或是不知道XV文件的, ...     写了很久了, 但是担心版权问题, 一直没有帖出来~~~     能提取截止目前最新版本的迅雷看看XV文件. 好了, 不多说, ...

  4. 目标检测xml文件提取

    提取xml文件的目标名,xmin,ymin,xmax,ymax,在图上把框框出来并保存. 使用try except避免xml文件中可能存在的标注错误. xml文件提取: 使用xml.dom.minid ...

  5. Wallpaper Engine pkg壁纸文件提取工具

    简介: RePKG-GUI 基于RePKG开发,适用于Wallpaper Engine壁纸的用户,可以帮助用户轻松下载Wallpaper Engine中的壁纸图片,让用户可以获取到自己喜欢的壁纸,软件 ...

  6. 植物大战僵尸资源文件提取 总结

    PvZ资源文件提取 总结 参考 植物大战僵尸资源文件(main.pak):格式/提取/工具下载[转贴] 植物大战僵尸pak资源文件分析 植物大战僵尸资源提取 C/C++中判断某一文件或目录是否存在 P ...

  7. wav文件提取音频数据_python

    wav文件提取音频数据_python wav文件格式 首先需要知道wav文件格式:(10条消息) WAV文件格式详解_imxiangzi的专栏-CSDN博客_wav文件格式 简单来说wav文件分为三个 ...

  8. Veri-776数据集处理 xml文件提取转换成txt文件

    Veri-776数据集处理 xml文件提取转换成txt文件 最近在做重识别工作,数据处理时需要进行文件格式转换,这里将代码记录下来 from os import getcwd import os fr ...

  9. 【人脸识别】解析MS-Celeb-1M人脸数据集及FaceImageCroppedWithAlignment.tsv文件提取

    更多内容关注微信公众号:ML_Study 1,MS-Celeb-1M数据集:  MSR IRC是目前世界上规模最大.水平最高的图像识别赛事之一,由MSRA(微软亚洲研究院)图像分析.大数据挖掘研究组组 ...

  10. webpack5-打包css等样式资源,css等样式文件提取,css等样式文件压缩

    打包css资源 加载css资源需要安装style-loader,css-loader库 配置如下: module: {rules: [// 在rules中写详细的loader配置// 打包css资源{ ...

最新文章

  1. access导出MySQL表格_如何将Access数据库里的表内容导出到Excel
  2. ASP.NET页生命周期概述
  3. C++/C++11中std::queue的使用
  4. 别把你的目光停留在周围
  5. linux qemu 源码编译
  6. 计算机硬件大型作业报告,计算机硬件技术大作业报告.doc
  7. 打印容器_化妆品行业是如何通过3D打印来定制开发产品的?
  8. python之基础学习day01
  9. 使用js实现换肤功能
  10. qt不规则按钮样式在自适应分辨率时应该注意的图片缩放模式
  11. python 编译procto错误处理
  12. jquery.ui.dialog 1.81在IE8中出现滚动条bug解决方法
  13. 脑电数据预处理,eeglab预处理采集的SSVEP数据
  14. 中国象棋(人机博弈)
  15. 最新稳定短视频去水印免费解析API接口分享
  16. ASPUPload3.0注册机
  17. 几种线性回归方法的简介
  18. 《此生未完成》读后感
  19. ai形状生成工具机器人_一名大学生使用一种语言生成AI工具来创建病毒博客文章...
  20. google ble 语音spec(voiceverBLERemotecontrol)

热门文章

  1. PowerPoint安装IguanaTex方法
  2. java calendar星期几_java使用Calendar类判断今天是星期几
  3. 中国(西部)云计算中心投产,将成西部规模最大数据中心
  4. JavaScript 删除Dom节点
  5. Altium Designer18学习
  6. jqwidgets简单技术
  7. SQL基础知识归纳总结
  8. python图片提取文字
  9. 【后端】Nginx 体系
  10. pre-trained模型的使用