文章目录

  • 前言
  • 使用Python统计Markdown文件字数

前言

因为大数据的大作业是整理这个学期所学的东西,还要求最低字数不低于3000字,不然就不及格,并且要求用md文件格式,我写好了之后,就是翻来覆去不知道咋统计这个字数,下来VScode统计字数的插件,发现对中文的字没用,并且我感觉代码应该不会被算到字数里吧,因此网上搜了好久,未果,于是才想起来,为啥这东西不能自己来做呢?

使用Python统计Markdown文件字数

md其实也相当于一中文本文件,就跟txt一样操作就行了,那么应该懂了:

import codecs
result = []
skips = ["https:", ".png", "```", "div"]
# 去除代码
flag_code = 0
sum = 0
with codecs.open("期末大作业.md", "rb", 'utf-8', errors='ignore') as txtfile:for line in txtfile:flag = 0line = line.replace("\r", "")  # 去除\rline = line.replace("\n", "")  # 去除\nline = line.replace("## ", "")line = line.replace("#", "")if "```" in line:flag_code = 1 - flag_codeif flag_code == 1:continuefor skip in skips:if skip in line:flag = 1if flag == 1:continueif line == "":continueresult.append(line)
remove = [" ", "[", "]", "<", ">", "-", "*", ".", ":"]
figue_n = 0
pure_chinese = []
for line in result:for rem in remove:line = line.replace(rem, "")new_line = linefor n in line:if n >= "a" and n <= "z":figue_n += 1new_line = new_line.replace(n, "")if n >= "A" and n <= "Z":figue_n += 1new_line = new_line.replace(n, "")sum += len(new_line)pure_chinese.append(new_line)
print("总字数", sum)
print(result)
print("字母数", figue_n)
print("纯中文字数", sum - figue_n)
print(pure_chinese)



这是抠出图片、代码、各种字母后基本就剩下中文了,有4000+,内心狂喜:交作业了~

使用Python读取markdown文件并统计字数相关推荐

  1. Python+pandas读取Excel文件并统计演员参演电影数量

    Excel样本数据请参考Python读取Excel文件并统计演员参演电影 >>> import pandas as pd >>> df = pd.read_exce ...

  2. python英文单词及其出现次数-Python读取英文文件并记录每个单词出现次数后降序输出示例...

    本文实例讲述了Python读取英文文件并记录每个单词出现次数后降序输出.分享给大家供大家参考,具体如下: 对文中出现的句号,逗号和感叹号做了相应的处理 sorted排序函数用法: 按照value值降序 ...

  3. python读取txt文件的行数_python读取txt文件符合条件的行数-女性时尚流行美容健康娱乐mv-ida网...

    女性时尚流行美容健康娱乐mv-ida网 mvida时尚娱乐网 首页 美容 护肤 化妆技巧 发型 服饰 健康 情感 美体 美食 娱乐 明星八卦 首页 > 高级搜索 python 关系网图 pyth ...

  4. python 读取excel文件 效率 时间 格式_python读取Excel文件中的时间数据

    在使用python读取Excel文件中的时间格式,碰到的时间格式转换问题: 读取这样的表格: 输出这样的数据结果: 然而这样的结果却不是我们想要的,我们需要的是这样的结果: 1.安装python官方库 ...

  5. python读取一个文件夹/子文件夹下的所有文件名字

    python读取一个文件夹/子文件夹下的所有文件名字 示例代码: import osfile_path = './images/' all_file_name = os.listdir(file_pa ...

  6. python删除重复值所在的行数_使用python读取txt文件的内容,并删除重复的行数方法...

    注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字. #coding:utf-8 import shutil readDir = "原文件绝对路经" ...

  7. python读取txt文件并画图

    1,使用python读取txt文件 已知txt文件内容如下: 0 01 12 43 94 165 256 36 请以第一列为x轴,第二列为y轴画图 步骤如下: 1)使用readlines读取文件 2) ...

  8. MATLAB和Python读取wave文件的波形对比

       用python读取.wav文件的波形后再用MATLAB读取文件波形进行验证. 1.MORSE 1.1 Python 程序见之前的博客. 波形如图1所示: 图1 1.2 MATLAB 读取波形程序 ...

  9. 用Python读取整个文件

    本文翻译自:Reading entire file in Python If you read an entire file with content = open('Path/to/file', ' ...

最新文章

  1. 任正非:明年至少招聘 8000 名应届生,华为人才将分为三类
  2. body里写注释 postman_HTTP Status 415 – Unsupported Media Type(使用@RequestBody后postman调接口报错)...
  3. c 获取当前时间插入oracle数据库,Oracle如何获取系统当前时间等操作实例,c++获取系统时间...
  4. 一些计算机知识的总结(转)
  5. Delphi XE 10.2.3使用CEF4Delphi取网页元素时碰到nbsp;变问号?的处理
  6. 10 个常用的软件架构模式
  7. 数字图像处理(一):灰度变换和直方图处理
  8. html中字体响应式怎么写,css字体单位之间的区分以及字体响应式实现_html/css_WEB-ITnose...
  9. 服务器系统装软路由,服务器系统设置软路由
  10. 【Paddle 经验分享】利用PaddleHub 2.x 完成文本分类训练的坑
  11. 小米手机连接不上网络 或者 暂时关闭状况不佳的连接
  12. 几个公共FTP服务器
  13. 在Win10上安装VC6
  14. 【IoT】产品模型:基于 ARM 的音视频采集与传输系统
  15. AtCoder Beginner Contest 065(CD)
  16. 分享收集网络上的免费0元虚拟主机
  17. 【企业安全实战】开源HIDS OSSEC部署与扩展使用
  18. 生吃素食健康驻颜5大注意
  19. 简单的理解position与anchorPoint
  20. Python新建纯色图片(任意颜色)

热门文章

  1. c++语言解一元二次方程,初学C++新手跪求:用C++编 解一元二次方程 并 结果用复数表示。。...
  2. MaxEnt报错处理方法
  3. Python3.X网络爬虫学习(六)
  4. 市内移出版本2.0(1、一页显示15条。2、增加控制标志。3、打印表格时绑定的list的优化。4、保存迁出登记信息时根据业务流水号判断增加还是修改。5、统一管理常量)
  5. 苹果手机怎么设置时间24小时制_手机资讯:无法激活 iMessage 等问题及解决办法汇总...
  6. javaweb项目JS文件报错解决办法
  7. GEE|假彩色目视解译山东省玉米、水稻、小麦等样本集制作代码
  8. 动画三:2D转换(超详细!)
  9. linux配置yum源的三种方法:
  10. 数据分析之数据透视表多维度计算(Office2019)