为什么有制作自己的电子书的想法

最近又发现了有意思的小说,很想阅读完整版,网上找来电子书下载,质量非常差,主要问题是有广告内容,如果是.txt格式的,则目录提取还不正常。我希望阅读一本目录正确完整,没有广告内容的电子书小说。

要解决的问题和思路
  1. 如何去除广告内容。
    我的思路是,先找来电子书的.txt文件,然后通过全局查找替换的方式,将所有重复多次出现的广告关键词全部替换成空内容。我不知道.epub文件能不能编辑,我发现有良好目录的.epub文件,但是不知道怎样去除里面的广告内容。
  2. 如何正确提取去了广告内容的.txt电子书的目录。
    我发现了一款工具,EasyPub,它的主要功能是帮我把.txt电子书根据固定格式提取内容目录,分章内容,再转化成.epub电子书。尤其是它里面根据正则表达式来匹配目录,这个功能很好,如果我们懂得运用正则表达式的话。
实际操作
  1. 去广告内容。
    用记事本打开.txt文件,使用其中查找全局替换功能将广告内容替换成空内容。
  2. 提取.txt文件的目录。使用EasyPub v1.5.0绿色版,把选定的.txt文件,根据自定义的匹配目录的正则表达式划分章节转换成.epub文件。
难点

难点主要是正确提取.txt文件内容的目录,我找的的这本小说的.txt文件的目录有很多问题,它的目录形式是数字.标题,而且是单独一行,标题前后没有多余的内容。但是它不少地方出现了一些错误的重复目录,样式有:数字 标题,比如:170 人潮非法数字.标题,比如:900111388828.融合神格的金钟其他内容数字.标题,比如:1oo28重林巨蜥146.照片。我自定义了以下的正则表达式来匹配到正确的目录:^[0123456789]{1,4}\.\S*
这个正则表达式限定了合法标题一定是这样的:

  1. 它以数字而不是其他内容作为开头。
  2. 它的开头的数字位数不能大于4位。
  3. 紧跟着数字后面是一个点号。
  4. 点号后面跟着任意的文字。
结果和收获

新产生的.epub电子书没有了烦人的重复出现的广告内容,目录完整,正确,除了几条重复目录(即一模一样的合法目录)没有处理。在定义正则表达式时,对点号的处理一度有问题,那就是它不仅匹配了有点号的目录,也匹配没有点号的目录。后来才知道,是我在匹配点号时没有加\转义符。

制作目录完好无广告内容的电子书相关推荐

  1. 如何制作一个纯净无广告无捆绑安装的Windows10重装系统的U盘启动盘?看这篇文章就够了!

    相信很多人都有使用过很多pe启动盘重装系统,虽然也是可以重装的,还是傻瓜式一键重装,优点就很显而易见,但是缺点也很多,例如最大的一个缺点估计就是各种捆绑软件,装了大半天,其实早就装完了,最后显示说是正 ...

  2. 深度迅雷5.8.3.556无广告绿色超级精简版【迅雷6核心文件】-绿软下载

    深度迅雷5.8.3.556无广告绿色超级精简版[迅雷6核心文件] 软件介绍: 迅雷(Thunder) V5.8.3.556 无广告绿色精简奥运版 本程序由迅雷官方版本5.8.3.556精简制作,其中部 ...

  3. 免费好用无广告的开源 gif制作软件 screentogif

    前言 平时一直用的是迅雷影音的gif截图,但是速度太慢,使用麻烦. screentogif 免费 开源 无广告 可录制 可编辑 导出的gif文件还小 官网地址 点击右上角下载 效果图 整个软件小巧精悍 ...

  4. 基于百度接口的手机无广告浏览器设计

    摘要 搜索工具在人们网络生活中扮演着重要的角色,在当今发达的信息时代,人们依靠各种各样的搜索工具来在网络上寻找所需要的资料,没有搜索工具,这些正确.有效的资源就没办法呈现在人们的眼前,因此,在搜索引擎 ...

  5. 开源阅读书源_安卓开源无广告追书神器阅读App

    身边很多朋友都喜欢在无聊的时候用手机看小说,非常便携,又可以打发时间.但普遍的痛点就是没有一款舒适的app,要么文件过大,要么广告太多,非常影响观感,导致好多经典的武林绝学也无心修炼.那么今天我给大家 ...

  6. wps右键新建里面没有word和excel_WPS竟然出过这么多实用工具?每个都免费无广告,简直相见恨晚...

    没想到,总被各种吐槽的WPS,竟然还出过这么多实用工具!向你分享4款WPS出品的软件和网站,其中1款让我又爱又恨,而另外几款免费无广告,和三顿一起来看看吧!WPS图片电脑上到底有没有好用的看图软件?这 ...

  7. 集成60 多个无广告及插件的绿色办公小工具,这个软件真的太良心了

    万彩办公大师内置了 60 多个无广告及插件的绿色办公小工具,如 PDF 工具集(PDF 相互转换.PDF 合并分割):文档/音视频/图片转换工具集:识别工具集:屏幕录制工具集:图片处理工具集:文件处理 ...

  8. 【PC工具】文件压缩解压工具winrar解压缩装机必备软件,winRAR5.70免费无广告

    微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 今天分享一个常用的压缩解压工具winrar. 为啥要搞这个无广告版呢(废话),总之网上 ...

  9. 无广告、无推送、无新闻,这7款手机浏览器实用且优秀

    如果问,有哪些好用的电脑浏览器?大家选项肯定非常明确,谷歌浏览器.火狐浏览器.Edge浏览器.但是,如果问,有哪些好用的手机浏览器?那么,就有很多不同的看法.市面上的手机浏览器数量众多,本篇文章无法覆 ...

最新文章

  1. 全国汽车牌照号详解细表(各省市区)
  2. python程序设计语言的执行方式_编程语言用Python执行程序的4种方式
  3. 学成在线--3.CMS页面管理开发(自定义条件查询)
  4. itext替换pdf中的中文
  5. HOJ 1157 SCUD Busters
  6. 在Eclipse的DDMS中查找genymotion模拟器的sdcard中的文件---开发中遇到的问题(一)...
  7. 屏幕取色器设计思路及源码
  8. swot分析法案例_型男收割机之SWOT分析法——大龄剩女脱单攻略
  9. 发光二极管之二——正负极如何判断
  10. cydia java_利用Cydia Substrate进行Android JAVA HOOK
  11. Nmap的下载与基本命令运用
  12. java如何使用conver_Springmvc conver实现原理及用法解析
  13. Frp内网穿透保姆级教程 windows内网穿透
  14. 啥是“quoting reference XXX” 递交申请材料时
  15. 软件测试面试刁难人?花重金购买的资料1套全给你解决
  16. 房地产行业商业智能解决方案分享
  17. HackTheBox –Craft实战
  18. 学完高性能计算后的发展怎么样?
  19. c语言中的return 0有什么用?
  20. python获取文件的绝对路径

热门文章

  1. Java性能优化权威指南--笔记
  2. nginx下安装配置modsecurity waf防火墙(附完整编译、配置、排错、详细规则)
  3. Spring2.5+Struts2+Ibatis整合之五
  4. python获取文件后缀_Python使用filetype精确判断文件类型 (文件类型获取)
  5. labview2020图文教程LabVIEW2020
  6. html编码后台转换,html unicode编码转换方法
  7. ArcGIS Pro 中的 Python 入门
  8. 非Root环境下安卓实现全屏,屏蔽下方虚拟按键:左键、右键。较新安卓系统无法屏蔽Home键。源代码例子
  9. 【萌新投稿】自学几个月Python制作的明日方舟寻访模拟器
  10. 制造“空间魔术”:为未来取暖的腾讯多媒体实验室