读书

发现用读书软件很长时间了,这是一个很不错的软件。尤其是腾+讯出品,自带社交加成,能方便的知道大家在读什么书。于是,读书开始变得没有那么闭塞,也减少了读完一本书之后的慌张。
虽然我是程序员。可是,发现最近读的技术书籍反而越来越少,文学乃至小说反而越来越多。或许是职业的缘故,或许是生活节奏的缘故,不管怎么说这算是一个好习惯。
有时候一周能读10个小时,不过最近发现能保持一天读一个小时就很不错,尤其是家里还有小孩子。

一个想法

微+信读书软件既然是+讯的作品,肯定天然就带有腾+讯的尿性,要做任务增加免费天数,为了白嫖也是累坏了人。总想玩点好玩的。
不如写个爬虫把书籍download下来放到自己的kindle上,主要是趁着免费
不过好怕怕腾+讯爸爸。

存在的问题

通过我的调查发现,包括不仔细的查看wireshark包,以及查看微+信读书转存下来的网页:
微+信读书的网页中没有书籍的实际字符串,我想可能放到了js脚本里面,或者哪里,总之没有找到。
这样导致直接使用js或者python爬虫不太能“科学上网”。

也就是这个问题阻碍了我很久。包括无数次上网查询。也没有找到,或许是害怕腾+讯爸爸的报复。

想法

首先需要手动登录微+信读书的网页版,然后验证登录,打开某一本要读的书籍。

下边就是脚本可以做的事情了(算法流程):

  • 使用python脚本,搭配pynput库,控制鼠标以及滚轮。
  • 剪切当前的屏幕存储图片
  • 使用ocr解析文字,并转存 尝试了tesseract发现对简体中文的识别有点弱鸡
  • Python脚本scroll到网页底部,直到不能scroll为止
  • ocr找到下一章标签,并解析处坐标
  • python pynput点击下一章
  • 回到开始

算法可以更有趣一点就是变成多线程:
可以用一个线程批量下载图片,然后转存。
之后可以用另外的线程去ocr。

实际解决

现在的实现直到了上一步想法,希望有志之士可以按照我的想法实现一下。不如就当做一个小项目玩一下。

if you care about the progress of this, please check github,I am trying do this by myself.

I am busy for my own work. so, Maybe I have no much time to do this.

But, I do think this is one great idea.

现状

从本人的观点来看,代码的第一版已经写完。虽然行数不多,现在实现的功能可以借助宿主机上的chrome实现全屏截图,然后自动下一章,然后截图。并且将截取的图片保存起来。
从某种意义上来说,可以把这些图片当做书籍本身。

下一阶段

尝试借助python的selenium库,起一个chrome,在这个chrome上将上边实现的功能进行嵌入。这样可以将启动起来的chrome设定一个比较固定的大小,然后在这个上边将所有需要配置的参数进行配置。就能免去很多切换平台带来的诸多需要重新配置的麻烦。

某读书软件书籍导出想法相关推荐

  1. 12.一键导出微信读书的书籍和笔记

    # 一键导出微信读书的书籍和笔记> 本项目基于[@arry-lee](https://github.com/arry-lee)的项目[wereader](https://github.com/a ...

  2. Python 一键导出微信读书的书籍和笔记

    作者:云外孤鸟 https://www.cnblogs.com/cloudbird/p/12683546.html 简介 全民阅读的时代已经来临,目前使用读书软件的用户数2.1亿,日活跃用户超过500 ...

  3. Python实战:一键导出微信读书的书籍和笔记

    全民阅读的时代已经来临,目前使用读书软件的用户数2.1亿,日活跃用户超过500万,其中19-35岁年轻用户占比超过60%,本科及以上学历用户占比高达80%,北上广深及其他省会城市/直辖市用户占比超过8 ...

  4. 读书软件源码,实现书籍阅读的其他功能

    基本原理 NSLayoutManager 会根据加入的 NSTextContainer 不断分走文字, 直到分完为止, 这时候读书软件源码可以使用 layoutManager.glyphRange(f ...

  5. 更换ip软件安卓_2019十大手机读书软件排行榜

    2019十大手机读书软件排行榜        相较于纸媒的单一,电子阅读的方式更加受到年轻人的欢迎.要想获得好的阅读体验感,这与阅读软件的界面设计.丰富的资源库.强大的功能都有着密切的关系.下面,就让 ...

  6. 手机处理器排行榜2019_2019十大手机读书软件排行榜

    2019十大手机读书软件排行榜        相较于纸媒的单一,电子阅读的方式更加受到年轻人的欢迎.要想获得好的阅读体验感,这与阅读软件的界面设计.丰富的资源库.强大的功能都有着密切的关系.下面,就让 ...

  7. 基于墨刀实现的原型系统:一款简易的读书软件

    一.产品说明 读书对于任何年龄段的人来说都是必不可少的,一款好的读书软件可以让人多读书.爱读书,基于以上想法设计了一款简易的读书app,旨在让更多人多读书.爱读书. 二.产品架构 主要分为三个功能模块 ...

  8. PDPS软件:导出Web浏览器文件功能及其操作方法

    目录 概述 导出Web浏览器文件操作 Web浏览器文件查看 本文已经首发在个人微信公众号:工业机器人仿真与编程(微信号:IndRobSim),欢迎关注! 概述 为了方便机器人虚拟仿真动画地查看,PDP ...

  9. PDPS软件:导出AutoCAD可编辑的2D布局图

    目录 概述 创建新仿真资源 JT格式2D布局图生成 导出2D布局图JT格式文件 JT格式文件转换为CAD格式文件 本文已经首发在个人微信公众号:工业机器人仿真与编程(微信号:IndRobSim),欢迎 ...

最新文章

  1. opengl库区分:glut、freeglut、glfw、glew、gl3w、glad
  2. 在CentOS 6.8 x86_64上安装ATS 6.2.1实录
  3. java实现在pdf文档上填充内容
  4. [转]Iphone NSString字符串常用方法
  5. java 大顶堆_107-大顶堆和小顶堆图解说明
  6. 3DSlicer29:Debug or Dev-170918
  7. UART串口通信浅谈之(二)--寄存器设置
  8. Linux环境下Mysql的安装教程及安装过程常见问题的解决方法
  9. 重写equals()与hashCode()方法
  10. html在线查看ppt,网页设计———HTML基本标记.ppt
  11. hdu 3255 Farming(扫描线)
  12. centos7 安装java8
  13. shipyard安装不迷茫
  14. 零伽壹浅谈:区块链技术在审计工作的应用
  15. DAVINCI DM36x开发攻略——U-BOOT-2010.12及UBL移植
  16. R语言的三种聚类方法
  17. 常见的三种中文内码转换代码
  18. 日志审计(启明设备)
  19. MySQL Win7 64位 下载、安装与配置图文教程
  20. IBM带库加磁带操作

热门文章

  1. Rust腐蚀盒子小程序抄家工具上线
  2. html文本框无填充颜色,将文本框设定为:无填充颜色和无线条颜色
  3. 浅谈数据结构中的数据逻辑结构
  4. Python:图像处理——使用Pillow对图像做基本变化
  5. Amazon S3服务 简介及基本概念
  6. 高频宽带功率放大器(频率:10KHZ-1MHZ 功率:400-800W)
  7. html js 设置样式,原生js设置样式 笔记:JS设置CSS样式的几种方式
  8. 职场环境之''彼得原理''
  9. Java版工人-监工模式实现
  10. 快手引流需要钱吗?快手免费引流怎么做?