owllook在线小说搜索引擎使用指南
owllook是一个在线小说搜索引擎,其目的是让阅读更简单、优雅,让每位读者都有舒适的阅读体验
owllook是我大学时期编写的一个Python开源项目,至今维护将近两年了,以前关于owllook介绍的原文章已经年久失修,再加上一些github用户不知道怎么安装使用,因此我将文章重新编辑一番,以作使用指南
介绍
owllook是一个基于其他搜索引擎构建的垂直小说搜索引擎,提供搜书、阅读、收藏、追更、推荐等功能
owllook 演示网址: https://www.owllook.net/
github开源地址:https://github.com/howie6879/owllook
owllook不保存数据,所有信息全部利用爬虫技术基于第三方网站搜索发现,再经过在线解析展示给用户,这样对使用者的好处在于:
多网站聚合,可选择性高
优质网站来源提供,可靠性强
页面解析会经过过滤,安全性高
自动去广告,可读性强
定时更新,自动追更
发现同类书友
……
owlllook基于python3.6,后端采用Sanic(对这个web框架感兴趣的朋友可在公众号后台回复sanic,看看我写的Sanic教程),前端使用了 bootstrap
和 mdui
,数据库方面则用了 MongoDB
储存用户使用过程中的产生的基本信息,诸如注册信息、搜索小说信息、收藏小说数据等,对于某些必要的缓存,则利用 Redis
进行缓存处理,如小说缓存、session缓存,注意,对于限制数据:都将在24小时删除
对于不同网站的小说,页面规则都不尽相同,我希望能够在代码解析后再统一展示出来,这样方便且美观,而不是仅仅跳转到对应网站就完事,清新简洁的阅读体验才是最重要的
目前采用的是直接在搜索引擎上进行结果检索,我尽量写少量的规则来完成解析,具体见项目里面的规则定义,遇到自己喜欢的小说网站,你也可以自己添加解析,owllook目前解析了超过 200+
网站,追更网站解析了 50+
有一些地方需要用到爬虫,比如说排行榜,一些书籍信息等,我不想动用重量级爬虫框架来写,于是我在owllook里面编写了一个很轻量的爬虫框架来做这件事,见 ruia 异步爬虫框架
目前实现功能如下:
多搜索源
丰富的解析源
界面统一解析
完善的阅读体验
搜索记录
缓存
书架
书签
登录
初步兼容手机
注册(开放注册)
上次阅读记录
最新章节
书友推荐(简单地基于相似度进行推荐)
目录获取
翻页
搜索排行
章节异步加载 感谢@[mscststs](https://github.com/mscststs)
排行榜 - 起点+owllook
自带爬虫框架,统一爬虫规范,对爬虫感兴趣的可以看看 - [ruia](https://github.com/howie6879/ruia)
安装
接下来的安装步骤,默认以 Centos7
为主,默认在 root
用户下操作,首先Python版本,最好是 Python3.6
,然后项目的数据库需要 MongoDBRedis
请先安装:
yum -y install bzip2 wget vim git
环境搭建
owllook的安装很简单,但是对于一些Python不熟悉或者新手来说确实有点困难,下面详细介绍了安装流程
数据库
owllook需要你在服务器上安装 MongoDB
和 Redis
,你不必管理数据库的创建,用这个的好处就在于可以自动生成
安装MongoDB:
vim /etc/yum.repos.d/mongodb-org-3.6.repo
输入:
[mongodb-org-3.6]
name=MongoDB Repository
baseurl=https://repo.mongodb.org/yum/amazon/2013.03/mongodb-org/3.6/x86_64/
gpgcheck=1
enabled=1
gpgkey=https://www.mongodb.org/static/pgp/server-3.6.asc
可以看到 repolist
已经存在:
# 安装
sudo yum install mongodb-org
# 启动
sudo systemctl start mongod
# 查看 MongoDB 后台进程
ps -aux |grep mongod
# 或者
sudo systemctl status mongod
可以看到MongoDB正在后台运行:
进入 MongoDB
:
安装Redis:
yum install epel-release yum-utils
yum install http://rpms.remirepo.net/enterprise/remi-release-7.rpm
yum-config-manager --enable remi
yum install redis
vim /etc/redis.conf
# 使 redis 能在后台运行
daemonize yes
启动 redis 服务
# 启动
systemctl restart redis
# 查看状态
systemctl status redis
# 查看端口
ss -an | grep 6379
启动 redis 客户端
redis-cli
# ctrl + d 退出客户端
下载代码
请先安装git然后克隆代码
cd ~
# 下载代码
git clone https://github.com/howie6879/owllook
搭建Python3.6环境:
# 下载anaconda管理 Python 环境
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.0-Linux-x86_64.sh
# 安装
chmod -R a+x Anaconda3-5.3.0-Linux-x86_64.sh
./Anaconda3-5.3.0-Linux-x86_64.sh
# 刷新终端
# 创建 Python3.6 环境
conda create -n python36 python=3.6
配置项目:
cd ~/owllook
# 安装 pipenv
pip install pipenv
# --python 后面的路径是上面conda创建的路径地址
pipenv install --python ~/anaconda3/envs/python36/bin/python3.6
# 如果出错 继续往下执行
pipenv run pip install pip==18.0
pipenv install
如下表示安装成功:
运行owllook:
cd owllook
python run.py
成功如下图:
项目截图
首页
搜索
榜单
书架
解析
阅读页
有什么问题欢迎留言,喜欢的话请点赞转发
往期推荐:
owllook在线小说搜索引擎使用指南相关推荐
- 设计 owllook 网络小说推荐系统
查看全文 http://www.taodudu.cc/news/show-6595204.html 相关文章: owllook在线小说搜索引擎使用指南 阿里云短信服务(短信验证码) 如何接入阿里云短信 ...
- 设计owllook网络小说推荐系统
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 数据 推荐算法 协同过滤 基于流行度的推荐 基于用户标签相似度的推荐 评价指标 算 ...
- 2022完整版搜索引擎优化指南清单(你可以按步骤执行的SEO工作清单)
采自:埃克森数字营销 2022完整版搜索引擎优化指南清单(你可以按步骤执行的SEO工作清单) 相信很多SEO新手,都为如何开展或者审核自己的SEO工作而烦恼无从下手,现在在阅读这篇文章的你是否也深 ...
- 解读百度《搜索引擎优化指南》
近日,百度发布了<百度搜索引擎优化指南>来为SEO提供了一个优化的标准.在前言中,百度肯定了SEO的正面作用,并邀请广大的SEOer与百度共同改善搜索引擎的算法.走出了这一步,也可以说是百 ...
- android 上下滚动文字_计算机毕设项目004之Android系统在线小说阅读器
计算机毕设项目004之Android系统在线小说阅读器 一. 项目名称 基于Android系统的在线小说阅读器 二. 项目简介 项目中的角色功能: 支持翻页动画:仿真翻页.覆盖翻页.上下滚动翻页等翻页 ...
- 学工在线新闻搜索引擎0.1 beta版
研究搜索引擎已经有一段时间了.经过半个月的努力,学工在线新闻搜索引擎推出了0.1beta版, 虽然有很多问题和不足,但还是实现了基本的搜索功能. 测试地址:http://202.114.20.55:8 ...
- PHP在线小说txt生成器源码
PHP在线小说txt生成器源码 上传空间即可访问 上传空间即可访问,无需数据库 PHP版本设置5.6,支持上传二级目录访问! 下载地址: http://www.bytepan.com/4TvwGRa9 ...
- 编写区块链_编写由区块链驱动的在线社区的综合指南
编写区块链 by Sandeep Panda 通过Sandeep Panda 编写由区块链驱动的在线社区的综合指南 (A comprehensive guide to coding a blockch ...
- MySQL做毕设_PHP+MYSQL在线小说阅读网的设计与实现
随着互联网信息的发展,人们在闲暇的时候更多的原因选择小说来进行阅读,一方面扩展自己的阅读圈,另一方面消磨闲暇时光,但是当下的很多小说网站,要么是要收取高昂的阅读法,要么就是整个网站多充斥着大量的广告, ...
最新文章
- Linux加密和安全
- 网易云音乐音视频算法的 Serverless 探索之路
- Flutter创建圆圈图标按钮
- Vite与webpack优势
- bean定义的继承 - Spring Framework reference 2.0.5 参考手册中文版
- 邮件系统之webmail
- 二分:路标设置(洛谷)
- 前端学习(1401):多人管理21新增用户
- MySQL5.7升级到8.0 之后,配合ubantu18.04遇到的常规问题以及非常规问题的解决方案
- 学习笔记01:《开放平台产品成长之路-POP》
- 西门子smartclient怎么用_西门子200SMART PLC软件各功能怎么用?编程必备!
- 基于SSM的驾校网站
- 学生管理系统IPO图_基于BIM技术的医院建筑运维管理系统构建
- ESP8266学习——HW Timer
- 游戏数据分析-玩家战力分析
- 任正非:副职要精于管理,正职要敢于进攻
- 阿里物联网云平台搭建(一)
- VSCode实现Cesium的自动提示功能
- INSTALL_FAILED_NO_MATCHING_ABIS 安装包安装失败,返回代码res=-113的解决办法 B站弹幕
- 《HBase 不睡觉》第一章 - 初识 HBase