做到网“平行网页寻源”技巧分享
做点事吧,从现在就开始。
由于前段时间调换工作,业余时间要相对多些,眼看着大把时间被荒废了,确实有些不忍,就想到找点兼职赚点外快,于是就在知乎上搜索了下“业余时间 兼职”,想看下大家是如何利用业余时间做兼职工作的,检索出来的结果真是让人眼界大开,其中,有一个说是在“做到!”上可以兼职翻译。初于好奇,在“做到!(现在已经被阿里巴巴收购)”上注册了一个帐号,结识了“做到!”,并且在短短的时间内,赚了一笔不菲的收入。所以,就针对自己兼职做一些简单的网页寻源方法分享,希望可以帮到有需要的人。
开始之前,先了解下什么是“平行网页寻源”?这个很关键,在做之前,起码要知道这个项目是要求你做什么的,因为在平台交流版块,每次都会看到新人在询问这个问题,不知道要做什么。
关于寻源方法,通常情况下包含如下三个步骤:
第一步:找到多语言网站主站url
第二步:这个主站至少包含2个语言分站url
第三步:抽取每2个语言分站下内容互译页面url
不难理解,其实就是找网页,支持多种语言的那种网页,然后,将有互译内容的网页面的URL提取出来即可。
知道了这个项目的玩法后,下面就是如何去寻找支持多语言的网页了,不同的人,可能有不同的方法,但是,这个方法很关键,掌握方法了,可以让你又快,又准的找到这种网页。方法不当,就犹如大海捞针。
其实,细心一点,你会发现任何网页的URL都不是随意设置的,都是经过一番考虑,有一定用意的,并且URL链接与网页的内容有着一定的相关性,所以,其实我们完全可以利用这种相关性,来缩小范围,快速准确地找到所需要的。
下面就是我个人在做寻源项目时,摸索到的一些方法:
(1)了解常用的各国域名后缀,即不同国家URL后缀命名方法;
(2)使用搜索引擎工具;
各国域名采用的后缀,可以在百度上查找到,以较为常见的语言为例,语言与后缀名对应如下:
中国:CN,美国:US, 英国:GB, 西班牙:ES, 俄罗斯:RU,法国:FR, 日本:JP,韩国:KR,越南:VN,泰国:TH, 土耳其:TR,葡萄牙:PT,印度尼西亚:ID,阿拉伯:AE,
清楚了不同国家URL后缀命名方法,剩下的事情,就交给搜索工具吧,让它去帮你检索你想要的网页。这件事度娘可能帮不到你了,我们要借助于谷歌Google或者谷歌变种的一些搜索引擎。 当然,使用搜索引擎工具,也是有一定技巧在里面的。这些技巧,在搜索关键字时,配合一些通配符,可以帮助你快速检索到想要的结果。上面提到的技巧,比如inurl的使用。
inurl是谷歌等搜索引擎支持的高级语法,它的作用是限定在URL(地址栏里的内容)搜索,比如:URL中包括xxx,则我们可以在谷歌中搜索“inurl:xxx”。
下面以谷歌为例,介绍如何使用谷歌检索的技巧以及各国域名后缀,能够快速检索到一类网站,供你进行筛选。例如,我现在要找一些西班牙语的网站,同时,这些网站也要支持英语,然后从这类网站中去筛选,看是否满足“平行网页寻源”的要求。
搜索到的结果:
从检索出的结果可以看到,URL中都包含有我们的关键词“es/en”,打开任意一个URL,
把上述的URL中的“en”去掉,
经过上述对比,这对网页满足“平行网页寻源”的要求,我们可以继续下一步在平台上验证该主站是否存在,如果不存在,那么我们就可以提交了,提交后,一旦采纳,我们会有2元的基础价格收入,如果找到的源是属于优质源,则后期会有30~320元更高的价格补贴。
简单的总结了平行网页寻源的方法,希望这篇文章可以帮助有需要的朋友,也可以关注我的公众号:做点事吧,一起来讨论平行网页寻源的方法。
附上我的邀请链接:https://www.zuodao.com?k=36405我的邀请码: 36405
做到网“平行网页寻源”技巧分享相关推荐
- 平行网页寻源(第二篇)
前段时间分享了做到网平行网页寻源的方法,几个读者在后台留言,不清楚做到网上寻源规则到底是什么,说的究竟是什么意思.尽管做到网上已经对寻源规则进行了实例化,但是,读者还是有些不解. 所以,今天就再详细说 ...
- 谷歌浏览器怎么查看网页源代码 Chrome浏览器网页源代码查看技巧分享
凭借简单.高效的使用体验,谷歌开发的网页浏览器"Chrome"在国内也不乏粉丝,甚至一度被视为装机必备的软件之一.但其操作方式和界面设计,与国产浏览器略有不同!那么,谷歌浏览器要怎 ...
- python爬虫爬取王者荣耀官网全部英雄头像(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...
- python爬虫爬取王者荣耀官网全部装备图片(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...
- Vue高仿网易云网页端源码
源码介绍: 音乐播放器虽然烂大街了,但是作为前端没自己撸一个一直是个遗憾,而且偶然间发现 pc 端 web 版的网易云音乐做的实在是太简陋了,社区仿 pc 客户端的网易云也不多见,为了弥补这个遗憾,就 ...
- HTML广告位出售单页网页模板源码分享
正文: 广告位出售页HTML网页模板,网站附加收入页,使用简单,右键记事本可以修改内容,实测可用,上传到服务器就可以打开. 程序: wwrhs.lanzoum.com/iNZN609hlv4d 图片:
- 经验分享-band 7.5已经工作的人如何准备雅思考试-学习心得-雅思频道|太傻网考试频道|常识 辅导 技巧 机经 名师 访谈 交流 资料 试题库...
经验分享-band 7.5已经工作的人如何准备雅思考试-学习心得-雅思频道|太傻网考试频道|常识 辅导 技巧 机经 名师 访谈 交流 资料 试题库 经验分享-band 7.5已经工作的人如何准备雅思考 ...
- 坚果云与服务器同步数据,#网盘每日小技巧分享# 如何在坚果云和服务器之间更好地同步数据?...
原标题:#网盘每日小技巧分享# 如何在坚果云和服务器之间更好地同步数据? 我们有很多用户利用坚果云在服务器之间同步数据,因为数据格式原因,出现了不少问题,影响用户体验. 其实,微软本身就推出了robo ...
- HTML5期末大作业:影视在线网站设计——电影网H5(9页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码
HTML5期末大作业:影视在线网站设计--电影网H5(9页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码 常见网页设计作业题 ...
最新文章
- python 目录和文件操作
- ubuntu mysql配置教程视频_ubuntu16.04安装配置mysql数据库,分割视频为帧图像
- 解密Redis持久化
- CodeForces - 1321C Remove Adjacent(贪心+模拟)
- Flask学习 一 基本结构
- 团队项目计划BACKLOG
- 错误记录:expected single matching bean but found 2
- c语言数组如何把一串数字存入数组_C语言经典编程题(下)
- 聊聊用于特征处理的tsfresh
- Matlab中的continue、break和return语句
- html 忽略标签属性,限制文本一定数目的字符忽略HTML标签/属性
- struts2+freemarker+sitemesh乱码,解决了
- 1.两数之和(力扣leetcode) 博主可答疑该问题
- Android注册时总是出现验证码不正确问题的解决
- 【.NET IoT】把达特甲醛传感器DART WZ-S接到树莓派RaspberryPi 3 b+上
- 码元、符号、波特率、比特率等概念的了解
- *p++,*(p++),*++p,(*p)++区别?
- SQL server 2008R2 入门
- win下禁用光标闪烁 记录
- java遍历map并赋值的最优解