做点事吧,从现在就开始。

由于前段时间调换工作,业余时间要相对多些,眼看着大把时间被荒废了,确实有些不忍,就想到找点兼职赚点外快,于是就在知乎上搜索了下“业余时间 兼职”,想看下大家是如何利用业余时间做兼职工作的,检索出来的结果真是让人眼界大开,其中,有一个说是在“做到!”上可以兼职翻译。初于好奇,在“做到!(现在已经被阿里巴巴收购)”上注册了一个帐号,结识了“做到!”,并且在短短的时间内,赚了一笔不菲的收入。所以,就针对自己兼职做一些简单的网页寻源方法分享,希望可以帮到有需要的人。

开始之前,先了解下什么是“平行网页寻源”?这个很关键,在做之前,起码要知道这个项目是要求你做什么的,因为在平台交流版块,每次都会看到新人在询问这个问题,不知道要做什么。

关于寻源方法,通常情况下包含如下三个步骤:

第一步:找到多语言网站主站url
第二步:这个主站至少包含2个语言分站url
第三步:抽取每2个语言分站下内容互译页面url

不难理解,其实就是找网页,支持多种语言的那种网页,然后,将有互译内容的网页面的URL提取出来即可。

知道了这个项目的玩法后,下面就是如何去寻找支持多语言的网页了,不同的人,可能有不同的方法,但是,这个方法很关键,掌握方法了,可以让你又快,又准的找到这种网页。方法不当,就犹如大海捞针。

其实,细心一点,你会发现任何网页的URL都不是随意设置的,都是经过一番考虑,有一定用意的,并且URL链接与网页的内容有着一定的相关性,所以,其实我们完全可以利用这种相关性,来缩小范围,快速准确地找到所需要的。

下面就是我个人在做寻源项目时,摸索到的一些方法:

(1)了解常用的各国域名后缀,即不同国家URL后缀命名方法;

(2)使用搜索引擎工具;

各国域名采用的后缀,可以在百度上查找到,以较为常见的语言为例,语言与后缀名对应如下:

中国:CN,美国:US, 英国:GB, 西班牙:ES, 俄罗斯:RU,法国:FR, 日本:JP,韩国:KR,越南:VN,泰国:TH, 土耳其:TR,葡萄牙:PT,印度尼西亚:ID,阿拉伯:AE,

清楚了不同国家URL后缀命名方法,剩下的事情,就交给搜索工具吧,让它去帮你检索你想要的网页。这件事度娘可能帮不到你了,我们要借助于谷歌Google或者谷歌变种的一些搜索引擎。 当然,使用搜索引擎工具,也是有一定技巧在里面的。这些技巧,在搜索关键字时,配合一些通配符,可以帮助你快速检索到想要的结果。上面提到的技巧,比如inurl的使用。

inurl是谷歌等搜索引擎支持的高级语法,它的作用是限定在URL(地址栏里的内容)搜索,比如:URL中包括xxx,则我们可以在谷歌中搜索“inurl:xxx”。

下面以谷歌为例,介绍如何使用谷歌检索的技巧以及各国域名后缀,能够快速检索到一类网站,供你进行筛选。例如,我现在要找一些西班牙语的网站,同时,这些网站也要支持英语,然后从这类网站中去筛选,看是否满足“平行网页寻源”的要求。

搜索到的结果:

从检索出的结果可以看到,URL中都包含有我们的关键词“es/en”,打开任意一个URL,

把上述的URL中的“en”去掉,

经过上述对比,这对网页满足“平行网页寻源”的要求,我们可以继续下一步在平台上验证该主站是否存在,如果不存在,那么我们就可以提交了,提交后,一旦采纳,我们会有2元的基础价格收入,如果找到的源是属于优质源,则后期会有30~320元更高的价格补贴。

简单的总结了平行网页寻源的方法,希望这篇文章可以帮助有需要的朋友,也可以关注我的公众号:做点事吧,一起来讨论平行网页寻源的方法。

附上我的邀请链接:https://www.zuodao.com?k=36405我的邀请码: 36405

做到网“平行网页寻源”技巧分享相关推荐

  1. 平行网页寻源(第二篇)

    前段时间分享了做到网平行网页寻源的方法,几个读者在后台留言,不清楚做到网上寻源规则到底是什么,说的究竟是什么意思.尽管做到网上已经对寻源规则进行了实例化,但是,读者还是有些不解. 所以,今天就再详细说 ...

  2. 谷歌浏览器怎么查看网页源代码 Chrome浏览器网页源代码查看技巧分享

    凭借简单.高效的使用体验,谷歌开发的网页浏览器"Chrome"在国内也不乏粉丝,甚至一度被视为装机必备的软件之一.但其操作方式和界面设计,与国产浏览器略有不同!那么,谷歌浏览器要怎 ...

  3. python爬虫爬取王者荣耀官网全部英雄头像(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...

  4. python爬虫爬取王者荣耀官网全部装备图片(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...

  5. Vue高仿网易云网页端源码

    源码介绍: 音乐播放器虽然烂大街了,但是作为前端没自己撸一个一直是个遗憾,而且偶然间发现 pc 端 web 版的网易云音乐做的实在是太简陋了,社区仿 pc 客户端的网易云也不多见,为了弥补这个遗憾,就 ...

  6. HTML广告位出售单页网页模板源码分享

    正文: 广告位出售页HTML网页模板,网站附加收入页,使用简单,右键记事本可以修改内容,实测可用,上传到服务器就可以打开. 程序: wwrhs.lanzoum.com/iNZN609hlv4d 图片:

  7. 经验分享-band 7.5已经工作的人如何准备雅思考试-学习心得-雅思频道|太傻网考试频道|常识 辅导 技巧 机经 名师 访谈 交流 资料 试题库...

    经验分享-band 7.5已经工作的人如何准备雅思考试-学习心得-雅思频道|太傻网考试频道|常识 辅导 技巧 机经 名师 访谈 交流 资料 试题库 经验分享-band 7.5已经工作的人如何准备雅思考 ...

  8. 坚果云与服务器同步数据,#网盘每日小技巧分享# 如何在坚果云和服务器之间更好地同步数据?...

    原标题:#网盘每日小技巧分享# 如何在坚果云和服务器之间更好地同步数据? 我们有很多用户利用坚果云在服务器之间同步数据,因为数据格式原因,出现了不少问题,影响用户体验. 其实,微软本身就推出了robo ...

  9. HTML5期末大作业:影视在线网站设计——电影网H5(9页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码

    HTML5期末大作业:影视在线网站设计--电影网H5(9页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码 常见网页设计作业题 ...

最新文章

  1. python 目录和文件操作
  2. ubuntu mysql配置教程视频_ubuntu16.04安装配置mysql数据库,分割视频为帧图像
  3. 解密Redis持久化
  4. CodeForces - 1321C Remove Adjacent(贪心+模拟)
  5. Flask学习 一 基本结构
  6. 团队项目计划BACKLOG
  7. 错误记录:expected single matching bean but found 2
  8. c语言数组如何把一串数字存入数组_C语言经典编程题(下)
  9. 聊聊用于特征处理的tsfresh
  10. Matlab中的continue、break和return语句
  11. html 忽略标签属性,限制文本一定数目的字符忽略HTML标签/属性
  12. struts2+freemarker+sitemesh乱码,解决了
  13. 1.两数之和(力扣leetcode) 博主可答疑该问题
  14. Android注册时总是出现验证码不正确问题的解决
  15. 【.NET IoT】把达特甲醛传感器DART WZ-S接到树莓派RaspberryPi 3 b+上
  16. 码元、符号、波特率、比特率等概念的了解
  17. *p++,*(p++),*++p,(*p)++区别?
  18. SQL server 2008R2 入门
  19. win下禁用光标闪烁 记录
  20. java遍历map并赋值的最优解

热门文章

  1. 嵌套虚拟化_下一代云的嵌套虚拟化
  2. css实现一个图片自适应,图片不会变形。
  3. javascript DOM 操作
  4. 小鱼儿CTO赵兴国:基于阿里云的互联网+视频会议系统实践
  5. Macromedia Captivate 使用手记
  6. 软件经验|使用消费级无人机干测绘(三)Pix4Dmapper软件介绍
  7. 牛客网专项练习30天Pytnon篇第24天
  8. (转)移植32位程序64位系统
  9. python查询链家 成都市高新区楼盘信息
  10. tpc-ds基准测试案例-hive