一、需求分析
用go语言抓取 豆瓣电影top250
抓取url:
https://movie.douban.com/top250

抓取字段:电影名称、评分、评价人数

二、运行:
正在抓取第0页……
肖申克的救赎 9.6 824764人
这个杀手不太冷 9.4 791399人
霸王别姬 9.5 589028人
阿甘正传 9.4 678850人
美丽人生 9.5 394009人
千与千寻 9.2 630458人
辛德勒的名单 9.4 364712人
泰坦尼克号 9.2 624623人
盗梦空间 9.2 732345人
机器人总动员 9.3 480979人
海上钢琴师 9.2 577308人
三傻大闹宝莱坞 9.1 641152人
忠犬八公的故事 9.2 430317人
放牛班的春天 9.2 432372人
大话西游之大圣娶亲 9.2 465333人
教父 9.2 329687人
龙猫 9.1 401043人
楚门的世界 9.0 428408人
乱世佳人 9.2 261186人
天堂电影院 9.1 298513人
当幸福来敲门 8.9 517770人
触不可及 9.1 350506人
搏击俱乐部 9.0 391458人
十二怒汉 9.3 162947人
无间道 9.0 379235人
正在抓取第1页……
熔炉 9.2 230668人
指环王3:王者无敌 9.1 274576人
怦然心动 8.9 516559人
天空之城 9.0 317896人
罗马假日 8.9 370862人
少年派的奇幻漂流 9.0 557923人
大话西游之月光宝盒 8.9 377930人
鬼子来了 9.1 215894人
星际穿越 9.1 458151人
蝙蝠侠:黑暗骑士 9.0 301300人
两杆大烟枪 9.0 263387人
飞屋环游记 8.9 479900人
活着 9.0 250291人
飞越疯人院 9.0 266980人
窃听风暴 9.1 210963人
海豚湾 9.3 175994人
闻香识女人 8.9 306894人
V字仇杀队 8.8 393427人
美丽心灵 8.9 292012人
教父2 9.1 177785人
哈尔的移动城堡 8.8 329450人
指环王2:双塔奇兵 8.9 259420人
指环王1:魔戒再现 8.9 289417人
天使爱美丽 8.7 462798人
情书 8.8 355630人
正在抓取第2页……
死亡诗社 8.9 261989人
美国往事 9.1 165768人
七宗罪 8.7 417016人
钢琴家 9.0 193470人
狮子王 8.9 268010人
辩护人 9.1 184702人
被嫌弃的松子的一生 8.9 261601人
致命魔术 8.8 322267人
控方证人 9.6 74343人
勇敢的心 8.8 284474人
剪刀手爱德华 8.7 461650人
饮食男女 9.0 177612人
小鞋子 9.2 127801人
音乐之声 8.9 221186人
低俗小说 8.7 314236人
入殓师 8.8 305490人
本杰明·巴顿奇事 8.7 374361人
沉默的羔羊 8.7 332710人
蝴蝶效应 8.7 361872人
黑客帝国 8.8 263790人
拯救大兵瑞恩 8.8 221863人
素媛 9.1 159897人
玛丽和马克思 8.9 224392人
西西里的美丽传说 8.7 322475人
心灵捕手 8.7 253548人
正在抓取第3页……
幽灵公主 8.8 221276人
第六感 8.8 219997人
阳光灿烂的日子 8.7 254632人
让子弹飞 8.7 591987人
春光乍泄 8.8 226800人
大鱼 8.7 236955人
大闹天宫 9.2 90498人
射雕英雄传之东成西就 8.7 259390人
重庆森林 8.6 305208人
阳光姐妹淘 8.8 252293人
上帝之城 8.9 150203人
甜蜜蜜 8.7 219633人
禁闭岛 8.6 334496人
致命ID 8.6 296372人
告白 8.6 319372人
一一 8.9 144124人
加勒比海盗 8.6 314012人
爱在黎明破晓前 8.7 204426人
狩猎 9.0 112979人
布达佩斯大饭店 8.7 283495人
阿凡达 8.6 500668人
断背山 8.6 299180人
风之谷 8.8 165217人
萤火虫之墓 8.7 191782人
疯狂动物城 9.2 456022人
正在抓取第4页……
摩登时代 9.2 80291人
爱在日落黄昏时 8.7 186451人
猫鼠游戏 8.7 202371人
末代皇帝 8.8 148111人
侧耳倾听 8.8 155656人
哈利·波特与魔法石 8.6 229709人
驯龙高手 8.7 267113人
超脱 8.7 159754人
海洋 9.0 95004人
幸福终点站 8.6 213611人
穿条纹睡衣的男孩 8.8 127481人
菊次郎的夏天 8.7 165585人
燃情岁月 8.8 142374人
消失的爱人 8.7 323395人
倩女幽魂 8.6 228708人
神偷奶爸 8.5 345293人
电锯惊魂 8.6 186192人
谍影重重3 8.7 169379人
岁月神偷 8.6 289352人
真爱至上 8.5 292293人
借东西的小人阿莉埃蒂 8.7 201807人
雨人 8.6 198321人
七武士 9.2 70156人
虎口脱险 8.9 101112人
恐怖直播 8.7 194852人
正在抓取第5页……
贫民窟的百万富翁 8.5 376457人
东邪西毒 8.6 233910人
记忆碎片 8.5 258781人
疯狂原始人 8.7 348948人
杀人回忆 8.6 191049人
怪兽电力公司 8.6 221069人
红辣椒 8.8 116235人
卢旺达饭店 8.8 109739人
黑天鹅 8.5 390705人
穿越时空的少女 8.6 173268人
魂断蓝桥 8.8 122263人
恋恋笔记本 8.5 259857人
猜火车 8.5 229628人
喜宴 8.8 125182人
英雄本色 8.7 136379人
雨中曲 8.9 87275人
傲慢与偏见 8.4 278663人
小森林 夏秋篇 8.9 110985人
教父3 8.7 119653人
喜剧之王 8.4 280151人
完美的世界 9.0 72740人
纵横四海 8.7 130696人
玩具总动员3 8.7 181584人
萤火之森 8.7 141373人
人工智能 8.6 177331人
正在抓取第6页……
我是山姆 8.8 93435人
浪潮 8.7 120227人
香水 8.4 256627人
冰川时代 8.4 251942人
7号房的礼物 8.7 155404人
撞车 8.6 163627人
哈利·波特与死亡圣器(下) 8.6 253235人
花样年华 8.5 224652人
追随 9.0 72964人
朗读者 8.5 262929人
一次别离 8.7 122269人
碧海蓝天 8.7 103214人
罗生门 8.7 112566人
秒速5厘米 8.4 269433人
梦之安魂曲 8.7 102680人
战争之王 8.5 162502人
荒蛮故事 8.7 114197人
可可西里 8.6 119344人
心迷宫 8.6 138691人
唐伯虎点秋香 8.3 289176人
超能陆战队 8.6 335960人
时空恋旅人 8.6 176282人
海盗电台 8.6 157460人
地球上的星星 8.8 74442人
谍影重重2 8.5 147237人
正在抓取第7页……
蝙蝠侠:黑暗骑士崛起 8.5 271620人
谍影重重 8.5 177826人
阿飞正传 8.5 163181人
小森林 冬春篇 8.9 95803人
恐怖游轮 8.3 285469人
迁徙的鸟 9.1 49228人
荒野生存 8.6 118434人
勇闯夺命岛 8.5 132085人
绿里奇迹 8.7 97961人
惊魂记 8.8 74428人
达拉斯买家俱乐部 8.6 152991人
魔女宅急便 8.4 176480人
再次出发之纽约遇见你 8.5 149095人
爆裂鼓手 8.6 212622人
未麻的部屋 8.8 81726人
卡萨布兰卡 8.6 115202人
燕尾蝶 8.6 102340人
东京物语 9.2 45441人
牯岭街少年杀人事件 8.7 94098人
这个男人来自地球 8.5 161029人
变脸 8.4 199136人
英国病人 8.4 164077人
被解救的姜戈 8.5 240489人
末路狂花 8.7 94801人
终结者2:审判日 8.5 130046人
正在抓取第8页……
E.T. 外星人 8.5 140618人
叫我第一名 8.6 100803人
忠犬八公物语 9.0 49926人
哪吒闹海 8.8 71973人
发条橙 8.4 172356人
青蛇 8.4 199167人
源代码 8.3 378590人
穆赫兰道 8.3 215062人
黄金三镖客 9.1 46238人
黑客帝国3:矩阵革命 8.5 141111人
新龙门客栈 8.4 167034人
非常嫌疑犯 8.6 106123人
美国丽人 8.4 170163人
城市之光 9.2 38415人
上帝也疯狂 8.6 89002人
无耻混蛋 8.4 205963人
初恋这件小事 8.2 421335人
勇士 8.9 80661人
爱·回家 9.0 43661人
蓝色大门 8.2 256607人
曾经 8.3 190832人
无敌破坏王 8.6 171185人
麦兜故事 8.5 118569人
暖暖内含光 8.4 133623人
大卫·戈尔的一生 8.7 78897人
正在抓取第9页……
蝴蝶 8.6 90229人
模仿游戏 8.5 228585人
血钻 8.5 117306人
国王的演讲 8.3 311857人
与狼共舞 8.9 52670人
遗愿清单 8.5 114164人
巴黎淘气帮 8.6 98714人
荒岛余生 8.4 120698人
偷拐抢骗 8.5 107235人
夜访吸血鬼 8.3 183949人
疯狂的石头 8.2 281233人
枪火 8.6 88708人
千钧一发 8.7 74720人
爱在午夜降临前 8.7 102760人
爱在暹罗 8.3 207990人
中央车站 8.7 71641人
月球 8.5 130528人
寿司之神 8.8 74039人
我爱你 9.0 49781人
两小无猜 8.1 300317人
罪恶之城 8.4 131576人
廊桥遗梦 8.5 89437人
假如爱有天意 8.2 214079人
彗星来的那一夜 8.3 146049人
黑鹰坠落 8.5 99899人
爬虫结束,总共耗时: 1.8951084s

Process finished with exit code 0

三、爬虫源代码

package main
import ("fmt""io/ioutil""net/http""regexp""time""os""strconv"
)
//定义新的数据类型
type Spider struct {url    stringheader map[string]string
}//定义 Spider get的方法
func (keyword Spider) get_html_header() string {client := &http.Client{}req, err := http.NewRequest("GET", keyword.url, nil)if err != nil {}for key, value := range keyword.header {req.Header.Add(key, value)}resp, err := client.Do(req)if err != nil {}defer resp.Body.Close()body, err := ioutil.ReadAll(resp.Body)if err != nil {}return string(body)}
func parse()  {header := map[string]string{"Host": "movie.douban.com","Connection": "keep-alive","Cache-Control": "max-age=0","Upgrade-Insecure-Requests": "1","User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36","Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8","Referer": "https://movie.douban.com/top250",}//创建excel文件f, err := os.Create("C:/haha3.xlsx")if err != nil {panic(err)}defer f.Close()//写入标题f.WriteString("电影名称"+"\t"+"评分"+"\t"+"评价人数"+"\t"+"\r\n")//循环每页解析并把结果写入excelfor i:=0;i<10;i++{fmt.Println("正在抓取第"+strconv.Itoa(i)+"页......")url:="https://movie.douban.com/top250?start="+strconv.Itoa(i*25)+"&filter="spider := &Spider{url, header}html := spider.get_html_header()//评价人数pattern2:=`<span>(.*?)评价</span>`rp2 := regexp.MustCompile(pattern2)find_txt2 := rp2.FindAllStringSubmatch(html,-1)//评分pattern3:=`property="v:average">(.*?)</span>`rp3 := regexp.MustCompile(pattern3)find_txt3 := rp3.FindAllStringSubmatch(html,-1)//电影名称pattern4:=`img alt="(.*?)" src=`rp4 := regexp.MustCompile(pattern4)find_txt4 := rp4.FindAllStringSubmatch(html,-1)// 写入UTF-8 BOMf.WriteString("\xEF\xBB\xBF")//  打印全部数据和写入excel文件for i:=0;i<len(find_txt2);i++{fmt.Printf("%s %s %s\n",find_txt4[i][1],find_txt3[i][1],find_txt2[i][1], )f.WriteString(find_txt4[i][1]+"\t"+find_txt3[i][1]+"\t"+find_txt2[i][1]+"\t"+"\r\n")}}
}func main() {t1 := time.Now() // get current timeparse()elapsed := time.Since(t1)fmt.Println("爬虫结束,总共耗时: ", elapsed)}

【go语言爬虫】go语言爬取豆瓣电影top250相关推荐

  1. Python爬虫实战 | (3) 爬取豆瓣电影Top250

    在本篇博客中,我们将使用requests+正则表达式来爬取豆瓣电影TOP250电影榜单,获取每部电影的序号.片名.导演.编剧.主演.类型.制作国家/地区.语言.上映日期.片长.又名.豆瓣评分和剧情简介 ...

  2. 爬虫实战:爬取豆瓣电影 Top-250 到 Excel 表格中

    最近在家无聊自学了python的一些基础知识.后来看到许多朋友都在写爬虫,自己感觉很有意思,也想试一下 >____< 其实本来我是想将数据爬取到excel之后再增加一些数据库操作,然后用f ...

  3. Python Scrapy 爬虫入门: 爬取豆瓣电影top250

    一.安装Scrapy cmd 命令执行 pip install scrapy 二.Scrapy介绍 Scrapy是一套基于Twisted的异步处理框架,是纯python实现的爬虫框架,用户只需要定制开 ...

  4. Python爬取豆瓣电影top250的电影信息

    Python爬取豆瓣电影top250的电影信息 前言 一.简介 二.实例源码展示 小结 前言 相信很多小伙伴在学习网络爬虫时,老师们会举一些实例案例讲解爬虫知识,本文介绍的就是经典爬虫实际案例–爬取豆 ...

  5. python爬取豆瓣电影top250_用Python爬虫实现爬取豆瓣电影Top250

    用Python爬虫实现爬取豆瓣电影Top250 #爬取 豆瓣电影Top250 #250个电影 ,分为10个页显示,1页有25个电影 import urllib.request from bs4 imp ...

  6. Python爬虫 爬取豆瓣电影TOP250

    Python爬虫 爬取豆瓣电影TOP250 最近在b站上学习了一下python的爬虫,实践爬取豆瓣的电影top250,现在对这两天的学习进行一下总结 主要分为三步: 爬取豆瓣top250的网页,并通过 ...

  7. Python爬虫入门(爬取豆瓣电影信息小结)

    Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...

  8. 一起学爬虫——通过爬取豆瓣电影top250学习requests库的使用

    一起学爬虫--通过爬取豆瓣电影top250学习requests库的使用 学习一门技术最快的方式是做项目,在做项目的过程中对相关的技术查漏补缺. 本文通过爬取豆瓣top250电影学习python req ...

  9. python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  10. python爬取豆瓣电影top250_【Python3爬虫教程】Scrapy爬取豆瓣电影TOP250

    今天要实现的就是使用是scrapy爬取豆瓣电影TOP250榜单上的电影信息. 步骤如下: 一.爬取单页信息 首先是建立一个scrapy项目,在文件夹中按住shift然后点击鼠标右键,选择在此处打开命令 ...

最新文章

  1. android ndk platform,Android NDK Platform Build and Application
  2. JavaScript奇技淫巧44招(2)
  3. pd.dataframe.append
  4. 将zookeeper、Tomcat、redis部署成windos服务
  5. 算法入门篇三 详解桶排序和整理排序知识 堆的相关操作 补充 不完整
  6. NSZombieEnabled使用
  7. jQuery 追加元素的方法如append、prepend、before、after
  8. Docker : 获取运行容器的IP地址
  9. 在Android上将ONNX神经网络模型与TensorFlow Lite结合使用
  10. Javascript第五章改变CSS样式节点两种方法,制作导航背景切换效果第十课
  11. 数据中心机房建设标准规范
  12. 使用企业微信的jsdk调用企业微信api--前端
  13. rake matlab,移动通信系统RAKE接收机的研究,matlab ,rake接收机
  14. 【数据统计】移动端数据可视化模板、数据统计、Axure移动端图表数据统计设计
  15. Gramine(原graphene-sgx)软件栈
  16. 微信小程序实战十三:狗狗小程序云搭建
  17. 中国撸串指北:13万家烧烤店的吃货最爱
  18. cocos creator 横版射击游戏全民吃鸡大战 H5+安卓+IOS三端源码
  19. Hazelcast IMDG技术详解
  20. bootstrap中固定table的表头

热门文章

  1. Android设置全屏/屏幕常亮
  2. C语言:__attribute__((weak)) 弱符号与__attribute__ ((weakref())弱引用
  3. 揭秘山寨iPad诞生记:3名工程师60天完成
  4. 请问电脑视频制作需要自己的配音,有什么好用的配音软件推荐呢?
  5. android 选择年月日控件(DatePick简单好用)
  6. 网络连接正常,但仅仅Microsoft store 无法连接网络
  7. 浅析,你的店铺为什么关闭?
  8. matlab 与cla的区别clf,cla和a的区别
  9. 国产蓝牙耳机哪个牌子好?五款商平价高人气蓝牙耳机品牌推荐
  10. 各大门户手机端页面是怎么切得