任务详情:

给定内地某日票房排行榜,输入指定影片名称 movie_name,如:'金刚川'。完成以下任务:

1. 任务一:获取指定影片的上映天数。如“金刚川”上映20天,返回 20;“一日成交”上映首日,返回0,“翱翔雄心”点映,返回 -1;

2. 任务二:获取指定影片的综合票房(万元)。如“金刚川”,返回 432.33;

3. 任务三:获取指定影片的排片占比。如“金刚川”,返回 0.248。

任务要求:

1. 程序接收 str 类型的变量 movie_name,返回 list 类型的变量;

2. 返回列表包含参数如下:[任务一:int, 任务二:float,任务三:float];

3. 任务一中,如果是上映天数是“上映首日”,返回0;如果上映天数是“点映”,返回 -1;

4. 任务三中需要将百分比形式转换为小数点形式。如 '24.8%' 需要转换为 0.248;如果票房 <0.1%,返回 0.001;

5. 票房信息排行榜在下方给出,utf-8编码

思路:

1.通过BeautifulSoup4里的soup.find()和soup.find_all()方法找到所有包含所需值的标签

2.再通过任务的要求通过find()方法找到电影名字,进行if判断跟传入的值进行比较,再跟任务要求取其所需的值

3.根据任务要求进行完善

代码如下:

import re
from bs4 import BeautifulSoup
import requestsclass Solution:def BoxOfficeSpider(self, movie_name: str) -> list:r = requests.get('######')r.encoding = 'utf-8'soup = BeautifulSoup(r.text, 'lxml')res1=soup.find('tbody',{'class':'table-body'}).find_all('tr')res2=''res3=''res4=''li=list()for x in res1:if x.find('p',{'class':'movie-name'}).text==movie_name:res2=x.find('span',{'class':'releaseInfo'}).textres3=x.find('div',{'class':'boxDesc-wrap'}).textres4=x.find('div',{'class':'countRate-wrap'}).textbreakif res2=='上映首日':li.append(0)elif res2=='点映':li.append(-1)else:li.append(int(res2.strip('上映天')))li.append(float(res3))li.append(float('%.3f'%(float(res4.strip('<%'))/100)))return lipass

以上仅代表个人的思路,如有欠缺请指教。

【网页处理与文本分析】影片票房任务相关推荐

  1. 文本分析简历项目收集-----机器学习(仅供参考)

    文本分析 项目3:基于自然语言处理的影评分析 项目简介:通过大量的正面和负面的电影评论对计算机进行自然语言训练,实现计算机对电影评论的基本情感分析,使其能够快速判断出评论是否积极 个人职责:1. 对正 ...

  2. 基于豆瓣影评数据的完整文本分析

    ♚ 作者:沂水寒城,CSDN博客专家,个人研究方向:机器学习.深度学习.NLP.CV Blog: http://yishuihancheng.blog.csdn.net 文本分析中很多的工作都是基于评 ...

  3. 基于豆瓣评价的文本分析 ——以《流浪地球》为例

    基于豆瓣评价的文本分析 --以<流浪地球>为例 项目背景 在电影行业飞速发展的当今,电影已经成为了非常普遍的娱乐选择,中国电影最近几年也是突飞猛进,越来越多的人走进电影院.而信息媒体的发展 ...

  4. 基于python的智能文本分析 豆瓣_长文干货 | 基于豆瓣影评数据的完整文本分析!...

    原标题:长文干货 | 基于豆瓣影评数据的完整文本分析! 作者:沂水寒城,CSDN博客专家,个人研究方向:机器学习.深度学习.NLP.CV Blog: http://yishuihancheng.blo ...

  5. 文本分析:吉利不裁员不降薪背后的真相是什么

    ​​之前推荐了一些数据入门的资料,这里不妨以一个小小的案例讲解如何进行简单的文本分析.主要的步骤包括以下: 从知乎相关问题爬下所有回答 将答案分词.去掉停用词.维护语料库 查看分词结果,并制作词云 我 ...

  6. laravel 分词搜索匹配度_SEO除了“中文分词”还有“文本分析”- 搜狗蜘蛛池博客...

    原出处:蜘蛛池博客 原文链接:SEO除了"中文分词"还有"文本分析" - 蜘蛛池博客 对于刚入职的SEO人员,日常工作中,我们很少谈论"中文分词&qu ...

  7. 自然语言处理文本分析_通过自然语言处理释放文本分析的力量

    自然语言处理文本分析 深度学习 , 自然语言处理 (Deep Learning, Natural Language Processing) Natural language is a language ...

  8. 在会计研究中使用Python进行文本分析

    最近在google搜Python在经管中的内容,意外发现 专著:在会计研究中使用Python进行文本分析 ,内容特别新,专著中含有Python代码,也有会计领域文本分析的应用成果. 财会专业的科研人员 ...

  9. 【自然语言处理与文本分析】自然语言处理概要

    自然语言处理的研究范畴 自然语言处理的基本流程 文本数据-->分词/词根还原-->词性标注-->[同义词标定]-->[概念标定]-->角色标定-->句法分析--&g ...

最新文章

  1. 知识库建设的5个步骤
  2. 1014. 福尔摩斯的约会
  3. 安装mysql提示找不到msv_安装mysql服务时提示“找不到msvcp140.dll”
  4. 由CloudStack项目引起的ESXI嵌套虚拟化引起的二级虚拟机无法被访问
  5. 50万年薪程序员,被百万网民怒喷后,却迎来大撕逼
  6. html5 测评游戏,暗黑之王评测:HTML5游戏铸就最华丽ARPG冒险
  7. IndiaHacks 2016 - Online Edition (Div. 1 + Div. 2) C. Bear and Up-Down 暴力
  8. python变量以及类型(含笔记)
  9. 【华为云技术分享】Python大神编程常用4大工具,你用过几个?
  10. 联想服务器st系列,联想ThinkSystem ST50评测 一款超值的入门级服务器
  11. php end array_value,PHP常用处理数组函数
  12. python三本经典书籍-有哪些 Python 经典书籍?
  13. ZYNQ7020 FPGA 如何生成从Flash和SD卡启动的镜像文件
  14. 计算机原理电梯控制系统设计,基于PLC电梯控制系统的设计
  15. 使用QT绘图控件QCustomPlot绘制波形图
  16. 营业执照争夺背后:吴忌寒正在重塑比特大陆 |链捕手
  17. IRQL的理解和认识
  18. 微信公众号开发C#系列-11、生成带参数二维码应用场景
  19. 一文了解肠-器官轴,肠好身体好
  20. DAX: 用SWITCH函数替换嵌套IF函数

热门文章

  1. ES6中的4个字符串方法
  2. 设置允许从网络访问计算机的用户账户(加入guest组),没法访问 您可能没有权限使用网络资源...
  3. python svg2rlg,Convert SVG to PNG with Python on Windows
  4. 护网行动(防守方)linux服务器通用安全加固指南(1)
  5. 历史上消失的日期:我消失了,但仿佛又没消失……
  6. 4454. 未初始化警告(只是题的长别怕,详细解读)
  7. laravel 批量上传图片
  8. Python语言程序设计基础(第二版)P93答案示例
  9. Python扩展正在加载
  10. C++多态之析构和纯虚析构分析与示例