[python]代码库def get_label(name):

if name in cats:

return cats[name]

return u'其它'

def get_label_by_crc32(n):

for k in cats:

if binascii.crc32(k)&0xFFFFFFFFL == n:

return k

return u'other'

def get_extension(name):

return os.path.splitext(name)[1]

def get_category(ext):

ext = ext + '.'

cats = {

u'video': '.avi.mp4.rmvb.m2ts.wmv.mkv.flv.qmv.rm.mov.vob.asf.3gp.mpg.mpeg.m4v.f4v.',

u'image': '.jpg.bmp.jpeg.png.gif.tiff.',

u'document': '.pdf.isz.chm.txt.epub.bc!.doc.docx.xlsx.xls.pptx.ppt.',

u'music': '.mp3.wma.ape.wav.dts.mdf.flac.',

u'package': '.zip.rar.7z.tar.gz.iso.dmg.pkg.',

u'software': '.exe.app.msi.apk.',

u'torrent': '.torrent.'

}

for k, v in cats.iteritems():

if ext in v:

return k

return u'other'

def get_detail(y):

if y.get('files'):

y['files'] = [z for z in y['files'] if not z['path'].startswith('_')]

else:

y['files'] = [{'path': y['name'], 'length': y['length']}]

y['files'].sort(key=lambda z:z['length'], reverse=True)

bigfname = y['files'][0]['path']

ext = get_extension(bigfname).lower()

y['category'] = get_category(ext)

y['extension'] = ext

[源代码打包下载]

python看不懂代码_爬虫参考,看不懂呀。相关推荐

  1. python大作业代码_爬虫大作业(示例代码)

    1.选一个自己感兴趣的主题(所有人不能雷同). 每天都有接触各大平台推送的新闻,了解到了校园外的大小事.故此,对新浪新闻标题的关键字的爬取,看看最近发生的实时,也想比较下标题党还是和实际内容的差异. ...

  2. python游走代码_爬虫-案例

    前提:爬虫的实际例子 搜索引擎(百度.谷歌.360搜索等). 伯乐在线. 惠惠购物助手. 数据分析与研究(数据冰山知乎专栏). 抢票软件等. 为什么用Python写爬虫程序: PHP:PHP是世界是最 ...

  3. python爬小说代码_中文编程,用python编写小说网站爬虫

    原标题:中文编程,用python编写小说网站爬虫 作者:乘风龙王 原文:https://zhuanlan.zhihu.com/p/51309019 为保持源码格式, 转载时使用了截图. 原文中的源码块 ...

  4. 冒泡排序代码_凡人能看懂的冒泡排序和快速排序(附动态图和代码详解))

    这是第一篇公众号文章,所以内容打算写的浅简一点. 这篇文章将主要介绍两种非常普遍的排序方式:冒泡排序和快速排序.内容包括两种排序的原理,代码剖析,以及时间复杂度分析. 因为注意到很多快排的文章在介绍完 ...

  5. 审查元素为什么看不见代码_代码审查:我们为什么这样做?

    审查元素为什么看不见代码 许多组织的开发人员都将代码审查作为他们的核心实践之一. 尽管这听起来很合理,但是随着时间的流逝,导致采用该实践的目标被遗忘了,唯一剩下的就是实践本身的盲目应用. 为什么我们需 ...

  6. python数据可视化代码_用Python代码实现5种最好的、简单的数据可视化!

    数据可视化是数据科学家工作的重要组成部分.在项目的早期阶段,您通常会进行探索性数据分析(EDA)以获得对数据的一些见解.创建可视化确实有助于使事情更清晰.更容易理解,尤其是对于更大.更高维度的数据集. ...

  7. python新年有趣代码_搞几款由“Python”语言编写的“有趣、恶搞、好玩”的程序代码!...

    下载好向圈APP可以快速联系圈友 您需要 登录 才可以下载或查看,没有帐号?立即注册 x 为提高大家对"Python"编程语言的学习兴趣,今天给大家分享几款有趣的Python程序代 ...

  8. python基础教程代码-Python基础教程代码怎么是英文 看不懂啊?

    很抱歉,目前几乎所有编程语言用的都是英文. 但学编程和学英文是两码事,编程语言所需要的英文,一个翻译软件就足够了. 比如说,abcdefg会数吧? 变量名可以用这些来标识,你用拼音也行,看得懂就好. ...

  9. 牛顿法python代码_一文看懂牛顿法(附Python实现)

    这是一个数据分析师的在线笔试编程题:不能使用数学库函数,求出一个数的算术平方根 是不是看的一脸懵逼? 这里就需要用到一个很常用的求解方法了 -- 牛顿迭代法,也被称作牛顿法 (Newton's Met ...

最新文章

  1. md5sum命令详解
  2. mysql replication 协议_深入解析MySQL replication协议
  3. MM模块部分名词解释
  4. Python:lambda表达式的两种应用场景
  5. mysql维表的代理键字段_mysql多维数据仓库指南--第三篇第12章(2)
  6. python编辑编程器_用Python制作编辑器
  7. 移植性问题のCString类型转换,字符串操作和UNICODE、ANSI字符集
  8. java是一种,java是一种编译程序吗
  9. tomcat 不支持put 高版本_Tomcat-远程代码执行漏洞
  10. 引力波应该称为空间波
  11. SoapUI接口测试——全流程转载
  12. Java完全自学手册,从外包到大厂,再到年薪100万都靠它
  13. 小爱同学app安卓版_小爱同学APK提取版-小爱同学APP最新版下载5.15.10安卓版-玩友游戏网...
  14. Feign出现The bean ‘seckill.FeignClientSpecification‘, defined in null, could not be registered. A be
  15. ubuntu20.04安装burpsuite
  16. HKEY_LOCAL_MACHINE:hardware\DeviceMap\SerialComm里找不到串口的解决办法
  17. 如何设置UISwitch的大小
  18. RPG游戏服务端压力测试-测试用例
  19. C++ 类成员函数指针的使用方法
  20. 产品交互设计入门书籍推荐(亲自看过)

热门文章

  1. BIM开发会用到哪些技术
  2. 上海宝付支付业务分析
  3. 乐视三合一摄像头和kinect_乐视三合一摄像头体验:识别准确 应用丰富
  4. Java中字节Byte和位Bit的关系
  5. 删除MySQL表的重复记录
  6. 【行业基础】学习喷墨打印技术 怎么能不知道波形
  7. Python医学数据分析入门,推荐你学习这本书
  8. 走进 “ SLASH(斜杠)青年 ” 李卓桓
  9. 青岛科技大学|物联网工程|物联网定位技术(第二讲)|15:00
  10. JavaScript函数(Function)