import sys
import importlib
importlib.reload(sys)#需要xlwt库的支持
from xlwt import *
#指定file以utf-8的格式打开
file = Workbook(encoding='utf-8')#指定打开的文件名
table = file.add_sheet('data')ldata = []from pymongo import MongoClient
#建立MongoDB数据库连接
client = MongoClient('10.255.73.102', 27017)
#用户验证
db = client.admindb.authenticate("mongoadmin", "secret")#连接所用集合,也就是我们通常所说的表
collection=db.post
i=0
#接下里就可以用collection来完成对数据库表的一些操作
#接下来可实现提取想要的字段内的数据# 写入到excel# 随机取出数据
for item in collection.aggregate([ {'$sample': {'size':2000}}]):
# print(item['post_content'])if 'post_content' in item:# 取取出空格,回车键content = str(item['post_content']).strip().replace(' ','').replace('\r\n','')#写入excel  第1列和第二列try:table.write(i,1,content)table.write(i, 0, item['post_time'])i += 1except:print('')
file.save('F:\\work\\week11\\data\\data2.xls')# 写入到txt中
#接下里就可以用collection来完成对数据库表的一些操作
with open ('F:/work/week11/data/data1.txt', 'wb') as f:
#接下来可实现提取想要的字段内的数据for item in collection.find({},{'post_content':1,'_id':0}):# print(item['post_content'])if 'post_content' in item:content =bytes(item['post_content'],encoding='utf-8')f.write(content)f.write('\r\n'.encode(encoding='utf-8'))

python mongodb 随机抽取数据相关推荐

  1. excel表格按行随机抽取数据

    pandas对excel数据按行不重复随机抽样 之前要从excel表格按行随机抽取数据,使用python内置函数生成随机数的方法可能会产生重复行,学习pandas后发现几行就可以解决 import p ...

  2. hive随机抽取100条数据_用Excel进行随机抽取数据

    点击上面的蓝字"我的森林小屋",关注我,获取更多精彩内容!在Excel中,RANDBETWEEN是一个随机抽取数据函数,表示"返回大于等于指定的最小值,小于等于指定最大值 ...

  3. 用SAS随机抽取数据集中的若干条数据

    SAS随机抽取数据集中的一些观测值 用到的函数是ranuni 例子:(123456是随机种子数) data list1:x = ranuni(123456):proc sort;by x; run; ...

  4. python实现随机抽取答题_如何在python中实现随机选择

    这篇文章主要介绍了如何在python中实现随机选择,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 想从一个序列中随机抽取若干元素,或者想生成几个随机 ...

  5. oracle随机取名,oracle 表查询随机抽取数据

    最近在做系统时用到了随机抽取记录的问题: 上网上查找了很多相关资料,发现了不同的方法及其差异.都是基于ORACLE的方法哦 首先第一个是随机抽取6个 select * from  (select * ...

  6. python实现随机抽取答题_问卷星可以随机抽取题库答题吗

    问卷星可以随机抽取题库答题吗 简介 自动填写问卷并提交 , 然后自动刷新继续填写 , 适用于问卷星 , 欢迎 Star 上个月开源了一个 Python 项目(登上过 GitHub 最流行的 中文语言 ...

  7. 使用python实现随机正态分布数据,并导出到表格(超详细)

    文章目录 一.前言 二.使用步骤 1.引入库 2.随机正态分布生成算法 2.1.利用np.random.normal函数生成二维数据 2.2.利用for循环生成100*100数据 3.生成分布图 4. ...

  8. Python 生成随机经纬度数据

    Python 生成随机经纬度 Description: python 自动生成经纬度, 该脚本适用于python3, 如果是python2请把# from __future__ import divi ...

  9. python随机抽号器_python 随机抽取数据

    #!/usr/bin/env python # -*- coding: UTF-8 -*- ''' @author: carry @contact: 864140438@qq.com @file: m ...

最新文章

  1. ab 发送post请求测试API性能
  2. 软考-信息系统项目管理师-项目人力资源管理
  3. memset函数具体说明
  4. leetcode 222. Count Complete Tree Nodes | 222. 完全二叉树的节点个数(Java)
  5. 04.elasticsearch-dynamic_mapping_and_index_template
  6. Hibernate中使用Criteria查询及注解——(HibernateUtil)
  7. c++ vs release没有exe_未来安全 | 第一次Geant4培训总结 | 有没有你关注的问题呢?...
  8. 农用地包括哪些地类_土地地类一览表
  9. osx10.15.5降级成10.3.3
  10. CSDN插件限时内测,新用户抢永久免费去广告特权
  11. Windows 命令行基础(博主推荐)
  12. 磁珠 符号_如何理解电子元件磁珠?
  13. oracle讲表通过主键去重,数据库试题,数据库基础试题及答案
  14. python while循环例题鸡兔同笼_使用函数嵌套和循环枚举解决鸡兔同笼问题(解数学题学Python编程)...
  15. maven多模块编译子包
  16. PostgreSQL数据库网络层——libpq服务端顶层接口
  17. 简单谈谈语音评测(语音评价)
  18. NUC972 使用不同的FLASH开机的ENV文件写法 NAND...
  19. 活期存款利息的计算方法
  20. Matlab:表数据计算

热门文章

  1. ddr老化测试_【鼎阳硬件智库原创︱DDR 】 DDR硬件调试篇:DDR硬件设计调试测试 之二...
  2. 【转载】什么是计算机图形学?
  3. 博士生们每天科研时间是多久?
  4. 升级Jquery版本,解决低版本安全漏洞
  5. java 矢量_[Java教程]矢量图标的使用
  6. 软考中级软件设计师--9.计算机网络
  7. 数据库IP网络切换问题
  8. 对于代码复现学习的一些理解||计算机研究生学习笔记||经验分享||深度学习||pytorch||不定期长期更新
  9. 原生js实现移动动画,变化动画
  10. win7关闭休眠_你的Windows7系统运行缓慢?给你一个Win7系统减肥攻略