python mongodb 随机抽取数据
import sys import importlib importlib.reload(sys)#需要xlwt库的支持 from xlwt import * #指定file以utf-8的格式打开 file = Workbook(encoding='utf-8')#指定打开的文件名 table = file.add_sheet('data')ldata = []from pymongo import MongoClient #建立MongoDB数据库连接 client = MongoClient('10.255.73.102', 27017) #用户验证 db = client.admindb.authenticate("mongoadmin", "secret")#连接所用集合,也就是我们通常所说的表 collection=db.post i=0 #接下里就可以用collection来完成对数据库表的一些操作 #接下来可实现提取想要的字段内的数据# 写入到excel# 随机取出数据 for item in collection.aggregate([ {'$sample': {'size':2000}}]): # print(item['post_content'])if 'post_content' in item:# 取取出空格,回车键content = str(item['post_content']).strip().replace(' ','').replace('\r\n','')#写入excel 第1列和第二列try:table.write(i,1,content)table.write(i, 0, item['post_time'])i += 1except:print('') file.save('F:\\work\\week11\\data\\data2.xls')# 写入到txt中 #接下里就可以用collection来完成对数据库表的一些操作 with open ('F:/work/week11/data/data1.txt', 'wb') as f: #接下来可实现提取想要的字段内的数据for item in collection.find({},{'post_content':1,'_id':0}):# print(item['post_content'])if 'post_content' in item:content =bytes(item['post_content'],encoding='utf-8')f.write(content)f.write('\r\n'.encode(encoding='utf-8'))
python mongodb 随机抽取数据相关推荐
- excel表格按行随机抽取数据
pandas对excel数据按行不重复随机抽样 之前要从excel表格按行随机抽取数据,使用python内置函数生成随机数的方法可能会产生重复行,学习pandas后发现几行就可以解决 import p ...
- hive随机抽取100条数据_用Excel进行随机抽取数据
点击上面的蓝字"我的森林小屋",关注我,获取更多精彩内容!在Excel中,RANDBETWEEN是一个随机抽取数据函数,表示"返回大于等于指定的最小值,小于等于指定最大值 ...
- 用SAS随机抽取数据集中的若干条数据
SAS随机抽取数据集中的一些观测值 用到的函数是ranuni 例子:(123456是随机种子数) data list1:x = ranuni(123456):proc sort;by x; run; ...
- python实现随机抽取答题_如何在python中实现随机选择
这篇文章主要介绍了如何在python中实现随机选择,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 想从一个序列中随机抽取若干元素,或者想生成几个随机 ...
- oracle随机取名,oracle 表查询随机抽取数据
最近在做系统时用到了随机抽取记录的问题: 上网上查找了很多相关资料,发现了不同的方法及其差异.都是基于ORACLE的方法哦 首先第一个是随机抽取6个 select * from (select * ...
- python实现随机抽取答题_问卷星可以随机抽取题库答题吗
问卷星可以随机抽取题库答题吗 简介 自动填写问卷并提交 , 然后自动刷新继续填写 , 适用于问卷星 , 欢迎 Star 上个月开源了一个 Python 项目(登上过 GitHub 最流行的 中文语言 ...
- 使用python实现随机正态分布数据,并导出到表格(超详细)
文章目录 一.前言 二.使用步骤 1.引入库 2.随机正态分布生成算法 2.1.利用np.random.normal函数生成二维数据 2.2.利用for循环生成100*100数据 3.生成分布图 4. ...
- Python 生成随机经纬度数据
Python 生成随机经纬度 Description: python 自动生成经纬度, 该脚本适用于python3, 如果是python2请把# from __future__ import divi ...
- python随机抽号器_python 随机抽取数据
#!/usr/bin/env python # -*- coding: UTF-8 -*- ''' @author: carry @contact: 864140438@qq.com @file: m ...
最新文章
- ab 发送post请求测试API性能
- 软考-信息系统项目管理师-项目人力资源管理
- memset函数具体说明
- leetcode 222. Count Complete Tree Nodes | 222. 完全二叉树的节点个数(Java)
- 04.elasticsearch-dynamic_mapping_and_index_template
- Hibernate中使用Criteria查询及注解——(HibernateUtil)
- c++ vs release没有exe_未来安全 | 第一次Geant4培训总结 | 有没有你关注的问题呢?...
- 农用地包括哪些地类_土地地类一览表
- osx10.15.5降级成10.3.3
- CSDN插件限时内测,新用户抢永久免费去广告特权
- Windows 命令行基础(博主推荐)
- 磁珠 符号_如何理解电子元件磁珠?
- oracle讲表通过主键去重,数据库试题,数据库基础试题及答案
- python while循环例题鸡兔同笼_使用函数嵌套和循环枚举解决鸡兔同笼问题(解数学题学Python编程)...
- maven多模块编译子包
- PostgreSQL数据库网络层——libpq服务端顶层接口
- 简单谈谈语音评测(语音评价)
- NUC972 使用不同的FLASH开机的ENV文件写法 NAND...
- 活期存款利息的计算方法
- Matlab:表数据计算
热门文章
- ddr老化测试_【鼎阳硬件智库原创︱DDR 】 DDR硬件调试篇:DDR硬件设计调试测试 之二...
- 【转载】什么是计算机图形学?
- 博士生们每天科研时间是多久?
- 升级Jquery版本,解决低版本安全漏洞
- java 矢量_[Java教程]矢量图标的使用
- 软考中级软件设计师--9.计算机网络
- 数据库IP网络切换问题
- 对于代码复现学习的一些理解||计算机研究生学习笔记||经验分享||深度学习||pytorch||不定期长期更新
- 原生js实现移动动画,变化动画
- win7关闭休眠_你的Windows7系统运行缓慢?给你一个Win7系统减肥攻略