如何用python读取word

使用Python的内部方法open()读取文本文件try:f=open('/file','r')print(f.read())finally:if f:f.close()如果读取word文档推荐使用第三方插件,python-docx 可以在官网上下载使用方式# -*- coding: cp936 -*-import docxdocument = docx.Document(文件路径)docText = '\n\n'.join([paragraph.text.encode('utf-8') for paragraph in document.paragraphs])print docText

python 里面怎么提取 空格分开的字符串

1、借助于lstrip()提取左边空格>>>s = ' A B C '>>>s.lstrip() # 去除字母字符串左边的空格'A B C '2、借助于rstrip()提取右边空格>>>s = " A B C ">>>s.rstrip() # 去除字符串右边的空格' A B C'3、借助于strip()提取左右两边的空格>>>s = " A B C ">>>s.strip() # 去除两边的空格'A B C'扩展资料python对象的处理方法对象的方法是指绑定到对象的函数。

调用对象方法的语法是instance.method(arguments)。

它等价于调用Class.method(instance, arguments)。

当定义对象方法时,必须显式地定义第一个参数,一般该参数名都使用self,用于访问对象的内部数据。

这里的self相当于C++, Java里面的this变量,但是我们还可以使用任何其它合法的参数名,比如this 和 mine 等,self与C++,Java里面的this不完全一样,它可以被看作是一个习惯性的用法,我们传入任何其它的合法名称都行。

参考资料百度百科-python

如何利用python抓取网页中的内容并存到word中

>>>app=my.Office.Word.GetInstance()>>>doc=app.Documents[0]>>>table=doc.Tables[1]>>>table.Cell(1,1).Select()>>>app.Selection.MoveDown(Unit=5, Count=2, Extend=1)>>>app.Selection.Cells.Merge()>>>1. my.Office.Word.GetInstance()用win32com得到Word的Application对象的实例2. 我所使用的样本word文件中包含两个Table第二个Table是想要修改的3. table.Cell(1,1).Select()用于选中这个样表的第一个单元格4. app.Selection.MoveDown用于获得向下多选取3个单元格5. app.Selection.Cells.Merge()用于执行合并工作

python操作word文档表格

office 2007中不能直接打开VB编辑器,请按Alt + F11打开。

import win32com.client # 导入脚本模块 WordApp = win32com.client.Dispatch("Word.Application") # 载入WORD模块 WordApp.Visible = True # 显示Word应用程序 1、 新建Word文档 doc = WordApp.Documents.Add() # 新建空文件 doc = WordApp.Documents.Open(r"d:\2011专业考试计划.doc") # 打开指定文档 doc.SaveAs(r"d:\2011专业考试计划.doc") # 文档保存 doc.Close(-1) # 保存后关闭,doc.Close()或doc.Close(0)直接关闭不保存 2、 页面设置 doc.PageSetup.PaperSize = 7 # 纸张大小, A3=6, A4=7 doc.PageSetup.PageWidth = 21*28.35 # 直接设置纸张大小, 使用该设置后PaperSize设置取消 doc.PageSetup.PageHeight = 29.7*28.35 # 直接设置纸张大小 doc.PageSetup.Orientation = 1 # 页面方向, 竖直=0, 水平=1 doc.PageSetup.TopMargin = 3*28.35 # 页边距上=3cm,1cm=28.35pt doc.PageSetup.BottomMargin = 3*28.35 # 页边距下=3cm doc.PageSetup.LeftMargin = 2.5*28.35 # 页边距左=2.5cm doc.PageSetup.RightMargin = 2.5*28.35 # 页边距右=2.5cm doc.PageSetup.TextColumns.SetCount(2) # 设置页面分栏=2 3、 格式设置 sel = WordApp.Selection # 获取Selection对象 sel.InsertBreak(8) # 插入分栏符=8, 分页符=7 sel.Font.Name = "黑体" # 字体 sel.Font.Size = 24 # 字大 sel.Font.Bold = True # 粗体 sel.Font.Italic = True # 斜体 sel.Font.Underline = True # 下划线 sel.ParagraphFormat.LineSpacing = 2*12 # 设置行距,1行=12磅 sel.ParagraphFormat.Alignment = 1 # 段落对齐,0=左对齐,1=居中,2=右对齐 sel.TypeText("XXXX") # 插入文字 sel.TypeParagraph() # 插入空行 注:ParagraphFormat属性必须使用TypeParagraph()之后才能二次生效

python处理word文档

public void save(){ try {FileOutputStream outStream=this.openFileOutput("a.txt",Context.MODE_WORLD_READABLE);outStream.write(text.getText().toString().getBytes());outStream.close();Toast.makeText(MyActivity.this,"Saved",Toast.LENGTH_LONG).show();} catch (FileNotFoundException e) {return;}

python批量提取word指定内容_python word 段落提取相关推荐

  1. python读取word指定内容_python解析html提取数据,并生成word文档实例解析

    简介 今天试着用ptyhon做了一个抓取网页内容,并生成word文档的功能,功能很简单,做一下记录以备以后用到. 生成word用到了第三方组件python-docx,所以先进行第三方组件的安装.由于w ...

  2. python删除文本中指定内容_Python实现删除文件中含“指定内容”的行示例

    本文实例讲述了Python实现删除文件中含指定内容的行.分享给大家供大家参考,具体如下: #!/bin/env python import shutil,sys,os darray = [ " ...

  3. python批量提取word指定内容_python批量提取word内信息

    单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来 #coding:utf-8 import os import ...

  4. python读取word指定内容_python读取word 中指定位置的表格及表格数据

    1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specT ...

  5. python读取数据库中指定内容_python如何用正则表达式读取对应字段写入数据库中?...

    我用*/5****/unibss/pkgchc4/puchc01/top-n1|head-n81>top.txt这个crontab的定时任务将top信息前8行写入top文本中内容如下:^[[m^ ...

  6. Python 自动化:根据模板批量生成含指定数据的 word 文档

    作者:一只河马h 来源:简说Python 一.需求说明 在平时工作当中,经常需要处理文件,特别是Word,处理Word时会遇一类比较常见的场景:文档中大部分文字固定不变,小部分内容需要修改. 这时我们 ...

  7. Python自动化:根据模板批量生成含指定数据的word文档

    一.需求说明 在平时工作当中,经常需要处理文件,特别是Word,处理Word时会遇一类比较常见的场景:文档中大部分文字固定不变,小部分内容需要修改. 这时我们会机械的重复打开.修改.保存文档等一系列操 ...

  8. 利用ASP.NET输出指定内容的WORD、EXCEL、TXT、HTM

    利用ASP.NET输出指定内容的WORD.EXCEL.TXT.HTM等类型的文档很容易的.主要分为三步来完成. 一.定义文档类型.字符编码 Response.Clear(); Response.Buf ...

  9. python批量重命名指定目录下所有文件的后缀名

    python批量重命名指定目录下所有文件的后缀名 有个需求,需要把某个文件夹下所有后缀名为.abc的更改为.xyz; #批量重命名指定目录下面所有文件的后缀名. word_dir为需要更改后缀的文件夹 ...

最新文章

  1. C#简介- 类和对象
  2. JDK容器学习之ArrayList:底层存储和动态扩容
  3. 分段路由中的控制指的什么?—Vecloud
  4. python扫描端口脚本_Python端口扫描简单程序
  5. static在内存层面的作用_static的作用和内存划分?
  6. mysql 为游标赋值_mysql 存储过程之游标
  7. 24-Logistic Regression
  8. Ocelot中文文档入门
  9. DbHelper数据库通用类使用方法
  10. 程序员初涉江湖 宜步步为赢(转-2) 作者:IT168 职业发展顾问Leo
  11. 阿里大数据部门真实工作场景,和你想象的一样吗?
  12. 自定义TxT文档下载
  13. 智汀指南:如何搭建摄像头远程监控系统?如何用手机远程监控摄像头?
  14. java中逗号运算符的含义_逗号运算符什么时候有用?
  15. 相关性扫描匹配CSM与分支限界
  16. Allegro阻抗分析指导书
  17. 用户研究方法定性定量_用户体验测试:定性测试
  18. 【分享】过来人告诫研一学生:研一生活如何过才叫精彩!(转)
  19. 一文带你看懂JAVA IO流,史上最全面的IO教学啦(附送JAVA IO脑图
  20. 不懂就问--Java基本数据类型与数组(定义了int型二维数组a[6][7]后,数组元素a[3][4]前的数组元素个数)案例分析

热门文章

  1. oracle Day1
  2. stk6.1安装方法
  3. PKUWC2019 游记
  4. 联想a366t 刷android4,联想A366t线刷刷机教程(刷官方rom)
  5. Web前端——jQuery库
  6. 【文章】夏至——郭敬明
  7. 机器学习Python学习——逻辑斯蒂回归(Logistic Regression)
  8. 小强升职记梗概_《小强升职记》读书笔记一
  9. 通过css实现单选按钮效果
  10. React Native开发之——Webstorm开发RN配置