基于python的docx模块处理word和WPS的docx格式文件方式

来源:脚本之家  责任编辑:小易  

就是从新另存为一个文件来编辑,而不是在原来的word文件上操作

Python docx module for Word or WPS processing

计算机二级考试MS Office考试题库ppt 操作题附答案 http://wenku.baidu.com/link?url=OyqhnOZAJj0i7jvWY6dkRbrXRm9o8-iY_QTP9cHUCjLgUHb39d05artTicYTcIBbrhXsrluLX

本文是通过docx把word中的表格中的某些已填好的内容提取出来,存入excel表格。

“Word-邀请函.docx”表示如下:“Word-邀请函”这个文件的文件名,“.docx”表示这个文件的保存格式。是Oficee中“Word”2010版本以上保存格式,与“.doc”是一样的。

首先安装docx的python模块:

word的临时文件,正常关闭文件的时候就会自动删除,没有自动删除也可以在安全保存文件后手动删除掉。

pip install python-docx

*.docx是2010以上版本的保存格式。你这个可以保存。 向左转|向右转

由于处理的为中文和符号,改成utf-8编码格式

没问题,这个WORD认的是字符,字符大小写没关系,只要不是汉字,

import sys reload(sys) sys.setdefaultencoding('utf-8') from docx import Document import pandas as pd

文件是Docx的。用Word2003是无法打开2007和2010中的Docx文件的。然而目前市场 方法,实现Word2003也能打开Docx文件! Docx文件说明 Docx格式文件是Microsoft Offic

# 打开文件 doc = Document(ur'test_1.docx')

怎么回事?我过去一看,是一个.docx的文件。 Docx文件是什么呢? Microsoft Office Word 2007文档的扩展名docx 是Office2007使用的,是用新的基于XML的压缩文件格式取代了其

为了处理word中以对勾形式勾选的项目,采用下面 的方法

此时,文件就变成了一个压缩包,双击打开我们会看到有几个文件夹,我们打开“word文件 方法三、可以利用在线转换的网站,将Docx转换为Doc格式的文件,类似于这样在线转换

1、十字路口 √ 2、丁字路口 3、环形路口 4、人行立交

昨天客服部的经理问,朋友传过来的一个文件打不开,怎么回事? Microsoft Office Word 2007文档的扩展名docx 是Office2007使用的,是用新的基于XML的压缩文件格式取代了其目

# 取出对号勾选的项目 print doc.tables[0].rows[3].cells[2].text print doc.tables[0].rows[3].cells[2].text.split(u'√')[1].strip().split(' ')[0][2:] '√' in doc.tables[0].rows[3].cells[2].text # 这个语句可以测试是否含有对勾, # 有的话就取出对勾后面的item,否则直接返回填空的text

docx格式是 Windows office2007 word的原生格式。所以要用 Windows office2007 word版本或更新版本的 Windows office word版本才能打开。好像国产的wps也可以打开。

True

文件是Docx的。用 Word2003是无法打开2007和2010中的Docx文件的。然而目前市场 方法,实现Word2003也能打开Docx文件! Docx文件说明 Docx格式文件是Microsoft O

num_rows = len(doc.tables[0].rows) print num_rows

xls = pd.read_csv(ur'output.csv')

print xls.columns[0] diction = {}

# 找到每个excel文档中需要被记录的键值在docx文档表格中的位置 for xlskey in xls.columns: for row_id in range(num_rows): row = doc.tables[0].rows[row_id] for cell_id in range(len(row.cells)): if row.cells[cell_id].text.strip() == xlskey.strip(): diction[xlskey] = [row_id, cell_id]

# 查看一下获得的键值位置 for key in list(diction.keys()): print key, diction[key]

楼层数 [21, 1]

宗地形状 [4, 1]

使用权取得时间 [14, 1]

采光通风状况 [19, 1]

已使用年限 [21, 4]

建筑朝向 [7, 1]

房屋结构 [17, 1]

交叉路口形式 [3, 1]

临街状况 [8, 1]

建筑容积率 [10, 5]

楼宇名称 [15, 5]

质量等级 [18, 1]

周围土地利用类型 [11, 1]

总建筑面积 [20, 1]

宗地位置 [0, 1]

所临道路名称 [2, 1]

装修标准 [16, 1]

那么我们认为这些表头键值对应的填入数据就在他们的右边,也就是下一个cell,因此我们只需要将row id不变,cell+1,就能取出填表内容。

# 开始填表!!! for each_column in xls.columns: pos = diction[each_column] textion = doc.tables[0].rows[pos[0]].cells[pos[1] + 1].text if u'√' in textion: this_text = textion.strip(' ').split(u'√')[1].split()[0][2:] else: this_text = textion xls.loc[0, each_column] = this_text

xls

楼宇名称 宗地位置 所临道路名称 交叉路口形式 宗地形状 建筑朝向 临街状况 周围土地利用类型 装修标准 房屋结构 质量等级 采光通风状况 总建筑面积 楼层数 已使用年限 建筑容积率 使用权取得时间
0 百兴花园 鄂州市鄂城区凤凰路47-11号 凤凰路 丁字路口 多边形 离街 商业用地 豪华 1、钢 2、钢、钢混 3、钢混 4、混合 5、砖木 6、其它 完好 122.7平方米 8 13年

Succeed!!!

之后只需要用一个glob函数取出所有的文档的path,然后依次执行上面的命令,即可完成word表格到excel(实际上是csv形式)的自动填表过程。

以上这篇基于python的docx模块处理word和WPS的docx格式文件方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

扩展阅读,根据您访问的内容系统为您准备了以下内容,希望对您有帮助。

docx怎么打开_docx格式文件是什么

docx格式是word文件的一种,必须用word2007才能打开。下载地址:http://apps.hi.baidu.com/share/detail/37298470

文件名word.docx写为word.docx.docx有影响不?

没有影响,只是word.docx作为文件名,后面的docx还是扩展名。

docx是什么格式?docx文件怎样打开?

Docx格式文件是Microsoft Office Word 2007以上版本的文档扩展名,Docx取代Doc。〈蚩?椒ǎ合认略豲ffice2007文件格式兼容包:点此下载,安装好之后直接可以打开Docx文件即可。打开下载的“office2007文件格式兼容包”先勾选“确认条款”,然后点解“确定”等待兼容包安装完成安装完成后,会弹出一个提示框,点击“确定”点击“确定”后就可以正常打开docx文件了

如何在不关闭a.docx的情况下对word文件a.docx重命名?

"文件“|”另存为“

docx是什么文件格式?docx文件怎样打开?

最近有朋友反映下载了一个教程文件后缀为docx不知道怎么打开,不管用什么软件打开都打不开,那么怎样打开docx格式的文件呢。

系统大全就来跟大家分享下如何打开docx文件,需要用什么软件才能打开docx格式的文件。

docx怎么打开,怎么打开docx文件,怎样打开docx文件,如何打开docx文件

 

格式为docx的文件

 

系统大全使用了记事本和word 2000打开docx文件均为乱码

docx怎么打开,怎么打开docx文件,怎样打开docx文件,如何打开docx文件

 

使用word2000无法打开docx文件

使用记事本打开也是乱码

出现这种问题,小编就开始在思考,doc文件是word文档,那么docx文件很可能是比较新版本的wodr文件,于是将word2000升级到了word2003,结果还是未打开该文件,于是通过查找相关资料,终于明白了怎么可以打开docx文件了。

其实docx文件根本也就是属于docx文档,只不过他属于word2007新的升级格式,与word2000和word2003存在部分不兼容。

找到了问题,解决起来就比较方便了,下面系统大全为大家介绍3种怎么打开docx文件解决办法。


  • 本文相关:
  • python 实现加密过的pdf文件转word格式
  • python除法之传统除法、floor除法及真除法实例详解
  • python smtplib实现发送邮件功能
  • 解决pandas中读取中文名称的csv文件报错的问题
  • python对csv文件追加写入列的方法
  • python将ansible配置转为json格式实例代码
  • python实现操纵控制windows注册表的方法分析
  • python实现id3决策树算法
  • python入门篇之字符串
  • python django切换mysql数据库实例详解
  • python numpy 一维数组转变为多维数组的实例
  • docx怎么打开_docx格式文件是什么
  • 文件名word.docx写为word.docx.docx有影响不?
  • docx是什么格式?docx文件怎样打开?
  • 如何在不关闭a.docx的情况下对word文件a.docx重命名?
  • docx是什么文件格式?docx文件怎样打开?
  • 全国计算机二级,将word素材.docx另存为word.docx,此后的操作...
  • 全国计算机二级,将word素材.docx另存为word.docx,此后的操作...
  • 在一个名为“Word-邀请函.docx”文件中在哪,找不到这个docx...
  • 编辑docx文档时出现~$+文件名.docx
  • word.docx.docx正不正确
  • 计算机一级考试word后缀名docx改成了DOCX保存后会零分吗...
  • Docx文件怎么打开,如何打开Docx文件?
  • DOCX是什么文件?怎么打开DOCX文件?
  • Docx文件怎么打开,如何打开Docx文件
  • DOCX是什么文件?怎么打开DOCX文件?求解答
  • Docx文件怎么打开,如何打开Docx文件
  • Docx文件怎么打开,如何打开Docx文件?
  • docx文件怎么打开?打开docx文件的四种方法
  • 破解docx文件密码,求大神解除docx后缀文件的密码,我的重要文...
  • 免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved