Python-docx包,可以用来创建docx文档
包含段落、分页符、表格、图片、标题、样式等几乎所有的word文档中能常用的功能。
但只对windows系统电脑的docx后缀文档有效
Python-docx的安装非常简单,如下图所示
pip install python-docx就可以安装python-docx了
添加标题
用add_heading()方法
添加正文
用add_paragraph()方法
from docx import Document
#创建一个Document对象
document = Document()
#标题
document.add_heading('中学生必读书籍')
#加上段落(正文)
document.add_paragraph('《石头记》')
document.add_paragraph('《钢铁是怎样炼成的》')
document.save(r"D:doctest.docx")#
生成文档截图
生成文档截图
add_run()方法可以在目前段落后添加内容的同时还可以设置字体的样式
第12~15行添加个空段落,赋值为p,然后在此空段落后面添加粗体字和斜体字
生成文档截图
添加图片
用到add_picture()方法
默认插入是图片原大小,若果要调整大小,则需要在参数上写上长宽大小
document.add_picture(r"D:dochusky.png", width=Inches(1.0), height=Inches(1.0))
下方代码,我插入了一只哈士奇图片
生成文档截图
添加分页符
用到add_page_break()方法
并在新页面添加了新的正文
可见,添加分页符后,文档有两页纸了
在处理一些csv和Excel格式文件
在读取中文的情况下,通常会遇到一些编码的问题
传统方法都是尝试用utf-8和gbk打开
然后都打不开(如以下两图)
上网翻阅了资料,见到推荐说多尝试其他文字编码
比如说GB2312编码、GB18030编码,但都不可以打开
我当时就想,与其猜灯谜般尝试这么多编码,不如看看有没有方法直接知道这个文件是什么编码
在搜索引擎的结果中,推荐了chardet库来查看编码方式的。
把文件解释成二进制,再调用chardet模块的detect方法读取这个文件数据就知道这个文件是用什么编码了。
可以看到,这个文件是用utf-16编码格式的
用utf-16编码,就能打开这个csv文件了
会持续更新,敬请期待,要源码的可以私我