Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

站长资源 2024/11/23 佚名

2 0 1

我就废话不多说了，大家还是直接看代码吧~

#!/usr/bin/python
# -*- coding: utf-8 -*-

import xlwt
import re

def host_regex(dataline):
 host_regex = r"<host>(.*"
 host = re.findall(host_regex, dataline)
 if host:
  return host[0]

def ip_regex(dataline):
 ip_regex = r"<ip>(.*"
 ip = re.findall(ip_regex, dataline)
 if ip:
  return ip[0]

with open("zbx_export_hosts.xml", "r", encoding="utf8") as f:
 lines = f.readlines()
 alldatas = []
 hostlist = []
 iplist = []
 for line in lines:
  host = host_regex(line)
  ip = ip_regex(line)

  if host is not None:
   hostlist.append(host)
  if ip is not None:
   iplist.append(ip)
 hosts_ip = []
 # 构造数据结构,形如：[[a,b],[c,d],...]
 multi_list = map(list, zip(hostlist, iplist))
 for multi in multi_list:
  hosts_ip.append(multi)
 workbook = xlwt.Workbook()
 worksheet = workbook.add_sheet('test')
 # 关键代码
 for hi in enumerate(hosts_ip):
  for num in range(len(hi[1])):
   # 行、列、值
   worksheet.write(hi[0], num, hi[1][num])

 workbook.save('excelwrite.xls')

PS：其实有两行代码冗余，就不删了！

补充知识：通过python写入xlsx大量数据问题简述

以前批处理生成数据文件都是通过c程序直接按照逗号分隔方式写文本文件以csv保存的。但是由于有些处理的数据表直接给业务人员看，业务人员习惯使用xls，因此提了些需求改造，对于一些小于100w的数据均要求改为xlsx文件格式的报表。

考虑报表文件数据处理便捷，因此决定用python实现，最初使用了openpyxl库，这个python库拥有非常强大的xlsx的读写api，能够很方便的实现读写。但是在实际使用中发现在处理较大行数的xlsx时，占用内存非常严重，8个字段50w行数据在运行中内存高达10G，这不是我们应用服务器能够接受的范围。

因此寻求改善，在网上了解后，发现创建xlsx表时，指定write_only参数是openpyxl提供的大数据写入解决方案，以下摘自官网范例，在选择了此参数后，无法通过ws.cell(row=i, column=j).value = ？的方式复制，只能通过append的方式追加行。关于设置只写cell设置样式，可以直接查看官网

> from openpyxl import Workbook
> wb = Workbook(write_only=True)
> ws = wb.create_sheet()
>
> # now we'll fill it with 100 rows x 200 columns
>
> for irow in range(100):
...  ws.append(['%d' % i for i in range(200)]) #可以先将一行的数据写在一个list中，直接ws.append(list)
> # save the file
> wb.save('new_big_file.xlsx') # doctest: +SKIP

不过仅仅按上述范例修改write_only跑数时发现内存占用并没有缓解，再仔细阅读官网说明时才发现这么一句话“When you want to dump large amounts of data make sure you have lxml installed.”原来在openpyxl安装时，并没有把lxml作为强依赖，只是一个可选包，然后查实发现确实服务器上并没有安装lxml包。

于是与为了解决这个问题先在测试环境上安装lxml，安装过程也不是很顺利。

首先先要装libxml2以及libxslt，因为没有root权限，均为源码安装，且只能安装在用户目录。需要注意的是libxml2在安装时需要--with-python='python安装目录'，libxslt安装的时候需要指定libxml2安装目录。

尤其最后的lxml安装也是坑挺多的，主要是指定libxml2和libxslt，安装lxml时先python3 setup.py build_ext -i -I${libxml2includepath} -L${libxml2libpath} -I${libxsltincludepath} -L${libxsltlibpath} ，再python3 setup.py install。

全部安装完之后，确实openpyxl写xlsx不再增加内存，先在tmp目录一个临时文件中写，待调用save方法时，保存到正式文件。

此外在这个问题解决中，还了解到writexlsx库也可以处理大文件xlsx的写入，并且安装没有这么多的依赖，其实还是非常推荐，也很简介，官网有介绍。

操作大文件时指定{'constant_memory': True}即可。

filename = 'test.xlsx'
wb = xlsxwriter.Workbook(filename, {'constant_memory': True})
ws = wb.add_worksheet('大文件')
i = 0
data= []
data.append('中文')
data.append(1323)
data.append('abc')
ws.write_row(i, 0, data)
i = i + 1
wb.close() #直接关闭即可，不需要额外save

以上这篇Python 使用xlwt模块将多行多列数据循环写入excel文档的操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

Python,xlwt模块,数据循环写入,excel文档

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

评论“Python 使用xlwt模块将多行多列数据循环写入excel文档的操作”

暂无评论...

www.wwsws.com 伏龙阁资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2024/11/23

可与Spreadsheets媲美的在线表格系统:EditG

2024/11/23

cygwin使用心得

2024/11/23

脚本的DVD开发

2024/11/23

局域网设置自动配置脚本文件的写法与用途

2024/11/23

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/23

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

Python暴力破解Mysql数据的示例

python 实现一个图形界面的汇率计算器

评论“Python 使用xlwt模块将多行多列数据循环写入excel文档的操作”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

Python暴力破解Mysql数据的示例

python 实现一个图形界面的汇率计算器

评论“Python 使用xlwt模块将多行多列数据循环写入excel文档的操作”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存