收藏 分销(赏)

(整理)python操作excel.教学文案.doc

上传人:人****来 文档编号:3816225 上传时间:2024-07-21 格式:DOC 页数:9 大小:36KB 下载积分:6 金币
下载 相关 举报
(整理)python操作excel.教学文案.doc_第1页
第1页 / 共9页
(整理)python操作excel.教学文案.doc_第2页
第2页 / 共9页


点击查看更多>>
资源描述
(整理)python操作excel. 精品文档 You are here: Home » 计算机 » 编程 » Python操作Excel Python操作Excel 2012-09-01 老婆单位有时候有一些很大的 Excel 统计报表需要处理,其中最恶心的是跨表的 JOIN 查询。他们通常采取的做法是,把多个 Excel 工作簿合成一个工作簿的多个表格,然后再跑函数(VLOOKUP之类)去查。因为用的函数效率很低,在 CPU 打满的情况下还要跑几个小时。 然后我就看不过去了,我也不懂 Excel,不知道如何优化,但我想用 Python+SQLite 总归是能够实现的。于是就尝试了一把,效果还不错,一分钟以内完成统计很轻松,其中大部分时间主要花在读 Excel 内容上。 1. Python 操作 Excel 的函数库 我主要尝试了 3 种读写 Excel 的方法: 1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都可以使用。xlrd 可以读取 .xls, .xlsx 文件,非常好用;但因为 xlwt 不能直接修改 Excel 文档,必须得复制一份然后另存为其它文件,而且据说写复杂格式的 Excel 文件会出现问题,所以我没有选它来写 Excel 文件。 2> openpyxl: 这个库也是不需要其它支持的,而且据说对 Office 2007 格式支持得更好。遗憾地是,我经过测试,发现它加载 Excel 文件的效率比 xlrd 慢 3 倍以上,内存使用在 10 倍以上,于是就放弃了。 3> win32com: Python Win32 扩展,这个库需要运行环境为 Windows+Office 对应版本。由于 Python Win32 扩展只是把 COM 接口包装了一下,可以视为与 VBA 完全相同,不会有读写格式上的问题。尝试了一下用 win32com 读取 Excel 文件,效率还是比 xlrd 慢一些。 由于读取效率上 xlrd > win32com > openpyxl,所以我自然选择了 xlrd 用来读取统计报表;而最终输出的报表格式较复杂,所以选择了 win32com 直接操作 Excel 文件。 2. Python 里的关系型数据库 SQLite 是一个非常轻量级的关系型数据库,很多语言和平台都内置 SQLite 支持,也是 iOS 和 Android 上的默认数据库。Python 的标准库里也包含了 sqlite3 库,用起来非常方便。 3. 用 xlrd 读取 Excel 并插入数据库样例 如果数据量不大,直接用 Python 内部数据结构如 dict, list 就够了。但如果读取的几张表数据量都较大,增加个将数据插入数据库的预处理过程就有很大好处。一是避免每次调试都要进行耗时较长的 Excel 文件载入过程;二是能充分利用数据库的索引和 SQL 语句强大功能进行快速数据分析。 #!/usr/bin/python # -*- coding: gbk -*- import xlrd import sqlite3 # 打开数据库文件 device_city_db = sqlite3.connect('device_city.db') cursor = device_city_db.cursor() # 建表 cursor.execute('DROP TABLE IF EXISTS device_city') cursor.execute('CREATE TABLE device_city (device_id char(16) PRIMARY KEY, city varchar(16))')   # 打开 device 相关输入 Excel 文件 device_workbook = xlrd.open_workbook('输入.xlsx') device_sheet = device_workbook.sheet_by_name('设备表') # 逐行读取 device-城市 映射文件,并将指定的列插入数据库 for row in range(1, device_sheet.nrows):    device_id = device_sheet.cell(row, 6).value    if len(device_id) > 16:        device_id = device_id[0:16]    if len(device_id) == 0:        continue    city = device_sheet.cell(row, 10).value    # 避免插入重复记录    cursor.execute('SELECT * FROM device_city WHERE device_id=?', (device_id,))    res = cursor.fetchone()    if res == None:        cursor.execute('INSERT INTO device_city (device_id, city) VALUES (?, ?)',                       (device_id, city))    else:        if res[1] != city:            print '%s, %s, %s, %s' % (device_id, city, res[0], res[1]) device_city_mit() 4. 将结果写入 Excel 文件样例 使用 win32com 写入 Excel 的时候要注意,一定要记得退出 Excel,否则下次运行会出错。这需要增加异常处理语句,我这里偷了个懒,出了异常后要手动杀死任务管理器中的 excel 进程。至于 win32com 中类的接口,可以从 MSDN 网站查阅。 import win32com.client as win32 import os excel = win32.gencache.EnsureDispatch('Excel.Application') excel.Visible = False # 貌似这里只能接受全路径 workbook = excel.Workbooks.Open(os.path.join(os.getcwd(), '输出.xlsx')) month_sheet = workbook.Worksheets(1) # 计算文件中实际有内容的行数 nrows = month_sheet.Range('A65536').End(win32.constants.xlUp).Row # 操作 Excel 单元格的值 for row in range(5, nrows-4):    month_sheet.Cells(row, 1).Value += something # 保存工作簿 workbook.Save() # 退出 Excel excel.Application.Quit() python操作Excel读写--使用xlrd 一、安装xlrd模块    到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。 二、使用介绍   1、导入模块       import xlrd    2、打开Excel文件读取数据        data = xlrd.open_workbook('excelFile.xls')    3、使用技巧         获取一个工作表           table = data.sheets()[0]          #通过索引顺序获取           table = data.sheet_by_index(0) #通过索引顺序获取           table = data.sheet_by_name(u'Sheet1')#通过名称获取           获取整行和整列的值(数组)              table.row_values(i)            table.col_values(i)           获取行数和列数            nrows = table.nrows           ncols = table.ncols                 循环行列表数据         for i in range(nrows ):       print table.row_values(i)   单元格 cell_A1 = table.cell(0,0).value   cell_C4 = table.cell(2,3).value   使用行列索引 cell_A1 = table.row(0)[0].value   cell_A2 = table.col(1)[0].value   简单的写入 row = 0   col = 0   # 类型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error ctype = 1 value = '单元格的值'   2.间接市场评估法xf = 0 # 扩展的格式化   环境的两个特点:table.put_cell(row, col, ctype, value, xf)   三、安全预评价报告的基本内容table.cell(0,0)  #单元格的值' (3)是否符合区域、流域规划和城市总体规划。  table.cell(0,0).value #单元格的值' 2.辨识与分析危险、有害因素  环境敏感区,是指依法设立的各级各类自然、文化保护地,以及对建设项目的某类污染因子或者生态影响因子特别敏感的区域。  1.依法评价原则;三、Demo代码 (四)环境价值评价方法   Demo代码其实很简单,就是读取Excel数据。     1 # -*- coding: utf-8 -*- 2 import xdrlib ,sys 3 import xlrd 4 def open_excel(file= 'file.xls'): 5 try: 6 data = xlrd.open_workbook(file) 7 return data 8 except Exception,e: 9 print str(e) 10 #根据索引获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_index:表的索引 11 def excel_table_byindex(file= 'file.xls',colnameindex=0,by_index=0): 12 data = open_excel(file) 13 table = data.sheets()[by_index] 14 nrows = table.nrows #行数 15 ncols = table.ncols #列数 16 colnames = table.row_values(colnameindex) #某一行数据 17 list =[] 18 for rownum in range(1,nrows): 19 20 row = table.row_values(rownum) 21 if row: 22 app = {} 23 for i in range(len(colnames)): 24 app[colnames[i]] = row[i] 25 list.append(app) 26 return list 27 28 #根据名称获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_name:Sheet1名称 29 def excel_table_byname(file= 'file.xls',colnameindex=0,by_name=u'Sheet1'): 30 data = open_excel(file) 31 table = data.sheet_by_name(by_name) 32 nrows = table.nrows #行数 33 colnames = table.row_values(colnameindex) #某一行数据 34 list =[] 35 for rownum in range(1,nrows): 36 row = table.row_values(rownum) 37 if row: 38 app = {} 39 for i in range(len(colnames)): 40 app[colnames[i]] = row[i] 41 list.append(app) 42 return list 43 44 def main(): 45 tables = excel_table_byindex() 46 for row in tables: 47 print row 48 49 tables = excel_table_byname() 50 for row in tables: 51 print row 52 53 if __name__=="__main__": 54 main() 收集于网络,如有侵权请联系管理员删除
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服