一、概述
现有一个wenda1.xlsx文件,内容如下:
需要将faq记录合并为一行,效果如下:
注意:faq记录,每一行用||来拼接。
二、多行转换一行
新建test1.py,内容如下:
# !/usr/bin/python3 # -*- coding: utf-8 -*- import xlrd # 打开excel文件,创建一个workbook对象 rbook = xlrd.open_workbook('wenda1.xlsx') # sheets方法返回对象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>] rbook.sheets() # xls默认有3个工作簿,Sheet1,Sheet2,Sheet3 rsheet = rbook.sheet_by_index(0) # 取第一个工作簿 faq_tmp_dict = {} # FAQ临时字典 faq_formal_list = [] # FAQ正式列表 first_category_tag = "" # 一级分类标识 index = 0 # 索引 #循环工作簿的所有行 for row in rsheet.get_rows(): index +=1 first_category_row = row[0] # 1级分类所在的列 first_category_value = first_category_row.value # 1级分类的值 if first_category_value != '1级分类': # 排除第一行,这些都是列名 if first_category_value: # 当1级分类的值不为空时 # 更新一级分类标识,用#连接 first_category_tag = "%s#%s"%(first_category_value,index) faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value # FAQ相似句的值 # 更新临时字典,不存在默认值为空字典,否则追加到列表中 faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value) else: # 当1级分类的值为空时 faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value) print(faq_tmp_dict) # 处理临时字典 for i in faq_tmp_dict: tmp_dict = {} # 一级分类,切割#号,取第一个 first_category = i.split('#')[0] # print("first_category",first_category) # faq所有记录,将faq列表转换为一行,用逗号拼接 faq_like_all = "||".join(faq_tmp_dict[i]) # print("faq_merge",faq_all) tmp_dict['first_category'] = first_category tmp_dict['faq_like_all'] = faq_like_all faq_formal_list.append(tmp_dict) print(faq_formal_list)
执行输出:
{'闲聊#2': ['不在吗?', '你好在吗?', '你在不在', '有人在么。', '你好?', '在么?说话啊', '客户在不在?'], '闲聊#9': ['你好', '客服你好', '你好,客服']} [{'first_category': '闲聊', 'faq_like_all': '不在吗?||你好在吗?||你在不在||有人在么。||你好?||在么?说话啊||客户在不在?'}, {'first_category': '闲聊', 'faq_like_all': '你好||客服你好||你好,客服'}]
从上面输出内容,可以看出。将多行合并为一行,并且将faq记录写入到一个字典里面了。接下来就可以写入到新表格了。
三、写入新表格
完整代码如下:
# !/usr/bin/python3 # -*- coding: utf-8 -*- import xlrd # 打开excel文件,创建一个workbook对象 rbook = xlrd.open_workbook('wenda1.xlsx') # sheets方法返回对象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>] rbook.sheets() # xls默认有3个工作簿,Sheet1,Sheet2,Sheet3 rsheet = rbook.sheet_by_index(0) # 取第一个工作簿 faq_tmp_dict = {} # FAQ临时字典 faq_formal_list = [] # FAQ正式列表 first_category_tag = "" # 一级分类标识 index = 0 # 索引 #循环工作簿的所有行 for row in rsheet.get_rows(): index +=1 first_category_row = row[0] # 1级分类所在的列 first_category_value = first_category_row.value # 1级分类的值 if first_category_value != '1级分类': # 排除第一行,这些都是列名 if first_category_value: # 当1级分类的值不为空时 # 更新一级分类标识,用#连接 first_category_tag = "%s#%s"%(first_category_value,index) faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value # FAQ相似句的值 # 更新临时字典,不存在默认值为空字典,否则追加到列表中 faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value) else: # 当1级分类的值为空时 faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value) print(faq_tmp_dict) # 处理临时字典 for i in faq_tmp_dict: tmp_dict = {} # 一级分类,切割#号,取第一个 first_category = i.split('#')[0] # print("first_category",first_category) # faq所有记录,将faq列表转换为一行,用逗号拼接 faq_like_all = "||".join(faq_tmp_dict[i]) # print("faq_merge",faq_all) tmp_dict['first_category'] = first_category tmp_dict['faq_like_all'] = faq_like_all faq_formal_list.append(tmp_dict) print(faq_formal_list) import xlwt import json f = xlwt.Workbook() sheet1 = f.add_sheet('Sheet1', cell_overwrite_ok=True) row0 = ["1级分类", "faq记录"] # 写第一行 for i in range(0, len(row0)): sheet1.write(0, i, row0[i]) # # 加载json文件 # with open("tj.json", 'r') as load_f: # load_dict = json.load(load_f) # 反序列化文件 # num = 0 # 计数器 max_length = 0 # 最大长度 for i in faq_formal_list: num+=1 # 自增1 faq_col = sheet1.col(1) # faq记录所在的列 length = len(i['faq_like_all']) # 计算长度 # print("长度",length) # 更新最大长度 if max_length < length: max_length = length # 设置表格宽度 faq_col.width = max_length * 20* 20 # 写入库名 sheet1.write(num, 0, i['first_category']) # faq_like_str = "||".join(i['faq_like_all']) sheet1.write(num, 1, i['faq_like_all']) # 保存到表格 f.save('test1.xls')
执行代码,它会生成一个test1.xlsx。
打开文件,效果如下:
以上就是python excel多行合并的方法的详细内容,更多关于python excel多行合并的资料请关注其它相关文章!
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
暂无“python excel多行合并的方法”评论...
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新动态
2024年11月24日
2024年11月24日
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]