본문 바로가기

PYTHON/Pandas

excel 변환

여러 엑셀 합치기

import glob  
import sys
data = pd.DataFrame() 
for f in glob.glob("../data/4_1_*.xlsx"): 	# data 폴더 안 4_1_로 시작하는 파일 모두
    df = pd.read_excel(f, sheet_name="원하는시트명", header=3, 
                      dtype={'ID':str, 'EXID':str}) 
    df = df.replace("EOD", np.nan)
    df = df.dropna(how='all')
    data = data.append(df, ignore_index=True)
# 공백제거
data = data.applymap(lambda x: x.strip() if isinstance(x, str) else x)
#파일저장  
data.to_excel("../폴더/파일명.xlsx", index=False)
# column 확인
data.info()

# 편집
## 정렬
data.sort_values(by="ID")
## 삭제
data.dropna(axis=1, how='all', inplace=True)
### 특정열 삭제
data.drop(["Unnamed: 24"], axis=1, inplace=True)

 

여러 시트 합치기

import xlsxwriter
df1 = pd.read_excel("../data/file_1.xlsx")
df2 = pd.read_excel("../data/file_2.xlsx")
df3 = pd.read_excel("../data/file_3.xlsx")
writer = pd.ExcelWriter('../data/all.xlsx', engine="xlsxwriter")
df1.to_excel(writer, sheet_name="sheet1")
df2.to_excel(writer, sheet_name="sheet2")
df3.to_excel(writer, sheet_name="sheet3")
writer.close()

'PYTHON > Pandas' 카테고리의 다른 글

input output  (0) 2019.12.29
dataframe  (0) 2019.12.29
series  (0) 2019.12.29
basic  (0) 2019.12.29