본문 바로가기

0. SW 사용법/Power Query

데이터 추출_폴더에서

데이터 추출 _ 폴더에서


[폴더에서]는 하나의 폴더에 있는 여러 파일을 한 번에 가져올 수 있는 기능입니다.

제동하는 파일의 종류는 엑셀(.xlsx), 텍스트(.txt), 콤마로 구분한 CSV(.csv) 등 입니다. 


그럼 하나의 폴더에 여러 개의 엑셀 파일이 파워쿼리에서 어떻게 병합되어 하나의 파일로 생성되는지 사용 방법을 함께 보겠습니다.




1. 엑셀을 실행하고 [데이터]탭-[데이터 가져오기]목록-[파일에서]-[폴더에서]를 실행합니다.

2. 나타난 [폴더] 대화상자에서 저장 경로를 지정합니다.




3. [조합]목록에 [결합 및 편집]을 실행합니다.

편집을 실행하면 파워 쿼리 편집기로 내용을 가져가겠다는 것입니다. 

 

4. [파일 병합]에서는 폴더를 선택해야 모든 파일에 모든 시트를 병합할 수 있습니다. 



5. 파워 쿼리는 폴더의 모든 내용을 쿼리 편집기로 가져와 테이블로 구성했습니다.

데이터의 중복을 막기 위해 [Kind]열의 필터 목록을 눌러  Sheet 만 체크합니다.



6. 내용과 더불어 파일 이름을 테이블에 추가 사용하기 위해 [Source.Name]을 변형합니다.

[홈]탭-[열 분학]목록-[구분 기호 기준]을 선택하고 [--사용자 지정--]--> 점(마침표)를 입력합니다.



7. 필요한 열만 남기고 모두 제거하는 작업입니다.

Shift키를 누른 상태로 Source.Name.1, Name, Data를 선택하고 마우스 오른쪽 버튼 [다른 열 제거]를 실행합니다. 



8. 필요한 열만 남았습니다. 실제 데이터는 [Data]에 'Table'형식으로 저장되어 있습다니다.

[Data]에 확장 버튼을 클릭하고 '원래 열 이름을 접두사로 사용'를 체크 해제하고 [확인]합니다.



9. 각 시트 안에 있던 모든 데이터가 합쳐져 표시됩니다. 첫 줄을 필드 이름으로 지정해야 합니다.

테이블 왼쪽의 테이블 아이콘을 클릭하고 [첫 행을 머리글로 사용]을 선택합니다.



10. 세 개의 파일에 12개의 시트에 데이터가 합쳐졌기 때문에 9과정에서 사용한 첫 행을 제외하고 필드명 행이 35개 포함되어 있습니다.

35개의 필드명을 제거하기 위해 항목 중 아무거나 선택하고 필자는 [품목]열을 선택하고 값 '품목'을 제거하는 필터를 실행했습니다.



폴더에 모든 엑셀 파일, 파일 안에 모든 시트의 데이터가 하나의 데이터 집합으로 생성되었습니다. 또한 파일명을 재 사용해서 어떤 지점의 데이터인지 알 수 있도록 했습니다. [폴더에서]를 실행할 때 지정한 경로의 새로운 지점의 엑셀 파일을 추가한다고 가정해 보십쇼! 이제 여러분은 다시 이 과정을 거칠 필요가 없습니다. 폴더에 파일을 추가하고 '새로 고침' 버튼만 눌러 주면, 추가한 파일을 포함하여 다시 데이터 집합을 구성해 주니까요.

'0. SW 사용법 > Power Query' 카테고리의 다른 글

파워쿼리란?  (0) 2018.02.27