본문 바로가기
데이터 AI 인사이트 👩🏻‍💻/KPMG 교육

Project 기획 및 관리 (5) Power BI, 파워쿼리

by odimilk 2024. 12. 2.

기술은 늘상 바뀐다. 우리가 가고자 하는 곳에 필요없는 기술은 쓸모없다.

 

디지털 대시보드

SQL을 하는 이유, 엑셀에서 산점도를 보는 이유. 우리는 프로그래머처럼 우리만의 독특한 기술이 아닌이상 그때그때마다 사용되는 기술, 취업하는 곳에서 필요로 하는 기술이 필요하다. 대시보드는 하나의 시각화를 보고 의사결정을 빠르게 할 수 있도록 도와주는 소프트웨어이다. 대시보드 구축하라는 것은 차트형식으로 만들어지는 것이다. 대시보드 소프트웨어는 Power BI, 태블로. 노코드/로코드가 대세이다. 프로그래밍 없이도 대시보드를 만들 수 있는 것이 많다. 비용을 내는 소프트웨어 중 대표적인 것이 태블로이다. 초창기에 마우스 클릭 몇번만으로도 근사한 시각화가 만들어지고, 고생하지 않더라도 미리 만들어놓은 탬플렛들이 있어서 연결해서 사용할 수 있게끔 연동을 해준다. 오늘은 기술에 관련된 몇몇만 알려준다. 태블로 온라인 강의 추천하고, 이거는 수료증도 준다. 태블로는 유료이고, Power BI는 무료이다. 그런데도 불구하고 태블로가 시각화 도구에 선두주자로 나와있는 이유는 예전에는 태블로밖에 없었다. 이미 사람들이 소프트웨어로 만들어놨기 때문에 태블로로 사용할 수 밖에 없다. 소프트웨어쪽의 이론은 기술이 있다면 빨리 서비스를 줘라고 한다. 초기에 도입한 툴로 계속 사용하기 때문이다. 태블로 잘하는 사람이 연봉이 높을 것이다. 하지만 단순 기술만 사용할줄아는 사람이 아니라 인사이트까지 도출할 수 있는 사람이다. 우리는 Power BI 다운해서 사용할 것이다. Power BI도 유료가 있다. 유료버전은 인사이트까지 자동으로 해준다는 것이다.

2023년도 KPI 목표달성 몇퍼센트 하려는지 짜는 겁니다. 라고 하고 프로젝트 상세내용은 영업은 매출대비 수익성대비 고객대비라고 하는 보려고 합니다. 일정표는 어떻게 되니?는 각각 부서에 자료 요청하고 프로젝트라고 기획서를 쓰는 것이다. 단지 프로젝트 기획서가 정해진게 없다. 일반적인 프로젝트를 하는 팀들에게 정해진 것은 있다. 사실 프로젝트 기획서는 발주사에게 맞추는 것이다. 양식을 받거나, 서로에게 경쟁인 경우는 거래처의 전문성을 보겠다라고 하면 투입되는 사람들의 전문성을 보겠다라고 하면 AS사후관리같은 경쟁일 경우에는 점수표가 있다. 가격점수가 높은지, 그런거에 맞춰서 사용하면 된다. 프로젝트를 하든 SQL을 하든 기술이 먼저가 아니라 프로젝트를 하는 능력이다. 꼭 소프트웨어를 선택해야하는 케이스는 우리가 해야하는 소프트웨어들이 있어서 미리 해놓으면 좋다. 태블로를 권장한다.

 

Power BI 실습

데이터 가져오기 - csv 파일

‘새 열’ 눌러서 y=year([join_date]) 함수 입력하면 새 열이 생긴다.

파워비아이 DAX는 지금에야 자리잡고 있어서, 그냥 사전에 SQL 처리하고 Power BI 작업 하는 것을 추천한다. 시각화는 시각화의 역할을 하게끔 하는 것이 좋다. 전처리할거는 다 해놓고, Power BI에서는 시각화하려고 한다. 요즘 회사에서는 개인용 사무용 소프트웨어, 문서 전문 워드 등 엑셀에서 데이터분석인 파워쿼리, 피벗테이블을 밀고 있다. DAX는 파워비아이의 함수라는 것만 알면 된다.

범주별 평균 누르고 기준값과 범주에 데이터 넣어주면 아래와 같은 함수식이 자동으로 생성된다.

다른 파일도 불러와서 모델 만들기

차트 그리기 어려우면 먼저 테이블로 데이터 확인해도된다.

분해트리

상세적인 모델이 뭐 있는지 알 수 있다. 분류하고 개수 확인할 수 있다.

 

Power BI 파워쿼리

열 병합할 수 있다. SQL에서는 concat으로 병합할 수 있지만 파워쿼리에서는 열병합으로 가능하다.

병합의 방법으로 연도, 월, 일이 컬럼이 나눠져있었는데 3개의 컬럼을 병합하고 사용자지정으로 ‘-’으로 구분해준다.

→ 이거를 SQL에서 한다면

SELECT CONCAT(C1,C2,C3) 전입지코드,

date_format(CONCAT(C4,’-’,C5,’-’,C6), ‘%Y%m%d’) 전입일 *

FROM 인구이동2018

날짜로 변경할 때는 무조건 ‘-’을 넣어야한다.

데이터 전처리가 아주 중요한 과정이다. 거의 90프로는 전처리하는데 시간을 써야한다.

 

프로젝트 기획서 - 데이터 전처리 요구사항

새로운 필드 생성, 필드명 변경, 필드 내용 변경, 필터링

기술 스택 포함하여 작업해달라고 하면 이런 작업을 할때 어떤 기술을 넣어야할지도 GPT에 물어봐서 생성한다.

요구사항 분석을 자세하게 넣는다. 중간보고서 작성해서 완료되었는지 계속 확인해야한다. 담당자도 포함해서 진행여부(퍼센트)로 포함하여 넣는다. 작업을 만들어서 납품하는 사람이 아니라, 작업을 원하는 요구사항을 하는 사람이라서 요구사항을 자세히 분석해야한다. 프로젝트 매니저들이 이런일을 받아와서 서로 협의하는 것이다. 필요사항을 받아오고 프로그래머들한테 넘겨주고, 진행률을 보고서에 정리해서 프로그래머들하고 실제로 싸움을 많이 한다. 현업에서 프로젝트 명세서, 문서화해서 작업하는 것들이고, 일지를 매일매일 써야한다. 문서가 없으면 나중에 누가 잘했는지, 못했는지 모르기때문에 일자별로 다 기록해야한다. 프로젝트 일지 - 날짜별에 따른 목표, 진행상황, 누가 얼만큼 했는지, 이슈 및 해결 방안을 매일매일 쓴다. 이거는 내부적으로 보는 자료이다.

이후에 포트폴리오를 쓸 때랑도 연관되어있다. 프로젝트 기획서 = 포트폴리오

IT쪽으로 가고 싶으면 기술쪽 단어를 많이 포함시켜야한다.

데이터의 요구사항이 가장 중요하다. SQL, 엑셀, 파이썬으로 하던지간에..