본문 바로가기
커리어 노트 📈/KPMG 교육

기초 통계 및 경영 통계 (2) 파이썬

by Hayley S 2024. 12. 3.

파이썬 & Power BI 연동 가능하다. py 확장자는 그래픽은 따로 화면을 띄어야하는데, 주피터노트북은 그럴 필요가 없다. 주피터노트북에서 Power BI 구성할 수 있고, 권장한다. 주피터는 대답 작업 각각 나오고, 에디터 중에서도 질문 답 질문 답을 한눈에 볼 수 있어서 보고서 작성에 용이하다. 질의응답해서 포트폴리오 할때 작업을 많이 한다. 전문 프로그래머가 아니면 주피터노트북을 많이 사용한다. 특히 데이터 분석 쪽에서. 파이썬 소프트웨어에서 Power BI 리포트를 생성해낼 수 있다는 것이다. 언어끼리 다 연결해서 쓸 수 있다. 태블로에 대한 시각화를 사용할 수 있다. PyGWailker 다운받으면 된다. 모듈이 있다. 모듈을 갖다놓고 나서 사용하면 태블로와 같이 시각화 전문 프로그램으로 쓴 것 처럼 할 수 있다. 배움의 조각조각들을 나중에 연결해서 사용할 것이다.

파이썬에서 게임을 만들려고 하면, pygame이라는 모듈이 필요하기 때문에 설치해야한다. 챗지피티로 코드 가져오기.

numpy와 pyttx3 같은 모듈은 Anaconda Prompt에서 설치를 한다.

 

Visual Studio Code에서 코드 쓴다.

*여기에서 계속 에러가 났던 이유는 오른쪽 하단에 파이썬 버전이 안맞춰져있었다.

 

실습 - 한국어 입력하면 한국어를 선택했다고 뜨게 만드는 코드

 

For 문

 

파이썬 컴프리헨션

긴 구문을 압축해서 쓰는 것이다. 자주 나온다. 문법이 아주 자유롭지는 않아서 복잡한 건 못쓴다.

만들어진 코드를 봤을 때 어떤건지 아는 정도만 해도된다.

list: 형식, 갯수가 서로 달라도됨.

array: 형식, 갯수가 통일되어야함.

인공지능 데이터, 공장 실시간 데이터 모두 다 array다.

텐서플로우가 뭐냐면 이런 텐서 자료들이 흘러다니는 것이다.

데이터분석은 주피터노트북으로 많이 한다.

 

Dictionary

처음에는 데이터 키를 본다.

list는 수정이 가능하지만, tuple은 수정이 불가능하다. 데이터를 바꿔야한다면 tuple을 list로 변경하고 수정해야한다.

 

주피터노트북 실습

pandas 설치 방법 1) 아나콘다 프롬프트 (터미널)에서 설치 2) 주피터노트북에서 설치

딕셔너리 예시

국어 점수 70점 이상인 데이터만 나왔으면 좋겠어.

인덱스가 몇번인지 작성해서 데이터추려서 결과값에 나타낼 수 있다.

jum이라는 리스트 생성해서 조건문 걸어서 결과값 출력하기.

jason 파일보면 아래 구조 처럼 되어있다.

파이썬에서 딕셔너리가 인공지능에 엄청 쓰인다.

 

Markdown

<p>는 태그라고 부른다.

주피터는 pdf로 파일 저장할 수 있다. 인터넷 연결안해도 익스플로러같은 HTML도 생성해준다. 문서처럼 볼 수 있다.

 

교재 시작 - 13_descriptive_statistics_20200120.ipynb

matplotlib을 설치해준다.

기술통계 확인한다.

데이터프레임 확인한다. → 이거 주면 지피티가 잘 분석해준다.

정해진 부분의 데이터만 출력해낸다.

나이가 70이상인 데이터의 개수 구하기.

2개 이상의 자료는 [를 두개 넣어야한다.

세가지 필드를 뽑아와서 count수 출력하기

 

현업에서 R 파이썬 모두 많이 쓴다. R은 2017년에 대세였고, 통계 특화 소프트웨어다. 그러다가 인공지능 관련 텐서플로우랑 연결되는 파이썬이 뜨다가 지금은 R도 텐서플로우랑 연결이 된다. 장바구니 분석, A/B테스트 모두 R이 훨씬 더 유리하다. 통계적으로 잘 나오고, 시각화도 더 잘된다. 파이썬은 시각화 오류 가끔 많다. 둘다 하는 것을 권장한다.