본문 바로가기
데이터 AI 인사이트 👩🏻‍💻/KPMG 교육

비즈니스 애널리틱스 II (7) 분류 분석 및 평가

by Hayley S 2025. 2. 13.

분류 분석(Classification Analysis)

분류 분석은 머신러닝에서 가장 중요한 알고리즘 중 하나이며, 이산적인 값(Discrete Value) 을 예측하는 데 사용된다. 즉, 데이터가 특정 그룹(클래스)에 속하는지 여부를 판단하는 것이 핵심이다.

예를 들어:

  • 이메일이 스팸(1)인지 아닌지(0) 분류하는 문제
  • 환자가 암에 걸렸는지(Yes) 아닌지(No) 예측하는 모델
  • 고객이 이탈할 가능성이 높은지(High) 아닌지(Low) 예측하는 분석

실무 활용 예제:

금융 산업 → 신용 카드 사기 탐지 (Fraud Detection)
이커머스 → 고객이 상품을 구매할 가능성이 있는지 예측
의료 분야 → 환자가 특정 질병을 가질 확률 예측
제조업 → 제품의 불량 여부 예측

분류 모델은 비즈니스 의사 결정을 내리는 데 있어 필수적인 역할을 한다. 기업들은 이를 활용해 마케팅 타겟팅, 리스크 평가, 추천 시스템 구축 등을 수행한다.


분류 알고리즘의 종류: 로지스틱 회귀(Logistic Regression) / 결정 트리(Decision Tree) / 랜덤 포레스트(Random Forest)

로지스틱 회귀(Logistic Regression)

선형 회귀와 비슷하지만, 결과값이 0과 1 사이의 확률로 변환되는 함수(Sigmoid)를 사용한다. 즉, 데이터를 특정 클래스로 분류하는 데 특화된 회귀 모델이다. 

로지스틱 회귀 공식:

 

이 식을 통해, 특정 입력값 X가 주어졌을 때 Y가 1(참)일 확률을 계산한다. 모델이 예측한 확률이 0.5 이상이면 1(양성), 0.5 미만이면 0(음성)으로 분류한다.

로지스틱 회귀의 실무 활용:

스팸 이메일 분류 → 이메일 본문 내용 기반으로 스팸 여부 판단
고객 이탈 예측 → 고객이 서비스 구독을 취소할 가능성 예측
의료 데이터 분석 → 환자가 특정 질병에 걸릴 확률 예측


결정 트리(Decision Tree)

결정 트리는 데이터를 기준에 따라 여러 개의 노드로 분할하여 최종적인 예측을 수행하는 모델이다. 사람이 의사 결정을 내리는 과정과 비슷한 방식으로 작동한다.

결정 트리 예제:

예를 들어, "고객이 대출을 받을 수 있는지?"를 판단하는 문제에서

  • 첫 번째 기준: 고객의 신용 점수가 700점 이상인가?
  • 두 번째 기준: 연 소득이 5천만 원 이상인가?
  • 세 번째 기준: 최근 1년간 연체 기록이 있는가?

각 질문에 따라 데이터를 나누어가며, 최종적으로 "대출 승인" 또는 "대출 거부"를 결정하는 방식이다.

결정 트리의 실무 활용:

금융 → 고객의 대출 승인 여부 예측
의료 → 환자가 특정 질병을 가질 확률 예측
마케팅 → 고객이 특정 상품을 구매할 가능성 판단


랜덤 포레스트(Random Forest)

랜덤 포레스트는 여러 개의 결정 트리를 조합하여 더 강력한 분류 모델을 만드는 앙상블 학습 기법이다. 각 트리가 독립적으로 학습한 후, 최종적인 예측을 투표 방식(Majority Voting) 으로 결정한다.

랜덤 포레스트의 장점
(1) 과적합 방지 → 여러 개의 트리를 조합하므로 특정 데이터에 과적합되는 위험 감소
(2) 강력한 성능 → 단일 결정 트리보다 훨씬 높은 예측 성능 제공
(3) 다양한 데이터 처리 가능 → 수치형/범주형 데이터 모두 처리 가능

랜덤 포레스트의 실무 활용:

부동산 가격 예측 → 아파트의 위치, 면적, 건축 연도 등을 고려하여 가격 예측
이커머스 추천 시스템 → 고객의 이전 구매 이력을 기반으로 제품 추천
의료 산업 → 환자의 유전자 데이터 분석 및 질병 예측


분류 모델 평가 방법 (딥러닝에도 적용됨)

머신러닝 모델을 만들었다면, 얼마나 성능이 좋은지 평가해야 한다. 특히 정확한 예측이 중요한 의료, 금융 분야에서는 평가 지표를 제대로 이해하는 것이 필수적이다.

(1) 혼동 행렬 (Confusion Matrix): 분류 모델의 성능을 평가할 때 가장 중요한 개념이 혼동 행렬(Confusion Matrix) 이다.

 

 

  • TP (True Positive): 실제 1인 데이터를 정확히 1로 예측한 경우
  • FP (False Positive): 실제 0인데 1로 잘못 예측한 경우
  • FN (False Negative): 실제 1인데 0으로 잘못 예측한 경우
  • TN (True Negative): 실제 0인 데이터를 정확히 0으로 예측한 경우

예제 - 질병 진단 모델

  • TP → 환자가 실제로 질병이 있고 모델도 질병이 있다고 예측
  • FP → 건강한 사람을 질병이 있다고 잘못 예측
  • FN → 실제로 질병이 있는데 모델이 건강하다고 잘못 예측
  • TN → 건강한 사람을 건강하다고 정확히 예측

(2) 정밀도(Precision), 재현율(Recall), F1-score

머신러닝에서 정확도(Accuracy)만 보는 것은 위험하다. 특히 의료 및 금융 분야에서는 정밀도와 재현율이 훨씬 중요하다.

정밀도(Precision): 모델이 "1"이라고 예측한 것 중에서 실제로 1인 데이터 비율

 

재현율(Recall): 실제 1인 데이터 중에서 모델이 1로 잘 예측한 비율

F1-score: Precision과 Recall의 조화 평균

 

✅ 의료 분야에서는 FP(거짓 양성)보다 FN(거짓 음성)이 더 위험하다.
✅ 금융 사기 탐지에서는 Precision이 높은 모델이 더 중요하다.