데이터 분석 및 인공지능 👩🏻💻
-
[딥러닝 프로젝트] LSTM 기반 운동 동작 인식: 미디어파이프 활용
이 프로젝트는 MediaPipe와 LSTM(Long Short-Term Memory) 모델을 활용하여 사람의 운동 동작(등, 스쿼트, 옆구리)을 인식하는 시스템을 구축하는 것을 목표로 하였다. 주요 단계는 데이터 수집 및 전처리, 모델 학습, 그리고 실시간 동작 인식으로 구성된다.✅ MediaPipe → 실시간 관절 좌표 추출✅ LSTM 모델 → 운동 동작을 시계열 데이터로 학습✅ OpenCV → 웹캠 영상 처리 및 GUI 구성✅ NumPy & Pandas → 데이터 전처리 및 저장코드 및 데이터: https://github.com/haewon1219/lstm-motion-recognition1. 데이터 수집과 전처리motion_data.py 스크립트는 OpenCV를 활용하여 웹캠에서 실시간으로 프레임을..
2025.02.06
-
비즈니스 애널리틱스 I (1) 추천시스템, 파이썬 자료구조, 네이버 API 연결
추천시스템비슷한 취향의 사람을 연결해주는 것이다. 넷플릭스라면 유사도가 비슷한 사람이 본 것을 보여준다. 우리가 구현을 못하는 이유는 실제 데이터가 없으면 구현을 못한다. 파이썬이 제공하는 모듈로는 택도 없다. 파이썬이 제공하는 모듈로 추천시스템을 구현안한다. 일반 모듈로는 못쓴다. 거기다가 플러스해서 붙여야한다. 그런 부분들은 추천으로 해서 잘 됐는지는 실제 데이터가 필요하다. 추천시스템은 데이터를 가지고 어떤 알고리즘을 쓰는지가 중요하다. 시중에 나와있는 알고리즘이 아닌 다른 요소들을 찾아내야 한다. 넷플릭스는 사용자 취향에 따라서 추천해주는데 한국이라면 계절도 있고 다른 요소들도 있다.설계라는 것은 엄청 나게 많이 알아야 할 수 있는 것이다. 쓸데 없는 설계는 안하는게 낫다. 이론으로 완전 무장하면..
2025.01.26
-
비즈니스 애널리틱스 I (2) 네이버 API 활용을 통한 데이터 수집, 전처리, 분석, 시각화
네이버 API 검색import requestsimport pandas as pd# 네이버 개발자 센터에서 발급받은 클라이언트 ID와 시크릿을 입력합니다.client_id = 'Your ID'client_secret = 'Your Password'query = '직장인'url = 'https://openapi.naver.com/v1/search/shop.json' # 쇼핑몰# 요청 헤더에 인증 정보를 추가합니다.headers = { 'X-Naver-Client-Id': client_id, 'X-Naver-Client-Secret': client_secret}params = { "query": query, "display": 100}# API에 GET 요청을 보냅니다.response ..
2025.01.26
Recent posts ⚡️
-
비즈니스 애널리틱스 II (7) 분류 분석 및 평가
분류 분석(Classification Analysis)분류 분석은 머신러닝에서 가장 중요한 알고리즘 중 하나이며, 이산적인 값(Discrete Value) 을 예측하는 데 사용된다. 즉, 데이터가 특정 그룹(클래스)에 속하는지 여부를 판단하는 것이 핵심이다.예를 들어:이메일이 스팸(1)인지 아닌지(0) 분류하는 문제환자가 암에 걸렸는지(Yes) 아닌지(No) 예측하는 모델고객이 이탈할 가능성이 높은지(High) 아닌지(Low) 예측하는 분석실무 활용 예제:✅ 금융 산업 → 신용 카드 사기 탐지 (Fraud Detection)✅ 이커머스 → 고객이 상품을 구매할 가능성이 있는지 예측✅ 의료 분야 → 환자가 특정 질병을 가질 확률 예측✅ 제조업 → 제품의 불량 여부 예측분류 모델은 비즈니스 의사 결정을 내리..
2025.02.13
-
KPMG 과정 마지막 날 일기
오늘 KPMG 마지막 날이다.. 며칠 전부터 계속 이제 끝이라는 생각이 들면서 많이 먹먹해지고 아쉬운 감정이 들었다.날짜를 세어보니 딱 4개월이었다. 작년 10월, 이 과정을 들을지 말지 고민을 많이 했었다. 영국에서 취준을 포기하고 귀국하는 길에 싱가포르에서 IT 영업직군을 지원해보려고 6주 간 싱가포르에서 지낸 뒤, 9월이 가까워져서야 한국으로 들어왔다.한국 들어와서는 장성 집에서 지내면서 도서관에서 컨택할 교수님 리스트를 짰고, 마음 속에서 계속 일렁이는 자기불확신과 불안함 때문에 힘들었다. 박사가 하는 일을 잘 알지 못했고, 내가 학계에 맞는 사람인지도 모르겠었고, 어떤 학교 / 교수님 / 전공 / 대학원을 가야할지 모르겠어서 계속 되는 물음표 속에서 살아야 했다.그러다가 KPMG 과정 광고를 인..
2025.02.13
-
비즈니스 애널리틱스 II (6) 회귀분석, XGBoost 등 최신 빅데이터 기법
회귀 분석(Regression Analysis)회귀 분석은 머신러닝과 통계학에서 가장 기본적이면서도 중요한 기법이다. 데이터의 패턴을 학습하여, 연속형 값(숫자)을 예측하는 데 사용된다. 머신러닝 모델 중에서도 가장 해석이 쉬우며, 데이터가 어떻게 변화하는지 설명하는 데 탁월하다.회귀 분석이 중요한 이유는 "변수 간의 관계를 파악하고 미래 값을 예측" 하는 데 있다. 예를 들어, 고객의 소비 습관을 분석하고 마케팅 전략을 세울 때, 매출을 예측하는 모델이 필요하다. 단순한 가정이 아니라, 데이터 기반의 의사 결정을 내릴 수 있도록 도와주는 것이 회귀 분석의 역할이다.실제 비즈니스에서의 활용 범위는 매우 넓다.✅ 부동산 - 아파트 크기에 따른 가격 예측✅ 금융 - 고객 신용 점수 기반 대출 승인 여부 예측..
2025.02.13
-
비즈니스 애널리틱스 II (5) 분산, 공분산, PCA, 추천시스템
분산, 공분산, 상관계수특징 추출은 데이터를 간단하게 만들면서도 중요한 정보를 뽑아내는 과정이다. 쉽게 말해, 데이터를 잘 살펴보고 비슷한 성질을 가진 것들을 한 방향으로 묶어주는 작업이라고 생각하면 된다. 이 과정을 통해 데이터의 본질을 더 잘 파악하거나 분석하기 쉽게 만들 수 있다.벡터는 어떤 변수에 대해 크기와 방향을 가진 것을 뜻한다. 데이터 분석에서는 벡터를 이용해 변수들 간의 관계를 표현하거나, 비슷한 방향을 가진 데이터끼리 묶는 데 사용한다. 즉, 데이터가 어떤 방향성을 가지고 있는지 확인해서 그룹을 나눌 때 벡터가 중요한 역할을 한다.PCA(주성분 분석)는 데이터를 차원 축소하면서도 중요한 정보를 최대한 유지하는 방법이다. 데이터를 살펴보면 어떤 방향으로 가장 많이 퍼져 있는지를 알 수 있..
2025.02.10
-
비즈니스 애널리틱스 II (4) PCA와 차원축소, AutoML, 데이터스케일링, Fit & Transform
Data Grouping 군집x변수가 많을수록 데이터는 분석하기에 유리해진다고 한다. 최근의 문제는 기존에 갖고 있는 변수가지고는 한계가 있는데 그 이유는 개인화된 데이터이기 때문이다. 방문한 접속 빈도수가 얼마나 되고, 가족 수가 몇명인지, 우리 물건을 어떻게 사갈까 세그멘테이션은 가능하지만, 개개인이 뭘 살지는 예측하기가 어렵다. 얼마나 버는지, 가족구성원, 경제상황, 건강상태 세부적인 내용을 모르기 때문에 그룹안에 넣어버리면 초개인화는 불가능하다. 세그멘테이션이라는 군집으로 안되는 것들을 어떻게 더 세그멘테이션 할 수 있는지 찾아야 한다. 리뷰의 내용을 가지고 개인화한다고 하면 국물이 흘렸다고 리뷰를 자주쓴다면 청결함, 까칠함, 우선시하는 것들을 볼 수 있다. 이런 것들까지 분석하는 최고의 도구가 ..
2025.02.10