전체 글 148

여름방학 시작 & 지도교수님의 첫 피드백

부산에서 열린 KrAIS 학회에 다녀왔다. 해외 교수님들, 박사생들이 많이 참여해서 좋은 발표를 많이 들을 수 있다고 해서 망설임없이 바로 등록했었다. 다녀오고 나서는 많은 걸 느끼고 배울 수 있어서 너무 의미깊은 시간이었다.박사생이 된지 딱 4개월이 지났다. 처음 맞이하는 여름방학이 시작되었다. 연구실은 바닥공사와 가구구매 전이라 사용이 어려우니까 아마도 학교에 나가기 보다는 집과 장성을 오가면서 가끔 중앙도서관에 갈 것 같다.학회에서 지도교수님과 잠깐 대화를 나눌 수 있는 타이밍이 있었다. 그간 궁금했었던 피드백과 앞으로의 방향성에 대해 들을 수 있었다. 교수님도 어쩌면 내가 먼저 찾아뵙고 여쭤보기를 바라셨던 것 같기도 하다. 앞으로는 좀 더 당당하게 질문도 많이 하고, 적극적인 자세를 취해야겠다. ..

슬기로운 박사과정 생활

1학기 박사생의 일상은 ~~ 혼밥먹기 달인이 되기도 하고, 도서관이 지겨울 때는 카페를 전전하기도 한다 :) 길고 긴 겨울이 지나서 봄이 되고, 축제 풍경을 보게 되었다. (물론 나는 축제를 1도 즐기지 못함) 남자친구가 학교로 놀러와줘서 같이 학식 점심을 먹었다. 학식은 왤케 다 맛있는지.. 가격도 넘 착하고!남자친구는 이직을 하게 되어서 퇴사 후 3주 동안 휴가기간을 보냈었다. 그 동안 학교에도 몇번 같이 와줘서 밥도 먹고, 학교 구경도 했다. 축제 풍경을 오랜만에 보니 옛날 생각도 떠오르고, 젊음이 느껴져서 새로웠다.. 신기했다.. 연세 = 파랑 🩵 학교 굿즈 사모으기 달인이 되었다. 공책하나 볼펜하나 다 연세대학교ㅎㅎㅎ 그냥 소속감이 느껴져서 좋다. 가격도 저렴하구! 연구에 필요한..

25년 6월 어떻게 잘 끝나간다

논문 투고부터 수업3개 발표랑 과제제출 다 몰려있던 6월...🫠6월이 시작되고 이 한달을 어떻게 버티나 했었다. 그치만 하나하나 끝내다보니 어느덧 부산에 가는 날이 돌아왔다.하루에 4시간 자면서 했더니 머리도 많이 빠지는 것 같고, 체력도 떨어졌었다. 미뤄서 생긴 일은 아니라서 박사기간동안 이런 생활이 계속될 것 같아 불안함이 엄습하기도 했다.그래도 내 이름으로 내 성과를 이뤄가는 과정에 바닥부터 시작해서 빠르게 배우고 성장한 기분이 무엇과도 바꿀 수 없다.내가 가는 이 길이, 이 업이 나와 점점 맞아가는 느낌이다.열심히해도 내 것 같지 않던 날들, 업무에 주인의식을 가지면 오히려 질책받던 날들, 성장하고 싶지만 억누르던 환경들.. 그런 날들이 있었기 때문에 지금 가는 길에 감사함을 가질 수 있는 것 ..

박사일기 | 흰 도화지 하나 들고온 나

3월 13일 목요일2주차가 끝나간다. 너무나도 어색했던 박사생이라는 타이틀과 연세대학교 교정과 이름, 그냥 모든 것들.집에 돌아가는 길이 헷갈려서 네비만 무작정 따라가다가 서울숲까지도 가보고, 한강따라 가보기도 했다. 새로운 것들에 대한 거부감이 심한 편이 아니라고 스스로 생각했으나, 여전히 익숙하지 못하고 새로운 것들에 대한 두려움은 존재했다.나 뿐만 아니라 교수님도 신임교수님이시기에 항상 바빠보이시고, 긴장하신 듯 보였다. 내가 도와드릴 수 있는게 뭘까 생각하다가 가끔씩 조심스럽게 교수님께 도와드릴게 있는지 여쭤보면 항상 없다고 하신다. 간단한 사무일조차도 스스로 처리하시는게 편하신건지 아니면 박사생에게 부담을 주기 싫으신건지 모르겠지만, 선하시고 배려를 많이 해주신다는 건 느껴진다.아직도 KCI 논..

비즈니스 애널리틱스 II (7) 분류 분석 및 평가

분류 분석(Classification Analysis)분류 분석은 머신러닝에서 가장 중요한 알고리즘 중 하나이며, 이산적인 값(Discrete Value) 을 예측하는 데 사용된다. 즉, 데이터가 특정 그룹(클래스)에 속하는지 여부를 판단하는 것이 핵심이다.예를 들어:이메일이 스팸(1)인지 아닌지(0) 분류하는 문제환자가 암에 걸렸는지(Yes) 아닌지(No) 예측하는 모델고객이 이탈할 가능성이 높은지(High) 아닌지(Low) 예측하는 분석실무 활용 예제:✅ 금융 산업 → 신용 카드 사기 탐지 (Fraud Detection)✅ 이커머스 → 고객이 상품을 구매할 가능성이 있는지 예측✅ 의료 분야 → 환자가 특정 질병을 가질 확률 예측✅ 제조업 → 제품의 불량 여부 예측분류 모델은 비즈니스 의사 결정을 내리..

KPMG 과정 마지막 날 일기

오늘 KPMG 마지막 날이다.. 며칠 전부터 계속 이제 끝이라는 생각이 들면서 많이 먹먹해지고 아쉬운 감정이 들었다.날짜를 세어보니 딱 4개월이었다. 작년 10월, 이 과정을 들을지 말지 고민을 많이 했었다. 영국에서 취준을 포기하고 귀국하는 길에 싱가포르에서 IT 영업직군을 지원해보려고 6주 간 싱가포르에서 지낸 뒤, 9월이 가까워져서야 한국으로 들어왔다.한국 들어와서는 장성 집에서 지내면서 도서관에서 컨택할 교수님 리스트를 짰고, 마음 속에서 계속 일렁이는 자기불확신과 불안함 때문에 힘들었다. 박사가 하는 일을 잘 알지 못했고, 내가 학계에 맞는 사람인지도 모르겠었고, 어떤 학교 / 교수님 / 전공 / 대학원을 가야할지 모르겠어서 계속 되는 물음표 속에서 살아야 했다.그러다가 KPMG 과정 광고를 인..

비즈니스 애널리틱스 II (6) 회귀분석, XGBoost 등 최신 빅데이터 기법

회귀 분석(Regression Analysis)회귀 분석은 머신러닝과 통계학에서 가장 기본적이면서도 중요한 기법이다. 데이터의 패턴을 학습하여, 연속형 값(숫자)을 예측하는 데 사용된다. 머신러닝 모델 중에서도 가장 해석이 쉬우며, 데이터가 어떻게 변화하는지 설명하는 데 탁월하다.회귀 분석이 중요한 이유는 "변수 간의 관계를 파악하고 미래 값을 예측" 하는 데 있다. 예를 들어, 고객의 소비 습관을 분석하고 마케팅 전략을 세울 때, 매출을 예측하는 모델이 필요하다. 단순한 가정이 아니라, 데이터 기반의 의사 결정을 내릴 수 있도록 도와주는 것이 회귀 분석의 역할이다.실제 비즈니스에서의 활용 범위는 매우 넓다.✅ 부동산 - 아파트 크기에 따른 가격 예측✅ 금융 - 고객 신용 점수 기반 대출 승인 여부 예측..

비즈니스 애널리틱스 II (5) 분산, 공분산, PCA, 추천시스템

분산, 공분산, 상관계수특징 추출은 데이터를 간단하게 만들면서도 중요한 정보를 뽑아내는 과정이다. 쉽게 말해, 데이터를 잘 살펴보고 비슷한 성질을 가진 것들을 한 방향으로 묶어주는 작업이라고 생각하면 된다. 이 과정을 통해 데이터의 본질을 더 잘 파악하거나 분석하기 쉽게 만들 수 있다.벡터는 어떤 변수에 대해 크기와 방향을 가진 것을 뜻한다. 데이터 분석에서는 벡터를 이용해 변수들 간의 관계를 표현하거나, 비슷한 방향을 가진 데이터끼리 묶는 데 사용한다. 즉, 데이터가 어떤 방향성을 가지고 있는지 확인해서 그룹을 나눌 때 벡터가 중요한 역할을 한다.PCA(주성분 분석)는 데이터를 차원 축소하면서도 중요한 정보를 최대한 유지하는 방법이다. 데이터를 살펴보면 어떤 방향으로 가장 많이 퍼져 있는지를 알 수 있..

비즈니스 애널리틱스 II (4) PCA와 차원축소, AutoML, 데이터스케일링, Fit & Transform

Data Grouping 군집x변수가 많을수록 데이터는 분석하기에 유리해진다고 한다. 최근의 문제는 기존에 갖고 있는 변수가지고는 한계가 있는데 그 이유는 개인화된 데이터이기 때문이다. 방문한 접속 빈도수가 얼마나 되고, 가족 수가 몇명인지, 우리 물건을 어떻게 사갈까 세그멘테이션은 가능하지만, 개개인이 뭘 살지는 예측하기가 어렵다. 얼마나 버는지, 가족구성원, 경제상황, 건강상태 세부적인 내용을 모르기 때문에 그룹안에 넣어버리면 초개인화는 불가능하다. 세그멘테이션이라는 군집으로 안되는 것들을 어떻게 더 세그멘테이션 할 수 있는지 찾아야 한다. 리뷰의 내용을 가지고 개인화한다고 하면 국물이 흘렸다고 리뷰를 자주쓴다면 청결함, 까칠함, 우선시하는 것들을 볼 수 있다. 이런 것들까지 분석하는 최고의 도구가 ..

비즈니스 애널리틱스 II (3) K-means, 유사도 계산, 단위 벡터

SPSS/SASS 통계 소프트웨어spss에서 세그멘테이션, RFM, kmeans 할 수 있다.spss는 통계전문 소프트웨어 / 드래그앤드롭만 해도 해준다. / 시각화가 안되서 별도의 툴로 해야한다.RFM 분석 : 접근 빈도성으로 고객을 분류해주는 방법론통계만 전문적으로 하는 리서치 회사들한테 별거 아닌데도 외주로 줄만큼 회사 내부에서는 분석관련한 작업을 거의 하지 않는다. 분석안하고 판매 집계 작업만 한다. 심도 있는 분석인 회사에서 하지 않는다.이제는 SPSS나 SASS 처럼 비용을 내지 않는 파이썬으로 작업이 가능하다는 것이다. 기술반이면 오늘 벡터나 넘파이 (한달내내한다), 리스트 얘기하고 있을거다. 넘파이를 정확히 알고 있는지 질문공세를 엄청한다. 아무리 포트폴리오를 해놨다고 해도 신뢰가 백프로 ..