비즈니스 애널리틱스 II (4) PCA와 차원축소, AutoML, 데이터스케일링, Fit & Transform
Data Grouping 군집x변수가 많을수록 데이터는 분석하기에 유리해진다고 한다. 최근의 문제는 기존에 갖고 있는 변수가지고는 한계가 있는데 그 이유는 개인화된 데이터이기 때문이다. 방문한 접속 빈도수가 얼마나 되고, 가족 수가 몇명인지, 우리 물건을 어떻게 사갈까 세그멘테이션은 가능하지만, 개개인이 뭘 살지는 예측하기가 어렵다. 얼마나 버는지, 가족구성원, 경제상황, 건강상태 세부적인 내용을 모르기 때문에 그룹안에 넣어버리면 초개인화는 불가능하다. 세그멘테이션이라는 군집으로 안되는 것들을 어떻게 더 세그멘테이션 할 수 있는지 찾아야 한다. 리뷰의 내용을 가지고 개인화한다고 하면 국물이 흘렸다고 리뷰를 자주쓴다면 청결함, 까칠함, 우선시하는 것들을 볼 수 있다. 이런 것들까지 분석하는 최고의 도구가 ..
2025. 2. 10.
허깅페이스 주요 역할과 사용법
허깅페이스는 자연어 처리(NLP) 및 AI 모델을 쉽게 활용하고 배포할 수 있도록 하는 플랫폼이다. Transformers 라이브러리, Datasets, Tokenizers, Spaces 등의 다양한 기능을 제공한다. 사용 방법은 크게 사전 학습된 모델 사용, 파인튜닝(Fine-tuning), 데이터셋 활용, 모델 배포로 나눌 수 있다. 🔹 Hugging Face의 주요 역할1. 사전 학습된 모델 제공 (Pretrained Models)대표적으로 BERT, GPT, T5, RoBERTa, Llama 등의 모델이 있음.이미 학습된 모델을 가져와서 새로운 데이터에 맞게 추가 학습(파인튜닝, Fine-tuning) 가능 → 전이 학습을 쉽게 할 수 있도록 지원함. 2. 모델 배포 및 공유 (Model Hu..
2025. 2. 6.
파이썬 자료구조 - 튜플, 딕셔너리, set, 리스트, 클래스, 객체지향언어 특징
1. 리스트(List)리스트는 여러 값을 하나의 변수에 순서대로 저장할 수 있는 데이터 구조입니다. 리스트는 가변적이며, 중복된 값도 저장할 수 있습니다.표현 방법: [ ] 대괄호를 사용합니다.특징:순서(인덱스)가 있다: 요소는 인덱스를 통해 접근할 수 있습니다.가변성(Mutable): 리스트의 요소를 추가, 삭제, 수정할 수 있습니다.중복 허용: 리스트는 같은 값을 여러 번 포함할 수 있습니다.사용 예시:fruits = ['apple', 'banana', 'cherry'] fruits.append('orange') # 요소 추가 print(fruits) # 출력: ['apple', 'banana', 'cherry', 'orange'] 2. 튜플(Tuple)튜플은 리스트와 비슷하지만, 값이 **불변(im..
2025. 1. 28.