본문 바로가기

데이터 AI 인사이트 👩🏻‍💻/정리노트13

파이썬 자료구조 - 튜플, 딕셔너리, set, 리스트, 클래스, 객체지향언어 특징 1. 리스트(List)리스트는 여러 값을 하나의 변수에 순서대로 저장할 수 있는 데이터 구조입니다. 리스트는 가변적이며, 중복된 값도 저장할 수 있습니다.표현 방법: [ ] 대괄호를 사용합니다.특징:순서(인덱스)가 있다: 요소는 인덱스를 통해 접근할 수 있습니다.가변성(Mutable): 리스트의 요소를 추가, 삭제, 수정할 수 있습니다.중복 허용: 리스트는 같은 값을 여러 번 포함할 수 있습니다.사용 예시:fruits = ['apple', 'banana', 'cherry'] fruits.append('orange') # 요소 추가 print(fruits) # 출력: ['apple', 'banana', 'cherry', 'orange'] 2. 튜플(Tuple)튜플은 리스트와 비슷하지만, 값이 **불변(im.. 2025. 1. 28.
딥러닝 학습 순서 딥러닝 학습은 기초 수학 → 프로그래밍 → 신경망 원리 → 컴퓨터 비전 → 고급 모델 구현의 순서로 진행하는 것이 효과적이다. 각각의 단계를 차례대로 익히고, 이론과 실습을 병행하면서 이해도를 높이는 것이 중요하다. 1. 기본적인 수학 개념딥러닝의 기반은 수학이다. 데이터를 다루고 모델을 훈련시키기 위해 반드시 알아야 한다.선형대수: 벡터, 행렬 연산, 행렬 곱, 전치 등을 이해해야 한다.미분과 편미분: 딥러닝 모델에서 손실 함수(오차)를 줄이기 위한 경사 하강법(Gradient Descent)을 이해하는 데 필요하다.확률과 통계: 데이터의 분포를 이해하고, 모델의 성능 평가에 사용된다.학습 방법: 간단한 예제를 통해 벡터 연산, 경사 하강법, 확률 분포를 계산해보는 연습을 한다. 2. 파이썬과 라이브러.. 2025. 1. 16.
K-Nearest Neighbors (KNN) K-Nearest Neighbors(KNN)는 거리 기반 학습 알고리즘으로, 새 데이터 포인트의 분류(Classification)나 회귀(Regression)를 위해 가장 가까운 K개의 데이터 포인트를 참고한다. 비지도 학습처럼 보일 수 있지만, 주로 지도 학습(Supervised Learning)에 속한다.KNN은 학습 단계에서 모델을 생성하지 않고 데이터를 그대로 저장한다. 새로운 데이터 포인트를 분류하거나 값을 예측할 때, 기존 데이터를 기준으로 거리를 계산하여 가장 가까운 이웃 K개의 데이터를 참고한다. 이 이웃들의 다수결이나 평균을 바탕으로 결과를 예측한다. KNN 작동 원리KNN은 새로운 데이터 포인트가 주어졌을 때, 학습 데이터 중 가장 가까운 K개의 이웃을 찾아 이웃의 정보를 기반으로 결과.. 2025. 1. 14.
[GPT랑 공부하기] 이미지 데이터 분석: 기술통계, KNN 분류, 커머스 활용과 네이버 API 연계 인사이트 👩  : 이미지에서 기술통계란?💻 : 이미지에서 기술통계는 이미지 데이터를 요약하고 설명하는 데 사용되는 통계적 기법입니다. 이를 통해 이미지의 주요 특성과 분포를 정량적으로 이해할 수 있습니다. 다음은 이미지에서 기술통계가 적용되는 주요 방법과 개념들입니다:1. 픽셀 값의 기술통계이미지는 픽셀 값의 배열로 구성됩니다. 기술통계는 픽셀 값 분포를 요약하는 데 사용됩니다.최소값 및 최대값: 이미지에서 가장 어두운 픽셀과 가장 밝은 픽셀의 값.평균값: 픽셀 값의 평균으로, 이미지의 전반적인 밝기를 나타냄.중앙값: 픽셀 값의 중앙값으로, 이상치의 영향을 줄임.표준편차: 픽셀 값의 변동성을 나타냄.왜도(Skewness) 및 첨도(Kurtosis): 픽셀 값 분포의 비대칭성과 뾰족함 정도를 측정.2. 히스토그.. 2025. 1. 14.
[GPT랑 공부하기] 컴퓨터 비전과 OpenCV 라이브러리 👩  : 컴퓨터 비전이 뭐야?💻  : 컴퓨터 비전(Computer Vision)은 컴퓨터가 이미지나 영상을 분석하고 이해할 수 있도록 하는 인공지능(AI)의 한 분야입니다. 인간이 눈을 통해 세상을 보고 인지하는 방식처럼, 컴퓨터가 디지털 이미지를 입력받아 그 안에 담긴 정보를 추출하고 해석하는 것을 목표로 합니다.주요 개념과 목표컴퓨터 비전의 핵심은 디지털 이미지나 영상 데이터를 처리하여 유의미한 정보를 생성하는 것입니다. 이를 통해 다음과 같은 작업이 가능해집니다:이미지 인식: 이미지 안의 객체를 식별(예: 얼굴, 자동차, 동물 등).객체 탐지(Object Detection): 이미지나 영상에서 특정 객체의 위치와 종류를 탐지.세그멘테이션(Segmentation): 이미지나 영상을 픽셀 단위로 나.. 2025. 1. 14.
[데이터분석 커리어패스] 어떤 커리어가 나에게 맞을까? 1. 데이터 분석가 (Data Analyst)데이터 직무 중에서 가장 기본 입문 포지션이다. 데이터 분석가는 데이터를 수집하고 정리하며, 이를 바탕으로 기업이 더 나은 의사 결정을 내릴 수 있도록 돕는다. 주로 Excel과 대시보드 작업이 중심이며, 머신러닝 모델은 다루지 않는다. 하는 일: 보고서 작성, 트렌드 분석, 비즈니스 질문에 대한 답변 제공. 주요 도구: Excel, SQL, Tableau/Power BI, Python(기본 통계 및 데이터 정리). 추천 이유: 데이터를 통해 이야기하는 것을 좋아한다면 시작하기 좋은 포지션이다. 2. 데이터 과학자 (Data Scientist)데이터 분석가의 역할을 확장하여 머신러닝과 고급 통계를 활용해 복잡한 문제를 해결한다.  하는 일: 고객 행동 예측 모.. 2025. 1. 10.
[파이썬] Run 안될 때 확인 방법 (가상환경 확인, Print, Run Python File) 어제까지만 해도 문제 없던 코드가 Run을 눌렀을 때 자꾸 에러가 뜨는 것이다 ㅠㅠ 그래서 결국 도움을 요청해서 알아내긴 했는데 여전히 해결되지 않은 에러가 뜨면 스스로 해결하지 못해서 답답하다.Terminal에서 사용하고 있는 가상환경에 들어가야만 작동이 되니, 일단 먼저 conda activate 가상환경이름 을 해주었는지 확인하자. 요즘 파이토치, 미디어파이프를 활용해서 프로젝트를 했었는데, VS Code로 실행하다보면 버전을 못따라가서 충돌하기도 한다고 한다. 그래서 에러가 몇 열에서 나는지 확인하고, print('-----')을 중간에 삽입하여 어디까지 실행이 되는지 확인한다.  그리고 Run에서 'Run Python File'로 돌려보았다.  그랬더니 안되던게 되는 매직이...ㅠㅠ 다음에 안되.. 2024. 12. 29.
[참고사이트] 보고서 작성 보고서 작성 예시 확인하기https://www.kbfg.com/kbresearch/index.do KB경영연구소 www.kbfg.com 2024. 12. 6.
[참고사이트] 파이썬 공부 자료 파이썬 공부1)위키독스 점프투파이썬https://wikidocs.net/24 04-1 함수파이썬에서 함수를 이해하는 것은 매우 중요하다. 먼저 함수란 무엇인지 알아보자. [TOC] ## 함수란 무엇인가? 함수를 설명하기 전에 믹서를 생각해 보자. 우리는 믹서에…wikidocs.net 2)코딩도장https://dojang.io/mod/page/view.php?id=2337 파이썬 코딩 도장: 29.1 Hello, world! 출력 함수 만들기Unit 29. 함수 사용하기 프로그래밍을 하다 보면 들어가는 값만 바뀔 뿐 같은 코드가 계속 반복되는 경우가 많습니다. 특히 같은 코드를 반복해서 작성하면 코드도 길어지고 중간에 실수할 가능성dojang.io 2024. 12. 5.
[참고사이트] 마케팅 최신 소식, 데이터 분석, CIO, Looker 관련 도움되는 사이트마케팅 관련 최신 트렌드 https://www.openads.co.kr/home 오픈애즈오픈애즈www.openads.co.kr “데이터의 길이 세상의 길과 이어지기 위해서” https://community.heartcount.io/ko/being-truly-data-driven-signal-2/ 데이터의 길이 세상의 길과 이어지기 위해서본 웨비나(블로그)에서는 의사결정에 활용할 수 있는 세가지 정보의 원천과 정량적 자료 분석 결과의 세가지 유형을 살펴본 후, 데이터에서 noise와 signal(쓸모있는 패턴)을 구분하는 이론과 실용community.heartcount.io CIO 리포트 소프트웨어 트렌드 (한국어번역) https://www.cio.com/kr/software-devel.. 2024. 12. 5.
[참고사이트] 공모전, 창업 아이디어 및 활용 사례, AI 개발자 모임 사이트 선생님이 추천하는 사이트, 세미나 공모전 정보https://onoffmix.com/ 온오프믹스 :: 모임문화 플랫폼 onoffmix.com 창업 아이디어, 활용사례들https://www.gpters.org/ AI 커뮤니티 - 지피터스챗GPT에 대한 정보와 활용사례를 나누는 커뮤니티입니다.www.gpters.org AI 인공지능 개발자 모임 사이트, AI 전문적인 지식 최신자료http://aidev.co.kr/ AI Dev - 인공지능 개발자 모임 aidev.co.kr 2024. 12. 2.
[교재 복습] 협업 AI 개념과 의미, AI를 이용한 가입자 이탈 조기 발견 프로젝트 1. 폴라니의 역설: 인간의 암묵적 지식은 AI 영역이 아니다.암묵적 지식 - 인간의 영역 (경험, 생각, 능력, 행동)명시적 지식 - AI 활용 영역 (데이터와 정보, 문서, 레코드, 파일)우리가 실제로 일하는 과정에는 체계화하고 자동화하기 어려운 것이 많고, 암묵적이고 직관적인 지식이나 경험에 의존한다. 암묵적 지식은 언어와 시각 등의 형식으로 표현될 수 없는 경험과 학습에 의해 쌓인 지식이다. 체험을 통해 얻은 지식은 말이나 글로 표현하기 어렵다.명시적 지식은 말이나 글로 표현할 수 있고, 특정 매체에 기록할 수 있는 것이다. 우리가 가진 지식이나 경험은 기록되기 어렵기 때문에 명시적 지식으로 그대로 발현시키기 어렵다. 2. 모라벡의 역설: 인간에게는 쉬운 일이 AI는 어렵다.체스와 바둑은 전형적으.. 2024. 11. 17.
[chatbot 관련 기사] 은행과 통신사의 CS 챗봇 도입 사례로 본 AI 챗봇의 미래 https://www.channelnewsasia.com/singapore/focus-what-happens-when-you-contact-bank-or-telco-customer-care-centre-4735346 싱가포르인들이 고객 서비스에 많은 시간을 소비하고 있는 것은 고객 서비스의 효율성이 부족하다는 것을 보여준다. 특히 평균 16.1시간을 대기하는 것은 생산성과 직접 연결된 임금 손실의 원인으로 작용한다. 고객 서비스 개선이 중요하다.고객들이 가장 좌절을 느끼는 요인으로는 문제를 반복해서 설명해야 하는 점(60%)과 여러 부서로의 전화 연결(53%)이 있다. 고객 서비스 과정에서 불필요한 반복을 줄이고, 효율적인 문제 해결 방안을 도입하는 것이 중요하다. 고객에게 동일한 정보를 다시 설명하는 .. 2024. 11. 13.