본문 바로가기
커리어 노트 📈/KPMG 교육

Business AI 개론 및 IT 산업 혁신 (5)

by Hayley S 2024. 11. 11.

AI 산업 트렌드 및 AI 서비스 활용 방안

AI 기술에서는 동영상 요약 기능이 있다. 영상물은 주로 이미지와 소리로 구성되며, 1초에 27장의 이미지가 연속적으로 구성된 것을 프레임이라고 한다. AI는 이러한 프레임과 소리를 분석해 영상을 요약한다. 하지만 영상은 방대한 양의 데이터를 포함하고 있어, 이미지와 비슷한 작업 같지만 훨씬 많은 데이터량을 처리해야 하는 특징이 있다.

IT 지식은 기술팀과 소통할 수 있는 정도만 알아도 충분하다. 예를 들어, 컴퓨터에는 CPU라는 주 처리 장치가 있으며, 이는 키보드 등의 입력 장치와 연결되어 작업을 처리한다. Q 대기열은 프린터와 같이 먼저 들어온 작업이 먼저 처리되는 FIFO(First In, First Out) 구조를 의미한다. 또한, 컴퓨터는 직렬병렬 코드 구조를 사용하며, 외부 입력 장치와 출력 장치를 제어하는 시스템이다.

GPU는 주로 그래픽 처리와 대량의 연산을 위한 장치로, CPU와 함께 작동한다. 핸드폰과 같은 소형 기기에는 CPU 칩셋이 소형화되어 내장되며, 이와 같은 경우를 임베딩이라고 한다. 이는 기계 안에 또 다른 마이크로 소자나 반도체가 들어가 프로그래밍되는 형태로, 이러한 소형 반도체 기술이 임베디드 시스템에서 사용된다.

현대 인공지능 기술에서는 인공신경망을 만드는 것보다 그걸 서빙(serving)하는 과정이 더 중요하다. 일반적인 인공지능 모델은 0과 1의 비트 단위로 쪼개져 있어서, 이진화된 이후에는 수정이 어렵다. 예를 들어, 신호등에서 노란색을 정지 신호로 학습시켰다고 하자. 그런데 나중에 노란색이 황토색으로 바뀌면, 모델 자체는 수정할 수 있어도 카메라가 받아들이는 데이터를 수정하는 건 쉽지 않다.

이런 문제는 특히 자율주행 자동차에서 많이 발생하는데, 이걸 온보딩(onboarding)이라고 한다. 요즘 인공지능을 서비스로 제공하는 데 있어, 제조 공정에서 카메라를 장착해 불량을 검사하는 기술도 중요하다. 이때 온보딩된 데이터는 나중에 프로그램으로 쉽게 수정할 수 없어서 문제가 생길 수 있다. 예를 들어, 색상이 바뀌었을 때는 이를 해결하기 위해 컴퓨터 비전(Computer Vision) 기술이 필요하다. 자율주행 시스템에서 리눅스를 사용하는 이유는 안정성과 유연성, 그리고 실시간 처리 능력 때문이다. 윈도우는 폐쇄환경이다. OpenCV는 컴퓨터 비전 작업을 위한 필수 도구로, 이미지와 비디오 처리를 실시간으로 수행한다. 리눅스에서 C와 결합해 사용할 경우 성능 최적화가 가능하여, 자율주행 시스템의 요구에 맞는 고성능 비전 모듈을 구현할 수 있다.

컴퓨터 비전 분야에서는 이미지 색상을 수정하거나 변형하는 소프트웨어로 OpenCV(Open Source Computer Vision)라는 도구를 쓴다. 자율주행 분야에서는 이 OpenCV를 다루면서도 C 언어를 쓸 수 있는 사람이 필요하다. 임베디드 반도체 라인에서도 C 언어가 필수적이기 때문에, 자율주행이나 로봇 산업에서 C 언어의 수요가 다시 늘어나고 있다. 최근 들어 기계에 장착되는 시스템들이 많아지면서, 자율주행 자동차나 로봇 같은 분야에서도 C 언어가 중요해진 것이다.

마지막으로, 인공신경망을 만들고 수정하는 과정은 간단하지 않다. 제대로 된 데이터셋을 사용해야 하고, 데이터셋의 형상이 바뀌는 경우에는 OpenCV 같은 컴퓨터 비전 소프트웨어로 수정 작업을 해야 한다.

올해 국내외 디지털 전환 현황은 국가 전략과 기업의 위상에 점진적으로 영향을 미치고 있다. 정부는 대기업과 벤처기업 간의 협업을 권장하고 있으며, 예를 들어 제약회사는 AI 기술을 보유한 벤처기업과 협력해 디지털 혁신을 추진하고 있다. 대기업은 기존 프로세스에 중소기업의 혁신적인 기술을 결합해 시너지를 내도록 유도하고 있다.

의료 분야에서는 이미 어느 정도 인공신경망이 도입되어 있지만, 지속적으로 외부 인력을 통해 기술을 보완하고 있다. 특히, 헬스케어 분야에서는 소규모 회사들이 혁신의 주체로 활약하고 있다.

또한, 고객 서비스(CS) 센터는 대부분 AI를 활용한 자동화 시스템으로 전환되고 있어, 다양한 산업에서 디지털 전환이 가속화되고 있는 모습이다.


인공지능은 특징(feature)에 기반하여 작동한다. 특징이란, 예를 들어 이미지가 있을 때, 그 이미지의 가로와 세로 픽셀값을 표 형태로 나타내는 것을 말한다. 여기서 필터(filter)가 해당 표와 곱셈 연산을 수행하여, 특정 위치의 점이 어떤 색을 가지는지 인식한다. 이 과정을 합성곱(Convolution)이라고 하며, 이를 구현하는 레이어가 Conv2D다. 필터는 이미지의 세로 방향이나 특정 값들을 탐색하고 추출하는 역할을 하며, GPU 연산을 통해 효율적으로 계산된다.

전이학습은 기존에 이미 만들어진 AI 모델을 사용자가 원하는 대로 수정하여 새로운 문제에 적용하는 것을 의미한다. 최근에는 이와 같은 전이학습이 AI 산업의 주요 트렌드로 자리 잡고 있으며, 사용자가 기존의 모델을 바탕으로 빠르게 결과를 도출하거나 성능을 개선할 수 있어 효율적인 접근법으로 각광받고 있다.

컴퓨터 비전 기술은 제조업의 미래에 큰 변화를 가져올 수 있는 핵심 기술로, 객체 인식이미지, 영상, 텍스트 생성 등 다양한 응용이 가능하다. 이러한 기술을 통해 제조업의 자동화 및 품질 관리가 더욱 정교해지고 있다. 또한, 컴퓨터 비전 기술의 발전과 더불어 허깅페이스(Hugging Face) 같은 플랫폼이 등장해, AI 모델을 쉽게 활용할 수 있는 환경이 조성되고 있다.

이루다 AI는 성희롱과 혐오 표현 논란으로 인해 서비스가 중단된 사례로, AI 모델이 편향된 데이터를 학습할 때 발생할 수 있는 문제를 보여준다. 이는 AI 모델이 다양한 데이터를 학습하면서 사회적 책임과 윤리적 문제를 고려해야 한다는 필요성을 제기하고 있다.

AI 기술 중 GAN(생성적 적대 신경망)은 이미지나 텍스트와 같은 콘텐츠 생성에 주로 사용되며, 다양한 분야에서 콘텐츠를 자동으로 생성하거나 변형하는 데 활용된다.

큰 기업들은 AI를 단순히 도입하기 어렵다. 예를 들어 LGCNS와 같은 대기업은 AI 플랫폼을 어떻게 도입하고 활용할지 깊이 고민하고 있다. 이와 관련해, 최근 주목받는 기술은 디지털 트윈으로, 이는 실제 환경을 가상으로 재현해 소방훈련과 같은 상황을 시뮬레이션하는 데 사용된다. 이를 통해 기업들은 현실적이고 효율적인 교육과 테스트 환경을 구축할 수 있다.

유니티(Unity)와 언리얼 엔진(Unreal Engine)은 대표적인 게임 개발 소프트웨어로, 게임을 만들기 위해서는 기획자들이 배경, 스토리, 물리 계산 등의 작업을 협력하여 기획한다. 게임 개발은 이러한 다양한 기획자들이 협력해 프로그래밍 작업을 완성해야 하므로, 복잡한 협업 과정이 필요하다. 특히, 여러 명의 사용자가 동시 접속하는 온라인 게임의 경우, 서버와 네트워크를 잘 다룰 수 있는 프로그래머가 중요하다. 게임 회사에서는 해당 게임에 대한 깊은 이해와 관심이 중요하며, 이를 바탕으로 고객 홈페이지에서 이벤트 확인 등의 세부적인 이해와 분석도 필요하다.

ARVR 기술은 현재 가장 주목받는 분야 중 하나다. 특히 VR의 경우, 무거운 장비를 간소화하는 것이 주요 과제로 남아 있다. VR 장비의 무게와 크기를 줄이려는 노력이 필요하며, 이런 문제를 해결하기 위해 콘텐츠 개발과 기기 설계가 중요한 역할을 한다. 사용자가 기기를 쉽게 착용하고 이용할 수 있도록 만드는 것이 이 기술의 대중화와 관련된 핵심 과제다.

메타(Meta)에서 출시한 퀘스트3는 가상과 현실을 혼합한 형태의 장비로, 무선 기능과 가벼운 무게 덕분에 사용성을 크게 개선한 제품이다. 이러한 장비들은 단순히 게임을 넘어 다양한 콘텐츠 산업으로 확장되고 있으며, 교육이나 훈련과 같은 수업에서도 적극적으로 활용될 전망이다.

이렇게 정리된 내용을 통해, 현재 AI와 디지털 기술의 발전이 제조업, 게임 산업, AR/VR, 디지털 트윈 등 다양한 분야에서 어떻게 적용되고 있는지 이해할 수 있다.


헬스케어는 현재 AI 분야에서 가장 주목받는 영역이다. 예를 들어, 당뇨 측정 웨어러블 기기와 같은 기술이 개발되고 있으며, 이를 통해 실시간 건강 모니터링이 가능해지고 있다. 또한, AI 챗봇을 활용한 상담 서비스도 의료 분야에서 활발히 도입되고 있어, 환자들에게 맞춤형 의료 상담을 제공하는 데 큰 역할을 하고 있다.

우수사례 TensorFlow

https://www.tensorflow.org/about/case-studies?hl=ko

객체 감지 태스크 가이드 (Google)

https://ai.google.dev/edge/mediapipe/solutions/vision/object_detector?hl=ko&_gl=1*138d4q*_up*MQ.._gaMTA3Nzk4Mzc0MS4xNzI5MjI5ODUx*_ga_P1DBVKWT6V*MTcyOTIyOTg1MC4xLjAuMTcyOTIyOTg1MC4wLjAuNTgxMzM4NDQ4

SK 하이닉스 기술블로그

https://news.skhynix.co.kr/post/all-around-ai-2

 

[All Around AI 2편] AI 알고리즘의 기본 개념과 작동 원리

인공지능이란 특정 목적을 위해 설계된 컴퓨터 알고리즘으로, 주어진 입력에 기반해 자동으로 과업을 처리한다. 이는 개발자가 직접 컴퓨터에 알고리즘을 입력하는 기존의 방법과 달리, 데이터

news.skhynix.co.kr

 

 

선은 파라미터(매개변수)를 의미한다.

이 선을 통해 데이터가 전달된다고 생각하면 된다. 파라미터가 많으면 많을수록 더 많은 경우의 수를 고려할 수 있게 된다.

우리는 데이터를 이용해 예측값을 계산하고, 이 과정에서 여러 가지 경우의 수를 만들어낸다.

여기서 'W' 값은 예측1 * W + 예측2 * W + ... 이런 식으로 계산되고, 이것은 신경망의 중간 단계인 '히든 레이어'에서 이루어진다.

딥러닝에서는 간단한 수식(wx + b)을 사용해서 데이터를 처리한다. 여기서 'w'는 가중치(weight), 'x'는 입력값, 'b'는 편향(bias)이다. 이 수식을 통해 모델은 최종적으로 하나의 예측값을 만들어내게 된다.

쉽게 말해서, 우리가 원하는 것은 새로운 입력 값(X)을 사용해서 최종적으로 하나의 결과값(예측값)을 얻는다. 예를 들어, 우리가 실제 데이터를 분석하다 보면, 최종적으로 100이라는 값이 나올 것이라고 예측할 수 있다.

여기서 'W'는 한 번만 계산된다. 예를 들어, 온도나 지역 같은 여러 변수들이 있을 때, 이 변수들 각각에 가중치(W)를 곱해서 하나의 결과 값을 얻게 된다. 이렇게 나온 값 하나만 사용하지 않고, 여러 중간 결과를 더해서 또 다른 결과를 만들어내기도 한다.

파라미터의 개수가 얼마나 많든지 간에, 결국에는 최종적으로 하나의 예측값을 얻는 게 목표다.

예를 들어, 입력 변수의 개수가 6개라면 (INPUT_SHAPE(6)), 이들을 이용해 5개 혹은 6개의 레이어를 거쳐 계산을 진행한다.

 

e1= 에폭값

모델을 돌리다보면 한번씩 튀는 경우가 있다.

TensorFlow

https://brunch.co.kr/@andrewhwan/53

MediaPipe Solutions

https://ai.google.dev/edge/mediapipe/solutions/guide?hl=ko

기술을 갖다 쓰는게 중요하고 6개월 배우면 할 수 있고, 유니티도 3개월이면 한다.

 

PPT [AI 기획] 아이디어 차원

  • 우리의 아이디어가 왜 필요한가?
  • 아이디어 타당성/시장성/유사제품 또는 플랫폼
  • 데이터셋 구성에 필요한 제약사항
  • 기술구현 시 이 아이디어만의 특이사항(타제품과의 차별성)
  • 기술검증에 대한 방안
  • 마케팅 전략 - GPT로 만들기