WeniVooks

검색

생성형 AI와 Notion으로 배우는 디지털 전환 실무

인공지능과 머신러닝

1. 인공지능이란?

인공지능(AI, Artificial Intelligence)은 컴퓨터가 사람처럼 생각하고 행동하게 만드는 기술입니다. 인공지능의 의미는 기술 진보에 따라, 대중의 기대에 따라 달라져왔습니다. 예를 들어, 예전에는 자판기도 ‘인공지능 자판기’였고 ‘세탁소’도 ‘인공지능 세탁소’였죠. 초기에는 단순한 자동화도 인공지능의 일부로 여겨졌지만, 오늘날의 인공지능은 훨씬 더 복잡하고 정교한 작업을 수행할 수 있는 수준에 도달했습니다.

현대의 인공지능 기술은 단순히 인간의 인지 능력을 모방하는 것을 넘어서, 때로는 인간의 인지 능력을 뛰어넘는 결과를 보여주고 있습니다. 특히 생성형 AI의 발전으로 인공지능을 활용하여 창의적이고 복잡한 작업을 수행할 수 있게 되었습니다. 이러한 AI의 다재다능한 능력은 다양한 산업 분야에 혁신을 일으키고 있으며, 인간의 창의성과 AI의 효율성이 결합하여 새로운 패러다임을 창출하고 있습니다. 생성형 AI가 인간의 창의성과 어떻게 시너지를 발휘하고 있는지 간략한 사례를 소개하겠습니다.

출판 업계는 ChatGPT가 가장 큰 영향력을 끼치는 분야 가운데 하나가 되었습니다. 많은 서적들이 GPT의 도움으로 빠르게 출판되고 있습니다. 저희도 출판사가 있어 GPT와 미드저니를 활용한 동화책을 2023년에 1권 출간했으며, 2024년 2권 출판이 예정되어 있습니다. 한국의 카카오브레인이라는 회사는 시 쓰는 AI 모델 ‘SIA’를 개발하여 2022년 첫 시집을 출간하였습니다.

카카오 브레인에서 출간한 AI 시집

한국에서는 웹툰 채색, 말풍선 지우기 등도 AI를 활용합니다. 네이버웹툰은 웹툰 작가들이 단순 반복작업을 빠르게 해낼 수 있도록 제작툴을 개발했습니다. 이번 장에서는 네이버웹툰의 채색 프로그램을 실습해보도록 하겠습니다. 여러분도 네이버 가입 후 무료로 실습해보실 수 있습니다.

링크: https://ai.webtoons.com/ko/painter

채색 전

채색 후

위의 캐릭터는 한국에서 크게 인기를 끌었던 웹툰 ‘유미의 세포들’의 주인공 유미입니다. 유미의 스케치를 채색해보았습니다. 좌측 상단의 ‘채색하기’라는 버튼을 클릭한 후, 채색을 희망하는 부분을 세 번 클릭하여 얼굴과 머리 채색을 완성하였습니다. 클릭 10번이면 간략한 채색은 끝낼 수 있습니다.

생성형 AI를 활용하여 그림이 아닌 사진도 만들 수 있습니다. 아래 이미지는 NVIDIA가 발표한 CANVAS라는 툴을 이용하여 필자가 직접 그림을 그린 것을 캡쳐한 것입니다. 왼쪽에는 필자가 원하는 느낌을 간단한 그림으로 그린 것이고, 오른쪽은 CANVAS가 그림을 사진으로 정교하게 만들어낸 것입니다.

ChatGPT에는 GPT Store라는 기능이 있습니다. ChatGPT를 통해 맞춤형 챗봇을 개발하고, 이를 다른 사용자들과 공유하고 판매할 수 있는 서비스입니다. GPT Store의 인기 1순위는 ‘가상 여자친구 AI’라는 사실을 아시나요? AI와 사랑에 빠지는 ‘Her’라는 영화는 우리 생활에도 일어날 수 있는 일로 다가와 있습니다.

이와 같은 채팅 앱 중 가장 한국에서 유명한 캐릭터는 ‘이루다’입니다. 이루다는 2020년도에 출시되었습니다. 누가 사람이고, 누가 기계인지 모를 정도로 완벽한 대화를 지원하여 화제가 되었습니다. 다음은 제가 페이스북에서 이루다와 대화를 한 내용입니다.

지금은 이루다 말고도 취향에 맞게 여러 캐릭터 중 하나를 선택하여 대화를 나눌 수 있게 되어있습니다.

https://zeta-ai.io/ko

이번에는 영상 분야를 살펴보도록 하겠습니다. OpenAI에서 발표한 Sora는 이미 생성형 AI의 생산 품질이 인간이 생산해낼 수 있는 영상의 한계를 아득히 뛰어 넘었음을 보여줍니다. Sora는 텍스트를 기반으로 영상으로 만드는 모델입니다. 사진으로 보는 것보다 직접 접속(https://youtu.be/HK6y8DAPN_0)해서 보시는 것을 권해드립니다.

Sora를 이용한 뮤직비디오, 광고는 이미 나오고 있습니다. 그 파급력 또한 ChatGPT에 뒤지지 않을 것으로 보고 있습니다.

25년 10월에 Sora2가 나와서 광고, 뮤직비디오, 영화 등 여러 분야에서 이미 활용되고 있습니다.

Toys"R"Us의 광고, 출처: https://youtu.be/F_WfIzYGlg4

위 사례들을 통해 볼 수 있듯이, 인공지능은 이미 우리 일상 깊숙이 자리 잡고 있습니다. 그리고 일부 분야에서는 인간을 뛰어 넘는 생산력을 보여주고 있습니다. 따라서 지금 이 단계에서는 인공지능이 단순히 ‘인간의 지성’을 모방하는 단계에 머물러 있다고 보기에는 무리가 있습니다. 우리의 일하는 방식, 소통하는 방식, 그리고 창작하는 방식을 근본적으로 변화시켜 줄 그 무언가로 보는 것이 합당합니다. 앞으로 AI의 기술은 더욱 발전할 것이고 우리는 더 많은 혁신 응용 사례를 보게 될 것입니다. 이에 따른 사회의 적응단계도 필요할 것입니다.

다만 생성형 인공지능이 인간의 지능을 갖춘 범용 인공지능(AGI, Artificial General Intelligence)이 될 수 있는 가능성에 대해 학계에서는 비관적으로 보고 있습니다. 생성형 AI 모델이 범용 인공지능으로 가는 길이 아님을 여러 연구 결과들이 보여주고 있습니다. 생성형 AI도 단순하게 보면 행렬의 연산이며, 이 수학 수식에는 한계가 있기 때문입니다. 다만 불가능이라 생각했던 기술들이 한 달이 멀다하고 나오고 있으므로, 앞으로 어떤 인공지능이 나올지는 성급히 예단하지 말고 지켜봐야 할 것입니다.

이 글을 썼던 24년과 지금은 상당히 시점이 다릅니다. 비교해보시면 좋을 것 같아 글을 수정하지 않고 남겨둡니다. 이제 AI로 된 광고를 보고, AI로된 TV프로그램을 보고 있습니다. 이제 인간의 지성을 넘었다 평가하며 AGI는 이미 도달했다고 보고 ASI로 가는 길목이라 보는 시각이 많습니다.

https://youtu.be/FEGcAB9kJpA

2. 머신러닝이란?

지금까지 이야기에서 언급된 생성형 인공지능(Generative AI), 대규모 언어 모델(Large Language Models, LLM), ChatGPT 등이 각각 어떤 개념이고, 어떤 기술에 의해 탄생했는지 알아보도록 하겠습니다.

AI와 관련되어 많이 접하게 되는 단어들을 도식화 하면 아래와 같습니다. 먼저 가장 큰 원을 이루고 있는 것은 AI로, 포괄적인 의미로 사용되고 있습니다. 그 다음으로 큰 원에 해당하는 머신러닝은 인공지능의 핵심 기술로, 컴퓨터가 데이터로부터 학습하여 성능을 향상시키는 과정을 말합니다. 이는 데이터를 기반으로 패턴을 인식하고 의사결정을 내리는 능력을 컴퓨터에게 부여합니다. 머신러닝은 말 그대로 머신이 배울 수 있도록 만드는 기술입니다.

말로만 이해하기에는 조금 어려울 수 있습니다. 구글에서 만든 ‘티처블 머신’으로 실습하면서, 머신러닝의 핵심적인 기능을 학습하며 머신러닝이 무엇인지 이해해보도록 하겠습니다. 로그인 없이도 실습이 가능하니 꼭 따라해 보시기를 바랍니다.

‘티처블 머신’은 구글에서 만든 노코드 인공지능 학습 툴입니다. 웹 기반이라 인터넷만 된다면 어디서든 실습해볼 수 있으며, 이미지, 사운드 등을 인식하여 빠르게 활용가능한 인공지능을 만들 수 있습니다.

Teachable Machine

아래 이미지에서 Get Started를 클릭해주세요.

Image Project를 클릭해보세요. 웹 캠을 허락하라는 창이 나오는데 허락 버튼을 클릭해주세요.

마스크와 노마스크를 분류해보도록 하겠습니다. 마스크를 쓴 사진과 마스크를 쓰지 않은 사진을 각각 촬영해보도록 하겠습니다. 여기서 사진은 데이터이며 사진 위에 입력하는 텍스트를 라벨링이라고 합니다. 웹 캠버튼을 클릭해 촬영하고, 그 위에 연필 모양을 클릭하여 각각 마스크, 노마스크라고 입력해주세요. 이제 Train Model 버튼을 통해 이 사진을 기반으로 컴퓨터를 학습시키도록 하겠습니다.

이렇게 학습을 시키면 컴퓨터는 수학 수식을 만들어냅니다. 이제 학습된 이 모델은 보여준적 없는 새로운 이미지를 보더라도 확률적으로 어디에 가까운지 맞출 수 있게 됩니다. 여기서 중요한 점은 맞추는 정도를 확률로 표시한다는 점이에요. 뒤에 ChatGPT도 이 확률 기반으로 텍스트를 생성해내니 주의 깊게 봐주세요.

다만 제대로 맞추는 것은 한계가 있어요. 학습된 데이터의 양, 데이터의 질 등이 영향을 끼칩니다.

어떻게 이렇게 맞출수 있을까요? 사람에게 먼저 비유를 해보도록 하겠습니다. 여러분들은 어떻게 풀과 꽃과 나무를 비교할 수 있나요? 여러분이 어렸을 때 누군가 여러분에게 반복해서 알려주었을 것입니다.

여러분은 어렸을 때부터 풀, 꽃, 나무를 구분하려고 수없이 반복해서 시도했을 것입니다. 그 결과, 이제는 이 세 가지를 명확하게 구분할 수 있게 되었죠. 이는 여러분이 각 사물의 특징을 학습했기 때문입니다. 그러나 몇 번 보지 못한 것들은 여전히 구분하기 어려울 수 있습니다. 데이터가 적어 특징을 학습하기 어렵기 때문입니다.

컴퓨터도 이와 같은 방식으로 학습할 수 있습니다. ‘티처블 머신’에서처럼 컴퓨터에게 마스크를 쓴 사람과 마스크를 쓰지 않은 사람의 데이터를 제공하면, 컴퓨터는 이 두 가지를 구분할 수 있게 됩니다. 우리가 뇌에 특징을 기억하듯, 컴퓨터는 데이터를 바탕으로 복잡한 수학공식으로 이루어진 수학 모델을 학습합니다.

여기서 조금 더 깊이 들어가보겠습니다. <심층학습>이라는 책에서는 컴퓨터의 학습을 다음과 같이 정의합니다.

학습이란 “한 컴퓨터 프로그램이 어떤 과제류 T에 속하는 과제들을 수행하며 그 수행의 성과 측정한 측도가 P라고 할 때. 만일 어떤 경험 E 때문에 T의 어떤 과제에 대한 성과 측도 P가 개선되었다면, 그 컴퓨터 프로그램은 경험 E로부터 학습한다고 말할 수 있다” - Mitchell, 1997

주가를 **예측(predict)**한다고 가정해보죠. 주가 예측은 새로운 데이터에 대해 예측하는 작업이며, 우리가 앞서 본 마스크와 노마스크를 구분하는 작업도 새로운 데이터에 대해 기존의 데이터를 바탕으로 구분한다는 맥락에서 일종의 예측이라고 할 수 있습니다.

만일 제가 옷을 갈아입고 수염을 기른 후 나타나면 이는 이전에 입력하지 않은 새로운 데이터이지만, 학습된 **모델(Model)**은 이를 기반으로 올바르게 예측할 수 있습니다. 이 모델이 바로 컴퓨터가 학습한 수학 수식이라고 할 수 있습니다. 티처블 머신에서 Model Trained 버튼은 입력된 데이터를 기반으로 이러한 복잡한 수학 수식이 만들어졌다는 것을 의미합니다.

이미지를 바로 설명드리는 것은 매우 어려운 일이니 주가 예측으로 다시 돌아와 보도록 하겠습니다. 파란색 선이 오늘까지의 주가입니다(현실은 복잡하겠지만 설명을 위해 단순화 했습니다). 그래프는 y = ax + b형태의 그래프입니다. 인공지능에서는 이와 유사하게 y = Wx + b 형태로 표현됩니다. 컴퓨터는 초기 W와 b의 값을 랜덤하게 설정합니다. 오차를 줄이기 위해 W와 b의 값을 수정해 나갑니다. 그러다 보면 오차가 점점 줄어들다가 더 이상 오차가 줄어들지 않는 순간이 옵니다. 마지막으로 사용자가 날짜를 입력하면, 이전에는 없던 데이터지만 수정된 그래프를 기반으로 값이 예측됩니다.

요약하자면 머신러닝은 데이터를 바탕으로 복잡하고 정교한 수학 수식(모델)을 만들어내는 과정이며, 학습을 많이 시킬 수록 성능이 개선됩니다.

머신러닝이 정말 좋은 기술이지만 2019년에 아래와 같은 단점이 지적되었습니다. 2024년인 지금은 많은 부분이 해결되었는데, 현재와 비교해보면 좋습니다. 불과 10년도 안되었는데 이전에 안되겠다고 생각한 것들이 이제는 가능하게 된 것들이 참 많습니다.

머신러닝의 단점(개리 마르커스 교수의 에세이에서 발췌)

  1. 많은 데이터 필요
  2. 재활용 힘듦
  3. 충분히 투명하지 않음
  4. 인과관계와 상관관계의 구분이 어려움
  5. 신뢰성 있는 엔지니어링의 어려움

3. 딥러닝이란?

딥러닝(Deep Learning)은 머신러닝의 한 종류로, 컴퓨터가 여러 층(layer)으로 이루어진 인공 신경망을 통해 복잡한 패턴을 배우는 기술입니다. 뒤에서 배울 ChatGPT, Claude, Gemini와 같은 대규모 언어 모델도 이 딥러닝 안에 포함된 것입니다. 여기에 뉴런, 뉴런과 뉴런이 연결되는 시넵스는 뒤에서도 중요한 개념이니 꼭 기억해주세요.

여기서 인공 신경망은 인간의 뇌에 있는 뉴런(neuron, 신경세포)의 구조를 모방한 것입니다.

여기서 아래 있는 수식은 아래와 같은 다층 신경망으로 대비됩니다.

어려워 보이지만 앞서 배웠던 것에 수식을 쌓아 올린 것 뿐입니다. 아주 간단한 구조부터 보시죠. 아래 있는 그림이 선 하나입니다.

그런데 이렇게 하면 복잡한 것을 예측하지 못하죠? 주식도 직선 형태로밖에 예측을 못하잖아요? 그래서 아래처럼 쌓아 올린 것입니다.

이렇게 쌓아 올리면서 신경망처럼 엮은 것이죠. 그러면 복잡한 것도 예측이 가능합니다. 원리는 앞과 같습니다. 랜덤한 값을 넣고 오차가 적어지는 범위로 w값과 b값을 옮겨가는 것이죠. 랜덤한 값이기 때문에 재현이 불가능하고 실제 어떤 원리로 이 수식이 잘 작동하는 것인지 증명하기는 어렵습니다. 그래서 Hidden layer가 많아지는 이 부분을 블랙박스라고도 얘기합니다.

2장 생성형 AI 원리와 이해2.2 생성형 AI 발전 과정