4 minute read


한빛미디어 ‘나는 리뷰어다’ 활동을 위해서 책을 제공받아 작성된 서평입니다.


image


Machine Learning / Deep Learning의 이론을 공부하다보면 어렴풋이 각 Algorithm의 Base에는 어려운 수학 이론이 바탕에 깔려있다는 느낌을 받습니다.

AI라는 견고하고 훌륭한 건물의 설계도가 바로 수학인 것이죠.

저도 각종 Algorithm이나 최신 Deep Learning Model이 어떤 수학적 배경과 이론을 바탕으로 작동하는지 알아보려고 논문을 읽다보면

마치 외계어와도 같은 수식에 빠르게 포기했던 경험이 많이 있었습니다.

어려운 수학 공식과 각종 이론과 증명들에 대한 두려움 때문에 Machine Learning / Deep Learning 분야에 대한 공부를 포기하려고 하신 분들도 많을 것이라고 생각합니다.

저를 포함해 이런 경험을 가진 분들에게 단비와도 같은 책이 이번에 출판되었습니다.

이 책은 Machine Learning / Deep Learning의 기본이 되는 전반적인 수학 기초 개념을 쉽게 설명하기 위해서 많은 노력을 한 흔적이 보입니다.

수학 개념을 예제와 그림을 통해 알기 쉽게 설명하고, 번역가 분이 뭔가 더 설명이 필요하다고 생각되는 부분은 보충 설명을 친절하게 달아주셨습니다.



책의 특징



앞서 언급했지만, 이 책의 가장 큰 특징을 꼽으면 Machine Learning / Deep Learning의 기본이 되는 수학을 알기 쉽게 그림과 예제로 풀어서 설명해 준다는 것입니다.

자주 보거나 들어서 어렴풋이 알고 있는 용어 혹은 개념들의 뜻을 수학적으로 쉽게 설명합니다.

겁에 질릴만한 어려운 수식을 적어놓고, ‘이 수식은 이런 것이다!’라고 불친절하게 설명하는 것이 일반적인 방식이 아닌, 간단하고 중요한 최소한의 수식을 최대한 쉽고 자세하게 설명하기 위해서 노력합니다.

이름만 들어도 머리가 아픈 내용들을 실제 AI Model에서 사용되는 사례와 방법 설명하며 실제 문제에서 어떻게 사용되는 예시로써 설명합니다.


추가적으로, 잘 AI 관련 책에서 거의 다루지 않는 분야에 대한 최신 트렌드에 관련된 이야기도 합니다.

최근에는 ChatGPT을 필두로 LLM이 전 세계를 강타하고 있었고, 그 전에는 Image 관련 Model이 유행했었습니다.

하지만, 그 이외에도 AI를 활용하여 우리들에게 큰 도움이 될 수 있는 다양한 분야가 있고, 그에 대한 연구 내용도 이 책에서 함께 다루고 있습니다.



Chapter별 소개



Ch. 2. 확률 개념

  • AI에서 중요한 위치를 차지하고 있는 확률에 대한 기본 개념을 알아봅니다.
  • 확률변수, 확률분포, 조건부 확률, 균등 분포, 정규분포, 기대값, 평균, 분산, 마르코프 과정, 연속분포, 이산분포, 확률밀도함수 등과 같은 개념들에 대해서 설명합니다.


Ch. 3. Data를 Function에 Fit하는 방법

  • Model의 Train은 Data를 특정 Function에 Fit하는 과정이라고 볼 수 있는데, 이 과정 전체에 나오는 수학적 이론들을 알아봅니다.
  • 각 Model의 특성( Linear Regression, Logistic, Softmax, SVM, Random Forest, KNN, Tree 등)
  • Loss Function / Activation Function / Optimizer 등에 사용된 수학적 이론
  • 성능 평가방법에 사용된 수학 이론등도 함께 알아봅니다.


Ch.4. 최적화 for NN

  • 신경망(Neural Network)은 Deep Learning의 근간이 되는 Model 이기 때문에 이에 대해서도 수학적인 관점에서 알아봅니다.
  • 먼저 Neural Network 종류와 이를 학습시키기 위한 Loss Function, Optimizer, Activation Function 등에 대해서도 수학적 원리를 알아봅니다.
  • Neural Network에서 가장 중요한 Hyperparamter라고 할 수 있는 Learning Rate의 의미에 대해서 확인하고 그 밖에 Feature Scale, 경사하강법, Weight 초기화 방법에 대해서도 알아봅니다.


Ch.5. CNN

  • CNN은 AI 시대를 연 그야말로 혁명을 일으킨 Model 구조이니 이것을 그냥 넘어갈 순 없습니다.
  • Convolution 연산의 수학적 의미, 사용분야, 응용방법에 대해서 알아보고, Image AI Model을 응용한 분야, 예를 들면, Vision, NLP 등에 대해서 살펴봅니다.
  • 마지막으로, Pooling 연산 등과 같이 CNN에서 사용되는 중요 연산에 대한 수학적인 정리를 하고 마무리합니다.


Ch.6. 특이값 분해

  • 특이값 분해의 수학적 원리에 대한 설명과 응용분야를 살펴봅니다.


Ch.7. NLP & Time Series

  • 지금 세상은 NLP가 장악하고 있다고 해도 과언이 아닐 정도로 자연어처리 분야 열풍이 일어나고 있습니다.
  • Image 분야에 CNN이 있다면, NLP에는 Transformer / Attention이 있습니다.
  • Transformer / Attention의 수학적인 원리에 대해서 설명하고 있습니다.
  • NLP의 Dataset인 말뭉치(Corpus)를 효과적으로 표현하기 위한 다양한 방법론과 각 방법에 대한 수학적 배경에 대한 설명을 합니다.


Ch.8. 확률적 생성모델

  • 생성모델(Generative Model)이란 어떤 Dataset과 유사한 Data를 생성해 내는 Model을 말합니다.
  • 조금 더 구체적으로 학습한 Dataset의 확률 분포를 학습한다고 할 수 있으며 이는 기존 AI Model과는 다른 개념의 Model입니다.
  • 생성모델을 잘 이해하기 위해서 우리가 어떠한 사고의 전환(결정론적 사고 vs 확률 이론적 사고 전환)이 필요한지와 생성모델이 기존 모델과 다른 점을 수학적으로 설명하고, 이를 학습하기 위한 방법 그리고 이 생성모델이 유용한 분야에 대해서 살펴봅니다.


Ch.9. 그래프 모델

  • 다양하게 응용 가능한 그래프 기반 모델 설명 및 장점과 기본 개념 및 다양한 활용 방안에 대해서 알아봅니다.


Ch. 10. 운용 과학(Operational Research)

  • 운용 과학이란 시간과 비용을 효율적인 방법으로 다양한 요구조건과 가용자원의 균형을 맞추는 과학분야 즉, 최적점 찾기 학문입니다.
  • 이 분야는 AI 관련 도서나 글에서 쉽게 찾아보기 힘든 주제이기도 합니다.
  • 운용 과학에서 다루는 다양한 방법론 열거하고, 수학적 배경지식을 설명합니다.
  • Machine Learning / Deep Learning을 이용한 문제 풀이 방법도 소개합니다.
  • 이런 내용은 다른 AI 관련 도서는 찾기 쉽지 않다.


Ch. 11. 확률

  • 확률은 AI에서 매우 중요한 수학적 개념입니다. Model이 출력하는 값이 확률이기도 하지만 Model 학습시에도 다양한 부분에서 확률이 사용되기 때문이기도 합니다.
  • 이 책에서 사용한 확률에 대한 개념들을 정리하고, AI Model에서 알아야할 확률 이론들도 함께 알아봅니다.


Ch. 12. 수학적 논리

  • 신경망 이전에 존재했던 논리기반 AI 모델에 대해서 다룹니다.
  • Deep Learning이 나오고 잘 다루어지지 않고 있지만, 최근 연구에서 논리기반 AI 모델이 개선되고 있다고 합니다.
  • 과거의 이론이라고 생각했던 ‘논리’체계를 이용하는 방법을 Machine Learning / Deep Learning과 결합하는 방법에 대한 흥미로운 접근에 대한 내용들을 찾아볼 수 있습니다.
  • 논리기반 AI 모델이 에이전트에게 다양한 논리체계를 부여하는 방법론에 대해서 알아봅니다.


Ch. 13. 편미분 방정식

  • 편미분은 신경망을 학습시킬 때 필연적으로 사용하는 Backpropagation의 핵심 원리입니다.
  • 자연계에서 편미분 방정식의 의미와 응용분야와 AI에서 편미분 방정식의 역할에 대해서 살펴봅니다.


Ch. 14. AI, 윤리, 수학, 법률, 정책

  • 마지막으로 AI를 둘러싼 비기술적인 요소들에 대해서도 살펴보고 책은 마무리 됩니다.



총평


AI Model의 가장 기본적이고 깊은 곳의 이론적 배경을 이해하고 싶지만, 너무나 높은 수학이라는 벽에 좌절했던 저에게는 한줄기 햇살같은 책이었습니다.

저와 비슷한 경험이 있으시거나 혹은 AI 관련된 수학적 기초를 이해하고 싶으신 분들에게 추천드립니다.