1 minute read


한빛미디어 ‘나는 리뷰어다’ 활동을 위해서 책을 제공받아 작성된 서평입니다.




이 책은 이런 책이에요


요즘은 산업/사회 전반적으로 Machine Learning / Deep Learning이 사용되지 않는 곳을 찾기가 어려워졌습니다.

다양한 분야에서 인간의 결정에 조금씩 도움을 줍니다.

물론 그 결정이 그리 큰 위험이 없는 분야일 수도 있지만, 어떤 경우에는 그 결정이 큰 영향을 끼치는 고위험인 경우도 있습니다.

Machine Learning Model이 이와 같은 고위험 결정을 하고 있기 때문에 최근들어서 Model 그 자체의 위험성도 서서히 드러나고 있는 실정입니다.


Machine Learning Model이 중요한 결정을 하는 일이 늘어나다 보니, 의도하지 않은 오용 혹은 의도적인 남용으로 인한 사고 사례가 속출하고 있습니다.

이러한 분위기 속에서 Machine Learning의 진정한 이점을 활용하려면 실무자의 조치가 필수적이 되었습니다만, 널리 인정받는 전문 자격증이나 모범 사례가 많이 부족한 상황입니다.


이 책은 이러한 전반적인 분위기 속에서 Model을 배포할 때 좋든 나쁘든 결과에 대한 책임에 대한 실무적인 가이드를 제공하기 위해서 기획되었습니다.

Model의 위험 관리 절차를 제대로 이해하고, 일반적인 도구를 사용해 설명가능한 Model을 제시하고, 안정성/안전성/편향관리/보안/프라이버시 등과 같은 일반적인 보안 이슈를 디버깅하고 개선하는 다양한 방법을 제시해 줍니다.



이런 분들에게 추천드려요


Machine Learning Model 배포 혹은 Machine Learning 위험 관리를 다루어야 하는 Machine Learning 엔지니어 및 Data Scientist에게 유용할 것입니다.

또한, Python Code Example을 통해서 모델 거버넌스의 기본 사항을 배우고, Workflow를 개선하여 기본적인 위험 통제 방법을 소개하기 때문에 이와 관련된 업무를 담당하고 있는 분들에게도 유용한 책입니다.


특히, Machine Learning의 자동화된 의사결정에서 발생할 수 있는 의도하지 않는 결과에 대한 우려를 가지고 있는 사람들에게도 도움이 되고, 법률이나 규정을 준수 및 관리해야 하는 규제 기관이나 정책 전문가들에게도 큰 도움이 될 것입니다.



이렇게 구성되어 있어요


이 책은 전체적으로 Machine Learning Workflow와 전통적인 모델 위험 관리나 사고 대응, 버그 바운티, 레드 팀과 같은 기존 컴퓨터 보안 모범 사례를 Machine Learning Model에 결합하여 실전 검증된 위험 통제를 적용하는 전반적인 방법을 설명합니다.

설명 가능한 여러 모델을 더 투명하게 확인하는 방법과, 모델의 안전성과 신뢰성을 테스트하고, 편향 관리를 위한 모델 구조화 방법도 제시하고, 마지막으로 Machine Learning Pipeline과 API 보안 설정을 설명하는 구성으로 되어 있습니다.



이런 점이 아쉬워요


용어의 번역이 조금 낯설고 이질적으로 느껴졌습니다. 물론 Machine Learning 리스크 관리라는 분야가 생소하다 보니 관련 용어도 조금 어려울 수도 있지만, 가끔씩 억지로 번역하지 말고 원래 단어를 그대로 적어주는 것이 더 이해하기 쉽지 않았을까 하는 부분들도 있었습니다.

그리고, 이론적으로 추상적인 개념들이 많아서 이해에 어려움이 좀 있을 수 있습니다. 예제 코드가 같이 제공된다고는 하지만 여전히 쉽게 다가가기 힘든 부분이 있습니다. 앞서 말했듯이, 이런 분야가 많이 알려진 분야가 아니다 보니 그럴 수도 있을 것입니다.

마지막으로, 요즘 소위 핫한 기법들(강화학습, Generative AI, LLM)은 다루고 있지 않고, 전통적인 Machine Learning 기법들을 다루고 있습니다.