본문 바로가기
도서 리뷰

[도서 리뷰] Machine Learning at Work 머신러닝 실무 프로젝트

by 이든Eden 2022. 4. 22.
이 서평은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

 

 

나는 머신러닝 실무자다. 그래서 머신러닝 실무 프로젝트 그러니까 내가 평소에 하게되는 프로젝트말고 다른 사람들의 프로젝트는 어떻게 돌아가는지 궁금하던 찰나에 한빛 미디어에게 이 책을 받게 되었다. 난 3학년이 끝나자마자 취업해서 제대로 안들은 수업이 1년치나 있었다(예를 들면 소프트웨어공학). 근데 회사에서는 스크래치부터 해야되는 일을 몇 개 맡았었다. 챗봇 빌더를 개발할 때는 심지어 백엔드 개발자 한 분과 나와 같이 디비와 전체 시스템을 논의하며 만들정도로 스크래치였다. 이렇게 하면 맞겠지 정도만 생각하고 개발하였기 때문에 정말 정석적으로 남들이 어떻게 하는지 궁금했었다.

 

어떤 사람들이 이 책을 읽을까? 나같은 사람일까? 책의 예상 독자는 다음과 같았다.

  • 머신러닝 입문서를 떼고 실무에 활용하려는 개발자
  • 대학에서 배운 머신러닝을 제품이 적용하려는 주니어 개발자
  • 소프트웨어 개발자는 아니지만 머신러닝 시스템 및 기술적인 내용에 흥미가 있는 비즈니스 담당자

Advanced 단계로 넘어가는 사람들에게 딱이란 생각이 들었다. 내가 머신러닝 실무 프로젝트를 읽으며 중점적으로 본 것은 실제로 내가 일하면서 이 책과 어떤 다른 점들을 가지고 있는지였다.

 

Chapter 3까지는 거의 머신러닝 이론과 관련된 것이었고 4장부터가 진짜 머신러닝 모델을 서비스하기 위한 어떤 일련의 과정들을 보여준다. 나는 예전에 안드로이드와 연동하는 API를 flask로 개발한 적이 있는데 물론 좀 다르지만 아래의 [그림 2]와 어느 정도 비슷하게 나와있어서 오 실무와 꽤나 비슷하군 싶었다.

 

[그림 2]

 

Chapter5의 학습 리소스 수집하기에서도 내가 해본 방법이 있었다ㅋㅋㅋㅋ 바로 5.4 동료나 지인에게 데이터 입력 요청인데 내 경우에는회사의 동료들에게 부탁하여 데이터를 모았다. 내가 했던 프로젝트 중 장문인식(손바닥인식)을 시작했을 때는 회사사람들에게 데이터를 부탁해서 약 50-100명의 데이터로 시작을 했었다. 물론 데모도 회사사람들의 손바닥으로했었다. 딥러닝 모델을 돌려본다고해서 무조건 성공하진 않는다. 그렇기 때문에 회사에게 마냥 데이터를 요청하기도 쉽지 않다. 이게 현실인 것 같다.

 

뒤로 갈수록 결정 트리를 시각화해 원인 분석, SHAP을 활용한 기여도 시각화 등 머신러닝 아웃풋의 결과를 설명할 수 있는 방법이 나온다. 난 아무래도 이미지데이터를 주로 사용하니까 아주 친근하지는 않은데 재밌었다.

 

읽으면서 좋았던 점은 다양한 사례와 심지어 코드까지 있었던 점이고, 아쉬웠던 점은 다양한 사례임에도 불구하고 요즘 얼굴인식, 기계번역, 객체인식 등 다양한 기술이 서비스되고 자주 사용하고 있는데 그런 딥러닝 모델의 서비스에는 비중을 많이 두지 않았다는 것이다.

 

하지만 모델 서비스라는 전체적인 큰 틀을 보고 싶은 사람들과 만든 모델을 실무에 사용해보고 싶은데 어떻게 해야될지 감이 안오는 사람들에게 좋은 책이 될 것 같다.