[이병희 기자]“현업의 실제 머신러닝 프로세스는 끝날 때까지 끝난 것이 아니라 고리(루프)처럼 지속적으로 다른 과정으로 돌아가는 반복적인 형태이다. 머신러닝 프로세스의 특징은 무한반복인 것이다.”  

안길승 한양대 응용확률연구실 연구원(산업경영공학 석박사통합과정)은 서울산업진흥원(SBA), 한양대 오픈소스SW사업단이 개최한 서울창조전문인력 양성 교육 ‘머신러닝 입문’과정에서 머신러닝 프로세스에 대해 설명했다. 그는 “머신러닝 프로세스는 기획, 데이터수집, 데이터탐색, 데이터 전처리, 모델링, 모델평가, 결과보고서 작성 등의 순서대로 돼 있다”면서 “그러나 결과보고서 작성까지 했더라도 다시 앞쪽의 프로세스로 돌아가 다시 시작하는 경우가 많다”고 말했다.

예를 들어 문제정의가 제대로 돼 있지 않다고 하면 모델평가 혹은 결과 보고서를 작성한 뒤라도 문제를 새로 정의하는 상황도 발생한다는 것이다. 안 연구원은 이런 루프와 같은 무한반복하는 형태를 아예 없앨 수는 없다면서 피드백 루프를 줄일 수 있는 방법은 철저한 기획과 경험을 많이 쌓는 것이라고 조언했다.

그는 기획의 중요성이 크다고 설명했다. 머신러닝은 데이터 크기와 사용하는 모형 등에 따라 엄청난 시간이 소요되는 작업이기 때문에 기획을 잘못하면 그대로 시간을 낭비하는 경우가 있다는 것이다. 안 연구원은 “어떠한 문제를 해결해야 하고, 이 문제를 해결하는데 어떠한 데이터가 필요하고, 어떠한 모델이 필요한지 등을 분석전에 반드시 잘 정해야 한다”고 강조했다.

 

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지