[이병희 기자] “R은 공개소프트웨어이고 연계된 툴이 많아 향후 분석 등은 R 기반에서 충분히 할 수 있을 것이다.” 허윤 모니카컨설팅 대표는 한양대 오픈소스SW사업단, 서울산업진흥원의 재직자 교육 과정에서 “오픈소스R이 통계분석에서 주목할만한 성장을 기록하고 있다”면서 이렇게 밝혔다.

허 대표는 비즈니스 인텔리전스(BI) 영역에서 R을 바라보는 3가지 오해에 대해 설명했다. 첫 번째 오해는 R이 소셜네트워크나 소셜네트워크서비스 분석에 국한돼 사용되는 것이라는 편견이다.

허 대표는 “불과 2~3년 전만 해도 통계분석, 데이터 분석은 SAS와 같은 고가 솔루션이 시장의 90~95%를 점유하던 때가 있었다”면서 “R이 들어오며 처음에는 SNS 분석 일부에 국한하는 것으로 생각됐지만 빅데이터가 본격화되며 병렬연산 처리하는 R에 대한 관심이 커졌다”고 설명했다.

허윤 모니카컨설팅 대표는 한양대 오픈소스SW사업단, 서울산업진흥원(SBA)의 재직자 교육과정에서 오픈소스R의 장점에 대해 설명했다.

두 번째 오해는 R이 대용량 데이터 분석이 안된다는 것이다. 허 대표는 이에 대해 “이전에는 데이터 사이즈가 1G만 되도 멈춰버리는 경우도 있었다”면서 “그러나 이제는 메모리가 아니라 파일단위로 분석하는 패키지가 나와서 이런 문제가 없어졌다”고 말했다.

세 번째 오해는 R을 배우려면 어렵지 않느냐는 것이다. R이 기계어와 가깝고 통계적인 개념도 필요하고 배우고 어려운 것이 사실이지만, 커뮤니티에서 나오는 패키지 등도 많이 나오기 때문에 상대적으로 이전보다는 배우기 쉬워졌다는 것이 허윤 대표의 설명이다.

허윤 대표는 “R은 기본적으로 통계분석 소프트웨어”라며 “R은 통계분석, 데이터마이닝, 데이터핸들링 고급과정 분야에, 파이썬은 딥러닝쪽에 많이 들어가 있다”고 소개했다. 그는 R은 1) 무료이다보니 전 세계 사용자가 많고 진화속도가 빠르다는 것 2)파이썬과 SAS 솔루션과 비교해 쉽게 구현 가능한 다양한 그래픽 3) 다양한 운영체계에서 구현가능 4) SPARK, 딥러닝 등 다양한 연계 프로그램 등이 있다는 것이 장점이라고 소개했다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지