![AI 평가 플랫폼 디자인 아레나을 이용한 테스트 모습 [사진: 디자인 아레나]](https://cdn.digitaltoday.co.kr/news/photo/202508/587182_546608_3640.jpg)
[디지털투데이 AI리포터] 최근 인공지능(AI)의 성능을 측정하는 새로운 방식으로 디자인 능력을 평가하는 플랫폼 디자인 아레나(Design Arena)가 주목받고 있다고 24일(현지시간) 온라인 매체 기가진이 전했다.
AI는 기존에 수학 문제 해결 능력이나 자연스러운 대화 수행 능력 등으로 평가됐으나 디자인 아레나는 디자인 능력에 초점을 맞춘 것이 특징이다.
디자인 아레나는 사용자가 원하는 디자인 내용을 입력하면 랜덤으로 선택된 4종의 AI가 해당 디자인을 생성하고 사용자가 선호도를 기준으로 승자를 선택하는 방식으로 테스트가 진행된다. 투표 과정에서 AI의 정체는 공개되지 않으며 인간의 선호도를 기반으로 AI의 디자인 능력을 평가할 수 있다.
디자인 아레나는 사용자가 원하는 디자인 내용을 입력하면 랜덤으로 선택된 4종의 AI가 디자인을 생성한다. 이후 사용자는 선호도를 기준으로 승자를 선택하며 투표 과정에서 AI의 정체는 공개되지 않는다. 이렇게 인간의 선호도를 바탕으로 AI의 디자인 능력을 평가할 수 있다.
기가진이 가상의 빵집 웹사이트 디자인을 요청한 결과, 5회에 걸친 승패 선택에서 오픈AI의 GPT-5가 1위로 선정됐다. 또한 플랫폼의 전체 통계에서는 카테고리별 순위가 확인할 수 있다.
웹사이트 디자인 부문에서도 승률 73.6%로 챗GPT-5가 1위를 기록했다. 모든 카테고리를 종합한 전체 순위 1위는 승률 73.7%를 기록한 앤트로픽의 클로드 오퍼스 4.1(Claude Opus 4.1)였다.
디자인 아레나는 계정 등록 없이 누구나 참여할 수 있다. 결과를 통해 AI별 디자인 성능 순위를 확인할 수 있어 AI 창작 도구로서의 활용 가능성과 경쟁력을 가늠하는 지표로 활용될 전망이다.

