틱톡 모회사 바이트댄스가 텍스트 기반 고품질 영상 생성 인공지능 '매직비디오-V2'를 개발했다. [사진: 매직비디오-V2 깃허브]
틱톡 모회사 바이트댄스가 텍스트 기반 고품질 영상 생성 인공지능 '매직비디오-V2'를 개발했다. [사진: 매직비디오-V2 깃허브]

[디지털투데이 AI리포터] 틱톡의 모회사 바이트댄스 연구팀이 텍스트를 기반으로 고품질 동영상을 생성하는 인공지능(AI) '매직비디오-V2'를 개발했다고 18일(현지시간) 온라인 매체 기가진이 전했다.

매직비디오-V2는 텍스트를 이미지로 변환하는 'T2I(Text to Image)'모듈, 이미지를 동영상으로 변환하는 'I2V(Image to Video)'모듈, 동영상의 해상도를 확장하는 'V2V(Video to Video)'모듈, 그리고 시퀀스를 확장하는 '인터폴레이션(추정된 중간값)'모듈로 구성됐다.

이것은 입력된 텍스트를 기반으로 T2I모듈에서 이미지를 생성해, I2V모듈에서 연속적으로 동영상이 되는 이미지 32장을 생성한다. 이후 V2V모듈에서 해상도를 확장하는 방식이다.

연구팀은 매직비디오-V2를 다른 최첨단 동영상 생성 AI와 사람이 만든 동영상을 비교했다. 그 결과, 매직비디오-V2는 다른 동영상과 비교한 품질 평가에서 '더 우수하다'고 답한 비율로 과반수 이상을 받았다. 

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사