[디지털투데이 AI리포터] 미국 텍사스대 오스틴 캠퍼스 연구팀이 제로샷으로 음성 편집과 합성이 가능한 인공지능(AI) '보이스크래프트'(VoiceCraft)를 공개했다고 16일(현지시간) 기가진이 전했다.신경 코덱 언어 모델인 보이스크래프트를 통해 매우 자연스러운 음성 편집이 가능하다. 보이스크래프트는 깃허브와 허깅페이스에 공개돼 있어 실제로 직접 사용해 볼 수도 있다.데모용 음성을 업로드한 후 '옮겨쓰기' 버튼을 클릭하면 음성 내용이 전사된다. 텍스트 란에는 읽어줄 문장을 입력한 후 실행 버튼을 클릭하면 음성이 완성된다.완성된 음
[디지털투데이 홍진주 기자] 구글이 쿠키 도용 위협에 대응하기 위한 새로운 보안 기능인 '디바이스 바운드 세션 자격증명'(Device Bound Session Credentials, 이하 DBSC)을 도입한다고 밝혔다. 이는 인증 시스템의 취약점을 악용하도록 설계된 멀웨어 위협으로부터 사용자 보안을 강화한다는 설명이다.3일(현지시간) IT매체 테크레이더에 따르면 구글은 크롬 블로그를 통해 "브라우저가 아닌 실제 기기에 바인딩하는 새로운 모델을 개발 중"이라고 발표했다. 쿠키는 사용자의 인증 정보와 기본 설정을 저장하기 때문에 가장
[디지털투데이 황치규 기자] AI 확산에 대비한 인프라를 확보하기 위해 거액을 투입하려는 빅테크 기업들 간 경쟁이 고조되고 있다. 최근에는 마이크로소포트으와 아마존웹서비스(AWS)의 행보가 눈에 띈다.마이크로소프트가 오픈AI 경영진들과 AI 인프라 확대 일환으로 최대 1000억달러 규모 데이터센터 프로젝트를 위한 계획을 구상하고 있다는 소식이다. 디인포메이션 보도에 따르면 양사가 논의 중인 프로젝트는 오픈AI AI 모델 운영에 필요한 전용 서버 칩을 수백만개 가량 탑재한 슈퍼컴퓨터를 제공한다. ㆍ마이크로소프트-오픈AI, 최대 100
[디지털투데이 황치규 기자]업스테이지는 자체 개발한 노코드 LLM 종합 평가 플랫폼 ‘이벨버스(Evalverse)’를 무료로 공개한다고 3일 밝혔다. 이벨버스는 오픈소스 형태로 깃허브(GitHub)에 공개돼 누구나 쉽게 활용할 수 있다.회사 측에 따르면 통상 LLM 성능 평가에는 특정 데이터셋을 기준으로 응답 정확도를 기록한 ‘벤치마크’ 지표를 활용한다. 모델 추론, 상식, 언어 이해 능력 등 6가지 부문을 측정하는 허깅페이스 ‘H6’ 지표를 포함, 대화 능력 지표 ‘MT-bench’, 감성 평가 지표 ‘EQ-bench’, 및 지시
[디지털투데이 AI리포터] 데이터 및 AI 기업 데이터브릭스(Databricks)가 오픈소스 거대언어모델(LLM) 'DBRX'를 공개했다고 28일(현지시간) 일본 IT미디어가 전했다.이는 오픈소스 프로젝트 메가블록스를 기반으로 한 전문가 혼합(MoE) 모델로 기존 오픈소스 LLM 모델보다 훈련 속도와 연산 효율이 2배 이상 빠른 것으로 알려졌다.데이터브릭스에 따르면 DBRX는 1320억개의 파라미터로 표준 업계 벤치마크에서 메타의 라마(LLaMa)2의 2배 크기라고 한다. 또 언어 이해, 프로그래밍, 수학, 논리 벤치마크 등에서 뛰
[디지털투데이 AI리포터] 중국의 대형 기술 기업들이 고급 거대언어모델(LLM) 개발을 강화하고 있다고 22일(현지시간) 홍콩 사우스차이나모닝포스트(SCMP)가 전했다.최근 텐센트 홀딩스(Tencent Holdings), 콰이쇼우(Kwaishou) 등 중국 굴지의 기술 기업들이 인공지능(AI) 도구의 기반이 되는 LLM 성능 향상에 열을 올리고 있다. 콰이쇼우는 중국에서 2번째로 큰 숏폼 앱으로 생성형AI모델로 콰이아이(KwaiYii)를, IT기업 텐센트는 '훈위안'(Hunyuan)을 보유하고 있다. 청 이샤오 콰이쇼우 최고경영자(
[디지털투데이 AI리포터] 마이크로소프트(MS)가 차세대 원격 캐시 저장소 시스템인 '가넷'(Garnet)을 발표했다고 20일(현지시간) IT매체 테크레이더가 전했다.캐시 저장소는 데이터의 신속한 저장과 처리, 시스템 성능 최적화에 중요한 메모리 유형 중 하나다. 그중 구글이 개발한 가넷은 더 뛰어난 이점을 보유했다는 평가가 나온다.가넷은 원시 문자열, 분석적, 객체 작업을 포함한 다양한 API 구현이 가능하다. 여기에 많은 클라이언트 연결과 작은 배치 작업에서 뛰어난 처리량과 확장성을 제공해 대규모 앱의 비용 절감에 기여하기도 한
[디지털투데이 AI리포터] 중국 텐센트 홀딩스가 학술 파트너와 협력해 이미지를 비디오로 변환하는 새로운 인공지능(AI) 모델을 공개했다고 지난 15일(현지시간) 홍콩 사우스차이나모닝포스트(SCMP)가 전했다.텐센트 홀딩스의 발표는 오픈AI의 챗GPT 및 소라, 구글의 제미나이와 같은 콘텐츠 생성 AI 도구에 대한 관심이 높아지는 시기에 이뤄지며 눈길을 끌었다.텐센트 홀딩스의 새로운 AI 모델은 '팔로우유어클릭'(Follow-Your-Click)이라고 불린다. 현재 2023년 10월에 출시된 비디오크래프터1의 업데이트 버전인 비디오크
[디지털투데이 AI리포터] 대안형 소셜미디어(SNS) 플랫폼 블루스카이(Bluesky)가 사용자들이 소셜 미디어 경험을 통제할 수 있는 모더레이션 서비스인 '오존'(Ozone)을 오픈소스화한다고 12일(현지시간) IT매체 테크크런치가 전했다.오존을 통해 사용자는 자신의 취향에 맞는 맞춤형 네트워크 환경을 만들 수 있다. 예를 들어 거미 이미지를 차단하는 모더레이션 서비스를 설치하면 거미 사진이 피드에서 사라진다. 블루스카이는 이러한 방식으로 전 세계 다양한 상황, 문화, 선호도를 고려한 모더레이션을 제공하고자 한다.모더레이션 서비스
[디지털투데이 AI리포터] 닌텐도 스위치 에뮬레이터 유즈(Yuzu)의 개발사인 트로픽 헤이즈가 유즈의 지원을 중단한다.5일(현지시간) 일본 기가진에 따르면 트로픽 헤이즈는 닌텐도에 240만달러(약 32억520만원)의 손해배상금을 지불해야 한다. 이는 닌텐도의 미국 법인인 닌텐도 오브 아메리카가 저작권 침해를 이유로 트로픽 헤이즈에 제기한 소송에 따른 결과다.유즈는 오픈소스로 개발되고 있으며, 대부분의 개발이 깃허브를 통해 이뤄졌다. 앞서 닌텐도는 유즈가 "디지털 밀레니엄 저작권법(DMCA) 우회 금지 규정을 위반했다"고 주장하며 소
[디지털투데이 석대건 기자] 퀄컴 테크날러지(Qualcomm Technologies, Inc.)가 바르셀로나에서 열린 모바일 월드 콩그레스(MWC) 2024에서 '퀄컴 AI 허브'를 공개했다고 27일 밝혔다.퀄컴 AI 허브는 스냅드래곤 및 퀄컴 플랫폼을 사용하는 모든 제품에 적용 가능한 최적화 AI 모델 라이브러리를 지원한다.지원하는 AI모델 라이브러리는 위스퍼(Whisper), 컨트롤넷(ControlNet), 스테이블 디퓨전(Stable Diffusion), 바이추안 7B(Baichuan 7B) 등 약 75가지다.퀄컴은 이 모델들
[디지털투데이 황치규 기자] 마이크로소프트가 지난해 간판 클라우드 생산성 플랫폼인 '마이크로소프트365'(M365)에 생성형 AI 비서인 코파일럿을 내놓고 1인당 월 30달러를 받겠다고 했을 때 관전 포인트는 과연 기업들이 지갑을 선뜻 열겠느냐는 것이었다.구독료와 비슷한 비용을 추가로 내야 하는 상황을 기업들이 선뜻 받아들이기 쉽지 않을 것이라는 관측과 생산성 향상 측면에서 월 30달러는 낼 만한 가치가 충분하다는 앵글이 공존해왔다.최근 월스트리트저널(WSJ) 보도를 보면 M365 코파일럿을 6개월 넘게 사용해 본 초기 테스터들 사
[디지털투데이 이호정 기자] 카카오브레인은 흉부 엑스레이 판독문에서 특정 병명을 추출하는 의료영상 판독문 전문 레이블러 프로젝트를 지난 16일 '깃허브(Github)'에 공개했다고 19일 밝혔다.레이블러 프로젝트는 글머리 기호 형식 등 정리되지 않은 자연어로 작성된 판독문에서 특정 병명을 추출하는 연구 개발 프로젝트이다. 흉부 엑스레이 결과를 바탕으로 진단 가능한 병명 중 발병 빈도 또는 중요도가 높은 ▲골절 ▲흉막 병변 ▲기흉 등 총 13가지 병명 추출이 가능한 것이 특징이다. 예를 들어 사용자가 자연어로 작성된 판독문을 입력하면
[디지털투데이 AI리포터] 애플이 인공지능(AI)을 활용해 검색 기술 스포트라이트(Spotlight)의 기능을 강화하는 방안을 검토 중이라고 15일(현지시간) 나인투파이브맥이 전했다.앞서 블룸버그는 애플이 개발한 IDE(통합 개발 환경)인 엑스코드(Xcode)에 추가될 새로운 AI 기능을 설명하는 보고서를 발표했다. 여기에는 AI를 활용한 더욱 강력한 스포트라이트 버전에 대한 설명도 포함됐다. 새 버전은 기존보다 복잡한 작업을 수행하고 특정 앱에 연결할 수 있는 등의 기능을 골자로 한다.스포트라이트는 아이폰, 아이패드, 맥에서 사용
[디지털투데이 AI리포터] 애플이 마이크로소프트(MS)의 깃허브 코파일럿에 대적할 인공지능(AI) 도구를 준비하고 있다고 15일(현지시간) 블룸버그통신이 전했다.애플은 인공지능(AI) 기능을 강화하기 위해 새로운 소프트웨어 도구를 개발 중이다. 애플의 새로운 AI 도구가 최근 MS의 깃허브 코파일럿과 유사하게 작동한다고 알려지며 주목을 받고 있다. 또한 애플은 앱 테스트용 코드를 생성하는 데 AI를 사용하는 방안을 모색 중이다. 이러한 움직임은 애플이 생성형 AI와 대규모언어모델(LLM)에 대한 추진에 나섰다는 것을 반증한다. 실제
[디지털투데이 AI리포터] 스터빌러티 AI가 최신 이미지 생성 모델 '스테이블 캐스케이드'(Stable Cascade)를 공개했다. 이는 이전 모델인 스테이블 디퓨전(Stable Diffusion)보다 더 빠르고 강력하다는 설명이다.14일(현지시간) IT매체 더버지에 따르면 스테이블 캐스케이드는 사진을 생성하고, 생성된 이미지를 변형하거나 기존 사진의 해상도를 높일 수 있다. 또 모델 이미지의 특정 부분만 채워 편집하는 인페이팅 및 아웃페인팅 기능, 기존 사진의 가장자리만 사용해 새로운 사진을 만들 수 있는 캐니 엣지(canny e
[디지털투데이 황치규 기자]ERC-20과 대체불가토큰(NFT) 기능을 결합한 실험적인 토큰 표준인 ERC-404가 이더리움 생태계에서 관심을 끌고 있다.8일 디파이언트에 따르면 첫 ERC-404 토큰인 판도라는 가치는급증해, 1만6600달러에 거래되고 있다. 2월 2일 출시 이후 5000% 이상 상승한 수치다. DEX스크리너(DEXscreener)에 따르면 판도라 현재 시가 총액은 1억6600만달러 규모다.NFT마켓플레이스인 블러(Blur)에서 판도로 토큰 플로어 프라이스(floor price)는 7.45달러다. 1300명 이상 홀
[디지털투데이 AI리포터] 애플이 이미지 편집 인공지능(AI) 모델 'MGIE'(MLLM-Guided Image Editing)를 출시했다고 7일(현지시간) IT매체 더버지가 전했다.애플과 미국 캘리포니아대학교 산타바바라 캠퍼스 연구진이 공동 개발한 MGIE는 텍스트 프롬프트(지시어)를 통해 이미지를 자르거나, 크기를 조정하고, 뒤집고, 필터를 추가할 수 있다. 사용자는 사진에서 변경하고 싶은 부분을 입력하기만 하면 되는 것이다. 예를 들어, 페퍼로니 피자 이미지 편집 시 "더 건강하게"라는 프롬프트를 입력하면 야채 토핑이 추가된다
[디지털투데이 황치규 기자]마이크로소프트가 자사가 제공하는 생성형AI 기술을 도입해 성과를 내고 있는 기업들 사례를 공개했다.회사 측에 따르면 보다폰(Vodafone)은 마이크로소프트와 협력해 유럽과 아프리카 전역 수백만 명을 위한 고객 중심 AI 및 클라우드 서비스 개발에 나서고 있다. 월마트는 마이크로소프트 플랫폼 기반으로 고객 및 직원이 사용할 수 있는 생성형 AI를 개발하고 있다. 바이엘(Bayer)은 마이크로소프트 365 코파일럿(Copilot for Microsoft 365)을 도입, 평소 정보 검색에 소요되는 수백 시간
[디지털투데이 AI리포터] 애플이 시스템 설정(Configuration)을 구성하기 위한 프로그래밍 언어 '피클'(Pkl)을 오픈소스로 공개했다. 애플이 내부에서 사용하던 언어를 오픈소스로 일반에 공개한 제품이다.기가진 등 외신에 따르면, 피클은 설정 항목을 제이슨(JSON), YAML 외에도 코틀린, 루비, 자바스크립트 등의 형식으로 자유롭게 출력 가능하다. 시스템 설정을 지정할 때 JSON이나 YAML 등의 정적 언어를 사용하면 표현력에 한계가 있어 코드가 반복되거나 구문 오류가 발생하기 쉽다. 이를 해결하기 위해 보조 도구를