앤트로픽(Anthropic)의 헌법적 AI(Constitutional AI)  [사진: 앤트로픽]
앤트로픽(Anthropic)의 헌법적 AI(Constitutional AI) [사진: 앤트로픽]

[디지털투데이 AI리포터] 인공지능(AI) 스타트업 앤트로픽(Anthropic)은 9일(현지시간) 헌법적 AI(Constitutional AI) 교육 방식을 공개했다. 

9일(현지시간) IT매체 아스테크니카에 따르면, 앤트로픽은 이 헌법적 AI로 지난 3월 출시된 앤트로픽의 클로드(Claude) 챗봇에 가치를 부여해 AI 시스템의 투명성, 안전성, 의사 결정 등에 대한 우려를 해결하고자 한다.

초기의 대규모 언어 모델(LLM)은 폭탄 제조법, 인종차별, 자살 유도 등의 부적절한 답변을 유도했다. 이에 오픈AI의 챗GPT와 마이크로소프트의 빙챗 등의 챗봇은 인간 피드백을 통한 강화 학습 기술로 오작동을 수정한다.

반면, 앤트로픽은 헌법적 AI를 기반으로 강화 학습 등을 통해 인간의 개입 없이 AI 언어 모델의 답변을 출력한다. 앤트로픽의 원칙에는 인권 선언, 애플의 서비스 약관 일부와 앤트로픽의 AI 연구소 원칙을 포함한다.
 
클로드 헌법은 범용적인 지침부터 철학적 고찰까지 다양한 주제를 다루며 관련 목록은 앤트로픽 웹사이트에서 확인할 수 있다.

앤트로픽의 AI 모델은 헌법적 AI에 기반해 자체적으로 응답을 비판 및 수정하고, 올바른 답변을 출력하기 위해  AI 생성 피드백에 의존한다. 해당 모델은 매번 다른 원칙을 무작위로 선택한다. 훈련 과정은 지난해 12월 발표된 연구 논문에서 자세히 설명돼 있다

앤트로픽은 헌법적 AI를 추가 연구와 피드백을 기반으로 계속해서 개선할 계획이다.

키워드

#AI #앤트로픽
저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지