본문 바로가기
INFO/생활정보

OpenAI, 달리3 출시(DALL-E 3) 세 번째 버전을 출시하다!

by naring_e 2023. 9. 21.
반응형

OpenAI, 달리(DALL-E 3) 세 번째 버전 출시

- DALL-E 3은 ChatGPT와 통합되므로 더 이상 프롬프트를 생각할 필요가 없습니다. -

 


 

| OpenAI 의 DALL-E 3 발표

open AI

OpenAI는 DALL-E의 세 번째 버전을 발표했다. 달리는 생성적 AI 시작 예술 플랫폼으로, 해당 버전에서는 사용자가 ChatGPT를 사용하여 프롬프트를 생성하고 더 많은 안전 옵션을 포함할 수 있다.

 

DALL-E는 텍스트 프롬프트이미지로 변환한다. 그러나 DALL-E 2조차도 특정 문구를 무시하면서 문제가 발생했었는데, OpenAI 연구원들은 최신 버전이 상황을 훨씬 더 잘 이해한다고 말했다.

 

DALL-E 3의 새로운 기능은 ChatGPT와의 통합이다. ChatGPT에 프롬프트를 표시하도록 요청하면 챗봇은 DALL-E 3이 따라갈 수 있도록 단락을 작성한다. 다른 사용자는 DALL-E에 대한 구체적인 아이디어가 있는 경우 자신의 프롬프트를 계속 사용할 수 있다.

 

DALL-E 3

DALL-E의 새 버전은 10월에 ChatGPT Plus 및 ChatGPT Enterprise 사용자에게 처음 출시될 예정이며, 가을에는 연구실과 API 서비스가 출시될 예정이다. OpenAI는 DALL-E 3의 출시를 시차적으로 계획하고 있지만 무료 공개 버전이 언제 출시될지는 밝히지 않았다.

 

OpenAI는 외설적이거나 잠재적으로 혐오스러운 이미지 생성을 방지하기 위한 강력한 안전 조치를 마련하는 데 DALL-E 3에 많은 작업을 집중했다고 주장한다. 시스템의 안전성 테스트를 위해 의도적으로 시스템을 중단시키려는 그룹인 외부 레드 팀과 협력했으며, 명시적이거나 폭력적인 프롬프트를 피하기 위해 특정 단어를 무시하도록 언어 모델을 가르치는 방법인 입력 분류기에 의존했다고 밝혔다. DALL-E 3는 또한 프롬프트에 이름이 구체적으로 언급되어 있는 경우 공인의 이미지를 재현할 수 없다.

 

OpenAI 대변인은 DALL-E 3살아있는 예술가 스타일의 이미지 생성을 거부하도록 훈련되었다고 밝혔다. 메시지가 표시되면 특정 아티스트 스타일의 예술 작품을 모방할 수 있는 DALL-E 2와는 다르다고 한다.

 

 

 

 

| DALL-E 3 - 이미지에 텍스트 고정

 

유튜버 MattVidPro AI는 "이렇게 좋은 이미지 생성을 본적이 없습니다!"라는 제목으로 하나의 동영상을 업로드했다.

Matt가 영상에서 보여주는 이미지의 눈에 띄는 특징 중 하나는 AI 이미지 생성기가 잘 못했던 작업, "이미지에 텍스트를 고정하는 모델"의 개선된 능력을 보여주었다.

그랜드 테 프트 오토 V

 

더 놀라운 것은 비디오 게임인 "Grand Theft Auto V"의 제품 사진이다.

언뜻 보기에 정말 비디오 제품 사진처럼 보이지만 DELL-3 가 생성한 이미지이다.

Matt는 "현재 대부분의 AI 이미지 생성 모델은 텍스트 철자를 이렇게 일관되게 맞출 수 없습니다"라고 했다.

반응형