Stable Diffusion을 사용하여 이미지를 만들기 위하여는 문자 형식의 프롬프트가 필요하다. 즉, 자신이 원하는 결과를 얻기 위한 프롬프트 사용법을 알아야 한다는 것이다. 그렇치 않을 경우, 최적의 결과물을 얻을 수 없다. 이상적 결과물을 얻기 위하여는 다음의 몇 가지 주의하여야 할 사항들이 있다.

 

Stable Diffusion, DALL-E 또는 MidJourney 등의 AI 이미지 생성기는 프롬프트를 잘 다루어야 한다. 멋진 이미지를 효율적으로 작성하기 위하여 필수적으로 숙달이 되어야 하는 방법이다. Stable Diffusion이 2022년 8월에 출시한 이후 많은 사람들은 이상적 결과를 얻을 수 있는 최선의 방법을 찾기 위하여 노력하여 왔으며, 또한 앞으로도 지속될 것이다.

 

가능한 구체적으로 작성할 것

Stable Diffusion은 특히 MidJourney와 비교하여 구체적인 프롬프트에 좋은 결과를 만들어 낸다. 원하는 이미지를 가능한 구체적으로 기술하여야 한다. 인터넷에 인기 있는 동물인 ‘"Cute cats’를 이용한 사례를 들 수 있다.

Prompt: “Cute Cat

 

매우 예쁜 고양이 이미지들을 생성한다. 만약 회색 고양이를 원한다면 프롬프트로 ‘cute gray cats’를 입력하여야 한다. 아래 그림은 그 결과 이미지를 보여주고 있다.

이 결과에 추가적으로 원하는 내용을 추가할 수 있다. 예를 들어 파란색 눈을 가진, 나비넥타이를 한 고양이를 요구할 수 있다. 이 경우 ‘Cute Grey Cat with blue eyes, wearing a bowtie’라고 프롬프트를 입력한다.

이와 같은 방식으로 이미지를 생산할 수 있다. 보다 상세히 기술하고, 다른 키워드로 작성을 시도하여보며, 이에 따른 결과들을 기억하여야 한다. 일부 단어들과 문장들이 영향을 크게 끼치며, 이에 따른 프롬프트 조정이 필요하다.

 

특정 예술 스타일이나 도구를 구체화 하여야 한다.

구체적 기술이라는 것은 끝이 없는 작업이다. 자신이 원하는 스타일을 추가할 수 있다. 이전 사례 ‘Cute gray cat’에 아크릴 그림 형식을 추가할 수 있다. 이를 위하여 ‘cute grey cat, acrylic painting’이라고 입력하면 다음과 같은 결과를 얻는다.

일반적으로 몇 몇개 단어를 사용하여 시작한 후 하나씩 단어를 추가하여 만들어 가는 것이 좋을 수 있다. Stable Diffusion은 많은 스타일들을 지원한다. 이 사례는 매우 단순한 경우이다. 좋은 결과를 위하여는 많은 키워드를 입력하여야 할 수도 있다. 다음은 이들 예술 스타일들을 알 수 있는 참고자료이다. 

특정 예술가 지정

Stable Diffusion은 특정 스타일이나 도구를 따라할 수 있다. 특정 예술가를 따라 그릴 수 있다. 예로 Pablo Picasso의 경우를 이야기할 수 있다. 예술가를 지정하기 위하여 ‘by 예술가 이름’을 프롬프트에 집어 넣어야 한다. 흥미로운 결과를 얻을 수 있다.

 

또한 하나 이상의 예술가를 결합하여 그리게 할 수 있다. 이 경우 매우 재미 있는 결과를 만들어 내기도 한다.

 

 

가중치 주기

가능한 모든 키워드를 이용하였지만, 자신이 원하는 이미지만을 만들 수 있다. 가중치는 이들 키워드들에 대한 비중을 달리하는 방식이다. Stable Diffusion은 이를 지원한다. 특정 단어에 대하여 더 많은 관심을, 그리고 다른 단어에 대하여는 조금 덜한 관심을 갖도록 조정할 수 있다. 단어 뒤에 콜론과 소숫점의 숫자를 적어 넣어야 한다. 단, 소숫점의 합계는 1이라는 것이다. 예를 들어 ‘cute, grey cat: 0.7’이라고 입력하면, Gray cat에 70%, cute에 30%의 관심으로 이미지를 생성한다. 예를 들어 ‘Cute:0.10, Grey Cat:0.60, Unreal Engine rendering:0.30’과 같이 기술하여야 한다. 대부분 GUI 형식의 Stable Diffusion이 이 같은 내용을 반영하고 있다.

 

다른 곳에서 영감 찾기

Stable Diffusion를 비롯한 예술작품 생성기는 폭발적 인기를 얻고 있다. 이제 수 백만개 이상의 AI 생성 이미지들이 인터넷에 돌아다니고 있다. 중요한 것은 이들이 어떠한 프롬프트를 사용하여 만들어졌는가를 알아 둘 필요가 있다.

참조할 곳들은 다음과 같다.

 

기타 중요한 설정 조정

좋은 프롬프트는 Stable Diffusion 사용의 가장 어려운 부분이다. 다른 중요 설정 항목은 다음과 같다.

  • CFG: Stable Diffusion이 프롬프트를 따르는 정도를 결정한다. 숫자가 높을수록 프롬프트를 더 잘 따르는 반면, 숫자가 낮을수록 AI는 더 자유로운 해석을 한다.
  • 샘플링 방법:  이미지를 노이즈에서 인식 가능한 모양으로 정제하는 방법이다. 이 중 몇 가지를 시도해 볼 필요가 있다. Euler_a, k_LMS 및 PLMS가 인기 있는 프롬프트이다.
  • 샘플링 단계:  최종 결과가 제공되기 전에 이미지가 샘플링되는 횟수이다. 때로는 30단계에서 좋은 결과를 얻을 수도 있고 때로는 50단계 또는 80단계로 가야 할 수도 있다. 일반적으로 150단계 이상에서는 더 나은 결과를 얻지 못한다. 더 적은 단계로 시작하여 추가하는 방식이 일반적이다.

 

양식화된 프롬프트 중 일부

다양한 프롬프트 가운데 일부 흥미로운 구성의 프롬프트를 소개한다. 이들 사례들은 매우 안정적 결과를 보여준다. 주제를 선택하고 가지 프롬프트를 추가하기만 하면 된다. 일반적으로 Stable Diffusion은 일몰과 낙엽에 관한 좋은 이미지 결과를 만들어 낸다.

 

(Subject), 35mm, sharp

주제를 선정하고, 추가적 프롬프트를 기입하면 실제와 같은 사람, 동물, 전경의 결과를 얻을 수 있다.

photograph of mount everest with a beautiful lake, 35mm, sharp, golden hour

 

(Subject), low poly 3d render, vibrant pastel colors, tilt shift, film grain

이와 같은 입력은 예술적 결과를 얻을 수 있게 된다.

truck, low poly 3d render, vibrant pastel colors, tilt shift, film grain

 

(Subject), (Environmental Description), cinematic, dramatic, composition, sunny sky, brutalist, hyper realistic, epic scale, sense of awe, hypermaximalist, insane level of details, artstation HQ

주제와 환경적 기술을 하면, 자신이 원하는 환경에서의 도시 이미지를 만들 수 있다.

 

참고문헌

'AI > Image AI' 카테고리의 다른 글

ChatGPT를 이용한 프롬프트 작성  (0) 2023.01.19
Midjourney 프롬프트 사용 팁과 리스트  (0) 2023.01.04

AI 텍스트-이미지 작성 도구들은 기본적으로 프롬프트로 불리는 텍스트를 입력하여야 한다. 또한 텍스트는 영어여야 한다. 이에 따라 영문으로 ChatGPT에게 질문을 한 후, 이를 명사와 형용사 단어로 분리하여 입력하는 방법을 사용하여야 한다.

 

ChatGPT에 질문하기

프롬프트는 가능한 한 중심적 단어로 구성되어야 하며, 이에 따라 프롬프트 리스트는 지나치게 길어서는 안 된다. 가능하면 짧고 간결하게 기술을 하도록 하여야 한다. 프랭크 로이드 라이트의 전원주택에 관한 질문으로 프롬프트를 만들고자 하면 다음과 같이 질문으로 우선 문장을 만들면 된다. 

프롬프트 만들기

이와 같은 ChatGPT의 답으로부터 사용된 명사와 형용사를 분리하여 프롬프트로 사용될 단어들을 만들어 준다. 이를 실행하는 방법은 다음과 같다.

 

이미지 만들기

이들 단어를 중심으로 단어들을 삭제하거나 추가하여 원하는 환경에서, 원하는 건축 디자인을 생성해 나아간다. 이 사례는 대지를 미국이 아닌 히말라야의 눈내리는 언덕에 위치한 경우를 상상하게 한 경우이다. 

'AI > Image AI' 카테고리의 다른 글

좋은 Stable Diffusion 프롬프트 작성 방법  (0) 2023.01.20
Midjourney 프롬프트 사용 팁과 리스트  (0) 2023.01.04

AI 이미지 생성 도구들이 많은 인기를 끌고 있다. 가장 인기있는 두 개의 도구는 MidJourney와 Stable Diffusion일 것이다. 두 도구 각기 특성과 이에 따른 장단점이 있다. 중요한 것은 자신에 적합한 도구의 선택이다. AI 이미지 생성 도구는 기존 예술작업을 학습데이터로 삼아, 새로운 새로운 작업 결과를 만들어 낸다. 결과물은 세련된 이미지로부터 실험적 작업에 이르기까지 다양하게 만들어 낸다. 

 

Midjourney

Midjourney는 프롬프트라고 이야기하는 텍스트를 입력한다. David Golz가 발명한 방법이다. Discord를 이용하여 Midjourney를 사용할 수 있다. 고품질의 이미지를 만든다. Midjourney는 인간의 상상력을 자극하는 것을 목적으로 하고 있다.

 

장점

  • 고품질의 그래픽
    • Midjourney는 고품질 그래픽을 만들기 위한 도구이다. 작품이나 마케팅 목적으로 하는 작업을 위한 좋은 도구이다.
  • 타인 작품 참고
    • Midjourney를 사용할 때, 다른 사람들의 작업 또한 볼 수 있다. 다른 사람의 작업을 통한 영감을 얻을 수도 있다.
  • 적정한 가격
    • Midjourney의 가격은 그리 비싼편이라 할 수 없다. 초기 25분 GPU 시간 동안 무료이다. 기본 회원 가격으로 200분 GPU 시간 사용에 월 $10이다. 이를 이용할 경우 개인 챗봇을 사용할 수 있으며, 개인용 접근 방식을 선택 사용할 수 있다. 표준 회원 가격은 월 $30이다. 15시간 GPU 시간의 사용이 가능하며, 기본 회원이 누리는 혜택도 같이 누린다. 
  • 단순한 인터페이스.
    • AI 이용 이미지생성 인터페이스가 비교적 단순하다. Discord를 이용하여 손쉽게 사용 가능하다.

 

단점

  • 제한된 커스터마이징
    • Midjourney는 좋은 이미지 생성 도구이다. 그러나, 더 좋은 전문적 제어를 할 수 있는 소프트웨어를 원할 수 있다. Midjourney는 다른 유사 생성 도구들에 비하여 제어 기능이 부족하다. 특정 기능을 이용한 이미지 생성을 단점이 될 수 있다. 자신이 원하는 제어 가능성이 매우 제한적이다. 색상 팔렛이나 스타일 등의 변경이 어렵다.  
  • 타 플랫폼과의 통
    • 일부 AI 예술 도구는 다른 도구와 통합이 가능하다. 이 통합 기능은 Midjourney에서는 지원하지 않는다.

 

Stable Diffusion

Stable Diffusion은 탁월한 AI 기반 이미지 생성기이다. 이 또한 고품질의 이미지를 만들어낸다. 매우 안정적이며 제어가 가능하다. Midjourney와 같이 Stable Diffusion은 문자 프롬프트를 사용하여 이미지를 만든다. Stable Diffusion은 두 개 부분으로 나뉘어진다. 하나는 이미지 생성 부분이고, 다른 하나는 이를 테스트하는 부분이다. 사전에 훈련된 데이터를 사용하여 새로운 이미지들을 만들어 낸다. 학습을 통해 이미지 생성을 구체화 한다. 무작위 단순한 이미지로부터 나중에 복잡한 이미지를 만들어 낸다.

 

장점

  • 쉬운 사용성과 빠른 이미지 생성
    • Stable Diffusion은 매우 사용이 쉽다. 초보의 경우에도 매한가지이다. 고품질의 이미지를 빠르게 생성한다. 웹사이트 이해가 쉽다. Stable Diffusion은 다양한 이미지를 생성한다. 조경으로부터, 예술 작품에 이르기까지. 인물화를 만들 수 있다. 상세한 디테일과 현실감 있는 결과도 만들어 낼 수 있다.
  • 프라이버시 보호
    • 웹사이트는 자신의 개인정보를 입력하지 않아도 된다. 사용자의 데이터를 수집하지 않으며, 안전하며, 얼마든지 무료로 사용 가능하다.
  • 무료
    • 웹사이트에서 직접 무료로 사용할 수 있다.
  • 타 플랫폼과의 통합
    • 다양한 방식으로 타 플랫폼과 연계하여 사용이 되고 있으며, 사용 가능하다.

 

단점

  • 새로운 도구
    • Stable Diffusion은 상대적으로 새로운 도구이다. 따라서 개선의 여지가 남아 있다. 아직도 개발자들은 고급 기능 개발에 노력하고 있다. 이는 사용자가 원하는 것 만큼 좋은 이미지를 만들지 못할 수도 있다는 것이다.

결론

미래에 AI 이미지 생성기는 보다 현실적이고 상세한 예술작품을 만들어 낼 것이다. 알고리즘은 보다 복잡해 질 것이며, 우리는 보다 세련된 결과를 얻을 수 있을 것이다. 전체적으로, 이들 도구는 예술과 디자인 분야에 유용한 도구로 사용할 것이다. 

   MidJourney와 Stable Diffusion은 좋은 품질의 결과를 만들어낸다.

  • MidJourney는 상상력이 강조된 이미지를 만들어 내며,  Stable Diffusion이 보다 자연스러운 결과를 가져온다. 어떠한 도구를 사용하는 것은 자신의 목적에 의한 것이다.
  • 초보의 경우 Stable Diffusion이 보다 바람직하다. 쉽고, 무료이며, 빠르다. 그리고 현실적 이미지 생성을 목적으로 하는 경우 바람직하다.
  • MidJourney를 사용은 상상력이 풍부한 이미지 생성을 가능하게 한다.

+ Recent posts