AI 이미지 생성 도구들이 많은 인기를 끌고 있다. 가장 인기있는 두 개의 도구는 MidJourney와 Stable Diffusion일 것이다. 두 도구 각기 특성과 이에 따른 장단점이 있다. 중요한 것은 자신에 적합한 도구의 선택이다. AI 이미지 생성 도구는 기존 예술작업을 학습데이터로 삼아, 새로운 새로운 작업 결과를 만들어 낸다. 결과물은 세련된 이미지로부터 실험적 작업에 이르기까지 다양하게 만들어 낸다. 

 

Midjourney

Midjourney는 프롬프트라고 이야기하는 텍스트를 입력한다. David Golz가 발명한 방법이다. Discord를 이용하여 Midjourney를 사용할 수 있다. 고품질의 이미지를 만든다. Midjourney는 인간의 상상력을 자극하는 것을 목적으로 하고 있다.

 

장점

  • 고품질의 그래픽
    • Midjourney는 고품질 그래픽을 만들기 위한 도구이다. 작품이나 마케팅 목적으로 하는 작업을 위한 좋은 도구이다.
  • 타인 작품 참고
    • Midjourney를 사용할 때, 다른 사람들의 작업 또한 볼 수 있다. 다른 사람의 작업을 통한 영감을 얻을 수도 있다.
  • 적정한 가격
    • Midjourney의 가격은 그리 비싼편이라 할 수 없다. 초기 25분 GPU 시간 동안 무료이다. 기본 회원 가격으로 200분 GPU 시간 사용에 월 $10이다. 이를 이용할 경우 개인 챗봇을 사용할 수 있으며, 개인용 접근 방식을 선택 사용할 수 있다. 표준 회원 가격은 월 $30이다. 15시간 GPU 시간의 사용이 가능하며, 기본 회원이 누리는 혜택도 같이 누린다. 
  • 단순한 인터페이스.
    • AI 이용 이미지생성 인터페이스가 비교적 단순하다. Discord를 이용하여 손쉽게 사용 가능하다.

 

단점

  • 제한된 커스터마이징
    • Midjourney는 좋은 이미지 생성 도구이다. 그러나, 더 좋은 전문적 제어를 할 수 있는 소프트웨어를 원할 수 있다. Midjourney는 다른 유사 생성 도구들에 비하여 제어 기능이 부족하다. 특정 기능을 이용한 이미지 생성을 단점이 될 수 있다. 자신이 원하는 제어 가능성이 매우 제한적이다. 색상 팔렛이나 스타일 등의 변경이 어렵다.  
  • 타 플랫폼과의 통
    • 일부 AI 예술 도구는 다른 도구와 통합이 가능하다. 이 통합 기능은 Midjourney에서는 지원하지 않는다.

 

Stable Diffusion

Stable Diffusion은 탁월한 AI 기반 이미지 생성기이다. 이 또한 고품질의 이미지를 만들어낸다. 매우 안정적이며 제어가 가능하다. Midjourney와 같이 Stable Diffusion은 문자 프롬프트를 사용하여 이미지를 만든다. Stable Diffusion은 두 개 부분으로 나뉘어진다. 하나는 이미지 생성 부분이고, 다른 하나는 이를 테스트하는 부분이다. 사전에 훈련된 데이터를 사용하여 새로운 이미지들을 만들어 낸다. 학습을 통해 이미지 생성을 구체화 한다. 무작위 단순한 이미지로부터 나중에 복잡한 이미지를 만들어 낸다.

 

장점

  • 쉬운 사용성과 빠른 이미지 생성
    • Stable Diffusion은 매우 사용이 쉽다. 초보의 경우에도 매한가지이다. 고품질의 이미지를 빠르게 생성한다. 웹사이트 이해가 쉽다. Stable Diffusion은 다양한 이미지를 생성한다. 조경으로부터, 예술 작품에 이르기까지. 인물화를 만들 수 있다. 상세한 디테일과 현실감 있는 결과도 만들어 낼 수 있다.
  • 프라이버시 보호
    • 웹사이트는 자신의 개인정보를 입력하지 않아도 된다. 사용자의 데이터를 수집하지 않으며, 안전하며, 얼마든지 무료로 사용 가능하다.
  • 무료
    • 웹사이트에서 직접 무료로 사용할 수 있다.
  • 타 플랫폼과의 통합
    • 다양한 방식으로 타 플랫폼과 연계하여 사용이 되고 있으며, 사용 가능하다.

 

단점

  • 새로운 도구
    • Stable Diffusion은 상대적으로 새로운 도구이다. 따라서 개선의 여지가 남아 있다. 아직도 개발자들은 고급 기능 개발에 노력하고 있다. 이는 사용자가 원하는 것 만큼 좋은 이미지를 만들지 못할 수도 있다는 것이다.

결론

미래에 AI 이미지 생성기는 보다 현실적이고 상세한 예술작품을 만들어 낼 것이다. 알고리즘은 보다 복잡해 질 것이며, 우리는 보다 세련된 결과를 얻을 수 있을 것이다. 전체적으로, 이들 도구는 예술과 디자인 분야에 유용한 도구로 사용할 것이다. 

   MidJourney와 Stable Diffusion은 좋은 품질의 결과를 만들어낸다.

  • MidJourney는 상상력이 강조된 이미지를 만들어 내며,  Stable Diffusion이 보다 자연스러운 결과를 가져온다. 어떠한 도구를 사용하는 것은 자신의 목적에 의한 것이다.
  • 초보의 경우 Stable Diffusion이 보다 바람직하다. 쉽고, 무료이며, 빠르다. 그리고 현실적 이미지 생성을 목적으로 하는 경우 바람직하다.
  • MidJourney를 사용은 상상력이 풍부한 이미지 생성을 가능하게 한다.

그림 1. 질문에 대답하는 전형적 모습

ChatGPT에 대한 관심이 뜨겁다. 가장 우선적으로 사용할 수 있고, 사용성이 높으며, 우려를 낳고 있는 사용분야이다. 이를 이용하여 최소한의 입력으로 문서를 만들 수 있다. 예를 들어 ‘MS word 사용을 위한 5가지 특징을 기술해 줘’라고 물으면, 그림 1과 같이 대답을 한다. ChatGPT는 출력 량의 제한이 있어 10가지 특징을 기술하라 하면, 7개 정도에서 멈추는 성능의 한계를 보인다. 

   이와 같은 문제를 해결하기 위한 방법으로 추가적으로 ‘조금 더 설명해 달라’ 고 할 수 있다. 그림 2는 상세히 기술하라는 요구에 대한 ChatGPT의 응답이다.

그림 2. 보다 상세한 기술을 요구할 경우와 대답

다른 방법으로, 이전 기술되었던 '항목에 대한 상세한 기술'을 요구할 수 있다. 그림 3은 이러한 사례를 보여주고 있다. 이전에 기술되었던 템플릿에 대한 설명을 조금 더 상세히 요구한 사례이다. 

그림 3. 이전 항목에서의 설명을 보다 상세히 기술하도록 요구한 사례.

 

ChatGPT에게 시를 작성을 요청할 수도 있다. 물론 ChatGPT에 있어서도 쉽지 않은 일인 모양이다. 그림 4은 한번의 에러 이후 작성한 추운 눈내리는 겨울날에 관한 시이다.

그림 4. 한번 실패후 작성한 시 작성의 사례

AutoDraw는 2017년에  Google이 발표한 그리기 도구이다. 기계학습을 이용하여 모든 사람들이 빠르게 그릴 수 있게 한다. 무료이며, 스마트폰, 태블릿, 노트북, 데스크톱에서 사용할 수 있다. QuickDraw에서 사용되었던 기술을 사용하고 있으며, 사용자가 무엇을 그리려고 하는지 추측한다. 현재 수백 개의 그림을 추측할 수 있으며 시간이 지남에 따라 더 많은 추측기능이 보강되고 있다.

 

AutoDraw

Microsoft는 혁신적 기술이라고 불리는 인공 지능 기술 ChatGPT 로 검색 엔진을 강화하여 Bing 사용의 활성화를 꾀하고 있다. 올 3월에 AI기능을 보완한 검색 엔진을 출시할 것으로 예상된다. The Information에 의하면 ChatGPT를 검색엔진에 심음으로써 검색에서 인간과 같은 대화를 할 수 있도록 기능을 강화하고 있다.

        
 Information 에 따르면 Microsoft가 ChatGPT를 심는 이유는 Bing 검색이 더 인간적인 답변을 제공할 수 있도록 하기 위함이다. 이는 Google과의 경쟁을 위한 것이다. Bing 검생엔진에서 AI가 실제로 어떻게 사용되는지에 대한 세부 정보는 잘 알려지지 않았다. 그러나 ChatGPT는 보이지 않는 존재로 기능할 가능성이 높다. Microsoft는 올해 3월에 새로운 AI 기능을 출시할 것으로 알려졌다.

'AI > 인공지능' 카테고리의 다른 글

ChatGPT의 사용 - 01  (0) 2023.01.18
AutoDraw - AI 기반 Drawing 도구  (0) 2023.01.09
TED - 모두를 위한 AI를 향하여  (0) 2023.01.06
생산성을 크게 높여주는 AI 도구 4가지  (0) 2023.01.05
생성형 AI의 미래  (0) 2023.01.05

 

오늘날 AI는 거대 기술기업의 고도로 훈련된 엔지니어들의 전유물이다. 그러나  왜 거대기술기업들 만이 AI에 집착하는 것인가? 이는 AI 프로젝트를 진행하기 위하여는 많은 숙련된 기술자와 엄청난 자금이 필요하기 때문일 것이다. 이들은 많은 사용자를 통하여 매출을 올릴 수 있다는 생각을 하고 있다.

   그러나 현재 이들 AI기술이 이들 기업 바깥으로 나아갈 경우, 잘 작동하지 않습니다. 예로, 피자가게를 들 수 있습니다. 좋은 맛집의 경우에도, 가끔 차가운 피자가 남아나고, 재료가 모자라기도 합니다. 그러나 이 상점은 데이터를 만들고 있으며, 데이터를 이용하여 AI 기술 적용의 가능성이 충분히 있다. 

   AI는 바른 데이터를 입력할 경우, 패턴을 잘 읽어 낸다. 이 능력을 이용하여 좋은 피자를 만들 수 있게 도울 것이며, 더 좋은 가게 운영을 도울 수도 있을 것이다. 지금까지는 많은 AI를 훈련하는데는 엄청난 데이터가 필요하였지만, 이제 적당한 규모의 데이터만으로도 적용 가능하게 되고 있다. 문제는 AI를 적용할 팀을 고용할 수 없다는 것에 있다.

 

어찌하면 이들 작은 기업들이 AI를 사용하게 할 수 있을 것인가? 이는 롱테일 문제일 수 있다. 오늘날 많은 기업들이 중소기업들을 위한 AI 플랫폼을 만들고자 하고 있다. 물론 이들 플랫폼이 실제적으로 사용 가능하기까지는 수 년이 걸릴 것이다. 그러나 대기업에 의존하지 않고 스스로 AI 시스템을 만들 수 있는 세상을 만들기 위한 노력들이 진행되고 있다.

 

Tome

이 도구는 AI를 기반으로하는 프리젠테이션 제작용 도구이다. GPT-3와 DALL-E를 내적으로 사용하고 있다. 무료이다.

 

QuillBot

AI 기반 문서작성 도구이다. 같은 내용으로 문장을 바꾸어주고, 스타일도 변경할 수 있다. 이 도구의 사용은 표절의 문제를 해결할 수 있게 한다.

 

Suprehuman

이메일 도구이다.

 

Notion

노트 작성 앱이다. 아직 인공지능 기능 연결이 되어 있지 않다.

'AI > 인공지능' 카테고리의 다른 글

MS사, 검색 엔진에 ChatGPT 탑재 예정  (0) 2023.01.08
TED - 모두를 위한 AI를 향하여  (0) 2023.01.06
생성형 AI의 미래  (0) 2023.01.05
안면 인식에 대한 3가지 잘못된 믿음  (0) 2023.01.04
AI 시대의 교육  (0) 2023.01.04

생성형 AI는 기계학습을 사용하며, 새로운 콘텐츠를 만든다. 문장, 이미지, 음악, 또는 비디오 등 다양한 형태가 있다. 핵심은 기술이 창작자 아이디어를 촉진하는 것이다. 2022년 OpenAI는 DALL-2와 ChatGPT를 내 놓았다. Stability AI의 Stable Diffusion 또한 세상에 모습을 드러 냈다. 그러나 아직 우리를 놀라게 할 것들이 많으며, 이 기술을 사용한 새로운 어플리케이션들이 봇물을 일으킬 것이라고 생각된다. 이 기술이 향후 어떻게 될 것인가?에 대한 전망이다.

 

생성형 AI는 점점 더 주류로 자리잡게 될 것이다.

현재 생성형 AI는 연구원, 개발자, 광고, 마케팅, 크리에이터 커뮤니티 등에서 얼리 어답터들이 사용하고 있다. 그러나 2023년에는 이 기술이 더욱 세련되어지며, 사용자 친화적으로 변화하며, 여러 기능을 통합하는 플랫폼들이 늘어나게 될 것이다. 우리는 광고 카피를 위해 특별한 작가가 필요하지 않게 되며, 애니메이션 제작을 하기 위하여 디즈니에 의존할 필요가 없게 될 것이다. 이를 깨달은 일반인들과 비즈니스에서 생성형 AI의 사용이 늘어나게 될 것이다. 이메일 작성, 홍보, 제품추천, 컨셉 아트, 홍보 자료 작성 등 다양한 적용을 통해 생성형 AI는 산업의 민주화를 가져올 가능성을 지니고 있다.

 

콘텐츠의 품질 향상이 이루어지게 될 것이다.

생성형 AI에 대한 주요 비판 중 하나는 내용의 비현실성에 있다. 그러나 앞으로 더 새롭고, 구체적인 소프트웨어의 등장으로 생성형 AI가 만든 콘텐츠의 현실성이 증가할 것이다. 이 생성형 AI의 주요 이점은 반복적이거나 일상적 작업에 대한 시간, 비용, 번거로움을 줄일 수 있다는 것이다. 또한 성능의 개선으로 품질이 더욱 개선될 것으로 예상된다. 보다 정교한 모델, 보다 낳은 최적화 기술, 우수한 하드웨어와 소프트웨어가 이를 뒷받침할 것이다.  조만간 이 기술은 파괴적으로 세상을 변화시킬 것이다.

 

더 많은 기업들이 생성형 AI를 사용할 것이다.

생성형 AI는 새로운 마케팅, 광고 뿐만 아니라 제품 아이디어 생성에 적합하다. 아직 단방향 커뮤니케이션의 형식으로 사용되고 있으나, 조만간 양방향 상호작용이 가능하게 될 것이다. 고객과 대화하며, 고객의 요구사항을 이해하는, 거의 인간과 같은 대응을 할 것이다. 일상적 문의와 요청을 처리하는 등의 업무 생산성을 높일 수 있을 것이다. 생성형 AI는 판매 분야에서도 사용될 것으로 예상된다. AI를 이용하여 고객을 위한 맞춤형 제안을 통한 판촉을 할 수 있을 것이다. 또한 고객 서비스, 대응 등의 도구로도 사용하게 될 것이다.

 

새로운 직업이 등장할 것이다.

생성형 AI의 보급은 이 기술 사용에 숙련된 사람들에게 새로운 직업을 만들 것이다. 스토리텔러, 캐릭터 제작, 시각화 디렉터와 같은 창의분야에서의 전문가 수요가 증가할 것이다. 이 전문가는 생성형 AI의 활용으로 최고 품질의 결과물을 만들 수 있어야 한다. AI가 일자리를 파괴할 것인지는 확실치 않다. 생성형 AI가 할 수 있는 능력을 발휘하게 하기 위해서는 창의적 재능을 가진 사람이 필요한 것은 현실이다.

 

규제가 높아질 것이다.

생성형 AI 보급과 성장에 따라 정부와 산업계는 규제의 필요성을 느낄 것이다. 모든 여느 기술과 같이 생성형 AI는 사용자에 따라 긍정적일 수도 있으며, 부정적일 수 있다. 이 기술은 강력한 기능을 가지고 있으며, 이는 이점과 함께 위험도 도사리고 있다는 의미이다. 가짜 정보, 도용, 개인정보 침해 등의 우려가 있으며, 이를 방지하기 위한 규제가 요구될 것이다.

'AI > 인공지능' 카테고리의 다른 글

TED - 모두를 위한 AI를 향하여  (0) 2023.01.06
생산성을 크게 높여주는 AI 도구 4가지  (0) 2023.01.05
안면 인식에 대한 3가지 잘못된 믿음  (0) 2023.01.04
AI 시대의 교육  (0) 2023.01.04
AI의 사용 분야  (1) 2023.01.03

안면인식시장의 성장률은 연 15%이다. 보안 시장에서 가장 빠르게 성장하고 있는 분야이다. 이 기술은 많은 이점이 있으나, 많은 우려를 낳고 있는 기술이기도 하다. 이 우려들은 다음과 같다.

 

1. 안면 인식의 안전성

안면인식 기술은 이미지를 다원적으로 분석한다. 이를 위해 고유한 수학 및 동적 패턴을 사용한다. 이 기술은 공공안전 및 보안 강화에 사용되고 있다. 도난, 납치, 테러 등 범죄 예방에 많은 도움을 주고 있다.

 

2. 안면인식의 프라이버시 침해 문제

불특정 다수를 대상으로 얼굴이 스캔되고 있다는 사실은 프라이버시 문제를 낳는다는 생각을 하지 않을 수 없다. 그러나, 안면 인식기술은 이미지 데이터를 250여개 점에 대한 숫자와 문자열로 변환하여 분석한다. 따라서, 안면인식 도구는 얼굴을 비교하는 것이 아니라, 대상을 알려진 숫자 및 데이터베이스와 비교를 한다. 얼굴 자체에 대한 설명 데이터는 데이터베이스에 암호화 되어 저장된다. 물론, 이 기술이 비윤리적으로 사용될 가능성은 상존한다. 이는 고의성과 윤리성의 문제이다.

 

3. 안면인식의 가격

안면 인식기술이 고가일 것이라는 편견이 있다. 그러나, 안면인식 기술은 점점 더 대중화되고, 가격이 저렴해 지고 있다.

 

참고문헌

 

'AI > 인공지능' 카테고리의 다른 글

생산성을 크게 높여주는 AI 도구 4가지  (0) 2023.01.05
생성형 AI의 미래  (0) 2023.01.05
AI 시대의 교육  (0) 2023.01.04
AI의 사용 분야  (1) 2023.01.03
기계학습, 그리고 Deep Learning  (0) 2023.01.02

+ Recent posts