728x90

많고 많은 생성형 AI 툴을 알아봤다면.

이를 활용하기위해 프롬프트를 어떻게 작성해야하는지 이야기해보려한다.

 

프롬프트란?

 

생성형 인공지능 (generative AI)에서의 "프롬프트(prompt)"는 AI 모델에게 원하는 작업을 수행하도록 지시하거나 유도하는 텍스트 또는 이미지다. 이는 모델이 특정 작업을 수행하기 위해 필요한 입력 정보를 제공하기도 한다.

 

프롬프트 작성법 101

 

1. 이미지 타입 입력하기

원하는 이미지 생성을 위해서는 이미지에 대한 정확한 설명이 필요하다. 먼저 묘사해야하는 부분은 어떤 이미지 타입인지이다.

 

예시

  • A photograph of…
  • A 3D rendering of…
  • A sketch of…
  • An illustration of…

사진인지 3D 렌더링인지 스케치나 페인팅의 종류인지 일러스트레이션인지. 어느 타입의 이미지인지를 묘사한다는 것은 쉽게 말해 전체적인 그림체를 결정하는 중요한 부분이다.

 

아래의 예시를 살펴보자.

(좌) A Photograph of a Rabbit. (우)A 3D rendering of a Rabbit.
A sketch of a rabbit.

 

사진인지, 스케치인지 3D 렌더링인지에 따라 이미지가 다른 모습을 보인다.

 

2. 그림의 주체

모든 생성형 AI 프롬프트는 원하는 이미지의 주체에 대해 묘사가 필요하다.

사람, 동물, 혹은 물건이나 추상적인 콘셉트 혹은 감정등 이미지의 중심이 되는 것에 대한 설정을 말한다.

 

예시

  • An illustration of an rabbit…
  • A photograph of a girl…
  • A 3D rendering of a desk…

3. 주체와 연관된 자세한 묘사

생성하고자 하는 이미지의 주체에 관련된 자세한 묘사를 곁들여야한다. 색상, 전체적 색감, 모양, 사이즈, 텍스쳐등이 이에 해당되는데. 예를들면 '강아지' 이미지를 만들려고 할때 그냥 '강아지'를 프롬프트에 입력하는 대신에 아래처럼 색깔을 추가해주는 것 만으로도 많은 변화를 찾아볼 수있다. 

(좌)an illustration of Red rabbit (우) an illustration of White rabbit

 

강아지의 색깔 이외에도 강아지 사이즈, 종류,  원하는 이미지에 포함했으면 하는 배경에 대한 묘사를 추가하게 되면 더 자세하고 커스터마이징된 이미지를 생성할 수있다는 것이다.

 

예시

  • An illustration of a red rabbit with yellow eyes…
  • A photograph of a guy wearing a blue suit…
  • A 3D rendering of a chair that’s round and green…

 

4. 스타일라이즈

클로드 모네 스타일

 

'추상적' '미니멀리스트' '초현실'같은 키워드를 포함해주면 생성형 아트를 스타일라이즈 해줄 수있다.이외에도 특정한 아티스트의 이름을 언급해서 스타일을 가져올 수도 있는데 예컨데 'Like Salvador Dali',  'Like Picasso' 같이 스타일이 뚜렷한 유명 화가나 아티스트의 스타일을 키워드에 포함하면 더 정교한 스타일라이징이 가능하다.

(좌) 살바도르 달리 스타일 , (우) 피카소 스타일

 

5.어떤식으로 구성할 것인가

최종 아웃풋 사이즈인 resolution, lighting 스타일, aspect ratio, 카메라 뷰의 구성을 조정할 수도 있는데. 사실 이 부분은 generative AI를 어느정도 이용한 이들이 조정해보는 걸 추천한다. 생성형 AI등에 따라 멤버십을 통한 제약이 걸려있기도 하기때문에 때로는 많이 쓸모 없을 수있는 프롬프트이다.

an illustration of white rabbit with surreal look taken from an aerial viewpoint.

예시

  • An illustration of a red rabbit with bright yellow eyes in the style of abstract expressionism with volumetric lighting.
  • A photograph of a president wearing a navy suit with a minimalist look taken from an aerial viewpoint.
  • A 3D rendering of a yellow chair that’s round in the style of cubism with a resolution of 900X900.

 

6. 프롬프트 작성 팁

  • 어려운 단어나 키워드를 피할것
  • 프롬프트는 짧고 간결하게. 대략 3~7개의 단어로 묘사하는 게 좋다.
  • 대조되는 단어 사용하지 말것. 예를 들면 '현실적'&'추상적' 이라는 단어가 같이 들어간 프롬프트는 피하는게 좋다.
  • Chat GPT같은 다른 AI를 활용해서 프롬프트를 작성해볼 것

50 AI art prompt 예시

1. Surreal landscape with floating islands.
2. Futuristic cityscape at night with neon lights.
3. Portrait of a mythical creature blending elements of a dragon and a phoenix.
4. Abstract pattern inspired by underwater coral reefs.
5. Artwork depicting an enchanted forest with glowing fireflies.
6. Retro-futuristic scene set in a space station café.
7. Cyberpunk street scene with flying cars and holographic advertisements.
8. Illustration of a steampunk-inspired airship flying over a Victorian city.
9. Psychedelic artwork with vibrant colors and swirling patterns.
10. Minimalist composition featuring geometric shapes and soft pastel colors.
11. Cosmic landscape with swirling galaxies and a majestic supernova.
12. Artwork inspired by Japanese cherry blossoms in a traditional ink wash style.
13. Scene from a post-apocalyptic world reclaimed by nature.
14. Fantasy castle perched on a cliff overlooking a stormy sea.
15. Illustration of a magical potion brewing in a laboratory.
16. Cybernetic organism merging organic and mechanical components.
17. Scene inspired by Norse mythology featuring gods and mythical creatures.
18. Abstract representation of the concept of time.
19. Otherworldly alien landscape with strange rock formations.
20. Artwork inspired by the music of a specific genre, such as jazz or electronic.
21. Futuristic transportation vehicle for traversing harsh desert terrain.
22. Surreal dreamscape with floating clouds and upside-down houses.
23. Illustration inspired by a famous work of literature or poetry.
24. Psychedelic album cover for a fictional band.
25. Robotic character with a unique personality and backstory.
26. Abstract composition based on the theme of love and relationships.
27. Scene from a dystopian society ruled by an oppressive regime.
28. Artwork depicting a mythical creature from Slavic folklore.
29. Underwater city inhabited by mermaids and sea creatures.
30. Celestial being embodying the spirit of the universe.
31. Illustration inspired by the concept of artificial intelligence and its implications.
32. Scene from a virtual reality world where anything is possible.
33. Futuristic fashion ensemble for a sci-fi runway show.
34. Abstract pattern inspired by the chaos theory.
35. Artwork depicting a parallel universe where magic is real.
36. Steampunk robot built for exploration and adventure.
37. Scene from a mythological underworld inhabited by demons and spirits.
38. Surrealistic interpretation of a famous historical event.
39. Illustration inspired by the colors and culture of India.
40. Abstract representation of the human mind and its complexities.
41. Futuristic city skyline with towering skyscrapers and flying vehicles.
42. Artwork inspired by the concept of transhumanism and human augmentation.
43. Scene from a fairy tale retold in a futuristic setting.
44. Illustration of a fantasy creature inspired by Egyptian mythology.
45. Futuristic space station orbiting a distant planet.
46. Abstract representation of the four elements: earth, air, fire, and water.
47. Artwork inspired by the mysteries of the cosmos and the search for extraterrestrial life.
48. Surrealistic interpretation of a famous piece of classical music.
49. Scene from a steampunk world where Victorian aesthetics meet advanced technology.
50. Illustration of a mythical city hidden deep within a jungle, untouched by time.

728x90
728x90

 

일레븐 랩스 링크

 

AI Voice Generator & Text to Speech | ElevenLabs

Rated the best text to speech (TTS) software online. Create premium AI voices for free and generate text-to-speech voiceovers in minutes with our character AI voice generator. Use free text to speech AI to convert text to mp3 in 29 languages with 100+ voic

elevenlabs.io

 

 

일레븐 랩스 플랜

 

일단 무료로 사용뒤 starter로 갈아타는 걸 추천한다. 무료와 Starter 플랜의 가장 큰 차이점은 본인의 목소리를 녹음해서 트레이닝 후 사용할 수 있다는 것이다. 또 더빙 스튜디오 이용이 가능해 다른 언어로 더빙이 가능하다. 무료 라이선스로는 상업적 콘텐츠 이용이 불가능하기 때문에 상업 이용 예정이라면 무료에서 유료 서비스로 갈아타는 것을 추천한다.

 

 

 

다른 언어로 더빙하기

일레븐 랩스의 더빙 서비스가 다른 비슷한 서비스와 다른점은 본래 사용한 음성이나 영상에 나온 음성을 토대로 다른 언어로 더빙이 가능하다는 점이다.

 

무료 멤버십에는 포함되어 있지는 않고, 유료 멤버십부터 사용 가능하다. 예를 들어 한국어로 녹음된 영상의 경우 Source Language에 Korean을, Target Language에 더빙으로 전환하고자 하는 언어를 선택해 넣으면 된다.

보이스 랩, 내 목소리로 voice만들기

기존의 보이스에서 높낮이, 유창성이라던가 발음을 조정할 수 있고, 또 원하는 음성을 넣어서 트레이닝도 가능하다.

 

보이스 클로닝은 유료 멤버십부터 가능하다. 본인의 목소리를 트레이닝해서 할 수 있음.

솔직히 무서워서 아직 하지 못했다.

 

 

 

기본 서비스

대사에서 음성으로, 음성에서 음성 변환

Text to Speech/ Speech to Speech

 

작성한 대사

 

[일레븐 랩스(Eleven Labs)는 프랑스를 기반으로 하는 디지털 커머스 및 웹 개발 회사입니다. 이 회사는 웹 애플리케이션 및 모바일 앱을 개발하고, 전자 상거래 솔루션을 제공하며, 사용자 경험을 개선하기 위해 최신 기술을 적극적으로 채택합니다.
Primarily focused on building web applications using PHP, JavaScript, and related frameworks and libraries, Eleven Labs also develops modern and responsive user interfaces using frontend frameworks such as Vue.js, React, and Angular.
Eleven Labsは、顧客のニーズに合わせたカスタマイズされたソリューションを提供し、プロジェクトの初期段階から最終的な展開およびメンテナンスまで、開発サイクル全体を管理します。顧客との協力を重視し、要件を正確に把握し、それに応じたソリューションを提供します。
영어 이외의 언어에 대해서 버전 2에서는 좀 더 나아졌다고는 하지만. 말의 높낮이라던가 억양은 아직도 많이 어색하기 때문에 계속해서 업데이트가 필요하다고 생각합니다. ]

제너레이팅이 어느 정도 되는 동시에 바로 재생이 가능하고, 아무래도 여러 언어를 섞은 대사는 한글에서 영어로, 영어에서 일본어, 일본어에서 한글로 바뀔 때 어색한 어감이 이어지기도 한다. 아래는 녹음된 음성의 예시다.

ElevenLabs_2024-03-18T08_42_23_Sarah_pre_s50_sb75_se0_b_m2.mp3
1.06MB

 

대사를 작성할 때는 언어를 하나로 통일감을 주는 게 제일 좋은 것 같다.

728x90
728x90

krea AI

Krea AI는 실시간 제작을 주로 하는 generative AI 서비스다.

 

이외에도 Image upscale, enhance를 통해 이미지 고화질, 해상도 개선을 해주는 역할을 하기도 하지만. 뭐라 해도 주된 서비스는 실시간 이미지 제작이라 볼 수 있다. 

 

 

https://www.krea.ai/home

 

www.krea.ai

 

Img to Img

 

Krea AI에서 이미지를 만드는 방법 중에 이미지 도형 배치를 참고해서 이미지를 생성할 수 있는데.

 

더 나아가 텍스트 프롬프트를 추가하여 디테일한 이미지를 만들어 낼 수 있다. 아래는 내가 사용한 프롬프트인데 확인해 본 결과 대문자와 소문자 차이는 없었다.

 

[cute Pika (OVERALL colored dark grey and light brown mix, white chest, dark grey colored ear, very short leg, very short arm, BIG ROUND EARS, no tail, mammal, Rodent),  look at viewer, full body,  high quality, background arches national park.]

 

위쪽 좌측에 위치한 이미지가 실제 Pika라는 북미, 아시아 쪽에 산악 지대에 사는 설치류의 한 종류인데. 아무래도 이미지 모델 트레이닝이 다람쥐, 청설모, 토끼, 곰, 웜뱃등 이름이 많이 알려진 동물들을 위주로 되어있어서. Pika의 이미지에 최대한 가깝게 이미지를 만들어내는데 조금 시간이 걸렸다.

 

하지만 무엇보다도 AI이미지 블렌드를 통해 이미지의 위치와 색상, 밝기등을 자유자재로 조절할 수 있다는 게 엄청난 강점으로 다가왔다. 이번 텍스트 프롬프트는 챗지피티의 도움을 받지 않고 그냥 자연어대로 작성해 조금 뒤죽박죽일 수는 있지만 실시간으로 프롬프트 적용 확인이 가능해 굳이 도움 받지 않고도 충분히 이미지 제작이 가능했다.

 


text prompt to Img

아래는 실시간 프롬프트에 대한 변화를 확인한 예시다.

 

쓰인 프롬프트

[a girl, short length hair, blond hair,  straw hat, blue eyes, white long short sleeve t-shirts, golden necklace, full bloom cherry blossom trees filled background.]

 

 

 

Krea AI generative image 장점

1. 실시간 프롬프트에 대한 이미지 확인이 가능. 로드가 빠르다

2. 주어진 트레이닝 모델에 한해서만 이미지 제작이 가능해서. 완전히 새로운 이미지나 트레이닝이 되지 않은 이미지에 대한 대응력이 낮다. 예를 들면 위의 Pika의 경우 토끼 혹은 쥐 그 사이의 동물을 만들어냈지 내가 원한 정확한 Pika의 모델을 만들지는 못했다.

 

 

또 다른 예시로 [a girl, Asian, blond hair]를 입력하게 되면 그냥 검정색 머리색깔을 가진 아시아인 여성을 만들어낸다. 그에 비해 [a girl, blond hair]를 입력하게 되면 금발의 백인 여성을 만들어낸다.

 

작성하는 프롬프트의 순서에 따라 인종이 바뀌는 게 큰 단점으로 다가왔다. 

 

좌측 이미지 [a girl, asian, green eye, gold blonde hair, beanie,]

우측 이미지 [a girl, asian, green eye, gold blonde hair]

위의 예시를 보면 프롬프트 순서에 따라 이전 텍스트가 생략/무시되는 경향이 있다.

 

 

AI Strength 의 정도에 따라 이미지가 너무 많이 차이 난다는 게 하나의 단점으로 자리 잡을 수 있을 것 같다. 특히 아시아인 여성, 상체, 눈의 색깔과 머리카락 색깔이 AI Strength에 따라 계속 바뀐다는 게.

일관된 모델 유지가 Krea AI에서는 아직은 풀어야 할 문제란 생각이 들었다.


Video to Video

 

집에 웹캠만 있다면 할 수있는 Video to Video 아무래도 영상을 돌리는데 컴퓨터 GPU가 많이 사용된다.

Nvidia GeForce RTX 3080 기준으로 39~40% 까지 치솟는 걸 보면 고사양 컴퓨터가 아니면 아무래도 컴퓨터 피로도가 많이 높아질 듯싶다. 하지만 뭐라 해도 실시간으로 영상 출력이 가능하다는 점에서 긍정적으로 평가할 수 있다 싶었다. 우측에 있는 Portrait, Concept, CGI, Cartoon 등의 옵션을 선택할 수 있고, 내가 적용해 본 결과 Portrait 보다는 좀 추상적인 Concept, CGI, Cartoon의 경우가 더 좋은 결과물을 냈고. AI Strength 슬라이더는 0.3~0.6 정도의 믹스에서  좋은 결과물을 냈었다.

 

다음에는 그린스크린을 뒤에 펼쳐두고 영상 테스트를 해볼까 싶었다.

 

 

 

더보기

Krea AI Overview

 

Krea AI is primarily a real-time generative AI service. While it also plays a role in enhancing image quality and resolution through image upscaling and enhancement, its primary service lies in real-time image creation.

 

-Img to Img

Among the methods for creating images in Krea AI, one involves referencing image shape arrangement. Furthermore, by adding text prompts, users can create detailed images. The following is a prompt example used, which, upon confirmation, showed no difference between uppercase and lowercase letters:

 

[cute Pika (OVERALL colored dark grey and light brown mix, white chest, dark grey colored ear, very short leg, very short arm, BIG ROUND EARS, no tail, mammal, Rodent),  look at viewer, full body,  high quality, background arches national park.]

 

The image located in the upper left corner is of a Pika, a type of lagomorph that inhabits mountainous regions in North America and Asia. However, since the image model training primarily focuses on well-known animals such as squirrels, chipmunks, rabbits, bears, and wombats, creating an image closest to a Pika required some time. Nevertheless, the ability to adjust image positions, colors, and brightness freely through AI image blending proved to be a significant advantage.

 

-Text Prompt to Img

 

Below is an example demonstrating the changes observed in real-time prompts:

 

Prompt Used:

[a girl, short length hair, blond hair,  straw hat, blue eyes, white long short sleeve t-shirts, golden necklace, full bloom cherry blossom trees filled background.]

 

**Advantages of Krea AI Generative Images**

 

1. Real-time confirmation of images based on prompts is possible, with quick loading times.

2. Since image creation is only possible within the given training models, the adaptability to completely new images or those not trained is low. For example, in the case of Pika mentioned earlier, it resulted in animals somewhere between rabbits and mice, rather than the exact Pika model desired. Another example is that entering [a girl, Asian, blond hair] generates a Caucasian girl with blonde hair, while simply entering [a girl, blond hair] produces a white girl with blonde hair.

It is evident that the order of prompts affects the ethnicity, which is a significant drawback.

 

-Image Variation According to AI Strength

 

Depending on the level of AI strength, images can vary significantly. Particularly, for Asian women, variations occur in skin tone, eye color, and hair color based on the AI strength.

 

-Video to Video

 

Video to video, if equipped with a webcam at home, is possible. However, given that it heavily utilizes the computer's GPU, especially with Nvidia GeForce RTX 3080, which can reach up to 39-40% usage, it could strain computers with lower specifications. Nevertheless, the ability to output videos in real-time is positive. Options such as Portrait, Concept, CGI, Cartoon are available on the right, and from my experience, selecting options like Concept, CGI, Cartoon resulted in better outcomes compared to Portrait. The AI strength slider yielded good results in the range of 0.3 to 0.6 mix.

Next time, I plan to test videos with a greenscreen backdrop.

 

728x90
728x90

 

AI 영상화 선두주자 Runway

 

Runway AI, Inc. (RunwayML)은 generative AI 판에서도 현재 영상으로 가장 주도하고 있는 앱 중 하나이다.

 

주로 이미지에서 영상으로 텍스트에서 영상으로 바꿔주는 콘텐츠 생성 모델과 제품을 중점적으로 하고 있으며. 상업용으로 적용할 수 있는 텍스트에서 비디오를 생성하는 최초의 AI 모델 Gen-1과 Gen-2를 개발했고, 유명한 이미지 생성 AI 시스템 Stable Diffusion과 협업하기도 했다.

 

현재 무료로 사용 가능하며, 생성 가능한 개수에 제한이 있기 때문에 더 많은 모델을 트레이닝하고 싶다면 유료 멤버십 전환을 해야 한다. 하지만 처음 시작하는 이들에게는 무료로도 충분히 궁금한 점을 채울 수 있기 때문에 무조건 무료 멤버십으로 시작하는 걸 추천한다.

 

 

 

 

 

 

런웨이 웹사이트는 아래에

 

 

Runway - Advancing creativity with artificial intelligence.

Runway is an applied AI research company shaping the next era of art, entertainment and human creativity.

runwayml.com

 

 

런웨이를 사용한 영화, 뮤직 비디오와 티브이 쇼들이 여럿 나와있으며 오늘은 이미지에서 영상으로, 영상을 스타일라이즈 된 영상으로 적용해 본 예시를 보여주고자 한다.

 

 

 

Expnad Image, Erase and Replace, Backdrop Remix, greenscreen replacement, motion tracking, inpaint 등 다른 서비스도 제공하고 있지만 Adobe프로그램을 활용해서도 가능하고, 아직까지는 이렇다 할 정도로 적용하기는 어렵기 때문에. 현실적으로 굳이 런웨이가 아니더라도 이에 최적화된 다른 프로그램을 이용하는 것이 낫다.

 

Img to Video

이미지를 영상으로 변환해주는 것의 가장 큰 장점은 이미지를 영상처럼 생동감 있게 바꿀 수 있다는 점에 있다. 

 

예컨대 배경의 나무를 움직인다거나 카메라의 모션을 주는 등 2d를 3d로 바꾸는 게 굉장히 용이한데.

 

아직까지는 여러 가지 이미지 날림과 뭉개짐이 있기 때문에

상업적 이용보다는 개인이 Visualization 등을 할 때 이용하기 좋은 것 같다.

 

 

image to video 선택해서 영상 제작

 

사용한 이미지는 모뉴멘트 벨리에서 찍은 사진인데. 첫 프레임을 위 사진으로 레퍼런스 잡아 적용할 수 있다.

 

모션 브러시를 통해서 구간을 나누고, 어떤 것이 움직여야 하는지 브러시를 통해서 구분시킬 수 있고, 카메라를 이용해서 어떤 방식의 모션을 줄지 지시를 내릴 수 있다. 

 

 

이렇게 해서 만들어진 영상이 바로 위와 같다. 생각보다 괜찮은 결과물이 나와서 좀 놀랐다.

 

 

 

 


 

Gen-1 Video to Video

 

기존 영상을 통해 다른 스타일의 영상을 만들어 내는 서비스로

기본 영상의 길이와 상관없이 초반 4초만 영상으로 바꿀 수 있다.

 

이때 주어진 트레이닝이 완료된 모델의 스타일로 바꿀 수도 있고, 텍스트 프롬프트를 통해서 스타일을 제시할 수 있다.

 

내 경우에는 런웨이에서 고를 수 있는 모델스타일로 한 개, 텍스트 프롬프트를 사용해서 스타일라이즈를 해봤는데. 두 경우 다 꽤나 괜찮은 영상이 나왔다.

 

 

영상을 결정하고 오른쪽의 Preview Style을 누르면 영상에 대한 미리 보기가 가능하고, 만약 마음에 들지 않는다면 여러 번 텍스트 프롬프트를 바꾸거나 미리 있는 스타일을 선택함으로써 새로운 스타일의 영상을 만들 수 있다. 

 

영상 제작에 있어서 시간이 걸리기 때문에 미리 보기를 적극 사용하는 게 좋다.

 

이 속도를 빠르게 하기위해서는 더 높은 플랜을 구매해야 하는데

무료 버전이 있기 때문에 미리 사용해 본 뒤 유료 멤버십으로 전환하는 게 좋다.

 

 

Style Strength는 영상을 어느 정도 스타일라이징 할 것인지에 관련된 슬라이더인데.

영상의 스타일이 어느 정도 반영될 것인가는 조정 가능하지만 웬만하면 50%에 세팅하는 것이 제일 좋다. 

 

 

오리지널 영상을 스타일라이징한 스크린 캡처

 

 

완성된 영상

오리지널 영상
스타일라이즈 영상

 

더보기

The Leading Innovator in AI Video Generation: Runway

 

Runway AI, Inc. (known as RunwayML) stands out as one of the foremost apps in the realm of generative AI, particularly excelling in video production. It primarily focuses on content creation models and products that transform images to videos and text to videos. Notably, it has developed the first AI models for commercial use that generate videos from text, known as Gen-1 and Gen-2. Additionally, Runway has collaborated with the renowned image generation AI system, Stable Diffusion.

 

Several movies, music videos, and TV shows have utilized Runway's technology, demonstrating its versatility. Today, I'd like to showcase an example of transitioning from images to videos and stylizing the resulting video. While Runway offers various other services like Expand Image, Erase and Replace, Backdrop Remix, greenscreen replacement, motion tracking, and inpaint, it remains the optimal choice due to its advanced features not easily replicated by Adobe programs or others.

 

The image-to-video conversion feature offers significant advantages, allowing images to come to life like videos. For example, it facilitates easy transitions from 2D to 3D, such as animating background elements or adding camera motion. Despite some imperfections like image distortions, it's ideal for personal visualizations rather than commercial use.

 

In this demonstration, I've selected Monument Valley images for video creation, using the first frame as a reference. By using motion brushes to delineate sections and instructing which elements should move via the camera, dynamic motion effects are achieved. The resulting video, created from an uploaded video via 'mdls', exceeded expectations in quality.

 

Moreover, the Gen-1 Video to Video service allows users to create videos in different styles from existing footage. Users can stylize videos based on completed model training or through text prompts. In my case, both methods yielded satisfactory results.

 

To expedite video creation, utilizing the preview feature is advisable. While upgrading to a higher plan may be necessary for faster processing, Runway's free version allows users to experiment before committing to a subscription. Setting Style Strength around 50% typically yields optimal results, allowing for sufficient style reflection without overwhelming the original content.

 

 

 

728x90
728x90

 

컴퓨터에서 다운로드하기

 

OpenAI에서 나온 ChatGPT 인걸 꼭 확인하고 가입을 진행해 준다.

 

구글, 마이크로 소프트, 애플 아이디로 가입이 가능하고, 이외에 이메일과 비밀번호를 생성해서 디렉트로 가입할 수도 있다. 

데스크톱 버전 챗지피티는 웹브라우저에서 바로 이용이 가능하다.

 

 

 

 

모바일에서 다운로드하기

 

생각보다 비슷한 인공지능 앱이 많이 나와있기 때문에 꼭 OpenAI의 챗지피티인걸 확인하고 다운로드해야 한다.

 

 

‎ChatGPT

‎Introducing ChatGPT for iOS: OpenAI’s latest advancements at your fingertips. This official app is free, syncs your history across devices, and brings you the newest model improvements from OpenAI. With ChatGPT in your pocket, you’ll find: · Voice

apps.apple.com

 

 

ChatGPT 무료버전 커스터마이징하기

 

유료버전은 좀 더 세분화해서 커스터마이징이 가능하지만. 처음부터 유료버전을 쓰기보다는 무료 버전으로 먼저 익숙해지는 것을 추천한다.

 

 

 

좌측하단의 Customize를 클릭해 주면

 

 

위와 같은 Customize ChatGPT창이 두 군데 나오는데.

위는 이용자 본인에 대한 내용을.

아래에는 ChatGPT의 반응에 대한 내용을 커스터마이징 할 수 있다.

 

간단한 예시로 아래의 창에

'Make every response in Korean.'

'답변은 한국어로 해줘'

 

라고 작성하고 저장하게 되면.

이후에 새로 연 질문에 대해 한국어로 대답하게 된다.

 

 

 

위의 예시와 같이 ChatGPT를 내 입맛대로 바꾸어 커스터마이징 하기 위해서는 아래와 같은 내용을 적으면 된다. 예시를 참고해서 자신의 상황과 쓰임에 맞게 바꾸면 된다.

 

 


이용자 본인에 대한 커스터마이징 예시 내용

 

1. 직업/역할: 중소 규모의 IT 회사에서 온라인 마케팅 전략을 관리하는 디지털 마케터입니다.

2. 현재 진행 중인 프로젝트/과제: 현재는 제품의 전환율을 높이기 위한 캠페인을 진행 중입니다.

3. 특별한 관심사: 소셜 미디어 마케팅과 데이터 분석에 관심사를 가지고 있습니다.

4. 가치 및 원칙: 투명성을 중요시하며 데이터 기반의 결정을 신뢰합니다.

5. 목표: 즉각적인 목표는 분기별 리드 생성 목표를 달성하는 것입니다.

6. 선호도: 프로젝트에 Google Analytics, Hootsuite 및 HubSpot을 사용하는 것을 선호합니다.

7. 언어 능력: 한국어가 모국어이지만 영어를 사용해 전문적인 맥락을 이해하는 데에는 문제가 없다.

8. 전문 지식: 검색 엔진 마케팅과 최적화에 전문화되어 있습니다.

9. 커뮤니케이션 스타일: 친근하지만 전문적이며 명확하고 간결한 커뮤니케이션을 중요시합니다.

 

 

ChatGPT의 응답에 대한 커스터마이징 내용

 

1. 응답 형식: 중요한 포인트를 처음에 요약하여 명확하고 체계적으로 제시해 주세요.

2. 어조: 친근하지만 전문적인 어조로 대답해 주세요.

3. 세부 내용 수준: 정확하면서 간결한 설명을 선호합니다.

4. 건의 유형: 디지털 마케팅 전략을 개선하기 위한 건의, 관련 자료 제공, 산업 동향 강조 등을 제시해 주세요.

5. 자료 참조: 산업 동향이나 데이터를 언급할 때는 출처를 명시해 주세요.

6. 문제 해결 접근법: 단기 및 장기적인 영향을 모두 고려하여 전략적 문제 해결 방안을 제시해 주세요.

7. 편향적 사고: 타당한 이유 없이 특정 마케팅 플랫폼이나 전략을 다른 것보다 선호하지 않도록 주의해 주세요.

8. 언어 선호도: 필요에 따라 전문용어와 영어를 사용해 주세요.

 

 


 

 

위의 내용설정에 한국어로 답변할 것이라는 커스터마이징을 추가했을 때 나오는 내용.

 

 


ChatGPT 다른 글

 

2024.03.11 - [Case Study/Generative AI] - Generative AI - Chat Gpt 01 - 챗지피티 소개, 커스터마이징하기

728x90
728x90

 

 

현재 나와있는 AI 모델 중에서 가장 유명한 것은 단연 챗 지피티일 것이다.

 

 

 

$20 달러짜리 Plus 멤버쉽과 $25 짜리 Team 멤버십이 있는데.

굳이 유로 플랜을 활용하지 않아도 무료 버젼으로웬만한 범위는 커버된다.

 

챗지피티의 가장 주된 특징은 자연어로 AI가 활용가능하다는 것인데.

 

말 그대로 이전 C언어, 파이썬 등 컴퓨터 언어를 활용해서 인풋을 넣는 방식이 아닌.

내가 사용하는 언어 그 자체를 넣어서 사용하여도 같은 아웃풋을 낼 수 있다는 것이다.

 

이를 통해 쉽게는 검색 포털 대신 간단한 내용을 리서치하는 것부터 시작해 일상 대화, 통번역,  프로그래밍, 코딩 오류에 대한 해결 등 넓은 분야를 한 번에 해결할 수도 있다.

챗지피티를 활용한 프로그래밍

 

또 유료 멤버십을 통해 사용할 수 있는 DallE는 현재 'Generative Ai'의 선두주자 라고 할 수 있는 Midjourney와 비슷한 프로그램으로서 자연어 입력을 통해 그림, 일러스트레이션을 도출해 낼 수 있다.

 

 

다시 본론으로 돌아와서 챗지피티는 각 창마다 다른 미션을 줄 수 있다.

 

왼쪽 목록을 살펴보면 대화창을 생성할 수 있는데.

모든 대화창마다 각자의 아이덴티티를 부여해 활용할 수 있다. 

 

chatgpt에게 여행 플래너, 퍼스널 운동 트레이너, 개인 비서, 카피라이터 등 각 대화창마다 새로운 아이덴티티를 부여해 필요할 때마다 해당 대화창에 들어가서 다른 업무를 동시에 지시, 답변을 받을 수 있다. 예를 들어

 

내 여행 플래너가 되어서 300만 원 버짓에서 갈 수 있는 해변가 주변의 여행지를 추천해 줘.

 

라는 방식으로 대화창에 역할과 지시를 부여할 수 있는데. 해당 대답에 대해 질의 응답을 반복해서 더 좋은 답변으로 좁혀 나갈 수있는 큰 장점이 있다.

 

 

이 대화창 이외의 공간에서 내 chatgpt의 마스터 페르소나를 설정할 수 도 있다.

왼쪽 하단의 챗 지피티 커스터마이즈 키를 누르면 두 개의 창이 뜨는데. 

이곳에서 내 계정의 챗지피티 자체를 설정할 수 있다.

 

 

그렇다면 챗지피티 대화창에서 역할 부여를 하는 것과 챗지피티를 커스터마이징 하는 것은 무엇이 다를까?

 

Customize chat gpt Vs chat gpt 대화창에서 역할 부여

 

이 둘의 키포인트는 얼마나 더 개인에게 맞춤형이 되어있는가이다. 

챗지피티 대화창에서 역할을 부여하고, 이야기 방식으로 지시를 이어나간다면.

원하는 답변을 얻을 수는 있지만.

챗지피티 모델 특성상 트레인 된 기준선과 도덕을 지키며 최대한 중립적인 답안을 내놓는다. 

 

하지만 만약 customize chatgpt에서 출신, 정치적 성향, 본인의 나이와 성별, 이념, 관심사 등을 입력하고. 챗지피티의 답변이 긴 것이 좋은지 짧은 것을 선호하는지, 주관적 일지 중립적 일지, 또 더 나아가 말하는 투는 캐주얼할지 공식적 일지를 세팅하면 중립적인 대답의 방향이 주관적으로, 나에게 맞게 바뀐다는 것이다.

 

다음에는 더 자세한 예시로 들어 가져올 생각이다.

 

 

 

728x90
728x90

왜 우리는 AI에 집중해야 하는가?

 

이미 급속히 발전하고 있는 AI 시장을 멈출 방법은 없기 때문에 이에 자연스럽게 환승해야하는 것이 가장 크다. 실제로 2022년을 시작해서 전세계적으로 거대 IT기업에서 해고가 발생하고 있으며 크게 AI의 발전으로 인한 필수 인력의 감소가 가장 큰 이유로 드러나고 있다.

 

더 새로운, 쉬운 툴이 나오고 있는 마당에 굳이 비싼 인력을 여러명 써서 일하지 않아도 되기 때문에.

이런 움직임은 당연하면서도 안타까운 현실이다.

 

 

비관론적인 의견들이 속속들이 등장하고 있으며 ‘AI가 사람들의 일을 앗아갈 것이다’ 라는 예측이 더욱이 부상하고 있다. 하지만 이 예측은 반은 맞고 반은 틀리다.

한쪽의 문이 닫히면 다른 한쪽이 열리듯이.

이전에는 불가능했던 많은 것들이 가능해졌다.

 

예컨대 한명의 일러스트레이터 혹은 화가가 해야할 일을 머신 러닝을 통해 트레이닝이 되어 다른 범주의 표현을 더 용이하고 저렴하게 할 수있다는 것이다. AI가 재능있는 테크 기업, 컴퓨터 사이언스 전공자를 위한 전유물이라 생각하면 오산이다. 사실은 그것의 정반대가 될것이다.

 

내가 겪어보고 활용해본 AI는 모두의 능력치를 평준화 시켜주는 아이러니한 툴이였다.


 

Deepfake란 무엇인가?

 

CS(Computer Science)에 관심없던 내가 AI에 관심을 가진 계기는 딥페이크 때문이었다.

 

대부분의 사람들이 불법적이라 생각하는 딥페이크.

대중매체에서는 딥페이크는 나쁜것, 불법적 성향이 강한것이라는 프레임을 씌우기에 바쁘지 이외의 것에는 많이 집중하지는 않고 있다.

 

대중 미디어에서는 딥페이크를 불법적 수단으로만 크게 조명하고 있지만.

실상으로는 생각보다 많은 분야에서 딥페이크는 이미 활용되고 있다.

내가 보는 영화, 드라마, 코미디 쇼, 뮤직비디오 웬만한 영상 미디어에는 상용화가 끝난 상태지만

누구도 구태여 밖으로 말하고 있지는 않는 것이다.

 

딥페이크를 파보지 않았다면 이런 나쁜 이미지에만 집중하게 된다.

 

하지만 반감을 떨치고 제대로 툴에 집중한다면 앞으로의 트렌드를 조명할 수 있게 된다. 

 

 

Deepfake의 활용 범위

현재 할리우드 현지에서 이 기술로 밥벌이를 하고 있는

나의 활용 경우를 예로 들자면 크게 세 가지를 들 수 있다. 

 

1) De-aging

2) Face Swap/Replacement

3) Beauty Fix


1) De-aging

말 그대로 젊게 만드는 법이다. 어느 정도의 노하우가 필요한 작업이고 보통은 모델 트레이닝과 machine learning 과정 이 필요하기 때문에 난이도가 높고, 시간이 어느정도 소요된다.

그만큼 정확도가 상승하고 좋은 퀄리티의  de-aging영상을 제작할 수있지만.

아이러니하게도 어느정도 나이 제약을 동반하기도 한다.

 

예컨대 70대가 10대로 탈바꿈하는 것은 이론상 가능하지만.

실상으로는 얼굴을 제외한 나머지 부분이 너무나도 부자연스럽기때문이다.

 

 

 

2) Face Swap/Replacement

이 경우에는 80대가 20대의 시절을 재현 하려는 경우에 많이 쓰이는 방법이다.

위의 사례와 비슷하게 모델 트레이닝을 거쳐야 하며 얼굴을 바꿔 끼우는 모델을 구할 때 많은 고심을 해야 한다.

 

모델 선정을 할 때 함께 어드바이징을 하는 단계에 참여하기도 했는데. 이목구비가 비슷한 연기자, 모델을 선정하면서 어느 정도 이상한 감정을 느끼기도 했다. 언젠가 봤던 영화 <Surrogate 2009>를 보는 것과 같은 기분을 느꼈기 때문이다. 실제 사람이 아바타화되는 것 같은 기분에 기술 윤리가 떠올랐던 순간이었다.

 

 

 

3) Beauty Fix

가장 문제 되지 않고, 실용적인 부분이라 생각한다.

 

말 그대로 덜 주름진 clear 한 피부 표현을 덧대어해주는 것인데.

Tiktok이나 카메라 필터에 쓰이는 피부 표현을 세분화되어하는 좀 더 현실적이 표현을 도와주는 것이다. 

 

더보기

[eng]

The swift evolution of the AI market is becoming an undeniable force, with its natural progression taking center stage. As we step into 2022, major IT players across the globe are experiencing workforce reductions on a global scale, mainly due to the ongoing evolution of AI. This shift is largely driven by the introduction of new, user-friendly tools that streamline operations, rendering the need for costly human resources obsolete.

Pessimistic viewpoints are emerging, predicting that AI will take away jobs from people. However, this prediction is only partially accurate; when one door closes, another opens. Many tasks that were once deemed impossible have become feasible. For instance, the use of machine learning enables illustrators or artists to train AI to handle their tasks, making diverse expressions more accessible and cost-effective. Considering AI as an exclusive tool for talented tech companies and computer science professionals is a misconception; in reality, it is quite the opposite.

The AI I have personally experienced and utilized has been an ironic tool that levels everyone's capabilities. My interest in AI was sparked by the advent of deepfakes.

 

Most people perceive deepfakes as illegal activities. Mainstream media often frames deepfakes as inherently bad, focusing on their illegal nature. However, beyond this negative image, deepfakes are already being utilized in various fields. Movies, dramas, comedy shows, music videos, and other visual media commonly employ deepfake technology, though this is not widely acknowledged.

 

If one does not delve into understanding deepfakes, they may fixate on this negative image. However, by overcoming biases and concentrating on the tool itself, one can better focus on future trends.

 

As someone currently earning a living in Hollywood using this technology, I can outline three major applications of deepfakes:

 

1. De-aging

   -This process revolves around portraying individuals in a younger light. Despite demanding a specific level of proficiency and involving model training alongside machine learning processes, it results in top-notch de-aging videos. Nevertheless, there are constraints, and attaining an entirely natural appearance can pose a challenge. Ironically, the primary limitation in de-aging via deepfake pertains to age. When actors or actresses in their 70s attempt to revert to their teenage or even 20s appearance, it compromises the realism, generating discomfort among the audience due to the mismatch between the talent's age and the rest of their physique.

 

2. Face Swap/Replacement

  - Frequently employed to replicate an individual's youthful appearance, this technique, akin to de-aging, demands model training. Selecting models with facial features resembling the subject requires careful consideration. Ethical dilemmas emerge as the technology blurs the distinction between reality and representation.

 

To achieve a relatively flawless outcome, seeking guidance from a deepfake artist is crucial, especially in the selection of models for replacement. At times, while offering advice, I've sensed a peculiar discomfort, reminiscent of the first viewing experience of the 2009 movie 'Surrogate,' as if touching upon the boundary of humanity in the creative process.



3. Beauty Fix

   - This particular application is regarded as less troublesome and more pragmatic. It refines skin texture, reducing wrinkles for a lifelike depiction. Widely utilized in platforms such as TikTok and camera filters, it offers a nuanced and genuine representation of smooth skin. The use of high-definition, intricate facial portraits extends to other mediums, including TV shows, music videos, and movies.

 

 

 

728x90

+ Recent posts