제 2의 네로 (AI)

스테이블 디퓨전 탐방기 6 - Automatic1111 실 사용기!

Dr. 네로 2025. 8. 1. 17:15

이 글은 닥터 네로가 아닌, 개조된 GPT가 작성했습니다.🐾

6편 – Automatic1111 txt2img 실전 완전 정복

“설명은 끝났고, 이제 그림을 뽑을 차례”

지난 시간, 프롬프트 구조와 작성법을 배웠습니다.
이제는 직접 Automatic1111 Web UI에서 이미지를 만들어보는 실전 편입니다.
이번 편에서는 txt2img 탭에서 사용하는 모든 주요 기능과 옵션을 완벽하게 이해하고,
그림 하나를 ‘의도한 대로’ 만드는 데 필요한 기술을 정리합니다.


📍 기본 화면 – txt2img 탭

Web UI를 실행하면 가장 먼저 마주하는 탭이 바로 txt2img.
말 그대로 텍스트 프롬프트를 기반으로 이미지를 만들어주는 기능입니다.

여기서 우리가 설정해야 할 요소들이 많지만,
하나하나 알고 보면 다 ‘내 그림의 성격’을 정하는 조절기예요.


🎨 주요 옵션 완벽 해설

✅ Sampling method (샘플링 방식)

AI가 그림을 만들어가는 ‘방식’이에요.
가장 많이 쓰이는 추천 메서드는 다음과 같습니다:

  • DPM++ 2M → 부드럽고 디테일 표현이 좋음 (기본 추천)
  • Euler a → 빠르고 날카로운 스타일, 실험용
  • DDIM → 전통적이지만 속도는 빠름, 묘사력은 낮음
  • DPM++ SDE → 가장 안정적인 고품질 결과

처음엔 DPM++ 2M 으로 시작하세요. 무난하고 성능 좋습니다.


✅ Scheduler (일정 방식)

Sampling Method가 이미지의 ‘방향’이라면, Scheduler는 ‘속도와 리듬’입니다.
대부분 Karras나 Exponential 두 가지가 많은데,

  • Karras → 부드럽고 안정적인 결과
  • Exponential → 빠르지만 결과는 약간 거칠 수 있음

Sampling method를 바꾸면 자동 연동되므로, 초보자는 따로 조정할 필요는 적습니다.


✅ Sampling steps (스텝 수)

그림을 몇 단계에 걸쳐 ‘그려나갈 것인가’입니다.

  • 20~30 스텝: 보통 설정, 빠르고 결과 양호
  • 40~50 스텝: 더 정밀한 그림, 다만 시간 증가
  • 100 이상: 거의 의미 없음 (오히려 손상될 수 있음)

추천: 30 스텝 + 좋은 모델 + Negative Prompt 조합이 베스트!


✅ CFG Scale (프롬프트 충실도)

프롬프트에 얼마나 ‘집착할 것인가’입니다.
높을수록 프롬프트에 맞추려 하지만,
너무 높으면 오히려 이상해집니다.

  • 보통 6~8 사이 사용
  • 낮으면 자유롭게, 높으면 고정적으로 그림을 만듬

추천: CFG = 7 (가장 안정적)


✅ Batch count / Batch size

  • Batch count: 몇 번 생성할 건가 (반복 횟수)
  • Batch size: 한 번에 몇 장 생성할 건가

예:

  • Batch count = 2, Batch size = 4 → 총 8장 생성

너무 높이면 GPU 메모리 부족으로 꺼질 수 있어요.


✅ Seed (랜덤 시드)

같은 설정이어도 매번 그림이 다르게 나오는 이유는 ‘시드’ 때문이에요.

  • -1이면 랜덤
  • 같은 Seed를 입력하면 같은 이미지 반복 생성 가능
  • 좋은 결과가 나왔을 땐 Seed를 기록해두세요!

✅ Script (부가 기능)

특히 유용한 스크립트:

  • Hires. fix (고해상도 복원)
    → 처음 512x768로 뽑고, 2배 확대하면서 디테일 추가
    → 얼굴, 배경 퀄리티 상승에 매우 효과적
  • XYZ Plot
    → 여러 설정을 한 번에 비교할 수 있음 (예: CFG 5~10 테스트)

🧪 간단 실습 예제

Prompt

watercolor, masterpiece, best quality, 1girl, white hair, red eyes, glowing eyes
 

Negative Prompt

easynegative,lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,(worst quality:1.2),low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,lowres graffiti,(low quality lowres simple background:1.1),(weapon:1.5),
 
Sampling: DPM++ 2M
 
Steps: 30
 
CFG: 7
 
Batch size: 1
 

✨ 결과: 디테일이 잘 잡힌 고해상도 일러스트가 완성됩니다! (결과는 다음주에 공개)


🧭 향후 사용할 고급 기능 (간략 소개)

✅ Checkpoint Merger

  • 여러 모델을 섞어 새로운 스타일 모델을 만드는 기능
  • 내 취향 모델을 직접 조합할 수 있어요!

✅ Train

  • 자신의 이미지로 LoRA 등을 학습해 커스터마이징
  • 나만의 캐릭터나 스타일을 AI에 학습시킬 수 있습니다.

✅ Extensions

  • Web UI에 다양한 기능을 추가하는 플러그인 시스템
  • 모델 뷰어, 스타일 태그 추천기, LoRA 패널 등 다양

🪞 닥터 네로의 마무리
그림은 AI가 그리지만,
그림의 ‘틀’을 짜는 건 당신입니다.

txt2img는 단순한 버튼이 아니라
의도, 방향, 감각을 설정하는 지휘봉입니다.

이제 당신의 손에 지휘봉이 쥐어졌습니다.
첫 곡을, 이제 시작하세요.

 

💡 다음 예고
📘 7편 – LoRA, ControlNet, VAE: “조합의 기술”
기본적인 뽑기는 끝났다.
이제는 수많은 기능을 조합해 내가 원하는 그림을 정밀하게 만드는 기술을 배워봅시다 😼