AI 제작
ChatGPT 이후, 인공지능(AI) 그림 생성 도구가 급속도로 늘어났다. 전업용인 Stable Diffusion(AI 그림 생성 도구)부터 대중적인 문심일언(文心一言), 즉몽(即梦)까지, AI 그림 생성의 ‘진입 장벽’은 점점 낮아지고 있다. 허나 많은 사람들이 발견한 것처럼 동일한 명령어를 입력해도 AI가 생성하는 그림은 천차만별이다. 심지어 같은 사람이 같은 플래트홈에서 동일한 명령을 반복해도 결과는 전혀 다를 수 있다.
AI 그림 생성이 왜 이렇게 ‘제멋대로’일가? 그 배경에는 어떤 기술적 원리가 있을가?
‘복사기’에서 ‘예술가’로의 진화
AI가 ‘제멋대로’ 하는 것을 리해하려면 먼저 기술 발전 과정을 알아야 한다.
초기 AI 그림 생성 기술은 고급 복사기와도 같았다. 기존 이미지를 복제할 뿐 진정한 창의력은 부족했다. 현재 주류 기술은 ‘확산 모델(扩散模型)’을 기반으로 하여 AI에게 ‘창의적 생성(创意生成)’ 능력을 부여했다. 이는 무작위 컬러 노이즈(随机彩色噪点)에서 시작해 수많은 노이즈 제거와 최적화 과정을 거쳐 완성된 이미지를 ‘조각(雕琢)’하는 것과 같다. 또한 이미지를 생성할 때마다 시스템은 ‘무작위 시드(随机种子)’를 시작점으로 사용하는데 서로 다른 시드는 다른 이미지를 생성한다. 마치 꽃을 심을 때 다른 씨앗마다 다른 꽃이 피는 것과 같다.
AI 모델은 결정론적인 매핑(映射) 관계가 아닌 데이터의 확률 분포를 학습한다. ‘한마리의 귀여운 고양이’라는 입력이 들어오면 AI는 특정 고양이 사진 하나가 아니라 ‘귀여운 고양이’에 관한 무수한 가능성을 활성화한 후 그중에서 무작위로 한가지 방향을 선택해 창작한다.
이러한 무작위성은 기술적 결함이 아니라 오히려 AI 기술의 핵심 장점이다. 바로 이 예측 불가능성이 AI에게 무한한 창의력을 부여해 창작자의 동반자로 될 수 있게 한다.
‘제멋대로’인 AI에 통제 가능한 고삐 채우기
무작위성이 AI 창작의 특징이지만 사용자는 몇가지 기술을 통해 결과를 더 통제할 수 있다.
직접적인 방법은 제시 단어를 정교화 하는 것이다. ‘아름다운 풍경’이라고 입력하는 대신 ‘화창한 봄날 오후, 벚꽃이 만개한 공원 산책로, 수채화 스타일’이라고 자세히 묘사하는 것이 좋다. 설명이 구체적일수록 AI의 리해도가 높아져 기대에 더 가까운 결과를 얻을 수 있다.
파라미터 튜닝(参数调优)도 결과를 크게 개선할 수 있다. 샘플링(采样) 단계 수나 안내 강도 등의 파라미터를 조정해 창의성과 통제 가능성 사이의 균형을 찾을 수 있다. 안내 강도가 높을수록 AI는 프롬프트를 엄격히 따르지만 일부 창의성이 손실될 수 있다.
적절한 샘플러(采样器) 선택도 중요하다. 서로 다른 샘플러는 다양한 붓과 같아 어떤 것은 속도를 추구하고 어떤 것은 질을 추구하며 어떤 것은 둘사이의 균형을 잡는다. 반복 최적화(迭代优化)는 전문가 사용자들이 자주 쓰는 전략으로 초기 생성 결과를 바탕으로 지속적으로 프롬프트와 파라미터를 조정해 뛰어난 결과를 얻을 수 있게 한다.
보다 정밀한 제어를 원하는 사용자를 위한 고급 기술도 있다. 례를 들어 ControlNet(제어확산모델 생성 결과) 기술은 AI에게 ‘설계도’를 제공하는 것처럼 스케치, 인체 포즈 그림 또는 심도 있는 그림을 통해 생성 결과의 구도와 분포를 정밀하게 제어할 수 있다. 이미지 기반 생성 기능은 사용자가 기존 이미지를 기반으로 수정하고 최적화할 수 있게 해주어 원래의 기본 구조를 유지하면서도 새로운 요소를 추가할 수 있다.
또한 실제 사용 시 홀시하기 쉬운 세부 사항도 있다. 서로 다른 그래픽 카드(显卡)와 메모리 구성(内存配置)이 생성 결과에 미묘한 영향을 줄 수 있다. 같은 AI 도구라도 버전이 다르면 결과가 달라질 수 있다. 때로는 설명어의 순서를 바꾸는 것만으로도 최종 결과에 영향을 미친다. 쉼표, 마침표 등의 문장 부호도 경우에 따라 AI의 리해에 영향을 줄 수 있다.
AI의 ‘창의적인 우연’과 공무
기술이 발전함에 따라 AI 이미지 생성은 더 통제 가능한 방향으로 나아가고 있다.
앞으로 우리는 이미지를 생성할 뿐만 아니라 최적화 방안을 능동적으로 제안하는 더 스마트한 AI 조수를 볼 수 있을 것이다. 대규모 언어 모델 기반의 프롬프트 최적화 도구도 지속적으로 개선되여 사용자가 AI와 더 잘 소통할 수 있도록 도울 것이다.
허나 우리는 AI의 ‘제멋대로’라는 특성이 AI의 중요한 특징을 반영한다는 점을 리해해야 한다. AI는 단순한 도구가 아니라 창의적인 동반자이다.
가장 훌륭한 AI 예술 작품은 종종 인간의 창의적 아이디어와 AI의 무작위 창조력이 완벽하게 결합된 결과물이다. AI의 ‘제멋대로’와 함께 공무(共舞)하는 것을 배워야만 가능성으로 가득 찬 창작 세계에서 독특한 스타일을 발견할 수 있다.
/ 과학기술일보
编辑:최화