글을 쓰면 영화 같은 영상이? 오픈AI 'Sora'

안녕하세요. 셀러 여러분!

2022년 공개한 개발사 오픈AI의 프로토타입 대화형 인공지능 챗봇인 GPT’의 시작으로 생성형AI가 활발하게 사용되고 있는데요.

일자리를 잃지는 않을까 걱정이 되면서도 AI와 같이 발전할 미래가 궁금해지는 요즘,

셀러 분들은 다가올 미래를 어떻게 준비하고 계신 가요?

이번 칼럼에서는 AI 트렌드를 따라잡기 위하여 개발사 오픈AI‘Sora’에 대해 알아보겠습니다.

 

 

GPT’에서 ‘Sora’의 등장까지

 

2022, 오픈AI가 개발한 프로토타입 대화형 인공지능 챗봇인 GPT’가 출시되었습니다.

이전 칼럼에서 언급된 GPT’에 대한 설명을 참고해볼까요?

▶ ChatGPT,'쇼핑 GPT’가 될 수 있을까

그 밖의 생성형AI 모델인 미드저니’, ‘DALL-E’, ‘스테이블 디퓨전등의 시스템으로 만들어진 이미지들을 보신 적이 있으신가요?

 

 

출처: 공익광고협의회

 

위의 이미지는 최근 대한민국 공익광고제에서 대상을 수상한 포스터 작품인 멸종 위기 1급 대한민국인데요.  한국의 저출산 상황을 잘 드러낸 작품입니다. 그런데 생성형AI 이미지 프로그램인 미드저니를 활용하여 만든 작품이라는 사실이 밝혀지면서 논란이 일고 있습니다.

단순하게 프롬프트 입력으로 나온 이미지라고는 퀄리티가 놀라울 정도로 좋은데요.

이제는 이런 생성형AI 이미지들을 광고에서 쉽게 찾아볼 수 있습니다.

 

 

출처: https://openai.com

 

이렇게 생성형AI에 점차 적응하고 있는 최근, 215(현재시간) ‘GPT’개발사인 오픈AI에서는 또 다른 AI영상생성 프로그램인 ‘Sora’를 공개하였습니다.

‘Sora’를 통하여 사용자는 프롬프트에 간단한 명령어를 입력하면 최대 1분 정도의 길이의 고화질 영상을 추출할 수 있습니다.

 

 

‘Sora’의 의미

출처: https://openai.com

 

‘Sora’는 일본어로하늘’,’허공’()을 뜻하는 말로, 오픈AI 해당 명칭에 대해 하늘을 날아오르다

무한한 잠재력을 의미한다고 밝혔습니다.  

 

 

‘Sora’ 영상과 프롬프트

오픈AI가 공개한 영상과 프롬프트의 지시말을 살펴볼까요?

*원본 영상은 https://openai.com 에서 확인하실 수 있습니다.

 

1.Mitten astronaut (우주비행사)

 출처: https://openai.com

 

 

 

2.Snow dogs (눈 강아지들)

 출처: https://openai.com

 

 

 

‘Sora’의 특징과 기술

‘Sora’는 기존에 발표된 AI영상생성 프로그램들과는 다르게 매우 자연스러우며 실제 장면을 보는 것 같습니다.  ‘GPT’의 언어 모델(LLM)을 기반으로 만들어진 ‘Sora’이기 때문에 인간의 대화 패턴이나 행동 등을 정교하게 학습할 수 있었다고 합니다.

그렇다면 ‘Sora’에 적용된 대표적인 기술 몇 가지를 알아볼까요?

 

 

1.시각적 데이터를 패치로 변환

 출처: https://openai.com

 

‘Sora’는 동영상과 이미지를 비주얼 인코더를 통해 패치라는 작은 데이터 단위 모음으로 표현합니다. 패치는 이전의 시각적 데이터 모델을 효과적으로 표현합니다.

 

2.비디오 생성을 위한 스케일링 변환기

출처: https://openai.com

 

‘Sora’는 노이즈가 들어간 패치를 깔끔한 패치로 변환하는 확산 트랜스포머(Diffusion Transformer) 기술을 사용합니다. 이것은 노이즈가 있는 패치를 실제 데이터와 비슷한 이미지로 변환하는 기술입니다.  컴퓨터 자원이 늘어날수록 확산 트랜스포머기술은 고품질의 영상을 만들어 냅니다.

 

 

3. 샘플링 유연성

출처: https://openai.com  영상캡쳐본

 

‘Sora’는 와이드 스크린1920X1080 , 1080X1920 비디오 및 그 사이에 모든 화면 비율로 샘플링 할 수 있습니다. 이를 통하여 ‘Sora’는 다양한 장치용 콘텐츠를 기본 종횡비로 직접 만들 수 있습니다.  

 

 

‘Sora’의 한계

‘Sora’의 영상 퀄리티는 이전의 AI영상생성프로그램들보다 수준이 높지만, 시뮬레이터로써 많은 한계를 보이고 있습니다. 예를 들면 유리가 깨지는 장면 같은 물리적인 장면을 정확하게 추출하지 않습니다. 그리고 아직까지 최대 1분정도의 영상길이로 추출되는 점을 발전시켜야 합니다.

 

 

‘Sora’의 전망과 쇼피파이

‘Sora’의 등장은 고성능 시뮬레이터 개발을 향한 시작점이며, 앞으로 지속적인 발전과 함께 강력한 기능을 갖출 것으로 전망됩니다. 이커머스 시장은 발전된 생성형AI들의 등장으로 더 많은 변화가 이루어질 것입니다.

글로벌 1위 커머스 플랫폼 쇼피파이에서도 이러한 변화에 발맞춰 AI기반 배경 편집도구인 ‘Shopify Magic’을 선보였습니다.

최근에 올라온 ‘Shopify Magic’ 관련 칼럼을 참고해볼까요? ▶Shopify Magic으로 콘텐츠 생성하기 

AI트렌드를 따라가는 쇼피파이사이트 구축에 관심이 있으시다면 쇼피게이트의 전문가에게 상담 받아보세요.

www.shopigate.co.kr