본문 바로가기

IT⬝AI⬝기술

상상을 현실로: Sora by OpenAI

얼마 전에 오픈AI는 동영상 생성 AI 소라(Sora)를 공개했습니다. 이전까지의 텍스트-to-비디오(text-to-video) 생성 모델을 뛰어넘는 영상을 보니 소름이 돋았습니다.    

 

오픈AI는 지금까지 Sora로 만든 수십 개의 클립을 공유했습니다. 그 중에는 마치 영화의 한 장면처럼 멋진 것도 있고 완성도가 떨어지는 것도 있었습니다. 

 

비디오 생성 AI

 

상상을 현실로


Sora는 사용자가 입력한 텍스트에 기반하여 해당하는 영상을 생성하는 AI 기술로, 최대 1분 길이의 영상을 만들 수 있습니다. 이는 기존 text-to-video 기술 중 가장 진보된 것으로, 피카랩스의 PIKA와 런웨이의 Gen2 같은 기존 모델들이 만들 수 있는 최대 4초 길이의 영상에 비해 현저히 긴 시간입니다. 

Sora는 다양한 캐릭터, 특정 동작 유형, 그리고 피사체와 배경의 세밀한 디테일을 포함한 복잡한 장면을 생성할 수 있는 능력을 갖추고 있습니다. 

현재는 OpenAI 내부 테스트 중이며, 일반 사용자에게는 아직 공개되지 않았습니다. Sora는 이미지를 영상으로 변환하거나 영상을 기반으로 새로운 영상을 생성하는 기능뿐만 아니라, 영상의 전후를 확장하거나 두 개의 영상을 통합하는 기능도 제공합니다. 공식 출시일은 아직 미정입니다.

공개된 시연 영상을 통해 Sora의 기능성과 가능성을 엿볼 수 있는데, 특히 이탈리아 부라노의 다채로운 건물 앞에서 창문을 통해 바라보는 달마시안 강아지의 모습, 도쿄 교외를 달리는 열차의 창문 너머 풍경, 거대한 구름 인간이 지구를 향해 빛줄기를 쏘는 장면 등 다양한 상황을 실감 나게 재현해낼 수 있습니다. 

현재 OpenAI는 전 세계 챗GPT 사용자의 수요를 감당하기 위해 더욱 강력한 인프라를 구축할 필요가 있으며, Sora의 공식 런칭까지는 상당한 시간이 소요될 것으로 예상됩니다. Sora의 출시는 AI 기술의 한계를 넓히고, 사용자에게 새로운 창조적 가능성을 제공할 것으로 기대됩니다.

 

Sora 영상 엿보기

 

 

A Stylish Woman Walks Down a Tokyo Street

 

Tokyo Woman by Sora

Prompt:

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

"스타일리시한 여성이 따뜻하고 빛나는 네온과 애니메이션 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 빨간색 긴 드레스, 검은색 부츠를 신고 검은색 지갑을 들고 있습니다. 그녀는 선글라스와 빨간 립스틱을 착용합니다. 그녀는 자신감 있고 자연스럽게 걷는다. 거리는 축축하고 반사되어 다채로운 조명의 거울 효과를 만들어냅니다. 많은 보행자들이 걸어 다닙니다."

 

 

A movie trailer featuring the adventures of the 30 year old space man

Spaceman Adventures  by Sora

Prompt:

A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

"빨간색 울 니트 오토바이 헬멧, 푸른 하늘, 소금 사막, 영화 스타일, 35mm 필름으로 촬영, 생생한 색상을 입은 30세 우주인의 모험을 담은 영화 예고편입니다."

 

 

The camera follows behind a white vintage SUV

SUV의 질주  by Sora
Prompt:

The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.

"카메라는 검은색 루프 랙이 있는 흰색 빈티지 SUV 뒤를 따라가며 가파른 산 경사면의 소나무로 둘러싸인 가파른 흙길을 속도를 내고, 타이어에서 먼지가 튀어오르고, 흙을 따라 속도를 내는 SUV에 햇빛이 비춥니다. 도로, 현장에 따뜻한 빛을 발산합니다. 비포장 도로는 다른 차나 차량이 보이지 않고 저 멀리 완만하게 구부러져 있습니다. 길 양쪽에 있는 나무들은 삼나무로, 곳곳에 녹지가 흩어져 있습니다. 커브를 따라가는 뒷모습이 여유롭게 보여 마치 험난한 지형을 뚫고 험난한 길을 달리는 듯한 느낌을 줍니다. 비포장 도로 자체는 가파른 언덕과 산으로 둘러싸여 있으며 그 위에는 맑고 푸른 하늘과 뭉게구름이 있습니다."

 

 

Several giant wooly mammoths

설원을 질주하는 맘모스 by Sora

Prompt:

Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

"여러 마리의 거대한 털복숭이 매머드(맘모스)가 눈 덮인 초원을 밟고 다가옵니다. 그들의 긴 털털한 털은 걸을 때 바람에 가볍게 날립니다. 저 멀리 눈 덮인 나무와 드라마틱하게 눈 덮인 산이 있고, 뭉게구름이 있는 한낮의 햇살과 멀리 높이 솟아오르는 태양이 만들어냅니다. 따뜻한 빛, 낮은 카메라 뷰는 아름다운 사진과 피사계 심도로 커다란 털복숭이 포유류를 포착하는 데 놀랍습니다."

 

Historical footage of California

 

골드 러쉬 당시 캘리포니아 by Sora

 

Prompt:

Historical footage of California during the gold rush.

"골드러시 당시 캘리포니아의 역사적인 영상입니다."

 

 

공식 홈페이지에 보다 자세한 설명과 원본 영상이 있습니다.

 

Sora: Creating video from text

The current model has weaknesses. It may struggle with accurately simulating the physics of a complex scene, and may not understand specific instances of cause and effect. For example, a person might take a bite out of a cookie, but afterward, the cookie m

openai.com