보도자료

DAY1 | 센스타임 LightX2V 추론 프레임워크 기반 ‘Seko 2.0’ 드라마 시리즈 생성 플랫폼 출시

2025-12-15

12월 15일 센스타임 ‘Product Launch Week’의 막이 오르고 센스타임은 첫 번째 플래그십 공개 제품으로 Seko 2.0을 선보였다.


Seko 2.0은 숏 드라마 및 모션 코믹 크리에이터를 위해 설계된 멀티 에피소드 드라마 생성 에이전트로 최대 100부작 시리즈 제작을 지원하며 에피소드 전반에 걸쳐 캐릭터·장면·소품의 일관성을 안정적으로 유지한다. 이를 통해 제작 효율을 대폭 끌어올려 기존 방식 대비 코믹 드라마 제작 시간을 80~90% 단축한다.


Seko 2.0은 센스타임의 오픈소스 LightX2V 프레임워크를 기반으로 한다. LightX2V는 실시간 영상 생성이 가능한 업계 최초의 추론 프레임워크로 저비용·고 처리량 영상 제작을 가능하게 한다. 이미 Cambricon 등 중국산 AI 칩에 성공적으로 적용되었으며 앞으로 크리에이터를 위한 더 합리적인 비용의 활용 솔루션 확산을 예고한다.


seko头图.png


최대 100부작 시리즈 제작 지원


Seko는 2025년 7월 첫 출시 이후 두 달 만에 10만 명 이상의 크리에이터를 끌어모았고 반년이 채 되지 않아 사용자 수 20만 명을 돌파했다. 이 가운데 숏 드라마 크리에이터가 30% 코믹 드라마 크리에이터가 20%를 차지한다.


새롭게 공개된 Seko 2.0은 창작 진입 장벽을 한층 더 낮추고 영상 제작 효율을 대폭 향상시킨다. 주요 업그레이드 기능은 다음과 같다.


1) 개선된 UI(User Interface): 시각적 표현을 최적화해 몰입감 있는 창작 경험을 제공한다.


2) 멀티 에피소드 생성 및 장기 컨텍스트 관리: 최대 100부작까지 제작을 지원한다.


3) 지능형 에이전트 스케줄링: 에피소드 간 캐릭터·장면·소품의 유연한 연동을 가능하게 한다.


4) 캐릭터의 메이크업과 스타일링을 상황에 맞게 조정할 수 있다.


센스타임 이사회 의장 겸 CEO 쉬리(徐立)는 다음과 같이 밝혔다. “Seko는 창의적 상상력은 있지만 전문 제작 역량이 부족한 사람들에게 문을 열어 창작 생태계에 진입해 상상력을 마음껏 펼칠 수 있도록 돕습니다. 또한 AI 역량이 지속적으로 발전함에 따라 생성되는 에피소드의 품질도 점차 고도화되어 정교한 하이엔드 작품과 대중적인 엔터테인먼트 콘텐츠가 조화롭게 공존하게 될 것입니다”라고 덧붙였다.


한편 중국에서는 AI 코믹·숏 드라마가 폭발적인 성장을 보이고 있다. 데이터에 따르면 올해 상반기 중국 본토의 코믹 드라마 공급량은 연복합 성장율83%로 급증했으며 3,000편 이상의 작품이 제작되고 총매출은 12배 증가했다. 개인 크리에이터와 소규모 팀의 참여도 크게 늘어 일부는 이를 두 번째 커리어로 삼고 있다.


다인(多人) 립싱크 및 오디오·비주얼 동기화 구현


현재 시장의 대부분 AI 영상 생성 제품은 단일 에피소드의 숏 필름이나 클립 제작에만 머물러 있다. 고품질·대규모 멀티 에피소드 제작에 대한 크리에이터들의 긴급한 수요를 충족하기 위해 Seko 2.0은 두 가지 핵심 기술 돌파를 달성했다.


1)  SekoIDX: 멀티 에피소드·크로스 샷 환경에서 캐릭터 일관성 확보


에피소드와 샷이 바뀌어도 캐릭터의 일관성을 유지하는 문제는 오랫동안 업계의 난제로 꼽혀 왔다. 기존 생성 방식은 새로운 동작이나 표정 프롬프트에 대응할 때 캐릭터가 ‘복붙처럼 생동감이 없거나’ 혹은 ‘전혀 다른 인물처럼 보이는’ 문제가 발생하곤 했다. SekoIDX는 확산 모델의 고 노이즈 단계에 ‘네거티브 레퍼런스 이미지’를 도입함으로써 참조 이미지와의 과도한 유사성을 피하면서도 멀티 에피소드·크로스 샷 전반에서 캐릭터 일관성을 안정적으로 유지한다. 또한 다양한 표정·포즈·장면 지시에 대해서도 높은 안정성을 보장한다.


2)  SekoTalk: 다인 립싱크와 자연스러운 오디오·비주얼 동기화 구현


기존 디지털 휴먼 기술은 다국어·다인 상호작용이 포함된 복잡한 장면에서 립싱크 정확도가 떨어지는 한계를 지녀왔다. SekoTalk은 2인 이상 립싱크를 지원하는 업계 최초의 솔루션으로 단일 인물부터 다인 상호작용까지 일상 대화, 격한 논쟁, 단체 카운팅 등 다양한 상황에서 정밀하고 자연스러운 오디오·비주얼 동기화를 구현한다.


이러한 기초 기술의 돌파는 곧바로 생산성의 비약적 향상으로 이어진다. 기존 워크 플로우에서는 50편 제작에 3개월 이상이 소요되었지만 Seko 2.0을 활용하면 코믹 드라마 제작 주기를 80~90% 단축할 수 있다. Seko의 포괄적인 기능을 통해 개인 크리에이터도 ‘1인 제작팀’ 모델로 영상 제작이 가능해진다.


seko2.png


국산 솔루션에 대한 적응과 확장


AI 숏 드라마·코믹 드라마의 멀티 에피소드 제작은 샷 수가 매우 많다는 특징이 있다. 5초짜리 영상 하나를 생성하는데 약 10만 토큰이 필요하며 10~20개 샷을 포함하면 총 토큰 수요는 100만~200만에 달한다. 


이러한 과제를 해결하기 위해 센스타임은 Phased DMD Distillation 기술을 개발해 멀티 에피소드 생성의 전체 비용을 크게 절감했다. 단계형 증류를 MoE(Mixture of Experts) 모델과 결합함으로써 서로 다른 모델이 생성 과정의 각 단계에 특화 되도록 설계해 추론 비용 증가 없이 모델 성능과 효율을 대폭 향상시킨다.


센스타임은 또한 업계 최초의 실시간 영상 생성 추론 프레임워크인 LightX2V를 오픈소스로 공개했다. DiT 증류 가속, 경량 VAE, 희소 어텐션 등의 최적화를 통해 저비용 실시간 영상 생성을 구현한다. LightX2V는 소비자급 GPU에서도 5초 영상을 5초 이내에 생성할 수 있어 수 분이 소요되는 Sora 2 대비 압도적인 성능을 보인다. 현재까지 350만+ 다운로드를 기록하며 전 세계 크리에이터들 사이에서 널리 활용되고 있다. 현재 LightX2V는 Cambricon, MetaX 등 중국산 AI 칩에 대한 적응을 완료해 거의 실시간 수준의 생성 효율을 갖춘 완전 국산 배포를 실현했다.


국산 칩 플랫폼에서 Seko는 국제 칩 플랫폼과 유사한 시간대의 생성 성능을 달성한다. 국제 칩은 초당 1.25초 분량의 영상을 생성하는 반면 국산 칩은 초당 1.0625초 분량을 생성한다. 국산 칩 성능의 지속적 향상과 생태계 성숙에 따라 이 격차는 더욱 줄어들 것으로 전망된다.


향후 센스타임은 Seko 크리에이터를 위한 국산 솔루션 옵션도 제공해 극한의 가성비를 갖춘 저비용 AI 영상 제작 시대를 본격적으로 열어갈 예정이다.


seko3.png


Douyin AI 숏드라마 차트 1위 등극


코믹·숏 드라마 시장에서 Seko는 다수의 히트작을 성공적으로 배출했다. 실사 숏드라마 「완신기(万心记)」는 Douyin AI 숏 드라마 차트 1위를 차지했으며「산꼭대기에 종말 요새를 세웠다(我在山顶建末日堡垒)」, 「은신록(隐神录)」 등 작품들도 큰 주목을 받았다.


고품질 영화·영상 산업 분야에서 Seko는 영화 산업을 대표하는 기업인 창장 영화그룹과 공식적으로 전략적 협력을 체결했다. 양측은 ‘AIGC + 영화·영상’의 융합 혁신을 공동으로 모색하며 내년에는 형초(荆楚) 문화·역사 스토리 시리즈 숏 드라마를 선보일 예정이다. 또한 극장 상영급 AIGC 영화를 공동 인큐베이팅 해 AI 창작 도구가 전문 영화 제작 프로세스 전반으로 깊이 스며들도록 추진한다. 이를 통해 Seko는 AI 기반 콘텐츠 제작이 전문 영화 산업의 실제 생산 체계로 확장되는 데 핵심적인 역할을 하게 된다.


seko4.png


센스타임 이사회 의장 겸 CEO 쉬리(徐立)는 혁신자의 딜레마(The Innovator’s Dilemma)의 관점을 인용하며 “파괴적 기술은 보통 신흥이거나 눈에 띄지 않는 시장에서 먼저 상용화됩니다”고 말했다. 그는 AI가 극도의 효율과 비용 경쟁력으로 창작자의 상상력을 해방시키고 역량의 지속적인 진화를 통해 콘텐츠 품질이 점차 고급화로 나아가 ‘양춘백설’과 ‘하리바인’이 공존하는 새로운 콘텐츠 생태계를 만들어갈 것이라고 강조했다.


현재 Seko는 스토리 릴레이 커뮤니티와 함께 창작 공모전을 공동 개최할 예정이며 많은 참여를 기다리고 있다.