보도자료

SenseTime, WAIC 2023에서 업그레이드된 "SenseNova" AI 거대 모델 시스템 공개

2023-07-25

2023년 7월 7일, 상하이 - WAIC(World Artificial Intelligence Conference) 2023의 전략적 파트너인 SenseTime이 WAIC 2023 기간 열린 "AI+: Regeneration" 포럼에서 다양한 신제품과 거대 모델 시스템인 "SenseNova"의 업그레이드된 내용을 공개하였다. 또한 SenseTime은 자동차 산업을 포함한 금융, 의료, 전자 상거래, 이동 단말기, 산업 단지와 같은 여러 분야에서 "SenseNova" 기술의 적용 사례를  소개하였다.


SenseTime의 이사회 의장 겸 CEO인 Xu Li 박사는 제품 출시 세션에서 "거대 모델의 발전은 인공 지능의 새로운 기술 혁명을 일으켰고, 산업 수요의 폭발적인 성장에 따라 새로운 애플리케이션 시나리오와 애플리케이션 모델이 빠르게 등장하고 있습니다. SenseTime은 '거대 모델 + Sensecore'를 통해 AI 인프라 기능의 도약을 촉진하여 거대 모델의 산업적 가치가 수천 개의 산업에서 꽃 피게 되기를 희망합니다."라고 말했다.

 1.png

SenseTime 이사회 의장 겸 CEO, 쉬리 (Xu Li)

 

"거대 모델 + AI 인프라"를 중심으로 하는 일반 인공지능(AGI) 전략에 따른 SenseTime의 "SenseNova" 기반 모델 시스템은 급속도로 업데이트되고 있다. 자연어 처리(NLP) 모델인 SenseChat 2.0은 거대 언어 모델의 입력 길이 제한 문제를 극복하여 모바일 단말기 및 클라우드와 같은 다양한 단말기 및 시나리오의 애플리케이션 요구 사항에 완벽하게 적응하고 배포 비용을 줄일 수 있다. SenseTime이 자체적으로 개발한 Text to Image 생성 플랫폼 SenseMirage 3.0의 모델 매개변수는 올해 4월 처음 출시된 이후 10억 개에서 70억 개로 증가했으며 전문가 수준의 이미지 디테일을 부각시킬 수 있다.

 

뿐만 아니라 SenseAvatar 2.0 디지털 휴먼 생성 플랫폼은 1.0 버전보다 음성과 입모양의 매치율을 30% 이상 향상시켜 4K 고화질 비디오 효과를 구현하고 AIGC 이미지 생성 및 디지털 휴먼 보컬 기능을 제공한다. SenseSpace 2.0같은 경우 공간 재구성 효율을 20%, 렌더링 성능을 50% 증가하여 100평방 킬로미터의 시나리오 구성을 완료하는데 단 38시간 소요된다. (1200TFLOPS/초 컴퓨팅 성능 지원) 또한 SenseThings 2.0은 밀리미터 수준의 정밀도로 작은 물체의 질감과 재질을 재현하여 높은 반사율과 거울과 같은 물체의 촬영 어려움을 극복하였다.

 2.png

 

"SenseNova" 거대 모델 시스템의 기본 기술 분야에서의 빠른 발전을 기반으로 SenseTime은 거대 모델의 다중 모달 기능 조합을 통해 산업 발전을 적극적으로 지원하고 업계를 선도하는 많은 새로운 돌파구를 가져왔다.

 

금융 분야에서 SenseTime은 은행, 보험사, 증권사 등 고객과 협력하여 디지털 휴먼을 활용해 지능형 고객 서비스, 지능형 마케팅 등의 업무를 수행하고, 대규모 언어 모델 역량 접근을 통한 투자 리서치 분석, 리서치 보고서 작성 등 새로운 기능을 제공함으로써 비용 절감과 효율성을 높였다.

 

의료 분야에서 SenseTime은 방대한 의학 지식과 임상 데이터를 기반으로 한 거대 중국어 의료 언어 모델인 "빅 닥터"를 생성하여 안내, 건강 상담 및 의사 결정 지원과 같은 다중 시나리오, 다중 대화 기능을 제공한다.

 

또한 SenseTime 은SenseChat 2.0과 SenseMirage 3.0을 결합하여 모바일 사용자에게 다양한 지능형 솔루션을 제공한다. SenseTime은 거대 모델의 경량화 버전을 통해 여러 솔루션을 모바일 장치에서 쉽게 배포하고 실행할 수  . 또한 SenseTime은Liu Cixin의 공상과학 소설을 기반으로 한 몰입형 체험 공간인 "삼체: 중력 너머"를 출시하여 소비자들에게 미래형 공상 과학 여행 경험을 선사하였다.

 3.png


온라인 숏 비디오 및 라이브 방송 플랫폼 분야에서는 SenseAvatar 2.0에서 생성된 디지털 휴먼이 널리 사용되고 있으며 SenseTime은 여러 선도 기업과의  전략적 협력을 통하여 ‘클라우드+AIGC+숏 비디오 생방송’ 생태계를 구축하여 업계에 보다 효율적이고 저렴하며 편리하고 사용하기 쉬운 AI 영상 및 마케팅 도구를 제공한다.

 

스마트 자동차 분야에서 SenseTime의 스마트 콕핏, 스마트 드라이빙, 차량-도로 협업과 같은 산업용 애플리케이션도 거대 모델을 적용하였다. 스마트 콕핏에서 SenseTime은 시각, 청각 등 다중 모달 통합을 통해 전방위적으로 사용자의 니즈를 인지하고 연동된 데이터를 통해 사용자의 습관과 선호도를 기록하며 독점적인 개인화 서비스를 제공한다. 동시에 SenseTime은 거대 모델의 강력한 환경 이해, 논리적 사고 및 콘텐츠 생성 기능을 사용하여 사용자를 더 잘 이해하는 "Cabin Brain"과 상호 작용이 가능한 디지털 휴먼을 제공하여 안전, 엔터테인먼트, 교육 및 효율성을 통합하는 스마트 캐빈 경험을 제공한다.

 4.png


최근 CVPR 2023에서 SenseTime과 공동 연구실은 인식과 의사결정이 통합된 자율주행용 범용 거대 모델인 UniAD를 최초로 제안하기도 했다. 이를 기반으로 SenseTime은 차량-도로-클라우드 협업 교통 시스템을 구축하고, 다중 모드, 다중 작업 범용 거대 모델로 대규모 도로변 시각 인식 모델을 개발하였다. 또한, Qiongyu 2.0과 Qualification 2.0을 결합하여 지능형 교통 트윈 및 시뮬레이션을 구축하고, Sensechat 2.0의 지각 추론 및 인간-컴퓨터 상호 작용 기능을 사용하여 자동차-도로-클라우드의 대규모 대화형 상호 작용의 진화를 촉진한다.

 

새로운 기술의 물결 아래, SenseTime은 거대 컴퓨팅 파워와 거대 모델로 AGI 시대의 장기적인 경쟁력과 혁신의 초석을 구축했으며, 다양한 분야를 위한 일반 모델을 출시했을 뿐만 아니라 기초 과학 연구의 혁신과 생성형 AI의 대규모 응용을 위한 장기적인 발전의 초석을 마련했다. SenseTime은 고효율 기술 연구 개발을 통해 AGI 시대에 끊임없이 인식의 한계를 뛰어넘고 변화를 포용하며 능동적으로 혁신해 나갈 것이다.