AI 서비스 전문 기업 이스트소프트(대표 정상원)는 K-콘텐츠의 글로벌 확장을 돕는 AI 휴먼 영상 제작 및 오토 더빙 서비스 페르소닷에이아이(PERSO.ai)에 다화자 보이스 클로닝과 스크립트 편집 기능 추가와 함께, 팀 요금제를 새롭게 출시했다고 17일 밝혔다.
이번 업데이트에서 PERSO.ai는 K-콘텐츠의 글로벌화를 가속할 신규 기능을 대거 탑재했다. 특히, 오토 더빙 서비스 ‘AI 비디오 트랜슬레이터’의 기술력을 한 층 강화해 영상 속 여러 인물의 음성을 한 번에 더빙해 내고, 이와 함께 K-콘텐츠의 특성을 살릴 수 있도록 관련 기술을 고도화했다.
그중 핵심은 ‘다화자 보이스 클로닝’이다. 영상 속 화자의 음성을 인식하고 복제하는 기능을 기존의 1명에서 10명까지 확대했다. 이에 따라 여러 인물이 등장하는 까다로운 인터뷰나 토론 영상 번역도 자연스럽고 일관된 결과물을 얻을 수 있게 됐다. 아울러, 한국어 대화의 특성을 반영한 AI 학습 모델도 적용해 한국어 음성 인식 정확도를 글로벌 최고 수준으로 끌어올렸다. 더 주목할 점은 대폭 개선된 립싱크 기술이다. 입술 움직임 패턴 및 주변 상황을 분석해 더욱 정밀한 결과물을 생성해 내는 독자적인 AI 모델을 개발했다.
이번 기술 고도화에 대해 이스트소프트 AI 엔진 플랫폼실 정의정 실장은 "2인 이상의 대화에서도 화자를 정확히 구분하고, 각자의 음색과 어투를 자연스럽게 유지하는 것이 이번 기술 고도화에 핵심"이라며 "헤이젠, 신세시아 등 글로벌 경쟁사와 차별화된 기술적 강점을 갖추게 됐다”라고 설명했다.
이외에도 오토 더빙 콘텐츠의 완성도를 높일 수 있는 ‘스크립트 편집’ 기능도 추가했다. AI 비디오 트랜슬레이터에서 생성한 번역 스크립트를 사용자가 수정할 수 있는 환경을 제공해, 문화적 맥락이나 전문 용어 등 AI가 놓칠 수 있는 부분도 보완할 수 있도록 한 것이다. 또, 해당 기능은 모바일 환경에서도 지원해 사용자가 언제 어디서든 손쉽게 번역 내용을 다듬을 수 있도록 지원한다.
AI 비디오 트랜슬레이터의 오토 더빙을 활용 중인 MCN 기업 트레져헌터의 홍석범 PD는 "스크립트 편집 기능으로 전문 용어 번역을 정확히 조정할 수 있어 콘텐츠 품질이 크게 향상됐다"라고 평가했다.
이스트소프트는 AI 비디오 트랜슬레이터 서비스 이용 비용도 기술 고도화에 따라 합리적으로 조정했다. 현재, 다른 글로벌 서비스보다 더 경쟁력 있는 가격으로 서비스 제공을 시작하며 트레져헌터, 순이엔티, 와프, 셀레이블 등 대형 MCN(다중 채널 네트워크) 사업자를 고객으로 영입했다.
기업 고객의 요구를 반영해 PERSO.ai의 협업 환경은 크게 개선됐다. 이스트소프트는 PERSO.ai의 팀 단위 협업을 더욱 효율적으로 지원하기 위해 ▲팀 단위 협업을 위한 ‘팀 플랜’ ▲멤버 초대 및 권환 관리 시스템 ▲크레딧 공유 메커니즘 ▲협업 워크플로우 등 팀 요금제를 출시하고 다양한 정책과 기능을 추가했다.
이스트소프트 PERSO SaaS 센터 김생근 센터장은 "K-콘텐츠의 감성과 특징을 다양한 언어로 정확히 전달하는 것이 우리의 핵심 미션"이라며 "이번 업데이트는 한국 크리에이터들의 글로벌 진출을 더욱 가속할 것"이라고 전했다.
이어 "현재 3,000만 구독자를 보유한 50개 이상의 파트너 채널과 협력 중이며, 올해 상반기 중 이를 500개 채널, 총 1억 구독자 규모로 확대할 계획”이라며 “앞으로 PERSO.ai가 국내를 넘어 글로벌 오토 더빙 및 AI 휴먼 영상 제작 시장을 선도해 나갈 수 있도록 할 것이다”라고 향후 포부를 밝혔다.