이에, 시스트란은 미디어 테크 오픈랩에 참가하며 ‘미디어 특성을 반영한 자동 자막 생성 기술’, 즉 방송·미디어 특성을 반영한 다국어 자막 자동 생성 기술을 소개하는 등 현재 가장 중점으로 추진하고 있는 국가 연구 사업과 기술, 성과물을 공유했다고 밝혔다.
미디어 테크 오픈랩은 ‘디지털 미디어 콘텐츠 산업혁신 및 글로벌 전략’의 주요과제 중 하나로 방송사 미디어 OTT 업체와 미디어 R&D 수행기관을 연계하여 기술개발 진행과정을 공유하고, 성과 교류 및 기술 홍보를 통해 협업 사업화 네트워크를 구축하기 위해 추진됐다.
행사에는 과학기술정보통신부 방송진흥정책국장, KBS, SBS, CJ E&M및 OTT 업체 관계자, 영상콘텐츠제작사 관계자, 미디어 R&D 연구개발기관 시스트란, 곰앤컴퍼니 등 약 100여명이 참석해 미디어 기술 사업화와 미디어 선도기술개발에 관한 세미나와 강연, 기술 교류, 전시회를 진행했다.
시스트란 관계자는 “미디어 콘텐츠 기계번역은 번역할 내용을 컴퓨터가 이해할 수 있는 형태의 언어로 표현해 기계번역을 수행해야 하므로 주로 문장 단위로 작업을 수행하게 되는데, 이때 동일 콘텐츠 내에서 앞뒤 문장의 맥락을 인식하지 못해 잘못 번역하는 문제가 빈번하다. 시스트란은 이를 해결하기 위해 영상 기반 구성 요소 추출 및 구성 요소 기반 맥락 분석과 스토리 맥락 간 관계 분석을 통해 인물 오인식 및 콘텐츠 오역을 방지하여 콘텐츠 및 시맨틱 자원에 특화된 번역 엔진을 개발했다”고 전했다.
시스트란의 기계번역 서비스는 기존에 번역되었던 문장을 참고로 하여 더 유사한 문체의 번역 결과를 만드는, 즉 콘텐츠의 장르 등 미디어의 특성을 번역에 접목하는 기술과 연속되는 문장에서 자주 발생하는 삭제된 문장요소를 이전 대화를 통해 추론 및 번역에 반영하여 오역을 방지하고, 문맥에서 추출한 시멘틱 리소스를 반영하는 특화 번역기술로 콘텐츠 내 문장의 인물 및 상황 오인식을 방지하는 ‘미디어 시멘틱 자원 기반 다국어 지원 서비스를 위한 번역 기술’이다.
55년 이상 기계 번역 분야 선두주자로 자리매김해온 시스트란은 주력 제품인 SPNS V10 버전 출시를 앞둔 가운데, ChatGPT를 개발하고 서비스하고 있는 OpenAI와의 협업으로 음성인식 기술과 대용량 언어모델 기술을 자사의 번역기술에 적용하여 음성(mp3)과 동영상(mp4)을 자동으로 번역하여 그 결과를 음성 및 동영상 파일에 다국어 자막으로 자동으로 추가하는 기능을 SPNS 제품에 추가하여 업계의 관심이 집중되고 있다.
시스트란 관계자는 “이번 미디어 특성을 반영한 다국어 자막 번역 자동 생성 기술의 성공적인 결과로 유명 OTT 업체 및 방송 콘텐츠 제작사로부터 문의가 많아졌다”고 전했다.
박경호 빅데이터뉴스 기자 pkh@thebigdata.co.kr
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>