학과소식학생프로젝트

학생프로젝트


실감형 TTS 개발을 위한 딥러닝 기반 문장 분류 시스템 (민*훈)

조회 148

소프트웨어융합대학 2023-06-27 16:40

실감형 TTS 개발을 위한 딥러닝 기반 문장 분류 시스템 (민*훈)

내용

추진 배경

작년 웹소설 플렛폼 [카카오 페이지]에서 웹소설 텍스트를 음성으로 들을 수 있는 TTS를 업데이트 하였다. 성우가 연기하는 오디오북과 같은 실감나는 음성을 기대하며 해당 웹소설 TTS를 이용하였으나 사람처럼 자연스러운 소리와 일정한 읽는 속도는 좋았지만 나레이션, 대사 구분 없이 모든 문장을 단일 소리로 읽는 것과 더불어 어떤 감정도 느껴지지 않는 소리로 읽어 글의 몰입을 깨뜨렸다.

목표 및 내용

오디오북과 같은 실감나는 소리를 출력하는 TTS를 실감형 TTS로 정의한다. 실감형 TTS를 글 전체에 적용하기 위하여 먼저 문장마다 출력할 소리를 정하기 위해 글의 형식을 정의하고 이를 기준으로 문장을 분류하는 것을 목표로 한다. 글의 문장은 각 문장이 어떤 소리 유형이 필요한가에 따라 의성문, 서술문, 인물문 총 3가지로 정의하였으며 이를 대규모 언어 모델인 kobert를 이용해 분류할 수 있도록 모델을 학습시킨다. 학습시킨 모델은 문장을 입력하였을 때 이를 분류할 수 있다.

  • 수행결과
  •  

    성능 평가 지표 중 정확도 수치가 [0.99375]가 나오며 상당히 높은 정확도를 출력하였다.

    글의 문장을 입력하면 그에 맞는 문장형식을 출력하는 시스템을 작성하여 Test set에 포함되지 않은 문장도 정확히 분류해내는 결과를 도출해내었다.