상세 컨텐츠

본문 제목

TTS(Text-to-Speech)

연구실

by myeongjaechoi 2024. 11. 26. 13:34

본문

GUI를 만들고, 오프라인에서 돌아가게 만들기 위해, STT, TTS를 교체해야 됐다. 그 중 나는 TTS를 바꾸었다.

원래는 Google Cloud Text-to-Speech API를 사용하여 네트워크가 필요하였다.

우선 간단하게 만들어보았다.

pyttsx3로 교체하였다. 음성은 잘 나오지만, 뭔가 자연스럽지 않고 기계같다.

그래서 찾아본 게 MeloTTS이다.

처음엔 잘 안 되었지만, 새로 가상환경을 다시 셋팅하여 문제를 해결하였다.

문제점은 아래와 같았다.

MeloTTS 문제점

  • Rust를 사용
  •  transformers 버전이랑 huggingface_hub 버전 충돌
  •  gradio가 urllib3을 2.x 이상 버전으로 요구하는 반면, botocore는 urllib3을 1.27 미만 버전으로 요구

 

'연구실' 카테고리의 다른 글

GUI 만들기  (0) 2024.11.19
KeywordSpotting  (1) 2024.11.12
KCC 한국 정보과학회  (0) 2024.07.02
엔트로피  (1) 2024.01.28
손실함수  (0) 2024.01.27

관련글 더보기