자세히 보기

By hannah_williams

음성을 문자로 바꿔주는’ 소프트웨어 8선

최근 몇 년 동안 음성 인식과 말을 문자로 바꿔주는 소프트웨어가 인기를 끌었다.

장애인 지원, 외국어 학습, 녹취 스트레스 해소 등 말을 문자로 바꿔주는 소프트웨어를 사용하는 데에는 여러 이유가 있다. 특히나 언론인들인 이 일이 얼마나 부담이 큰지 잘 알고 있다.

시중에 나와 있는 ‘말을 문자로 바꿔주는 소프트웨어’에는 어떤 것들이 있는지 알아보자.

1. 드래곤 내추럴리 스피킹

뉘앙스(Nuance)의 드래콘 내추럴리 스피킹(Dragon Naturally Speaking, DNS, PC용)은 8개 언어로 제공되는 음성 인식 소프트웨어다. DNS는 99%의 정확도를 자랑하며 현재 시장에서 가장 정확한 소프트웨어 중 하나로 인정받고 있다.

DNS에는 음성 명령을 포함하고 있어 사용자가 컴퓨터 작업 및 파일 전송을 위한 사용자 지정 명령을 추가해 음성으로 텍스트의 서식을 지정하고 편집할 수 있다. 윈도우, 맥, iOS, 안드로이드 기기에서 실행할 수 있다.

DNS는 음성 명령 및 편집 기능을 통합해 사용자가 음성을 전달하는 것처럼 텍스트가 제공되도록 하고 스피커에서 명령에 따라 특정 구두점 및 서식 옵션을 삽입한다.

최신 버전의 소프트웨어인 DNS 13은 가정용, 프리미엄 및 프로페셔널 버전에서 사용이 있으며 사용자는 사용자 지정 단어 목록을 가져오고 내보낼 수 있으므로 이미 어휘에 포함되어 있지 않은 특정 단어 및 약어를 추가할 수 있다.

뉘앙스 홈 에디션은 79.99파운드, 프리미엄은 125.99파운드, 프로페셔널 에디션은 279.99파운드에서 각각 시작한다.

2. 아마존 트랜스크라이브

아마존 트랜스크라이브(Amazon Transcribe)는 딥러닝으로 구동되는 자동 음성 인식 서비스다. 이 소프트웨어는 앱에 ‘음성을 텍스트로 전환’ 기능을 추가하고 싶어 하는 개발자에게 가장 적합하다.

또한 고객 서비스 요청에 대한 자세한 내용을 포함하여 오디오 및 비디오 파일을 복사하는 데에도 사용할 수 있다. 따라서 고객사와 회의 시 회의록을 작성해야 하는 업무 담당자에게 좋다.

임베디드된 API는 사용이 간편하며 아마존 S3에 저장된 파일의 사본을 신속하게 전송해 준다. 이밖에 각 단어에 대한 타임스탬프뿐 아니라 기존에 없던 새로운 단어나 약어를 추가하기 위해 어휘를 사용자 정의할 수 있다.

아마존 트랜스크라이브는 1년 동안 매월 60분의 무료 티어를 제공하며 가격은 초당 0.0004달러다.

3. 테미

테미(Temi)는 단 5분 만에 음성 데이터를 텍스트 데이터로 전환하는 자동 소프트웨어를 사용한다.

사용자는 이 앱으로 녹음하고 편집하며 공유할 수 있으며, 애플의 앱스토어와 구글 플레이에서 무료로 내려받을 수 있다.

이 앱에는 분당 0.10달러다. 여기에는 맞춤 타임스탬프, 화자(Speaker) 신분 확인, 앱에서 직접 사본을 MS 워드 및 기타 형식으로 내보낼 수 있는 기능도 들어 있다. 또한 테미는 사용자의 이메일에 직접 파일을 전송해 주기도 한다.


4. 윈도우 음성 인식


윈도우 음성 인식(WSR)은 마이크로소프트 윈도우 비스타 이상에서 음성 인식 기능을 제공한다.

‘음성을 텍스트로 전환 기능’은 사용자가 문서와 이메일 메시지로 지시할 수 있게 해준다. 영국, 중국어, 스페인어 등 8개 언어로 제공된다.

WSR의 정확성은 품질이 우수한 오디오를 사용할 때 가장 좋다. 윈도우 OS에 자동으로 내장되어 있기 때문에 음성 인식 소프트웨어에 대한 추가 비용은 없다.

그러나 텍스트 플랫폼에 대한 다른 소프트웨어와 비교할 때 WSR 사용자는 정확성을 보장하려면 필사 텍스트를 선택한 후에 ‘재생할 수 있는 피드백 재생’ 옵션을 선택해야 한다.

5. 음성 인식 사운드라이터
음성 인식 사운드라이터(SoundWriter)는 구글 문서 도구의 음성 입력 및 인식 소프트웨어 추가 기능이다.

사용자가 마이크를 설치해 사운드라이터를 사용하여 모든 구글 문서 파일을 모든 언어로 작성할 수 있다. 또한 사용자 정의 구성이 포함돼 있어 단어를 추가할 수 있을 뿐 아니라 특정 문자 및 구두점 스타일을 추가할 수도 있다.

애드온은 구글 크롬 브라우저에서만 작동하지만 사운드라이터는 구글 문서 도구의 일반 사용자에게 좋은 옵션이다. 또한 음성 입력이 통합돼 있으며 무료로 다운로드할 수 있다.

6. 구글 문서 음성 입력

구글 문서 도구 음성 입력은 구글 문서 도구 사용자, 특히 구글 제품군 플랫폼에서 음성-텍스트 기능만 필요할 수 있는 웹 기반 음성 받아쓰기 및 음성 인식 기능을 제공한다.

음성 입력을 위해 43개 언어로 접근할 수 있지만 음성 명령은 영어로만 제공된다. 크롬 웹 브라우저에 무료로 설치할 수 있다.

마이크 아이콘을 클릭하면 받아쓰기의 시작하고 중지할 수 있으며 사용하는 모든 음성은 직접 말할 때 그대로 사용된다. 따라서 고객과 회의 때, 말을 그대로 전할 때 유용하다.

추가 명령을 사용해 구글 문서 음성 입력은 즉시 텍스트를 삭제하거나 편집할 수도 있다.

7. 트린트


트린트(Trint)는 인공지능을 사용하여 오디오 및 비디오 파일의 자동 사본을 제공하는 ‘음성-텍스트 전환’ 소프트웨어다.

사용자는 소프트웨어에 내장된 빠른 검색 및 편집 기능에 접근해 자세한 정확성을 보장할 수 있다. 이 소프트웨어를 사용하면 필사본으로 작성된 콘텐츠를 쉽게 공유하고 공동 작업할 수 있으므로 팀 내 협업할 때 유용하다.

12개 언어와 3가지 영어 악센트로 제공되는 트린트는 3가지 모델로 구성돼 있으며 시간당 13.20파운드, 월 26파운드 기본, 월 100파운드로 고급 등으로 나뉜다.
 


오트랜스크라이브(oTranscribe)는 오디오 및 비디오 파일을 복사하는 데 사용할 수 있는 무료 음성 텍스트 전환 애플리케이션이다.

이 앱에는 스크립트를 통해 쉽게 탐색할 수 있는 양방향 타임스탬프와 마크다운, 일반 텍스트, 구글 문서 도구로 파일을 내보내는 옵션이 있다.

오트랜스크라이브는 이탈리아어와 중국어를 포함한 24개 언어로 제공되며 쉽게 접근할 수 있도록 키보드 단축키도 있다. dl-ciokorea@foundryco.com