자격증

NCE 자격증 이론정리 100편- AI 분야 -CLOVA Speech 핵심요약

CLOVA Speech 핵심요약

-정형화되지 않은 말소리를 인식하여 텍스트로 바꿔주는 음성인식 서비스

-음성인식 기술을 통한 미디어내 음성 인식 서비스

.음성메모, 영상자막생성, 통화 녹취록관리등의 서비스를 만들 때 활용할 수 있는 음성인식서비스

.인식결과 수정을 위한 Speech 빌더 제공

(아래. Audio 파일포맷, Video 파일포맷 지원가능 포맷 외워둘 것. 특히 audio포맷)

-결과파일 포맷 : json, smi, csv, xls, srt

-화자분리 기능제공, 인식결과 신뢰도 학습을 통한 학습 알고리즘 개선

-문장자동 분리 및 타임스템프 지원

타임스템프 기능을 제공하여 음성을 텍스트로 변환하는 과정에서 적절한 길이로 문장을 분리하고 시간을 표시한다. 또한 문장의 시작과 끝을 시각적으로 표시해주어 자막을 생성하는 등 다양한 방식으로 활용할 수 있다.

-키워드 부스팅

키워드부스팅기능을 사용하여 인식 확률을 높이고 싶은 단어를 미리 설정할 수 있다. 등록할 수 있는 문자 및 언어는 한글, 영어, 일본어, 숫자이다.

-인식결과 수정 에디터 제공

. CLOVA Speech를 통해 인식된 데이터를 손쉽게 수정, 편집하여 재가공 할 수 있다. 편집하려는 파일이 재생되고 있는 과정에서 인식된 데이터를 바로바로 수정할 수 있다. 인식결과는 자막은 물론 다양한 파일형식으로 추출 할 수 있다.

-API기반 인식 제공

CLOVA Speech 빌더 뿐만 아니라, API를 기반을오 한 활용이 가능하다.

최대 2시간 인식이 가능하며 인식 파일크기는 최대 2GB까지 지원한다.

-사용예1 : 고객센터에서 상담원과 고객이 나누었던 내용을 텍스트화하여 보관하고 싶을 때

-사용예2 : 오디오와 비디오 데이터의 음성을 텍스트화하여 아카이빙하고 분석가능

-사용예3 : 문장 자동분리와 타임스템프 기능을 통해 자동으로 손쉽게 자막생성 가능

-사용예4 : 현재 네이버 방송뉴스에 적용되어 자동자막생성 기능을 제공중

등록된 댓글이 없습니다.