산업
흄 AI, 첫 오픈소스 TTS 모델 ‘TADA’ 공개..."속도·효율성 탁월"
자연스러운 발화와 빠른 응답 속도, 높은 신뢰성을 동시에 구현하려는 경쟁이 치열해지는 음성 AI 분야에서 텍스트와 음성을 동일한 속도로 처리하는 새로운 음성 생성 기술이 공개됐다.음성 AI 전문 흄 AI는 10일현지시간 새로운 음성 합성 기술 ‘TADATextAcoustic Dual Alignment’를 발표하고, 모델과 코드를 허깅페이스와 깃허브에 오픈소스로 공개했다.이 기술은 텍스트와 음성을 1대 1로 정렬하는 토큰 구조를 도입, 기존 대형언어모델LLM의 음성 합성TTS 한계를 해결하는 것을 목표로 한다.현재 음
이 콘텐츠는 AI타임스 원본 기사의 요약입니다. 전문은 원본 사이트에서 확인해주세요.
원문 기사 보기 →