🎓
언론사 유튜브 채널, 기사는 많은데 영상이 안 올라오는 이유
저희가 언론사 고객들과 이야기를 나눠보면, 비슷한 이야기를 정말 자주 듣습니다."채널 개설은 2년 전에 했는데, 아직도 영상이 10개도 안 돼요."“몇 년전엔 활발히 운영을 했었는데, 지금은 그냥 방치하고 있습니다…”살펴보면 대부분 원인으로는 영상 한 편 제작하는데 공수가 너무 많이 들...
Junwoo
2026-05-07
🗞️
[Update] SDK 없이 계정 API 토큰으로 영상 자동 생성
달라진 점기존에는 자동화 API를 사용하려면 별도 SDK를 생성하는 절차가 필요했습니다. 이제는 계정 설정 > API 토큰에서 값을 복사해 요청 헤더에 붙여넣기만 하면 영상 자동 생성을 바로 시작할 수 있습니다.사용량은 현재 구독 플랜의 크레딧 한도 안에서 그대로 차감됩니다. 별도...
Junwoo
2026-05-06
🗞️
[Update] AI 동영상 클립 생성 기능
비디오스튜에서 텍스트 프롬프트만으로 AI 동영상 클립을 직접 생성할 수 있는 기능이 추가되었습니다.라이브러리의 비주얼 탭에서 AI 비디오 카테고리를 선택하면 [+추가] 버튼을 클릭하면 프롬프트 입력 화면이 열립니다.내용에 맞춰 적절한 묘사 프롬프트가 자동 생성되니 그대로 생성하거나 원하...
Junwoo
2026-05-04
🗞️
[Update] 대용량 비디오 업로드
비디오스튜에서 최대 1GB의 대용량 동영상 파일 업로드를 지원합니다.기존에는 최대 250MB로 동영상 클립을 별도로 분할하여 업로드를 하셨서야 했는데요. 이번 업데이트를 통해 대용량 비디오 파일을 분할 방식으로 업로드하실 수 있게 되었습니다.업로드 후 구간 편집대용량 비디오를 업로드하면...
Junwoo
2026-04-23
🎓
기업 영상 제작, 외주 맡기기 전에 이것만 알고 가세요!
회사에서 마케터로 일을 하다보면 이런 순간들을 겪어보셨을꺼에요. 위에서는 '우리도 유튜브 해야 하지 않냐'는 말은 심심찮게 계속 나오지만 흐지부지되고, 가끔 신제품이 나오면 홍보 영상을 만들어야 하는 일도 있겠죠.결국 유튜브 대행이든 홍보 영상 제작이든 에이전시들에게 견적을 요청하게 되...
Junwoo
2026-04-23
🗞️
[Update] 팟캐스트 스타일 영상 제작 기능
비디오스튜에 새로운 글쓰기 스타일인 팟캐스트 형식이 추가되었습니다.[아이디어로 시작하기]나 글다듬기로 팟캐스트 형식을 선택하면, 주제와 내용에 맞는 두 명의 화자가 자동으로 설정되고 실제 대화처럼 자연스러운 구어체 스크립트가 생성됩니다.정보 전달형 주제라면 사회자와 게스트, 인터뷰 형식...
Junwoo
2026-04-15
🎓
무료 동영상 사이트, 종류부터 잘못 고르고 있는 거 아닐까요?
영상 콘텐츠를 시작하려는데 예산은 없고, 유료 툴 구독료는 부담스럽고. 그래서 "무료 동영상 사이트"를 검색하다가 막막해진 분들 꽤 계실 거예요.근데 솔직히 말하면, 이 키워드로 찾을 수 있는 정보들이 대부분 비슷합니다. Pixabay, Pexels 등등의 스톡 라이브러리 사이트 목록 ...
Junwoo
2026-04-06
🗞️
언론사라면 꼭 챙겨야 할 2026 공용인프라 지원 사업: NewsTTV/뉴스이미지 무료로 쓰는 방법
한국언론진흥재단이 2026년 뉴스콘텐츠 공용인프라 구축 지원 사업 공모를 시작했습니다. 신청 마감은 4월 15일(수) 오후 5시까지입니다.이번 사업은 클라우드 기반의 뉴스 제작 도구들을 언론사에 최대 5년간 무료(또는 일부 자부담)로 지원하는 프로그램인데요, 저희 비디오스튜가 공급하는 ...
Junwoo
2026-04-01
비디오스튜에는 다양한 AI 보이스들이 탑재되어 있습니다. Google Wavenet, Amazon Polly, KT AI Voice, Naver Clova, Azure, ElevenLabs까지…
그렇다보니 자연스레 파생되는 이슈는 다들 학습된 모델이 달라서 똑같은 문장이 주어져도 읽는 방식이 미묘하게 다르다는 것입니다. 특히 단위를 읽을 때 그 차이가 두드러졌습니다.
이 포스팅을 통해 TTS 생성 시 한국어로 단위를 읽을 때 제대로 읽기 위해 고려했던 점들에 대해 이야기해보고자 합니다.
측정 단위 제대로 읽게 하기
TTS 엔진들을 다양하게 사용하다보니, 예를 들어 "100kg"이라는 표현을 읽을 때도 각 엔진들은 제각각으로 읽는 이슈가 있었습니다. "백 케이쥐"라고 읽는 엔진도 있고, "백 크흐..."라고 말끝을 흐리는 AI도 있었죠. (
AI도 당황하면 말끝을 흐리나…)물론 "백 킬로그램"이라고 정확하게 읽는 엔진도 있습니다.
그래서 이러한 단위들을 라이브러리화해서 전처리를 하는 프로세스를 개발했습니다. 모든 엔진들이 동일하게 읽도록 하기 위함이었죠.
숫자 제대로 읽게 하기
이렇게 서비스를 운영하다보니, 생각치 못한 이슈에 또 봉착하게 되었습니다. (한국어는 정말 매력덩어리..)
한국어에서는 숫자를 읽는 방식이 두 가지라는 점이죠. 우리는 본능적으로 사용하고 있어 잘 느끼지 못할 수 있습니다.
예를 들어, 시간을 말할 때 "10시 10분"은 "열 시 십 분"으로 읽죠. 왜죠…?
그리고 일반적인 숫자는 "일, 이, 삼"과 같은 한자어로 읽지만, 뒤에 수량을 나타내는 단위(수량사라고 해요. 저도 처음 들어봤어요…)가 붙으면 "한 개, 두 개, 세 개"로 읽게 됩니다. 공식적으로 수치를 재는 단위는 한자어를 쓰고요. (예: 10cm = “십 센치미터”)
자, 제가 숫자를 하나 드려볼께요. “90개”. 어떻게 읽으시나요?
원칙적으로는 90개까지는 “아흔 개”라고 읽는 것이 맞습니다. 아마 “구십 개”라고 읽으신 분들도 있으실꺼에요. 숫자가 커질 수록 우리가 일반적으로 더 편한 방식이 있기 마련이죠.
작은 숫자로 생각해볼까요? “9개”. 네, 이건 모두가 다 “아홉 개”라고 읽으셨을 것입니다.
이 원칙에 따라서 1~99까지는 고유한글로 읽는 방식으로 전처리 프로세스를 개발하게 되었습니다. 하지만 이는 말그대로 원칙적인 것이고, 고객들의 피드백에 따라 이 기준을 변경할 가능성을 열어두고 있습니다. 40개라면 “마흔 개”보다 “사십 개”가 더 자연스럽게 받아들여질 수 있으니까요.
어쨋든 일관된 사용경험을 위해 “하나, 둘, 셋”의 고유한글에 대응되는 단위 라이브러리를 만들게 되었습니다.
이 라이브러리는 TTS 서비스를 구현하려는 분들이라면 참고해주세요. 단, 지금도 끊임없이 고객 피드백을 통해 생각치 못한 단위들이 발견되고 있어서 완전한 버전은 아님을 말씀드립니다.
UX의 디테일 = SaaS의 성공
수량사라는 처음 듣는 표현을 접하면서, 한국에서 동영상 편집 SaaS 솔루션을 서비스하면서 많은 어려움이 있었는데, 또 한번 느끼게 되는 계기가 되었습니다. 정말이지 한국어는 변화무쌍하고 대단한 언어입니다…
동시에 영어권 서비스가 부럽다는 생각도 들었지만, 그 쪽은 또 그 쪽 나름대로의 고충이 있겠죠.
물론 비디오스튜에는 [텍스트 수동 지정]이라는 기능이 있습니다. 화면에 보이는 것과 상관없이 TTS를 생성하는 방법이죠.
< 화면에 보여지는 자막과 상관없이 TTS에서 읽을 소리를 설정하기 >
이 방법을 통해서 원하는대로, 소리나는대로 적어주면 되니까 TTS가 더 자연스럽게 발음하도록 유도할 수도 있고 잘못 읽는 단위를 사용자가 직접 수정할 수도 있습니다.
그럼에도 저희가 이렇게 디테일에 집중하는 이유는, 이런 작은 차이들이 서비스의 성장을 결정짓는다는 확신 때문입니다.
사용자는 숫자 표현이 포함된 문장을 입력하는 순간 어떻게 읽겠다라는 생각이 있습니다. 일단 그대로 생성되지 않는 다면 일차적으로 문제일 것이고요. 그걸 추가 편집을 하지 않아도 생각했던 그대로의 결과물이 가장 빠르게 나오도록 하는 것이 저희가 지향하는 UX의 종착점입니다.
앞으로도 계속 이렇게 저희가 하는 UX적인 고민들을 포스팅해보도록 하겠습니다. 앞서 말씀드린 것 처럼 모든 서비스들이 상향평준화되고 있는 현 상황에서는 이러한 디테일에 대한 고민이 서비스의 명암을 가른다고 믿으니까요.