리그베다 위키도 그렇지만 망할 엔하위키 미러는 인터넷 플랫폼 기반 하이퍼텍스트의 강점인 하이퍼링크를 너무 잘 구현해놨다. 분명 4.19 혁명에서 시작했는데 왜 나는 지금 한국 보컬로이드인 시유 음악을 유튜브에서 듣고 있지. 음. 역시 이번에도 서브컬처 이야기다.


보컬로이드 시유. 망했시유


보컬로이드 시유의 성우이자 GLAM의 리드보컬 김다희가 이병헌 협박 건으로 구속되어 있는 틈이 적기라는 건 페이크고, 지금 2014년은 보컬로이드 붐이 좀 가라앉아 차분히 뜯어볼 수 있는 시기라고 생각하여 이 글을 쓴다. 절대 과제하다가 하기 싫어서 이러는 것이 아니다.


보컬로이드라는 개념은 일단, 음성 합성에서 출발했다. 메커니즘은 궁금해하지 않을 테니 생략하겠다. 이후 음성 합성은 TTS로 일컬어지는 음성 출력으로 발전하는 양상을 보였다. 거기서 할 일 없는 사람들은 이렇게 나오는 목소리를 가지고 음악에 써 먹을 생각을 했다. 일단 처음은 IBM이었다. 1961년, 그들은 IBM7094를 이용해 1892년 노래인 〈Daisy Bell〉이라는 노래를 부르게 했다. 이후 《2001 스페이스 오딧세이》에서 최고의 악역 HAL 9000이 불러서 유명해졌지. 아. HAL에서 알파벳을 한 글자씩만 밀면 IBM이 되는 건 일단 그냥 유머로 넘기자.



이게 IBM 원본




이건 HAL9000 버전. 후반부에 나오니 인내심이 조금 필요하다.



근데 그건 일종의 실험이었고 큰 반향을 일으키지는 않았다. 그 전에도 간헐적으로는 있었을지 모르겠지만 본격적으로 음악에 이용한 것은 기술 덕후인 독일인이었다.



70년대 초에 결성하여, 사이키델릭의 음악들에 혁명을 일으켜 일렉트로니카로 발전시킨 독일 그룹의 이름은 바로 크라프트베르크다. 그러니까 우리말로는 발전소라는 뜻이다. 그들의 곡 〈Computerwelt〉를 들으면 괴상한 목소리들을 들을 수 있다. 현대의 보컬로이드와는 그 맥락이 다르지만, 아무튼 본격적으로 사람 목소리 대신 기계음으로 앨범을 낼 생각을, 그들은 했고 해냈다. 이쪽은 이제 다프트펑크 쪽이 이어받았다. 내 영어사전이 이것과 똑같은 소리를 내서, 고등학교 때 심심하지는 않았다.


그 이후 오토튠 기술이 눈에 띄게 성장을 하고나자 전세계 각국은 가창력 부족한 가수를 데리고 음정을 후보정하는데 써 먹었으나 일본은 역발상으로, 음성 합성 기술에 음정을 붙일 생각을 한다. 사실 이건 최신 기술은 아니었으나, 문제는 상업성이었다. 그러나 탄탄한 2D 내수시장(...)을 믿은 일본 기업 야마하와 크립톤은 저질러 놓은 음성 기술에 숨을 불어넣어 보컬로이드를 출시하기에 이른다. 당시 폭발적인 인기를 얻은 보컬로이드 열풍은 동해를 건너 한국에도 도착했고, SBS A&T는 야마하와의 기술 제휴를 통해 시유(SeeU)라는 현지 캐릭터를 만들어낸다. 그 과정에서 유명 작곡가 방시혁이 참여한 것을 보니 SBS가 정말 제대로 준비했다는 것을 느꼈다. 아니면 그냥 덕력이 높은 건가. 하긴 런닝맨을 보면... 참고로 SBS 가요 프로그램에서 시유와 GLAM이 같이 나온 까닭은 제작사 SBS 그리고 시유 성유가 소속된 GLAM의 합작품이기 때문. 군대에서 시유가 나오는 인기가요를 봤을 때, 당시 나는 상병이었고 사회 문화를 즉시 받아들이기에는 마음이 너무나 여렸다. 뭐, 나는 문화 잡식성 동물이기 때문에 큰 거부감 없이 곧장 문화의 새로운 물줄기로 인지하긴 했지만서도.



시작이 상업성 캐릭터였기 때문에 보컬로이드는 그 캐릭터성 때문에 오타쿠 문화가 먹는 욕을 그대로 먹는다. 뭐 이건 끝날 기미가 보이지 않은 예술 논쟁이니까 넘어가자.


그래. 이쯤에서 학구적인 이야기다. 다른 보컬로이드에 비해 탁한 음색을 낸다고 하는데, 아마도 한국어에 유기음이나 파열음보다 무기음이 많기 때문이라고, 리그베다 위키는 분석한다. 시유는 ㅐ, ㅔ의 발음도 구분하지 못한다. 음운론을 배우지 않았다 해도 다들 알겠지만, ㅔ와 ㅐ의 발음은 다르다. 둘 다 경구개 쪽에서 소리가 나는데다 비원순 전설모음이기는 하지만 ㅔ는 중(고)모음이고 ㅐ는 (중)저모음이다. 국제 발음 기호를 사용해도 둘을 분명하게 구분지을 수 있다. 그러나 나는 내지 못한다. 사실상 현대 젊은 화자들은 거의 내지 못한다고 보는 것이 옳다. 물론 보컬로이드 시유도 내지 못한다. 그 이유로는 용량 문제나 기술적 문제 혹은 성우 발음의 문제일 수도 있겠다.


그것 말고도 흥미로운 점은 많다. 아무리 사람이 녹음을 해도 다양한 발음을 전부 녹음하는 것이 아니라 기계로 합성을 해야하는 터라 자연스럽지 않은 발음이 나올 수밖에 없다. 보컬로이드 아티스트들은 이를 위해 실제 가사 대신 자연스러운 발음으로 바꾸어 보컬로이드 프로그램에 입력한다. 이때 유기음은 물론이고 받침과 같은 연음까지 고려해서 넣는다고 한다. 그렇다면 그들은 같은 철자가 문장의 첫부분과 중간부분에 들어갔을 때 음가가 달라진다는 것을 인식하고 있다는 거다. [바보]라는 단어를 발음했을 때 바의 ㅂ와 보의 ㅂ의 음가가 서로 다르다는 사실을, 나는 대학교에 와서야 배웠다. 그렇다. 보컬로이드 아티스트들은 최소 학사 수준이라는 얘기다. 대단한 사람들이야. 정말.


현재 음성합성 기술이 아무리 좋다고 해도 인간의 목소리에는 미치지 못하므로 보컬로이드로 뮤직비디오를 만들 때는 자막이 반드시 붙어야 한다. 아니면 발음을 알아듣기가 힘들거든. 사실 나보다는 발음을 잘하는 거 같지만...


보컬로이드가 얼마나 노래를 잘 부르는지, 현대 음성합성 기술이 어디까지 왔는지 궁금해할 사람들을 위해 유튜브 링크를 걸어 놓는다. 아마추어들이 결성하여 만든 뮤직비디오라고 믿기지 않을 퀄리티를 자랑한다.



'문화컨텐츠 > 음악' 카테고리의 다른 글

다프트 펑크 듣다가  (0) 2015.05.18
마이티 마우스(2인조 힙합 그룹)와 잡설  (0) 2015.02.18
픽사 UP OST 8비트 버전  (0) 2014.07.16

WRITTEN BY
_클로버
무색의 녹색 생각들이 맹렬하게 잠든다.

,