기타
2023.08.07 13:57

<창칼 10> 한국어 신화 깨기

profile
조회 수 321 추천 수 0 댓글 10
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부
<창칼 10> 한국어 신화 깨기
 
 
최근에 여기 <회원들 이야기> 코너에 올린 나의 글들을 재미 삼아 Google 번역기로 영어 번역을 시켜 본 적이 있다. 
 
문단을 복사하고 붙이기를 했을 때 번개보다 더 빠른 속도로 번역이 이루어졌다. 계산기 같은 속도에 입을 다물지 못했을 뿐만 아니라, 더욱 나를 놀라게 한 것은 번역의 질적 수준이었다. 기계가 번역을 했는데도 사람이 번역한 것처럼 정교하기가 그지 없었다. 과연 내가 쓴 복잡한 한국어 글들을 기계가 제대로 이해할까하고 얕잡아 봤는데, 아뿔사, 대상 글들을 거의 95% 수준으로 다 소화해 버리는 것이었다. 글을 정연하고도 쉽게 쓴 것도 아닌데 기계가 내 글의 복잡한 구절들을 다 파악하고 디코딩을 척척 해내버리다니. 호기심이 더 발동하여, ChatGPT에서도 같은 텍스트를 번역시켜 보았다. 그 속도는 구글 번역기만큼 빠르지 않았지만 정교함이나 세련됨은 구글 번역기보다 더 탁월났다. 이렇게 두 풀랫폼이 모두 AI 기술을 채택해서 한국어의 미묘하고도 정교한 표현들을 거의 다 훌륭하게 영어로 번역해내고 있는 걸 보면서 나는 아연해졌다. 더 나아가, 언어야 말로 최정점의 복잡한 인간의 인지 능력의 산물인데 이 언어 번역의 수준을 보면서 이제 AI가 인간의 두뇌를 거의 다 따라잡고 있다는 생각에 소름까지도 돋았다.
 
이제 언어가 달라도 AI의 도움을 받아 웬만한 것은 다 소통이 되는 시대가 된 것 같다. 한 때 번역은 컴퓨터 같은 기계가 할 수 있는 영역이 아니라는 인식이 만연했었고, 구글 번역기 초창기에는 번역이 너무 어설프고 엉성해서 과연 온전한 기계 번역이 가능할까 하는 의문도 많았었다. 그런데 어느 새 인공지능이 나와서 Neural Network 학습과 Deep Learning을 통해 해가 갈 수록 번역이 나아지고 세련되더니, 이제는 한국어의 미묘한 뜻까지도 쉽게 파악해서 번역해 버리는 단계까지 와버린 것이다. 좀 있으면 99.9%의 정확성으로 번역이 이루어지는 날이 빠른 시일내로 올 것 같다. 가끔 고향에 있는 내 숙소에 외국인들이 찾아 온다. 관리인 아주머니가 외국어 한 자도 모르지만 생판 모르는 외국인이 와도 이 번역기 덕분에 웬만한 소통을 다 한다고 하니, 기계 번역의 힘을 실감한다.
 
인공 지능의 언어 번역 얘기가 나온 김에 오늘은 우리가 늘상 사용하는 모국어인 한국어와 관련된 오해와 신화 한, 두 가지를 끄적거려 볼까한다. 
 
먼저, 한국어를 지칭하는 용어에 대해서다. 한국어를 가르켜 ‘우리말’이라고도 하고, ‘한국말’이라고도 하고, 일부는 ‘한글'이라고 말하는 사람도 적지 않다. 그 외에 한국내 공교육에는 과목으로서 ‘국어'라는 용어가 쓰이고 한국어를 외국어로서 가르칠 때는 ‘한국어'라고 부른다. 언어학에서도 물론 ‘한국어'라고 한다. 
 
훈민정음(한글 메뉴얼)의 첫 문장에 ‘우리말(씀)이 중국말과 달라…”라는 구절을 보면 ‘말'이라는 순수 국어 단어가 소리(speech)로써의 말을 예전부터 지칭한 것을 알 수 있다. 말소리(=한국말)를 적을 방법이 없어 글자로서 ‘정음’인 한글을 만들었다는 것이다. 그런데, 아이러니 하게도 '글자 매뉴얼' 제목을 '정문()'이라하지 않고 '정음(正音)'이라고 한 것으로 보아 소리 언어와 글자를 혼동하는 그 깊은 신화의 뿌리가 여기서 벌써 시작된 것을 알 수 있다. 물론, 세종대왕의 학자들이 만든 글자를 지칭해서 ‘한글’이라는 용어를 쓰기 시작한 것은 훨씬 뒤인 20세기 초(주시경 선생님에 의한 것)이긴 하지만, ‘말’이라는 말은 예전부터 말소리를 지칭했던 게 분명해 보인다. 하지만 글자를 가르켜 음(音, 소리)이라고 해 버림으로서 불행히도 말과 글의 혼동이 글자가 만들어진 시작점부터 기인한 것도 알 수 있다.
 
이런 혼란은 오늘까지 이어져서 안타깝게도 이 말을 받아적는 문자인, '한글'의 위대성을 강조하고 이를 사랑하는 마음이 지나치다 보니 많은 사람들이 한국말 혹은 한국어를 지칭할 때 ‘한글'이라고 말하는 사람들을 많이 만난다. 즉, 소리 언어와 글자를 섞어 버리는 것이다. '요즘 한글을 배워요?', ‘학교에서 한글을 가르치세요?’ 등이 그 예라면 예이다. 특히 미국 같은 외국에서 교포 자녀를 위한 ‘한글 학교'가 퍼지면서 그런 인식이 더 부추기어진 감도 없지 않다. 애초에 이 학교들이 만들어질 때  ‘한국어 학교'로 불리었으면 이런 인식이 확장되지는 않았을 거 같고 학교를 글자만 배우는 장소로 전락을 시키지  않았을 것 같다. 언어는 글자 이전에 말인 것이다. 물론, 집에서 한국말을 어느 정도 배운 교포 학생들이 '한글(=한국어)' 학교에 가서 글자를 배우게 한다는 일차적은 욕구는 이해를 하지만 글자 이전에 말을 제대로 배워야 하는 것이고 주말학교에서 글자외에 말도 가르쳐야 하는 것이니 "한국어 학교"라고 해야 맞다고 본다. 
 
외국어에 반해서 국내어라는 뜻으로서, ‘국어'는 그 용어의 정당성을 얻는 것처럼 보인다. 그렇지만 학교 과목으로써 National Language라고 지칭하는 것은 복수 언어들이 사용되는 인도, 말레지아, 필리핀 같은 아시아의 일부 국가들에서 그 국민들이 사용하는 여러 복수 언어 중, 국가 공식 언어(official language) 하나를 지칭할 때 쓰는 것으로서, 비교적 단일한 민족에다 단일한 언어를 쓰는 한국에서 굳이 ‘국어’라고 할 필요가 있었을까 싶다. 단어에 국수주의적인 냄새도 묻어나기도 하니, 한국인, 한국 땅, 한국 상품이라고 하듯 그냥 과목 이름도 '한국어'라고 하는 게 낫지 않나 싶다. 더 나아가 한국 역사 과목인 국사도 '한국사'라고 하는 게 더 맞아 보인다. 
 
말이 소리 언어이니 만치 ‘한국말'이라는 것도 중국말, 일본말처럼 발화된 스피치 언어를 지칭할 때 쓰는 게 맞는데, 음성 언어와 글자 언어를 통칭해서 한국어를 뜻하는 용어로 한국말이라고 쓰는 이들도 꽤 많다. “한국말을 참 잘 하시네요”는 잘 어울리지만 “한국말을 공부하고 있어요"라든가 “한국말은 참 어려운 언어예요"라고 하면 좀 어색해진다. 즉, ‘한국어를 공부하고 있’고 ‘한국어가 어렵다’라고 말해야 듣기에 더 좋다. 특히, ‘한국말 문법도 배워요'라고 하는 것 보다는 ‘한국어 문법도 배워요'라고 하는 게 더 자연스럽다. 
 
고유명사로서 ‘우리말’은 우리집, 우리가족, 우리나라처럼 ‘우리'라는 단어를 좋아하는 집단주의 선호 현상에서 나오는 문화적 현상이기에 더 언급해서 무엇하랴. 
 
가끔은 한국어는 영어에 비해  훨씬 비논리적인 언어라고 생각하거나 말하는 사람들을 접한다. 과연 그럴까? 
 
일단, 생각처럼 비논리적인 언어였다만, 앞에서 언급한 대로 구글 번역기 같은 AI가 그렇게 정연하게 번역을 잘 해 낼 수가 없을 것이다. 반대로 말해, 인공지능이 번역을 기똥차게(?) 잘해 낸다는 것은 한국어가 그만큼 논리적이라는 얘기도 되는 것이다.
 
두 번째로는 논리학과 논리적인 개념이 서양 철학에서 발달된 만큼 이런 논리 개념들을 자주 표출해온 영어 같은 서양 언어가 더 논리적으로 들릴 수는 있다고 본다. 하지만, 한국어도 논리를 담는 그릇으로 손색이 없는 언어이다. 이는, 엄밀히 말하면 논리의 문제가 아니고 언어 유형구조의 문제라고 생각한다. 
 
유형적으로 영어는 ‘분석어’로써 미묘한 화자의 다양한 심리적 태도를 고정된 수의 조동사 (may, could.. etc)와 인토네이션을 통해 전달한다. 반면, 한국어는 ‘교착어’로써 문장 어미를 다양하게 바꿈으로써 그것을 전달한다. ~(으)ㄹ까 해요, ~(으)ㄹ래요, ~(으)ㄹ게요, ~(으)ㄹ거에요, ~겠어요, ~(으)려고 해요, 등등이 그 예이다. 복잡하기는 하지만 어떤 측면에서는 다양한 어미가 많아서 다양한 미묘한 뉘앙스의 화자의 심리적 태도와 의도들을을 보다 더 정교하고도 다양하게 전달을 하니 더 섬세한 언어라고 주장할 수도 있을 것이다. 반대로 배우는 사람 입장에서는 배워야 할 것도 많고 뜻도 헥갈리는 어미들이  많으니 소통 효율이 떨어진다고도 주장할 수도 있다. 다 보기 나름이다.  
 
구조적으로는 가장 기본적인 것 하나만 든다면, 영어는 말하는 초점이 먼저 나오고 한국어는 초점이 뒤에 나오는 언어이다. 기술적으로 Head-first, Head-final이라는 말을 쓴다. 재미있는 것은 이게 문장 구조뿐만 아니라 사람들의 사고방식과 생활 습관까지도 반영한다는 것이다. 즉, 영어처럼 선초점 언어는 기본 문장구조 (동사(Head) + 목적어), ‘I like you’ 나 관계사절, (초점명사 + 관계대명사), ‘the person(Head) who I like’ 처럼, 말하는 초점 혹은 핵심을 앞으로 당겨서 먼저 얘기하는데, 영어 화자들이 얘기를 하는 방식도 두괄식을 선호해서, 핵심을 먼저 말하고 그에 대한 배경 설명이나 이유 설명은 나중에 펼쳐낸다. 이뿐만 아니라 생활 속에서도, 사람 이름인 경우, 초점인 first name을 먼저 말하고 배경이 되는 family name은 나중에, 그리고 주소도 개인 이름 먼저 쓰고 마을, 군, 주, 나라 순서로 마이크로 단위에서 매크로 단위로 넓혀 간다. 한국어는 이와 반대로 '후초점(Head-final)' 언어로서 ‘나 너를 좋아해(H)’/ (내가) 좋아하는 사람(H) 처럼 초점이나 핵심은 나중에 말하고, 담화나 이야기를 펼치는 방식도 미괄식을 좋아해서, 배경을 풀어낸 후에 핵심은 나중에 말하는 경향이 있다. 위에서 든 이름이나 주소를 말하는 방식도 핵심을 나중에 말하는 방식으로 영어와 거꾸로다. 
 
즉, 문화와 사물을 인식하는 방법의 차이가 언어 구조에도 반영이 된 것이라 참 흥미롭다. 스피드 시대에 두괄식이 미괄식보다 언어 소통 방식에 있어 더 효율적인 측면이 있다고 주장할 수도 있겠지만 이는 담화구조의 차이일 뿐 어느 언어가 더 소통에 유리하다, 더 논리적이다라고 연결시키는 건 무리한 견해라고 볼 수 밖에 없다. 
 
이외에도 한국어에 대해서 장점으로서, 혹은 약점으로서의 이런 저런 오해나 잘못 알려진 '신화'들이 꽤 많이 있는데 지면 관계 상 다 소개하지 못함이 아쉽다. 언어는 사회, 문화, 화자의 정서 등을 반영하고 더 나아가 화자들의 인지 구조까지도 담아 낸다고 한다. 한 나라의 언어를 보면 그 나라의 문화가 보이고 정서가 보이고 심지어 생각하는 방식까지도 보인다는 것이다. 이런 유기체적인 현상으로서 언어를 들여다 보는 것은 그래서 흥미롭고 유익한 일이다. 더 나아가, 이렇게 한 언어에 다양한 요소들이 복잡하게 얽혀있는 양상이라든지, 두 언어 간의 서로 다른 구조와 유형 같은 많은 차이를 초월해서 이제 인공지능이 언어들을 넘나들면서 서로 연결시켜주는 능력을 보이고 있다는 것을 우리는 간단하지 않게 지켜봐야 할 것 같다. 한국어가 점점 세계화돼 가고 있고, 인공지능이 나와 세상에서 가장 정교하고 복잡한 인류 언어 중의 하나인 한국어를 기계가 따라 잡고 있는 이 시점에서 우리는 보다 큰 틀에서 한국어를 들여다 보고, 또 이와 관련된 여러 현상을 고찰해 보는 것은 아주 뜻깊은 일이 될 것이다.
 
 
 
한국어 3_1.jpg
 
 
 
 
 
  • profile
    Organic 2023.08.08 23:38

    국어, 한국어, 한글의 정의를 명확히 구분해서 도움이 됩니다. 역시 한국어는 세계적으로 우수한 언어임에는 틀림없습니다. Chat GPT가 이정도로 미묘한 뜻까지 번역해버리니 이제 미지의 세계여행도 어렵지 않게 되었군요. Patagonia 여행, El Camino de Santiago순례길,... Spanish를 기본정도만 알아도 불편하지 않을 것같아 아주 기대가 됩니다.

     

  • profile
    창공 2023.08.09 13:43

    It is helpful to clearly distinguish the definitions of Korean, Korean, and Hangul. There is no doubt that Korean is a world-class language. Now that Chat GPT translates even such subtle meanings, it's no longer difficult to travel the unknown world. Patagonia trip, El Camino de Santiago pilgrimage road, I'm very excited that it won't be uncomfortable even if I know the basics of Spanish. (Google 번역기의 번역)

  • profile
    창공 2023.08.09 13:46

    It's helpful to clearly distinguish the definitions of Korean, Hangugeo (the Korean language), and Hangeul (the Korean writing system). Without a doubt, the Korean language is excellent on a global scale. Even translating such nuanced meanings accurately, ChatGPT has made it seem like exploring the unknown world is now much easier. Traveling to places like Patagonia or the El Camino de Santiago pilgrimage route won't be uncomfortable with just a basic understanding of Spanish. I'm really looking forward to it. ("ChatGPT 4" 번역)

  • profile
    창공 2023.08.09 13:47

    어느 게 좋아 보이나요? 사람의 취향에 따라 다르겠지만 두 번역 다 훌륭한 것은 틀림이 없죠? 제가 본문에서 말씀드린 대로 ChatGPT가 아주 약간 좀 더 세련돼 보이는 것 같기도 하고 암튼, 무서운 세상인 건 맞는 것 같습니다. 

  • profile
    창공 2023.08.09 14:10

    한 가지 더 놀라운 것은 상호작용의 기능이 없는 Google 번역기에 같은 내용을 다시 넣고 번역 시키면 똑같은 번역을 보여 주는 반면에, ChatGPT한테 같은 내용을 "또 다시" 번역하라고 명령하면, 영어 번역 내용이 달라진다는 것입니다. 이와 같이 ChatGPT가 물어 볼 때마다 대답을 조금씩 달리하는 능력은 인간의 신축적인 두뇌 작용을 닮은 것 같아 이 점이 특히 무서운 점이라고 생각됩니다. 즉, 기계가 생각을 한다고 느끼게 만들기 때문입니다. 위의 오거닉님의 댓글을 쳇지피티한테 다시 번역하라고 했더니 다음과 같이 조금 색다른 번역을 만들어 내는군요. 놀랍죠? 

     

    Distinguishing the definitions of "국어" (national language), "한국어" (Korean language), and "한글" (Korean script) clearly is helpful. Indeed, there's no doubt that Korean is an outstanding language on a global level. With ChatGPT being able to translate even such subtle meanings, now embarking on unknown world travels seems not so difficult. Journeys to places like Patagonia or the pilgrimage route of El Camino de Santiago won't be uncomfortable with just a basic understanding of Spanish. I'm very much looking forward to it. (ChatGPT4의 두 번째 번역)

  • profile
    Organic 2023.08.09 16:04

    ! 정말 무섭군요. 저렇게 번역을 세련되게 그것도 변화무쌍하게 해버리니 이제 인간의 바벨탑이 ChatGPT로 다시 세워지는 것 아닐까요?

  • profile
    창공 2023.08.10 08:37

    지금 다신 댓글 위험한 발언이네요. ^^ 농담이고요, 아주 멋진 발상이십니다. 다시 아래 보시면 둘 다 훌륭하기는 하지만 구글과 챗지피티가 어떻게 미묘하게 다른지 알 수 있겠죠? 구글 번역이 보다 원문의 뜻에 충실한 (literalality) 반면에 체지피티는 원문의 뉘앙스와 톤을 좀 더 살려서 영어화자들에게 더 실감나게 번역을 함으로써 화자들의 감성에 조금 더 다가가게 만드는 경향이 있다는 겁니다. 하여, 딥런닝의 조금 더 앞서 간다고 할 수 밖에요. 이전에 인공지능은 아무리 날뛰어 봐야 인간의 언어 직관 만큼은 따라 올 수 없다고 좀 회의적인 시각을 제가 가졌었는데 이번에 번역을 가지고 실험을 해 보면서 제 시각을 좀 수정해야 할 것 같고, 이제는 인공지능의 무한한 발전 가능성까지 보고 있습니다. 더 나아가, 이제 신형 바벨탑이 세워짐으로서 번역가들이 설 자리가 점점 없어지는 시대가 도래하는 것 같습니다. 

     

    Google 번역:  and! That's scary. To make the translation sophisticated and ever-changing like that... Wouldn't the Tower of Babel now be built again with ChatGPT? 

    ChatGPT 번역Wow! That's truly amazing. To translate so elegantly and even dynamically like that... Could ChatGPT be rebuilding the Tower of Babel for humanity once again? 

  • profile
    Organic 2023.08.10 08:55

    역시 ChatGPT네요. 이제 베이산악회원들에게는 신나는 날만 남은 것 같습니다. 외국어로부터 해방이 되어 버렸으니깐요. 이제 Amazon 정글, Patagonia 남극대륙, Africa 오지, 신비의 동유럽을 혼자 여행이 가능한 시대에 들어서게 됐군요. 건강한 체력, 뜨거운 열정과 의지, 어느 정도의 재력만 있으면 얼마든지 전세계를 누빌 수 있는 날이 온 것 같습니다.

     

  • profile
    창공 2023.08.10 14:33

    Indeed, it's ChatGPT. It seems that the members of the Bay Mountain Club now have only exciting days ahead. They've been liberated from foreign languages. Now, we're entering an era where solo travel to the Amazon jungle, Patagonia in Antarctica, remote regions of Africa, and the enigmatic Eastern Europe is possible. With good physical health, fervent passion and determination, and a certain level of financial means, it feels like the day has come when anyone can conquer the entire world. (쳇지피티)

  • profile
    Organic 2023.08.10 22:54

     

    After all, it is ChatGPT. Now, it seems that there is only an exciting day left for Bay Mountain members. I have been liberated from foreign languages. Now, we have entered an era where you can travel alone to the Amazon jungle, Patagonia Antarctica, the remote parts of Africa, and the mysterious Eastern Europe. It seems that the day has come when you can travel around the world as long as you have healthy stamina, hot passion and will, and a certain amount of money.- Google Translation

     

    오우~ 역시 Chat GPT입니다. Google Bard는 어떤 지 모르겠지만  위 Google 번역은 이제 촌스럽고 뭔가 허접하다는 느낌을 지울 수  없습니다. 앞으로 이 두회사의 바벨탑 쌓기가 어디까지 갈지 초미의 관심사가 될것같습니다.