Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1598-1363(Print)
ISSN : 2465-8138(Online)
Han-Character and Classical written language Education No.48 pp.69-99
DOI : https://doi.org/10.15670/HACE.2020.48.4.69

On the Transcription and Usages of Chinese Proper Names in Korean

Park Sunwoo
* Keimyung University, Associate Professor
2020년 4월 19일 2020년 5월 10일 2020년 5월 21일

Abstract

In this study, I analyzed the pattern and usage of Chinese proper nouns in Korean, which are transcribed in Sino-Korean transcription or Mandarin Chinese pronunciation. I assumed that the two kinds of Chinese proper nouns, which were differently transcribed in Korean, are not so much homonyms as synonyms, and analyzed the linguistic registers of Chinese proper names in two ways to clarify the difference between Sino-Korean transcription and Mandarin Chinese pronunciation. First, the token frequency of words in the corpus or searching trends in the search engine was investigated. Though the current Loanword Orthography (1986) by National Institute of Korean Language suggested that Chinese proper nouns should be transcribed in Mandarin Chinese pronunciation, the result of frequency analysis showed Sino-Korean transcriptions are also used frequently, depending on the types of medium or texts. Second, I extracted the example sentences in which the Chinese proper nouns appeared from the corpus and analyzed the text network consisting of nouns in example sentences. An analysis of the degree centrality and cohesive components in text networks confirmed that there was a distinct difference between the contexts in which the Sino-Korean word was used and the contexts in which Mandarin Chinese pronunciation appeared.

중국 인명 및 지명의 표기와 용법의 관계에 대하여

박선우
* 계명대학교

초록

본 연구에서는 중국 인명과 지명을 의미하는 단어가 한자음과 원지음으로 표기되는 양상과 용법을 분석하였다. 동일한 인명이나 지명을 의미하는 두 가지 표기 단어가 동의어가 아니라 유의어라고 가정하고 한자음 표기 단어와 원지음 표기 단어의 차이와 언어학적 레지스터를 밝히기 위하여 두 가지 방식으로 분석을 진행하였다. 첫째, 한자음 표기와 원지음 표기의 사용 양상을 살펴보기 위하여 말뭉치와 소셜미디어 등에서 단어가 출현하거나 검색되는 빈도를 조사하였다. 빈도의 측정 결과 1986년 이후 현행 외래어표기법에서는 중국의 고유명사를 중국 현지음으로 표기하는 것을 원칙으로 제시하였지만, 매체의 특성이나 텍스트의 성격에 따라서 이전과 마찬가지로 한자음으로 표기되는 경우가 적은 않았다. 둘째, 말뭉치로부터 한자음 표기 단어와 원지음 표기 단어가 출현하는 문장들을 추출하고, 용례 문장에 포함된 명사들로 구성된 텍스트 네트워크를 분석하였다. 텍스트 네트워크를 구성하는 명사들의 연결중심성과 하위집단을 분석한 결과 한자음 표기 단어가 사용되는 문맥과 원지음 표기 단어가 사용되는 문맥 사이에는 뚜렷한 차이가 있음을 확인할 수 있었다.

Ⅰ. 머리말

 

‘북경’과 ‘베이징’, ‘모택동’과 ‘마오쩌둥’과 같이 중국어의 고유명사인 인명과 지명에 대한 우리말의 표기법은 두 가지 방식이 있다. ‘북경’과 ‘모택동’은 우리말의 한자음을 적용한 한자어 표기법이며, ‘베이징’과 ‘마오쩌둥’은 중국어의 원음을 차용한 외래어 표기법이다. 현행 외래어 표기법 규정은 외국어의 원음을 존중하는 방식에 따라 ‘베이징’과 ‘마오쩌둥’으로 적는 것을 원칙으로 삼고 있으나, 국가 사이의 상호주의와 한자문화권에 포함된 한국의 특성을 고려하여 중국어의 고유명사인 인명과 지명을 중국어 차용어가 아니라 한자어로 간주하고 ‘북경’과 ‘모택동’으로 읽어야 한다는 주장도 여전히 제기되고 있다. 우리말의 표기법은 한국어의 음성언어를 반영한 결과이므로 ‘북경’으로 적느냐, ‘베이징’으로 적느냐는 논쟁은 표기법의 논쟁일 뿐만 아니라 ‘우리가 흔히 접하는 중국어의 인명과 지명을 한자어로 볼 것인가, 아니면 차용어로 볼 것인가’를 결정하는 논쟁이기도 하다. 만약 중국어의 인명과 지명을 한자어로 본다면 한자음 표기법을 적용해야 하겠으나 차용어로 본다면 영어나 한자와 상관이 없는 다른 언어들처럼 원지음을 기준으로 표기하는 것이 적절하다.

본 연구에서는 외래어 표기법 규범 등 어문정책과 관련된 문제에 집중하기보다는 다양한 데이터의 분석을 통하여 한국어의 언중들이 이러한 두 가지 표기법을 사용하는 양상을 살펴보고자 한다. 이러한 목적을 달성하기 위하여 ‘북경-베이징, 모택동-마오쩌둥’과 같이 두 가지 표기법이 공존하는 단어들을 대상으로 단어가 출현하는 빈도와 단어가 사용되는 문장들의 텍스트 네트워크를 분석하였다. 빈도 분석은 ‘세종말뭉치(2007)’, 2000년부터 2013년 사이의 약 6억 어절의 신문 기사(동아일보, 조선일보, 중앙일보, 한겨레신문)가 포함된 ‘물결21 말뭉치(corpus.korea.ac.kr)’, ‘구글(www.google.com)’과 ‘네이버(www.naver.com)’의 검색 트렌드를 바탕으로 진행하였다.

텍스트 네트워크의 분석은 세종말뭉치 가운데 ‘현대문어 형태분석말뭉치’에서 고유명사로 분류된 세 쌍, 여섯 가지 단어가 포함된 텍스트를 대상으로 진행하였는데, ‘연결중심성(degree centrality)’이라는 네트워크 분석의 지표를 통하여 용례 문장들에 등장하는 핵심적 단어를 조사하고, ‘응집도(cohesion)’ 분석을 통하여 텍스트 네트워크를 구성하는 단어들이 어떠한 화제로 묶여 있는지 분석하였다. 추출된 용례 문장이 부족하여 많은 단어를 대상으로 네트워크 분석을 진행하는 못하였지만 충분한 용례를 확보할 수 있는 ‘모택동’과 ‘마오쩌둥’, ‘북경’과 ‘베이징’, ‘상해’와 ‘상하이’의 비교와 대조를 통하여 한자음과 원지음 표기가 결코 완전한 동의어가 아니며, 두 가지 단어가 사용되는 텍스트의 화제를 구분할 수 있었다. 결론적으로 한자어 표기와 원지음 표기가 사용되는 문장들의 텍스트 네트워크 분석을 통하여 한자음 표기가 사용되는 문맥과 원지음 표기가 사용되는 문맥의 차이를 확인할 수 있었다.

  

Ⅱ. 한자음 표기법과 원지음 표기법

 

현실적으로 중국어와 인명과 지명에 대해서는 (1)의 용례들처럼 두 가지 표기법이 적용되고 있으나, 1986년에 제정된 현행 ‘외래어 표기법’의 기본 원칙에 의하면 외국의 인명과 지명은 현지 발음에 가깝게 표기해야 한다. 한국어의 음운체계나 한글 자모의 체계를 고려하다면 우리말의 체계에 존재하지 않는 발음을 표기하는 것은 불가능하지만 되도록 현지음과 유사하게 표기하는 것을 원칙으로 삼고 있다.

 

(1) 중국 인명과 지명의 한자음 표기법과 원지음 표기법

가. 인명

魯迅 노신 루쉰

毛澤東 모택동 마오쩌둥

習近平 습근평 시진핑

胡錦濤 호금도 후진타오

나. 지명

北京 북경 베이징

上海 상해 상하이

重慶 중경 충칭

天津 천진 톈진

靑島 청도 칭다오

 

외래어 표기법 규정의 원칙에 의하면 한자로 적을 수 있는 중국인이나 일본인의 인명도 원지음으로 적어야 한다. 예를 들어 중국의 ‘胡錦濤’나 일본의 ‘伊藤博文’을 각각 ‘호금도, 이등박문’이 아니라 ‘후진타오, 이토 히로부미’로 적게 되어 있다. 다만 중국의 인명은 1911년 신해혁명(辛亥革命)을 분기점으로 그 이전과 이후를 구분하여 적을 수 있다. 신해혁명 이전에 등장한 인물의 이름은 한자음으로 표기하고, 신해혁명 이후에 등장한 인물은 이름은 중국어 원음을 따라 표기하되 필요에 따라 한자를 병기할 수 있다. 다음은 현행 외래어 표기법이 적용된 『표준국어대사전』에서 중국의 작가 ‘魯迅’의 원지음과 한자음 표기 항목에 대하여 각각 풀이한 내용이다.

 

(2) ‘魯迅’ 표제항에 대한 풀이 (『표준국어대사전』 2008)

가. 루쉰루-쉰 (Lu Xun [魯迅]), 「명사」

『인명』 중국의 작가(1881~1936). 본명은 저우수런(周樹人). 일본에서 유학하여 의학을 배우다가 문학으로 전환하였다. 민중애, 사회악과 인간악의 증오 및 투쟁 정신이 작품 전체에 흐르고 있다. 작품에 <아큐정전(阿Q正傳)>, <광인 일기> 따위가 있다.

나. 노신발음 [노신], 「명사」

『인명』 ‘루쉰’을 우리 한자음으로 읽은 이름.

 

현행 철자법 규범이 적용되는 ‘표준국어대사전’과 달리 국내 포털사이트를 통하여 제공되고 있는 ‘고려대한국어대사전’(2009)에서는 ‘루신’과 ‘노신’이 비슷한 풀이 내용을 담고 있다. 아무래도 이러한 차이는 현행 외래어 표기법보다는 魯迅을 지칭하는 단어로서 ‘루신’과 ‘노신’이 모두 사용되는 현실을 반영한 것으로 보인다.

 

(3) ‘魯迅’ 표제항에 대한 풀이 (『고려대한국어대사전』 2009)

가. 루쉰

고유명사, 인명, 중국의 작가(1881~1936). 본명은 저우수런(周樹人)이다. 작품을 통해 낡은 도덕을 비판하고 사회악의 근원을 날카롭게 파헤쳤으며, 민중애와 투쟁 정신을 담았다. 중국 근대 문학의 바탕을 확립한 선구자로서, 그 업적이 높이 평가되고 있다. 작품에 <아큐정전(阿Q正傳)>, <광인 일기(狂人日記)> 등이 있다. 우리 한자음으로 읽으면 ‘노신(魯迅)’이다.

나. 노신

고유명사, 인명, 중국의 작가(1881~1936). 작품을 통해 낡은 도덕을 비판하고 사회악의 근원을 날카롭게 파헤쳤으며, 민중애와 투쟁 정신을 담았다. 중국 근대 문학의 바탕을 확립한 선구자로서, 그 업적이 높이 평가되고 있다. 작품에 <아큐정전(阿Q正傳)>, <광인 일기(狂人日記)> 등이 있다. 중국어 ‘Lu Xun[魯迅]’을 우리 한자음으로 읽은 이름이다.

 

한편, ‘국립국어원’에서는 원칙을 기계적으로 적용하지 않고, 이미 굳어진 관용 표기가 널리 통용된다면 그것을 인정할 수 있다고 제안하였다. 이러한 제안에 의하면 네덜란드의 화가 ‘Gogh’는 현지음에 가까운 ‘호흐’가 아니라 ‘고흐’로, 중국과 일본의 교포로서 각각 한국의 연예계와 스포츠계에서 활동했던 ‘백청강’(재중 동포)과 ‘정대세’(재일 동포)의 이름도 한자음으로 표기할 수 있다.1)

 

1) 널리 알려진 표기법을 허용한다는 의견은 2011년 6월 28일 문화체육관광부 산하 ‘국립국어원’에서 배포한 보도자료 “중국어 외래어 표기법이 혼란을 초래하고 있다는 조선일보 칼럼(2011.6.28.) 관련, 국립국어원 입장”에서 확인할 수 있다.

 

어문정책과 관련된 논의들을 살펴보면 한자음 표기법을 지지하는 주장과 원지음 표기법을 지지하는 주장이 첨예하게 대립하고 있다. 본 연구는 이러한 정책적 논쟁에 초점을 맞추고 있지 않으나 한자음 표기법을 주장하는 근거와 원지음 표기법을 주장하는 언어학적 논의만을 간단하게 살펴보고자 한다. 한자음 표기법을 지지하는 김병기(2002;2015), 김창진(2011), 박정구(2011) 등의 논의를 요약하면 대체로 3가지 근거를 찾을 수 있다. 첫째, 한자의 역사적, 문화적 가치와 정보를 고려해야 한다는 것이다. 한자문화권에 포함되어 있는 한국에서 한자나 한자어의 가치는 다른 차용어와 구별된다고 본다. 김창진(2011)에서는 이러한 한자문화권의 장점으로서 한자의 의미를 통하여 단어의 의미에 접근할 수 있는데, 원지음 표기는 이러한 한자의 의미 전달의 기능을 방해하는 표기법이라고 비판하였다. 박정구(2011)에서도 ‘우리와 언어 문화적 공유를 하지 못한 서구의 언어를 소리 나는 대로 적으려 노력하는 것은 다른 방도가 없기 때문이지만, 중국어를 표기하는데 있어서 우리가 쉽게 표기할 수 있는 귀중한 전통적 방식을 왜 버리려 하는가?’라고 문제를 제기하고 있다.

둘째, 중국이 한국의 인명과 지명을 중국의 한자음으로 읽으므로 상호주의 원칙에 따라 우리도 중국의 고유명사를 한국의 한자음으로 읽을 수 있다는 것이다. 김병기(2015)에서는 중국에서는 한국의 지명인 ‘제주도(濟州島)’와 ‘경주(慶州)’를 각각 ‘지조우따오’와 ‘칭저우’로 읽는다는 점을 지적하면서 중국이 우리의 인명과 지명을 한국한자음으로 읽지 않는데, 우리만 중국 한자음에 바탕을 둔 원지음 표기를 선택하는 것은 문제가 있다고 주장하였다. 김창진(2011)에서도 외래어 표기법은 자국어 중심주의를 원칙으로 삼아야 하며, 외국어의 고유명사라 할지라도 한국어의 언어 주체인 한국인에게 편리한 한자음 표기법을 적용해야 한다고 주장하였다. 셋째 한자의 표기와 발음 사이 음운론적 대응관계를 고려한다면 한 글자의 한자를 1음절로 표기하는 한자음 표기가 한 글자의 한자를 1-3음절로 발음하고 표기하는 원지음 표기법보다 편리하다는 점이다(김병기 2015: 91-92).

반면 원지음 표기법을 지지하는 엄익상(2008a;2008b), 고석주(2011), 류동춘(2011) 등의 논의를 요약하면 역시 세 가지 근거를 찾을 수 있다. 첫째, 한국에서 일어나고 있는 어문생활의 사회적 변화, 즉 한자 문화의 쇠퇴와 한글전용 정책 고려한다면 원지음 표기가 한자음 표기보다 불편하다고 볼 수 없다는 점이다. 과거와 달리 중국의 인명과 지명을 문어(文語)가 아니라 구어(口語)로 받아들이고 있으므로 중국의 인명과 지명이 어떠한 한자로 구성되어 있는지 별 관심이 없으며, 발음만 고려한다면 원지음을 그대로 차용하는 편이 오히려 편리하다고 본다.

둘째 근거는 외국어 고유명사의 표기 원칙에 대한 통일성을 유지하기 위해서는 중국어 역시 원지음으로 적는 것이 적절하다는 것이다. 중국어도 외국어인 이상 영어나 일본어처럼 현지 원지음을 기반으로 표기법을 마련해야 한다는 주장이다. 류동춘(2011)에서는 한자어가 우리 어휘의 많은 부분을 차지하고 있는 현실 때문에 한자로 기록된 인명이나 지명을 모두 외래어로 착각하는 경우가 많지만 중국인의 인명과 지명은 외래어가 아니라 외국어이므로 그 나라 발음에 따라 표기하는 것이 당연하다고 주장하였다. 셋째 근거는 한국 한자음과 현대 중국 한자음 사이의 차이가 커서 중국의 인명과 지명을 우리 한자음으로 표기하는 것이 음운론적으로 적절하지 않다는 것이다.

한자음 표기법과 원지음 표기법의 논쟁은 하나를 취하면 하나를 버릴 수밖에 없는 ‘제로섬 게임(zero-sum game)’의 사례이다. 이러한 논쟁에는 ‘북경’과 ‘베이징’이 동일한 대상과 의미를 갖고 있는 동의어(同義語)라는 전제가 깔려 있다. 하지만 ‘오르막길’과 ‘내리막길’처럼 지시 대상이 동일하더라도 동의어가 아닌 경우도 있다(임지룡 1992: 135). ‘완전한 동의어는 존재하는가’라는 질문에 대하여 Ullmann(1962)에서는 객관적 의미, 감정적 어조, 환기적 가치를 조금도 바꾸지 않고 완전히 교체될 수 있는 동의어는 없다고 보았으며, Bloomfield(1933)에서는 형태가 음소적으로 다르다면 의미도 다르기 때문에 실질적인 동의어란 존재하지 않는다고 주장하였다. 이용주․이을환(1964)에서도 동의어란 그 언어의 내재적 의미와 외재적 의미가 동일할 뿐만 아니라 뉘앙스나 가치까지도 동일해야 하므로 절대적인 동의어란 있을 수 없다고 본다.

만약 ‘북경’과 ‘베이징’이 완전히 동일한 의미를 가진 동의어가 아니라 유사한 의미를 가진 유의어(類義語)라고 가정한다면 한자음 표기법과 원지음 표기법 사이에는 어떠한 차이가 있으므로 굳이 두 가지 표기법 가운데 한 가지만을 취할 필요는 없다. 어휘의미론의 관점에서 단어의 의미는 발화된 문맥상에서 실현되므로 현실적으로 완전한 ‘동의어’란 존재할 수 없다. 이러한 논의를 따른다면 단어의 의미는 문맥에 따라 결정되므로, ‘북경’과 ‘베이징’도 유사하지만 사용되는 문맥에 따라 각각의 의미를 갖는 유의 관계의 단어이다. 이러한 차이는 유의 관계를 가진 고유어, 한자어, 차용어 사이에서 자주 관찰된다.

 

(4) ‘시골’과 ‘촌’의 교체 (양정숙 2019)

가. 올림픽 선수촌 / *선수 시골, 기자촌 / *기자 시골, 기지촌 / *기지 시골

나. 저쪽에 작은 *시골/촌이 있다.

 

(5) 차용어의 순화에 의한 유의어의 형성 (심지연 2006: 175-176)

가. 갤러리(gallery): ‘골프 경기에서의 관중’을 가리키는 말로 영어의 ‘갤러리’라는 단어가 언론에서 사용되기 시작하였다. 아직 표준국어대사전에 등재되지 않은 의미로, 순화어로 ‘관중’이 제시되었다. 그러나 ‘관중’의 의미 범위가 ‘갤러리’의 의미 범위를 포함하면서 더 넓기 때문에 ‘관중’이라는 단어만으로는 ‘갤러리’의 대체어가 될 수 없다. 수식어를 사용하여 의미 범위를 줄인 순화어가 필요하다.

나. 게스트(guest): 주로 ‘초대 손님’의 의미로 사용되었다. 순화어로는 ‘손님’이 제시되었는데, ‘초대 손님’의 의미로 검색한 결과 278개의 기사를 찾을 수 있었다. 이 경우 ‘손님’으로 순화한다면 의미 범위가 너무 커지기 때문에 ‘초대 손님’으로 정하는 것이 좋다고 본다.

다. 디테일(detail): 이 단어의 의미는 미술 전문 용어로 ‘미술품의 전체에 대하여 한 부분을 이르는 말’로 표준국어대사전에 등재되어 있다. 검색된 기사를 살펴보면, 주로 문화, 예술 분야에서 사용되었음을 알 수 있었다. 그런데 순화어로 제시된 ‘부분, 세분, 세부’는 문화, 예술뿐만 아닌 모든 분야에서 사용할 수 있는 단어들이다. 그러므로 ‘갤러리’를 ‘관중’으로 순화하는 경우와 같은 상황이 되어 ‘디테일’이라는 외래어가 그대로 사용되고 있음을 알 수 있다.

라. 딜레마(dilemma): 이 단어의 의미는 ‘선택해야 할 길은 두 가지 중 하나로 정해져 있는데, 그 어느 쪽을 선택해도 바람직하지 못한 결과가 나오게 되는 곤란한 상황’으로 표준국어대사전에 제시되어 있다. 순화어로 제시된 단어 중, ‘궁지’의 의미는 ‘매우 곤란하고 어려운 일을 당한 처지’로 제시되어 ‘딜레마’의 의미를 포함하고 더 범위가 넓음을 알 수 있다. 역시 ‘갤러리’와 동일한 문제가 발생하므로 순화어의 의미를 순화대상어의 의미 범위만큼 줄일 필요가 있다.

 

(4)는 유의 관계의 단어인 ‘시골’과 ‘촌’이 모든 문맥에서 치환될 수 없음을 보여주는 사례이다. 비슷하기는 하지만 미세한 차이가 있어서 ‘촌’이 사용되는 합성어나 문맥을 ‘시골’로 치환할 수 없다. (5)는 외래어를 대체할 고유어나 한자어 순화어를 보급하였지만 의미의 차이로 인하여 순화어가 보급되지 못하고 기존의 외래어가 여전히 사용되는 사례를 설명한 것이다.

이와 같이 비슷하지만 다른 문맥에서 사용되는 유의 관계의 단어들을 설명할 수 있는 개념이 바로 ‘레지스터’(Register)이다. 레지스터란 화자가 담화 상황, 대화 상대, 담화의 기능 등을 고려하여 사용하는 특수한 어휘적, 문법적 변이형을 가리키는 사회언어학적 용어이다.2) Crystal(2010)에 의하면 ‘레지스터’는 계층이나 연령, 지역, 문체 등에 따라 달리 나타나는 언어변이형으로서 전문용어나 아동언어, 지역 방언과 계층 방언, 속어 등이 이에 속한다. Halliday(1989)에서는 언어학적 변이형이 출현하는 원인을 사회적 요인과 기능적 요인으로 분류하였는데, 방언은 사회적 요인과 관련된 범주로, 레지스터는 기능적 요인과 관련된 범주로 보았다. 만약 ‘북경’과 ‘베이징’, ‘모택동’과 ‘마오쩌둥’이 레지스터와 같이 단어가 선택되는 담화나 텍스트의 상황과 기능, 대화의 상대와 텍스트의 주제 등을 고려하여 선택된다고 가정한다면 한자음 표기와 원지음 표기의 출현 환경을 어느 정도는 예측하거나 설명할 수 있을 것이다.

(6)은 ‘소셜미디어(social media)’와 각종 온라인 플랫폼 상의 문서를 분석한 데이터를 제공하는 Social Metrics(www.socialmetrics.co.kr)에서 2주의 기간 동안 ‘모택동’과 ‘마오쩌둥’의 연관어를 분석한 결과이다. ‘모택동’의 연관어와 비교하여 ‘마오쩌둥’의 연관어 출현빈도가 압도적으로 높다는 점에서도 차이가 있으나 ‘모택동’의 연관어는 ‘문화대혁명, 김일성, 박정희, 홍위병’ 등 역사적 사건과 관련된 것들이 많은 반면, ‘마오쩌둥’의 연관어는 ‘중국, 미화, 펀드, 달러, 사업’ 등 경제나 화폐와 관련된 것들이 많다. 따라서 한자음 표기와 원지음 표기가 사용된 레지스터에 어느 정도 차이가 있으며 두 단어의 차이로 말미암아 나타난 현상으로 해석할 수 있다.

 

2) www.glottopedia.org/index.php/Register_(discourse)

 

 

 

 

Ⅲ. 한자음과 원지음 표기의 비교 분석

 

본 연구에서는 한자음으로 표기된 단어와 원지음으로 표기된 단어의 레지스터와 차이를 분석하기 위하여 책과 신문 기사 등의 자료는 물론 인터넷 매체와 소셜미디어에도 자주 등장하는 중국 인명과 지명들을 선택하였다. 중국의 광활한 영토와 장구한 역사를 고려한다면 분석해야 할 단어들은 상당한 양이 되겠지만 구체적인 분석을 위해서는 최소한의 출현빈도가 필요하므로 언론과 소셜미디어의 텍스트에 자주 등장하는 다음의 단어들을 분석 대상으로 삼았다. 다음 단어의 쌍들에 대하여 각각 빈도 분석, 공기어 기반 텍스트 네트워크 분석을 진행하였다.

 

(7) 비교 분석 대상 단어

가. 인명 (가나다순)

강택민-장쩌민 노신-루쉰 등소평-덩샤오핑

모택동-마오쩌둥 손문-쑨원 장개석-장제스

나. 지명 (가나다순)

길림성-지린성 낙양-뤄양 북경-베이징

상해-상하이 산동성-산둥성 연변-옌볜

 

1. 출현빈도 분석

 

우선 한자음 표기와 원지음 표기가 얼마나 많이 출현하는지 ‘출현빈도(token frequency)’를 측정해 보았다. 출현빈도는 2가지로 나누어 분석하였다. 이미 구축되어 있는 범용 말뭉치와 신문 말뭉치를 기반으로 출현빈도를 분석하고, 인터넷 미디어에서는 사용자들이 해당 단어를 얼마나 자주 검색하는지 분석하였다. 출현빈도는 약 1,000만 어절 규모의 세종말뭉치(2007) 가운데 원시말뭉치를 제외하고 각 단어의 품사 정보가 포함되어 있는 형태분석 말뭉치에서만 측정하였다. 원시말뭉치를 활용할 경우, 더 많은 용례를 확보할 수 있으나 품사정보가 없어서 동음이의어(同音異議語)를 골라낼 수 없다는 문제가 있다. 예를 들어 인명인 한글 텍스트로 기록된 말뭉치에서 ‘노신(魯迅)’을 검색할 경우 ‘노신(老臣)’이나 ‘노신(老身)’과 같은 일반명사와 구분할 수 없다. 따라서 각각의 단어와 형태소마다 고유명사라는 품사정보가 기록된 형태분석 말뭉치만을 대상으로 빈도를 측정하였다. 참고로 세종말뭉치의 전체적인 규모와 형태분석 말뭉치의 규모는 다음과 같다.

 

(8) 세종말뭉치 (10,130,363개 어절, 880,377개 문장)

가. 형태분석 말뭉치 (형태소 출현빈도 합계 23,166,971개)

나. 1987년 이전 출판: 766,244개 어절 (7.56%)

다. 1988년 이후 출판: 9,066,908개 어절 (89.51%)

라. 출판연도 불확실: 297,211개 어절 (2.93%)

 

 

 

 

한자음과 원지음의 인명 빈도를 분석한 결과 비교적 최근의 인물인 ‘강택민-장쩌민’을 제외하고는 한자음의 빈도가 원지음보다 훨씬 높은 편이었다. ‘장쩌민’의 출현빈도도 ‘강택민’보다는 낮은 편이었지만 다른 원지음 표기보다 상대적으로 빈도가 높은 편이었다. 이러한 까닭은 江澤民이 중국의 공산당 중앙위원회 총서기(1989~2002)와 국가주석(1993~2003)으로 활동했던 시기가 현행 외래어 표기법이 제정된 1986년 이후이므로, 다른 인명들과 비교하여 언론과 매체 등을 통하여 ‘강택민’보다는 ‘장쩌민’으로 소개될 기회가 많았기 때문인 것으로 보인다.3) 하지만 세종말뭉치의 분석 결과 89.51%의 자료가 현행 원지음 표기법 규정이 적용된 이후에 출판되었음에도 불구하고 말뭉치가 구축된 2000년도 초반까지는 (7가)의 인명에는 한자음 표기법이 더 많이 사용되었다는 사실을 확인할 수 있었다.

 

3) 현재 중국 공산당의 중앙위원회 총서기(2012~) 겸 국가주석(2013)인 ‘시진핑(習近平)’ 역시 원지음 표기의 빈도가 압도적으로 높은 편이다. 이러한 경향은 ‘구글(www.google.com)’ 검색을 통하여 확인할 수 있다. 2020년 4월 기준으로 ‘시진핑’을 검색한 결과 약 9,320,000개(0.39초)의 결과가 나온 반면, ‘습근평’을 검색하면 약 190,000개(0.43초)의 결과만 검색되었다.

 

 

 

 

한자음과 원지음의 지명 빈도를 분석한 결과 인명과 마찬가지로 한자음의 빈도가 원지음보다 높은 편이었다. 한자음이 95번, 원지음이 78번 출현한 ‘상해-상하이’를 제외하면 한자음의 빈도가 원지음보다 훨씬 높은 편이었다. 결론적으로 원지음 표기를 원칙으로 제정된 현행 외래어 표기법이 1986년부터 적용되었음에도 불구하고, 이전에 사용되었던 한자음 표기법의 영향으로 2000년도 초반까지는 중국의 인명과 지명이 한자음으로 표기된 문헌들이 훨씬 더 많았다는 점을 확인할 수 있었다.

‘고려대학교 민족문화연구소’에서 구축한 신문 자료 말뭉치 ‘물결 21’(Trend 21 코퍼스, corpus.korea.ac.kr)의 빈도 분석 결과는 세종말뭉치의 분석 결과와 대조적이었다. ‘물결 21’에 포함된 2000~2013년 ‘동아일보, 조선일보, 중앙일보, 한겨레신문’의 기사에 나타나는 한자음과 원지음 표기법을 분석한 결과 인명이든, 지명이든 원지음 표기의 빈도가 압도적으로 높은 편이었다. 이러한 결과는 현행 외래어 표기법 규정의 영향을 받은 것이기도 하지만, 별도의 교열부와 교열기자를 운용하면서 기사를 교열하는 신문사의 기사 작성 및 출판 업무체계의 영향을 받은 것으로 보인다.

 

 

 

 

‘물결 21’을 통하여 (7)의 목록에 포함된 나머지 지명과 인명의 상대빈도를 분석한 결과는 대체로 <그림 3>과 유사한 편이었지만 ‘연변-옌볜’만은 상대빈도의 차이가 적은 편이었다. 2001년까지는 ‘연변’이 ‘옌볜’보다 자주 출현하였으며, 그 후로부터 2008년까지는 동등한 수준으로 사용되다가 2009년부터는 ‘옌볜’의 빈도가 상대적으로 높아졌다.

 

 

 

 

신문 기사 자료임에도 불구하고 한자음 표기인 ‘연변’의 빈도가 높은 원인은 중국 현지의 사건과 관련된 기사에서 ‘연변’과 원지음 표기인 ‘옌볜’을 병기하였기 때문에 나타난 현상이다. 2001년의 용례 문장들을 살펴보면 살인사건과 관련된 기사 등에서 ‘옌볜(연변)’과 같은 방식으로 두 가지 표기를 병기한 사례들을 확인할 수 있다.

(9) ‘연변’이 사용된 용례 문장들 (‘물결 21’ 2001년 기준)

가. 북한인 낀 3인조 강도, 연변 한국인부부 살해, 중국 지린(길림)성 옌볜(연변) 조선족 자치구에서 10일 한국인 부부가 조선족과 북한인이 낀 3인조 강도들에게 피살돼 중국 경찰이 수사에 나섰다.

나. 중국 지린성(길림성) 옌볜(연변) 조선족자치주 훈춘(혼춘)시에서 지난 10일 발생한 한국인 나창환(42) 이승지(35)씨 부부 살해사건에 탈북자가 가담한 것으로 밝혀졌다.

다. 재미동포 벤처투자가인 스티브 김(한국이름 김윤종.51.사진)씨가 해외 첫 한민족 대학인 중국 연변(옌볜) 과학기술대(총장 김진경)에 해마다 10만 달러의 장학기금을 기부하기로 했다.

 

‘세종말뭉치’와 ‘물결 21’의 빈도 분석 결과는 서로 대조적이었으며, 각각 한자음 표기와 원지음 표기의 빈도가 압도적으로 높은 편이었다. 이와 달리 검색 빈도를 조사한 결과는 어느 한 편의 빈도가 뚜렷하게 우세한 경향이 나타나지 않았다.4) 다음의 <그림 5>는 ‘네이버 데이터랩(datalab.naver.com)’을 통하여 2019년에 ‘북경-베이징’, ‘모택동-마오쩌둥’의 검색 횟수를 측정한 결과인데, 전반적으로 원지음 표기의 검색 빈도가 높은 편이지만 이와 비교하여 한자음 표기의 검색 빈도도 낮은 편은 아니었다.

 

 4) 출현빈도를 분석한 목적은 한자음 표기와 원지음 표기가 함께 사용되고 있다는 점을 확인하기 위한 것이다. (7)의 목록에 포함된 인명과 지명이 대부분 ‘북경-베이징, 모택동-마오쩌둥’과 유사한 결과를 보여주고 있으므로 다른 단어의 출현빈도 를 보여주는 도표는 따로 제시하지 않았다.
 

 

 

 

‘북경-베이징’, ‘모택동-마오쩌둥’과 달리 ‘노신-루쉰’의 검색 빈도는 원지음인 ‘루쉰’이 상당히 높은 편이었다. 정확한 원인은 알 수 없으나, 검색의 동기나 검색을 하는 이용자의 성향이 반영된 것으로 보인다.

 

 

 

 

구글의 검색 트랜드(trends.google.co.kr)를 통하여 2019년의 검색 횟수를 분석한 결과에서도 원지음이 한자음보다 높은 편이었다. 하지만 시기에 따라서 한자음이 원지음보다 높은 경우도 있었으며, 한자음 표기의 검색 빈도가 원지음 표기의 검색 빈도에 70-80% 정도 수준을 유지하였다. 따라서 현행 외래어 표기법의 영향으로 원지음 표기가 한자음 표기보다 자주 사용되고 있으나, 신문과 같이 어문규범의 교열의 과정을 거친 경우가 아니라면 한자음 표기가 아직도 많이 사용되고 있다는 결론을 내릴 수 있다.

 

 

 

 

최근 소셜미디어로서 각광을 받고 있는 ‘인스타그램’(www.instagram.com)의 ‘#태그’를 분석한 결과는 말뭉치나 검색 빈도와는 차이가 있었다. <그림 8>은 2019년 동안 인스타그램의 게시된 사진에 ‘북경-베이징’, ‘모택동-마오쩌둥’이 ‘#태그’로 출현한 누적빈도를 측정한 결과이다. ‘모택동’은 ‘마오쩌둥’과 비교하여 빈도가 훨씬 낮은 편이지만 ‘북경’과 ‘베이징’의 #태그 출현 빈도는 큰 차이가 없었다. 이러한 차이는 주로 여행과 명소의 사진을 공유하는 소셜미디어로서 인스타그램의 특성이 반영된 결과로 보인다.

 

 

 

 

범용말뭉치와 신문말뭉치의 출현빈도와 검색빈도를 분석한 결과 ‘세종말뭉치’에서는 1988년 이후에 출판된 문헌이 다수임에도 불구하고 한자음 표기가 상당히 우세하였으며, 신문말뭉치인 ‘물결 21’에 수록된 2000년대 이후의 기사에서는 현행 외래어 표기법의 영향으로 원지음 표기의 빈도가 절대적으로 높은 편이었다. 이와 달리 검색빈도는 전반적으로 원지음 표기가 우세한 편이었으나, 검색어와 관련된 사건, 시기, 매체에 따라 한자음 표기가 우세한 경우도 있었다. 결론적으로 단어에 따라 차이가 있으나 ‘한자음’과 ‘원지음’ 표기가 언중들에 의하여 함께 사용되고 있다는 점을 확인할 수 있었다. 더불어 인스타그램의 ‘#태그’를 분석한 결과는 매체의 성격이 한자음과 원지음 표기의 빈도에 영향을 미칠 수 있음을 보여주었다.

 

2. 텍스트 네트워크 분석

 

한자음 표기와 원지음 표기의 차이를 분석하기 위하여 텍스트 네트워크를 분석하였다. 일반적으로 텍스트 네트워크는 조사 대상 단어를 기준으로 동일한 문장이나 문단, 혹은 해당 단위의 앞뒤에 3-5어절을 기준으로 함께 등장하는 특정 품사를 기준으로 구성된다. 예를 들어 ‘북경’이 포함되는 문장이나 문단에 ‘천안문, 행사, 추모, 대학’ 등의 명사가 함께 등장할 경우 ‘북경’은 이들 단어들과 네트워크를 형성한다고 볼 수 있다. 본 연구에서는 한자음 표기와 원지음 표기가 어떠한 문맥에서 사용되는지, 사용되는 문맥의 차이가 무엇인지 알아보기 위하여 앞서 출현빈도 분석에 활용하였던 세종 형태분석말뭉치에서 한자음 표기와 원지음 표기의 용례 문장들을 추출하고 이 문장에 포함된 명사들이 형성하는 네트워크를 분석해 보았다.

정확하고 폭넓은 분석을 위해서는 형태분석말뭉치 외에도 원시말뭉치나 소셜미디어의 용례들도 함께 조사해야 하겠으나, 현실적으로 원시말뭉치나 소셜미디어에서 수집한 문장에서는 동음이의어를 구분할 수 없으므로 형태분석말뭉치의 용례들만을 분석하였다. 예를 들어 지명 ‘상해(上海)’를 분석하려면 동음이의어인 일반명사 ‘상해(傷害)’를 제외하고 용례들을 수집해야 하는데, 한자를 병기하여 표기하기 않은 이상 이러한 동음이의어를 구분하는 것이 불가능하였다. 반면 세종 형태분석말뭉치에는 ‘상해/NNP’와 같이 고유명사(NNP)라는 태그(tag)가 포함되어 있어서 ‘상해(上海)’가 포함된 문장만을 정확하게 추출할 수 있었다.

(7)에 포함된 한자음과 원지음 표기 단어 쌍들 가운데 일부의 단어들에 대해서는 충분한 용례를 추출하지는 못하였으나, ‘북경-베이징, 모택동-마오쩌둥, 상해-상하이’에 대해서는 텍스트 네트워크의 분석이 가능한 수준의 용례들이 추출되었다. (10)은 (7)의 인명, 지명 목록을 다시 제시한 것인데, 괄호 안의 숫자는 세종말뭉치 가운데 10,156,140개 어절과 23,166,971개 형태소로 구성된 형태분석 말뭉치의 880,377개 문장으로부터 추출한 용례 문장의 개수이다.

(10) 비교 분석 대상 단어의 출현빈도 (세종 문어 형태분석말뭉치 기준)

가. 인명 (가나다순)강택민(0)-장쩌민(12) 노신(10)-루쉰(1) 등소평(4)-덩샤오핑(3)모택동(21)-마오쩌둥(4) 손문(6/6)-쑨원(1) 장개석(14)-장제스(0)

나. 지명 (가나다순)길림성(30)-지린성(1) 낙양(5)-뤄양(0) 북경(97)-베이징(98)상해(37)-상하이(39) 산동성(13)-산둥성(2) 연변(46)-옌볜(2)

 

네트워크 분석은 ‘사이람(www.cyram.com)’에서 개발한 네트워크 분석용 프로그램인 NetMiner(4.4.3.b)를 이용하여 두 가지 방식으로 진행하였다. 첫째, 한자음과 원지음 표기의 단어들이 출현하는 용례 문장들에 포함된 명사들의 ‘연결중심성’을 분석하였다. 각각의 용례 문장에 함께 등장하는 명사를 기준으로 텍스트 네트워크를 구성하고 각 용례 문장들 안에 포함된 단어들의 중심성을 측정하여 한자음 표기나 원지음 표기가 등장하는 문장들에서 가장 핵심적인 역할을 하고 있는 단어들이 무엇인지 알아보았다. 연결중심성은 ‘연결정도 중심성’이라고도 하는데, 네트워크상의 노드들, 즉 텍스트 네트워크를 구성하는 단어들 사이에 연결선이 많을수록 높아진다. 텍스트 네트워크에서는 여러 문장에 자주 출현하여 다양한 단어들과 연결되는 단어들의 연결중심성이 높다. 따라서 연결중심성이 높은 단어는 텍스트의 중심 내용이나 화제와 관련된 핵심적 단어일 가능성이 높다.5)

둘째로는 네트워크를 구성하는 단어들 사이의 공기 빈도를 기준으로 단어들 사이의 응집도를 분석하였다. 응집도란 네트워크를 구성하는 각 단어들이 얼마나 응집되어 있는가를 나타내는 개념으로서 네트워크 안의 하위집단 구분에 활용되는 지표이다. 응집도를 통하여 텍스트 네트워크의 하위집단을 구분하면 특정 단어가 포함된 문장이나 문단들이 어떠한 화제에 대한 글인지 파악할 수 있다.6) 따라서 응집도의 분석을 통하여 한자음이나 원지음 표기가 포한된 문장들이 대체로 어떠한 주제와 소재를 다루고 있는지 분류해 보았다.

12가지 단어 쌍을 모두 분석하는 것이 바람직하겠지만 충분한 용례가 포함되어 한자음 표기의 네트워크와 원지음 표기의 네트워크를 비교할 수 있는 ‘모택동-마오쩌둥, 북경-베이징, 상해-상하이’만을 분석하였다. 세종 문어 형태분석말뭉치에서 추출한 용례 문장들을 NetMiner로 분석하기에 앞서서 다음과 같은 텍스트 전처리 과정을 통하여 네트워크 분석에 영향을 줄 수 있는 요소들을 제거하였다.

 

5) ‘연결중심성’에 대한 개념과 계산 방식에 대한 설명은 이수상(2012: 257-258)를 참조하기 바란다.
6) ‘응집도’에 의한 네트워크 하위집단 분석의 방법에 대해서는 이수상(2012: 283-302)를 참조하기 바란다. 

 

(11) 네트워크 분석을 위한 용례 문장의 전처리 과정

가. 검색어를 표시하는 ‘^’ 기호 일괄 삭제

나. 모든 문장들을 가나다순으로 정렬하여 반복되는 문장 삭제

다. 신문 기사의 바이-라인(By Line)에서 추출된 용례(예:‘베이징=황유성 특파원 yshwang@donga.com’)는 텍스트의 문맥이나 주제와 상관이 없으므로 삭제

라. 일반적인 형태소 분석기에서 분석되지 않는 고유명사 사전 추가 (예:강소성, 건국동맹, 걸프전, 경기고보 등)

마. 동일한 의미를 가진 비슷한 표기나 단어들을 동일 단어로 분석하기 위한 유의어 사전 추가 (예:교도통신-교도 통신, 낙양-낙양(洛陽), 블라디보스톡-블라디보스똑-블라지보스또끄 등)

바. 텍스트의 주제나 직접 관련되지 않는 단어들을 분석 대상에서 제외하기 위한 목록 추가(예:문제, 중국, 전, 일, 말, 후, 때, 뒤, 앞 등)

 

1) ‘모택동-마오쩌둥’의 텍스트 네트워크

다음 (12)는 ‘모택동’과 ‘마오쩌둥’이 포함된 용례 문장들의 텍스트 네트워크에서 연결중심성이 높은 핵심적 단어를 선별한 결과이다. 네트워크 분석에서 연결중심성이 높은 단어는 다양한 단어들과 자주 등장하며 텍스트의 핵심적인 개념이나 주제와 관련된 단어일 가능성이 높다. ‘모택동’은 국공내전, 공산주의 혁명과 사상과 관련된 단어들의 중심성이 높았고, ‘마오쩌둥’은 ‘아버지, 공산당, 테러리스트’ 같은 단어의 연결중심성이 높은 편이었다. 연결중심성이 높은 단어만으로는 한자음과 원지음 표기가 등장하는 문맥의 차이를 파악하기가 어려웠다.

 

(12) ‘모택동-마오쩌둥’이 포함된 텍스트 네트워크에서 연결중심성이 높은 단어 (1~5위)

가. 모택동: 장개석, 국가, 혁명가, 트로츠키, 사상

나. 마오쩌둥: 아버지, 공산당, 테러리스트, 추근(秋瑾), 봉기

 

반면 응집도 분석의 결과, ‘모택동’과 ‘마오쩌둥’이 등장하는 문맥과 화제의 차이를 가시적으로 확인할 수 있었다. ‘모택동’의 경우 네트워크에 포함된 단어들은 두 가지 화제로 분류되었는데, 그 가운데 하나는 일제강점기 항일투쟁과 관련된 단어들로서 구성된 집단(G2)이었다. 다른 집단(G1)은 사회주의와 모택동의 사상과 관련된 단어들로 구성되었다. 반면 ‘마오쩌둥’의 텍스트 네트워크는 세 집단으로 분류되었는데, 정치인으로서 마오쩌둥의 측근들과 후계자들(G1), 국공내전(G2), 공산주의 혁명(G3)과 관련된 내용으로 보인다. ‘마오쩌둥’이 포함된 텍스트의 네트워크는 주로 그의 일대기와 관련된 인물, 사건과 관련된 단어들로 구성되어 있었다. ‘덩샤오핑, 류사오치, 린뱌오, 펑더화이’와 같이 원지음 표기끼리 어울리는 경향도 관찰되었다.

 

 

 

 

 

 

2) ‘북경-베이징’의 텍스트 네트워크

 

‘북경’과 ‘베이징’이 포함된 문장들의 텍스트 네트워크에서 연결중심성이 높은 핵심적 단어를 선별한 결과, ‘북경’의 네트워크에는 ‘북한, 하북, 요리, 석기, 유적, NGO’와 같은 다양한 분야의 단어들이 눈에 띄었다. 반면 ‘베이징’의 네트워크에서 연결중심성이 높은 단어는 ‘한국, 베이징, 탈북자, 대사관, 망명, 공안’ 등이었는데, 탈북자들이 한국 대사관으로 망명한 사건에 대한 보도 기사와 관련된 것으로 보인다. 연결중심성이 높은 단어들을 살펴보았을 때는 ‘북경’은 역사적 유적, 시민단체, 요리 등과 관련된 문맥에, ‘베이징’은 탈북자나 한국 대사관과 관련된 사건 사고에 대한 기사에서 사용되었다는 점을 확인할 수 있다. 기사문에 주로 ‘베이징’이 사용된 것은 앞서 지적하였듯이 텍스트의 주제나 소재보다는 현행 외래어 표기법을 준수하는 기사문의 작성법에 영향을 받았을 가능성이 높다.

 

(13) ‘북경-베이징’이 포함된 텍스트 네트워크에서 연결중심성이 높은 단어 (1~7위)

가. 북경: 북한, 하북, 요리, 석기, 유적, 감옥, NGO

나. 베이징: 한국, 탈북자, 대사관, 공관, 조약, 망명, 공안

 

응집도 분석의 결과, ‘북경’의 텍스트 네트워크는 다양한 화제가 포함된 하나의 큰 집단(G2)과 상대적으로 구성 단어의 숫자가 적은 세 가지 소집단으로 구분되었다. 첫째 소집단(G1)은 비정부기구의 활동과 여성 회담과 관련된 네트워크이었으며, 둘째 소집단(G3)은 ‘하북 니하만’ 지역의 유적지와 관련된 네트워크이었다. 셋째 소집단(G4)은 북한과의 무역과 관련된 것이었다. 가장 큰 집단(G2)에는 역사, 요리, 독립운동, 외교, 관광지 등 뚜렷한 주제를 구별하기 어려운 다양한 단어들이 포함되어 있었다.

 

 

 

 

‘북경’과 달리 ‘베이징’이 포함된 텍스트 네트워크는 6가지 화제로 뚜렷하게 구분되었다. 첫째 집단(G1)은 국내 대기업의 중국 지사와 관련된 것이었고, 둘째 집단(G2)은 탈북자의 주중 대사관 망명과 관련된 것이었다. 셋째 집단(G3)은 북한에서 강의를 하고 있는 한국인 교수 일행이 중국을 통해 귀국하는 사건과 관련된 것이고, 넷째 집단(G4)은 축구와 관련된 북한과의 스포츠 교류를 다룬 것이었다. 다섯째 집단(G5)은 정부의 인도적 지원 활동, 여섯째 집단(G6)은 중국이 서구 열강과 맺은 조약을 다룬 역사와 관련된 것이었다. 여섯째 집단을 제외하면 모두 언론사의 기사와 관련된 것으로 보인다. 응집도의 분석을 진행한 결과 연결중심성과 마찬가지로 주로 사건 사고나 국제 외교 관계에 대한 보도 기사에 ‘베이징’이 사용되는 반면, ‘북경’은 보다 다양한 문맥에서 사용되고 있다는 점을 확인할 수 있었다.

 

 

 

 

3) ‘상해-상하이’의 텍스트 네트워크

‘상해’와 ‘상하이’가 포함된 문장들의 텍스트 네트워크에서 연결중심성이 높은 핵심적 단어를 선별한 결과, 한자음 표기와 원지음 표기의 사용 분야가 확실하게 구분되었다. ‘상해’의 네트워크에는 ‘3.1운동, 임시정부, 독립운동’과 관련된 단어들의 연결중심성이 가장 높았는데, 임시정부나 독립운동과 관련된 역사 관련 텍스트에서는 ‘상하이’보다는 주로 ‘상해’가 사용되고 있었다. 반면 ‘상하이’의 네트워크에서 연결중심성이 높은 단어는 ‘회의, 공장, 화장품, 증권’ 등으로서 경제적 중심지로서 무역과 국제회의, 증권시장과 관련된 텍스트에서는 ‘상해’보다는 주로 ‘상하이’가 사용되었다.

 

(14) ‘상해-상하이’가 포함된 텍스트 네트워크에서 중심성이 높은 단어 (1~7위)

가. 상해: 임시정부, 3.1운동, 통합, 성립, 이승만, 광동, 좌우익

나. 상하이: 북경, 회의, 공장, 화장품, 학교, 증권, 준공

 

응집도 분석의 결과에서도 ‘상해’와 ‘상하이’의 차이는 뚜렷한 편이었다. ‘상해’가 포함된 텍스트 네트워크를 구성하는 단어들은 세 가지 집단으로 분류되었는데, 가장 큰 집단(G1)은 독립운동과 ‘임시정부’와 관련된 단어들로 구성되었다. 둘째 집단(G2) 역시 독립운동과 관련된 것이지만 윤봉길 의사의 ‘홍구공원 의거’와 관련된 텍스트이었다. 셋째 집단(G3)도 독립운동과 관련된 단어들의 네트워크인데 구성 단어를 살펴보면 ‘의열단’과 ‘민족해방운동전선’ 등 주로 좌익 계일의 항일투쟁과 관련된 네트워크이다. 응집도 분석의 결과를 보면 ‘상해’가 사용되는 문맥은 대부분 임시정부의 독립운동과 관련된 것으로 보인다.

 

 

 

 

‘상하이’가 포함된 텍스트 네트워크는 네 가지 집단으로 분류되었는데, 가장 큰 집단(G1)은 상하이의 무역 중심지인 ‘푸동’이나 한국 기업들의 활동 등 주로 경제와 관련된 것이었다. 둘째 집단(G2)은 상하이시 서기로 활동했던 ‘주룽지(朱鎔基, 1928~)’ 총리에 관한 네트워크이며, 셋째 집단(G3)과 넷째 집단(G4)은 각각 중국의 ‘전국인민대표자회의’와 증권 시장과 관련된 네트워크이었다. 응집도 분석의 결과 ‘상해’와 ‘상하이’의 화제는 각각 ‘임시정부’와 ‘경제 및 무역’으로 볼 수 있으며, 연결중심성이 높은 단어를 분석한 결과와 일치되었다. 앞서 네트워크 분석을 통하여 살펴본 ‘모택동-마오쩌둥, 북경-베이징’과 비교해 볼 때, 한자음 표기와 원지음 표기가 사용되는 문맥이 보다 뚜렷하게 구분되었다.

 

 

  

Ⅳ. 맺음말

 

본 연구에서는 중국어의 인명과 지명을 표기하는 한자음 표기와 원지음 표기 단어 사이의 관계를 동의어가 아니라 문맥에 따라 선택되어 사용되는 유의어로 간주하고 두 가지 단어 쌍을 비교하여 분석하였다. 일단 범용말뭉치와 신문말뭉치의 출현빈도, 포털사이트와 검색엔진의 검색빈도, 그리고 인스타그램 ‘#태그’ 출현빈도를 분석한 결과 일방적으로 우세한 빈도로 사용되기보다는 말뭉치나 매체의 특성, 외래어 표기법의 영향에 따라 빈도의 차이가 나타나는 경향을 발견할 수 있었다.

텍스트 네트워크의 분석을 통해서는 한자음 표기는 한자음 표기끼리, 원지음 표기는 원지음 표기끼리 사용되는 경향이 강하다는 사실이 확인되었다. 또한 어휘별로 차이가 있으나, 한자음은 역사적 사건이나 이념, 사상의 문제를 다루는 문맥에서 특정 연관어들과 함께 집중적으로 사용되었다. 반면 원지음은 다양한 문맥에서 여러 가지 연관어들과 함께 사용되고 있으며, 경제, 무역, 외교, 국제 정치와 같은 현안이나 사건사고를 다루는 기사문에서 사용되었다. 결론적으로 한자음 표기와 원지음 표기가 사용되는 환경에는 차이가 있었다. 이러한 차이는 한자음과 원지음으로 표기되는 중국어의 인명과 지명이 결코 동의어가 아니며 언어학적 레지스터에 따라 선택되는 변이형이자 유의어라는 점을 암시한다. 어떠한 문맥에서 한자음과 원지음 표기 가운데 어떠한 단어가 사용될 것인지 분명하게 예측하기는 어렵겠지만, 자료를 보강하고 텍스트 네트워크의 분석과 같은 체계적이고 정량적인 연구 방법을 도입하면 앞으로 한자음이나 원지음 표기가 출현하는 환경이나 조건에 대한 어느 정도의 경향성은 기술할 수 있을 것으로 기대된다.

본 연구에서 분석한 한자음 표기와 원지음 표기의 차이를 고려한다면 당분간 한자음 표기와 원지음 표기는 문맥에 따라 선택적으로 사용될 가능성이 높다. 지나친 유추일지 모르겠으나 우리말의 기본 수사에서도 ‘하나, 둘, 셋’과 같은 고유어와 ‘일, 이, 삼’과 같은 한자어가 공존하고 있다. 수사를 표기할 때는 한글과 한자, 아라비아 숫자까지 사용하고 있지만 수사에 대한 표준어 규정이나 표기법이 혼란스럽다는 이야기는 들어 본 적이 없다. 이는 언중들이 고유어와 한자어, 한글과 한자와 아라비아 숫자를 적절한 상황과 문맥에 따라 자연스럽게 선택하여 사용하고 있기 때문이다. 이러한 선택은 중국의 지명이나 인명과 같은 고유명사의 표기에도 적용될 수 있다. 통일된 규정과 규칙을 바라는 언중들의 수요에 부응하여 일관성 있는 원지음 표기법을 세우는 것도 일리가 있으나, 오랫동안 사용하여 우리의 말과 글의 일부가 된 한자어 표기를 유지하는 것도 언중들의 요구 가운데 하나이다. 어문정책과 표기 규범의 권위에 의지하여 의식적으로 하나를 배제하고 하나만을 취하는 것은 자연스러운 일이 아니며, 언중들의 선택에 의한 자연스러운 공존을 모색하는 편이 적절하다.

Figure

Table

Reference

  1. 고석주(2011), <현행 외래어표기법이 맞다: 한글의 빛과 그림자>, ≪국어정책 연속토론회 자료집, 제1회 토론회 ‘호금도인가 후진타오인가’≫, 국립국어원.
  2. 김병기(2002), ≪21세기 한자는 필수다: 아직도 ‘한글전용’을 고집해야 하는가?≫, 다운샘.
  3. 김병기(2015), <중국 地名, 人名‘原音主義’ 表記비판: 북경인가, 베이징인가?>, ≪2015년도 춘계 연합학술대회 발표자료집≫.
  4. 김창진(2011), <漢字文化圈 외래어표기법은 韓國語 傳統으로 돌아가야 한다>, ≪국어정책 연속토론회 자료집, 제1회 토론회 ‘호금도인가 후진타오인가’≫, 국립국어원.
  5. 류동춘(2011), <‘호금도’는 우리말인가?>, ≪국어정책 연속토론회 자료집, 제1회 토론회 ‘호금도인가 후진타오인가’≫, 국립국어원.
  6. 박정구(2011), <누구를 위한 원음 표기인가?>, ≪국어정책 연속토론회 자료집, 제1회 토론회 ‘호금도인가 후진타오인가’≫, 국립국어원.
  7. 심지연(2006), <국어 순화어의 생성과 정착에 대하여>, ≪한국어학≫ 30호, 한국어학회.
  8. 양정숙(2019), <한국어 유의어 어감 분석과 교육 방안 연구>, 부산대학교 박사학위논문.
  9. 엄익상(2008a), <중국의 인명·지명을 원음으로 표기해야 할 이유>, ≪2008년 중국인문학회 춘계학술대회 발표논문집≫, 중국인문학회.
  10. 엄익상(2008b), <중국어 외래어표기법 반성: 원칙과 세칙의 문제>, ≪새국어생활≫ 제18권 4호, 국립국어원.
  11. 이수상(2012), ≪네트워크 분석 방법론≫, 논형.
  12. 이용주⋅이을환(1964), ≪국어의미론≫, 수도출판사.
  13. 임지룡(1992), ≪국어의미론≫, 탑출판사.
  14. Bloomfield, Leonard(1933). Language. New York: Holt, Rinehart & Winston.
  15. Crystal, David(2010). The cambridge encyclopedia of language (3rd Edition), Cambridge University Press.
  16. Halliday, Michael A. K.(1989). Spoken and written language. Oxford: Oxford University Press.
  17. Ullmann, Stephen(1962). Semantics: An introduction to the science of meaning. Oxford: Blackwell.