의견.png

"다국어도메인"의 두 판 사이의 차이

해시넷
이동: 둘러보기, 검색
잔글 (중요성)
잔글
1번째 줄: 1번째 줄:
'''다국어도메인'''<!--다국어 도메인--><!--IDN--><!--국제화도메인-->(多國語 domain; multilingual domain)은 영어뿐 아니라 한국어, 중국어, 일본어 등 세계 여러 나라의 언어로 표시한 [[도메인]] 주소이다. 예를 들어, "한국.com", "한국.kr" 등이 있다.
+
'''다국어도메인'''<!--다국어 도메인--><!--IDN--><!--국제화도메인--><!--자국어도메인-->(多國語 domain; multilingual domain)은 영어뿐 아니라 한국어, 중국어, 일본어 등 세계 여러 나라의 언어로 표시한 [[도메인]] 주소이다. 예를 들어, "한국.com", "한국.kr" 등이 있다.
  
 
==개요==
 
==개요==

2020년 8월 20일 (목) 13:26 판

다국어도메인(多國語 domain; multilingual domain)은 영어뿐 아니라 한국어, 중국어, 일본어 등 세계 여러 나라의 언어로 표시한 도메인 주소이다. 예를 들어, "한국.com", "한국.kr" 등이 있다.

개요

국내에서는 1999년 말부터 도메인에 대한 관심이 고조되었고, 영문.com 도메인은 포화상태에 이르렀다. 점차 도메인에 대한 관심이 높아가면서 자국어 도메인에 대한 필요성이 제기되었고, 영어가 아닌 다국어 도메인(multilingual domain)의 기술이 개발되어 등록 서비스를 시작하게 됐다. 한글.com의 다국어 도메인은 등록 업무를 시작한 지 두 달 만에 전 세계적으로 70만 건을 돌파하게 됐고, 한글.com은 기존의 포워딩 개념의 도메인과 달리 별도의 프로그램을 설치할 필요 없이 사용 가능한 도메인이다.[1]

영문 도메인(.com .net .org) 체계에서는 영문자와 숫자, 그리고 하이픈(-)으로 조합된 도메인 네임을 등록하여 사용해 왔다. 그러나 2000년 11월 10일 09:00(GMT 00:00)부터 국제 도메인의 등록정보를 관리하는 도메인 즉, 등기소 역할을 하는 미국의 VGRS(VeriSign Global Registry Services)에서 관리하는 계층방식이다. DNS 체계의 현 도메인 시스템과 같은 다국어 도메인 등록 서비스를 ICANN으로부터 승인된 도메인 네임을 등록 서비스를 할 수 있게 결정됐다. 따라서 “후투.com” “후투컴.net”, “한성테크.org”와 같이 DNS 체계 내에서 한글 도메인 네임을 사용할 수 있게 됐다.[2]

기원

도메인 이름 국제화의 아이디어 착상은 1970년대 인터넷 개발 단계로 거슬러 올라간다. 토론은 언어 및 스크립트의 유용성에 중점을 두었다. 그러나 도메인 이름 등록에 사실상 어떤 문자도 허용하는 오늘날 도메인 이름 시스템에 배치된 기술은 그 당시에 개발되지 않았다. 따라서 도메인 이름으로 등록할 수 있는 문자는 아스키문자로 제한됐다. a~z까지 글자와 0~9까지 숫자 및 하이픈이 그것이다.[3] 도메인 이름이 지난 1985년 처음으로 소개된 이래 이용자들은 일말의 의구심 없이 도메인 이름으로 영어 알파벳과 숫자, 그리고 하이픈을 사용해 왔다. 하지만 1980년대 후반에 들어 비영어권 국가의 인터넷 사용자가 폭발적으로 증가했고, 정보기술의 비약적 발전으로 다국어도메인의 필요성이 부각되면서 변화기를 맞게 됐다. 다국어도메인 서비스가 시행될 경우 인터넷 사용자들은 도메인 이름에 영어 알파벳, 숫자, 하이픈 외에도 한글을 포함한 각국의 자국어를 추가로 사용할 수 있는 길이 열리기 때문이다. 다국어도메인은 지난 1998년 APNG(Asia Pacific Networking Group)의 다국어도메인 서비스 개발 프로젝트에 그 기원을 두고 있다. 다국어도메인에 대한 논의는 1999년 11월 국제기술 표준화 기구인 IETF 회의에서 처음 제기됐다. 그 후 워킹 그룹이 결성되는 등 상당한 논의를 거쳐 2002년 10월 다국어도메인(IDN)의 국제표준안이 공식 승인됐다. 현재 다국어도메인을 시행하고 있는 국가는 일본, 대만, 중국 등이 있다.

이 같은 활발한 행보에도 불구하고 아직 다국어도메인이 현행 영문 도메인의 역할을 대체하기에는 해결해야 할 과제가 있다. IETF가 제시한 다국어도메인의 국제 표준은 향후 최소한 2차례 이상의 호환성 테스트를 거쳐 일정 수준의 안정성을 확보해야만 국제 인터넷 표준으로 인정받을 수 있다. 또한 대다수 애플리케이션은 다국어도메인을 지원하지 않고 있어 인터넷 이용자들이 다국어도메인을 사용하기 위해서는 한시적으로 인코딩 플러그인을 설치한 뒤 사용해야 하는 등 서비스의 범용성이 영문 도메인보다 떨어지는 것이 단점이다. 이밖에 현재 사용되고 있는 애플리케이션에서는 다국어도메인을 이메일 주소로 사용할 수 없기 때문에 애플리케이션의 개선이 없는 한 다국어도메인은 그 활용 범위가 대폭 제한될 수밖에 없는 상황이다. 하지만 이런 문제점에도 불구하고 시장에서의 다국어도메인 도입의 필요성과 가치는 점점 더 높아가고 있다.[4]

중요성

다국어도메인은 여러 이유로 중요한데, 가장 중요한 이유는 전 세계 인터넷 사용자의 수는 늘어가는데 아스키 문자를 사용하는 데 어려움을 느낀다. 인터넷에 액세스하는 사람 중 라틴계 언어와 스크립트를 사용하지 않는 사람이 사용하는 사람보다 더 많다. 이것은 이들이 아스키 문자를 인식하기 어렵고 키보드로 재현하거나 소프트웨어를 사용하여 브라우저에서 웹 사이트 주소를 입력한다는 것을 의미한다. 예를 들면 인터넷 항해를 더 쉽게 만드는 모국어로 된 다국어도메인은 온라인 뉴스를 러시아어로 읽을 때 추가 정보에 대한 링크가 있으면 아스키 웹 주소를 다시 치는 것은 상당히 어려울 수 있다. 또 러시아어 콘텐츠에 대해서는 키릴문자 기반의 주소를 갖는 것이 더 이치에 맞고, 링크나 이메일 주소를 포함한 게시판 광고를 볼 경우 웹 사이트나 이메일 주소는 사용자가 다시 칠 수 있는 문자를 기반으로 하는 것이 더 유용하다. 다른 말로 하면, 많은 국가와 영토에서 이 링크는 기본 라틴계 스크립트가 아닌 다른 스크립트가 돼야 한다. 또 다른 예로는 지정된 웹 사이트에서 정보를 온라인으로 얻어야 하는데, 웹 사이트 주소가 모국어와 다른 스크립트로 되어 있으면 문자를 인식하고 브라우저에 주소를 다시 치는 것이 힘겹다. 때로는 웹 사이트 주소가 이치에 맞지 않거나 아무런 의미가 없는 이름일 수도 있다. 이의 경우 사용자들이 인식할 수 있고 컴퓨터 키보드로 다시 칠 수 있는 스크립트나 알파벳을 사용하는 것이 훨씬 중요하다.

특히 다국어도메인은 홍보와 광고면에서 지역 시장과 비영어권 인터넷 사용자를 대상으로 한다는 점에서 장점이 있다. 따라서 자신이 기본 라틴계 스크립트에 친숙하지 않은 사용자이거나 이러한 사용자와 정보, 제품 또는 서비스를 교환하고 싶을 경우에 이런 시장에 다가갈 수 있기 위해서 다국어도메인이 매우 중요하다.[3]

구성규칙

한글.com 등의 다국어도메인 이름 속에는 영문자, 숫자, 하이픈(-)과 자국어 문자를 포함할 수 있다. 첫 글자와 마지막 글자가 하이픈이 될 수 없음은 영문 도메인 규칙과 동일하다. 도메인 이름 속에 단 한 글자라도 한글이 섞여 있으면 다국어도메인으로 간주하며 첫 글자가 한글이 아니어도 된다. 도메인의 글자 수는 퓨니코드로 변환된 후의 글자 수가 기존 영문 도메인의 제한선인 63자를 초과할 수 없다. 따라서 63자 이내의 다국어 변환 코드로 변환될 수 있는 한글의 최대글자 수는 동일한 글자 등이 반복된다면 35자 정도나 문자열에 따라 17자-25자 정도가 최대범위가 된다. 사용자는 변환되는 다국어 변환 코드 포맷에 대해 신경 쓸 필요는 없으며 규칙에 어긋나는 경우에는 등록시스템이 이를 지적해준다. 한글이 다국어변환 코드로 변환되는 중간단계인 유니코드는 만국 공통의 코드체계를 취하고 있으며 다국어도메인 이름이 사용될 수 있는 유니코드의 범위(Unicode points)가 설정되어 있다. 따라서 등록이 요청된 다국어도메인 이름이 유니코드로 변환되었을 때, 허용되는 유니코드의 범위를 벗어나는 문자가 섞여 있으면 등록될 수 없다. KISA에서 허용하는 다국어도메인 이름 구성규칙으로는 영문자, 숫자, 하이픈, 한글만 가능하고 VGRS에서 정하는 다국어도메인 이름의 구성규칙은 다음 표와 같다.

VGRS 구성규칙
유니코드(16진수) 문자 세트
002D 아스키 하이픈
0030-0039 아스키 숫자 0-9
0061-007A 아스키 소문자 a-
1100-11FF A한글 자음과 모음
3040-309F 일본어 히라가나
30A0-30FF 일본어 가다가나
3400-9FFF 한,중,일 통합한자
A000-A48F 중국 고어한자
AC00-D7A3 한글 음절

위의 코드범위를 해석하면 VGRS에서 정한 구성규칙에는 한글 도메인 내에 영문, 숫자, 한글 음절뿐만 아니라 한글 자음과 모음, 한자, 일본어까지도 포함시킬 수 있으며, 일본어나 중국어 도메인 이름 내에 한글을 섞을 수도 있다.[5]

용어

아스키

아스키는 미국 표준 코드로, 정보 교환을 위한 미국 표준 코드이다. 텍스트로 작업을 수행하는 컴퓨터 및 기타 장비를 위한 공통 숫자 코드이다. 컴퓨터는 숫자만 이해할 수 있으므로 아스키코드를 통해 “a” 또는 “@”등과 같은 문자들을 숫자로 표현한 것이다. 아스키 TLD 또는 아스키 도메인 이름과 관련하여 사용될 경우, 이는 국제화 이전에 a~z까지의 문자, 0~9까지의 숫자와 하이픈만 도메인 이름으로 허용되던 사실을 의미한다.

DNS

도메인 이름 시스템이라고도 하며, DNS를 사용하면 이해하기 어려운 IP 주소 대신 친숙한 문자열을 사용할 수 있으므로 인터넷을 더 쉽게 사용할 수 있다. 따라서 207.151.159.3을 입력하는 대신 www.internic.net을 입력할 수 있다.

IDNA 프로토콜

응용 프로그램의 국제 도메인 이름이라고도 하며, IDNA는 은 국제 인터넷 표준화 기구(IETF)에서 RFC3490에 정의한 프로토콜이다. 이를 통해 응용프로그램에서 비 아스키 문자를 포함한 도메인 이름을 취급할 수 있게 됐다. IDNA는 비 아스키 문자가 포함된 도메인 이름 문자열을 DNS를 사용하는 응용 프로그램에서 정확하게 이해할 수 있는 아스키 도메인 이름 라벨로 변환한다. 하지만 전 세계 언어에 사용되는 모든 문자를 도메인 이름에 사용할 수 없어서 그와 같은 모든 문자를 아스키 라벨로 전환할 수 없다.

IDN

다국어도메인 이름이라고도 하며 지역 언어 문자로 표현된 도메인 이름이다. 이와 같은 도메인 이름은 유럽의 많은 언어, 예를 들어 아랍어나 중국어 등 비라틴계 스크립트의 문자에서 필요할 때 발음 구별 기호를 포함한 문자로 구성될 수 있다.

IDN SLD

보통 지역 문자로 표시되는 전체 도메인 이름을 언급할 때 국제화된 최상위 라벨에 대한 단축 참조를 가리킨다.

LDH

글자, 숫자, 하이픈을 뜻하고, a~z까지의 문자, 0~9까지의 숫자 및 하이픈만 포함하는 아스키 문자의 하위 집합이며, 처음에 도메인 이름 라벨은 이러한 문자들의 하위 집합으로 제한됐다.

퓨니코드

퓨니코드는 DNS가 이름을 이해하고 관리할 수 있도록 하기 위해 모든 IDN이 인코딩되는 아스키 문자의 시퀀스이다. 도메인 이름 등록자와 사용자가 이러한 도메인 이름의 디코딩된 형태를 보지 못하게 하려는 의도이다. 유일한 목적은 DNS가 지역 문자를 포함한 웹 주소를 분석할 수 있도록 한다. DNS는 유일하게 아스키문자만을 취급할 수 있다. 도메인 이름의 퓨니코드 버전의 접두어는 항상 “xn--”이다. 따라서 이 접두어는 IDN 등록 시 혼란을 피할 수 있도록 종종 등록기구 레벨에 보존된다.[3]

각주

  1. 한글.com〉, 《도메인뱅크》
  2. 다국어 도메인〉, 《교보문고》, 2008-05
  3. 3.0 3.1 3.2 IDN: 국제 도메인 이름 국제인터넷주소관리기구 백서 - https://www.icann.org/en/system/files/files/factsheet-idn-fast-track-oct09-ko.pdf
  4. 송관호, 〈(디지털 포럼) 다국어 도메인〉, 《디지털타임스》, 2003-06-25
  5. 다국어 및 한글도메인 구성규칙〉, 《이지앤비즈》

참고자료

같이 보기


  의견.png 이 다국어도메인 문서는 인터넷에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.