검수요청.png검수요청.png

메타데이터

해시넷
이동: 둘러보기, 검색

메타데이터(metadata)는 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터를 말한다. 즉 동영상, 소리, 문서 등과 같이 실제로 존재하거나 사용할 수 있는 데이터는 아니지만, 이러한 실제 데이터와 직접적 또는 간접적으로 연관된 정보를 제공해주는 데이터를 말한다.

개요[편집]

인터넷의 급속한 발전으로 정보량이 급증하여, 로봇(Robot), 스파이더(Spider) 등을 활용한 기존정보 검색에 한계가 생겼다. 풀 텍스트(full text) 검색 방식으로는 이용자에게 부담을 주며 부적합한 내용이 검색되는 한계가 노출되었고 디지털 정보자원의 효율적 검색과 체계적 관리 및 자원과의 상호 운용성 지원을 목적으로 메타 데이터가 출현하였다.[1]

카렌 코일(Karen Coyle)는 메타데이터를 '어떤 목적으로 만들어진 데이터(Constructed data with a purpose)'라고 정의했다. 속성정보라고도 하는 메타데이터는 대량의 정보 가운데 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 여기에는 콘텐츠의 위치와 내용, 작성자에 관한 정보, 권리 조건, 이용 조건, 이용 내력 등이 기록되어 있다. 컴퓨터에서는 보통 메타데이터를 데이터를 표현하기 위한 목적과 데이터를 빨리 찾기 위한 목적으로 사용하고 있다. 이러한 메타데이터는 서술적 메타데이터(descriptive metadata)와 의미적 메타데이터(semantic metadata)로 구분할 수 있다. 기술적 메타데이터는 정보의 내용과는 관계가 없으나 그 정보가 어떻게 만들어졌는가를 표현하는 것이며, 의미적 메타데이터는 데이터 자체의 내용적인 측면을 서술한 것이다. 메타데이터는 데이터를 사용하는 사람에게는 보이지 않는다. 그러나 기계(컴퓨터)는 메타데이터의 내용을 이해하고 이를 이용한다. 곧, 웹 자료나 다른 것들에 관해 기계가 이해할 수 있는 정보가 메타데이터이다.

특징[편집]

사용 언어[편집]

  • HTML(Hyper text Markup Language) : 인터넷 웹사이트 등 하이퍼텍스트를 편집하기 위한 코딩 언어이다. 에이치티엠엘이라고 읽는다. 영어로 'T'를 강조하여, Hyper Text Markup Language라고도 한다. 1991년 팀 버너스-리(Tim Berners-Lee)가 처음 만들었다. 파일 확장자는 .html 또는 .htm이다. HTML 태그 안에는 헤드(head)나 바디(body)가 있고 바디 안에 테이블(table)이 있는 것처럼 계층적 구조를 가지고 있다. 하지만 새로운 태그를 사용할 수 없다는 점과 문서 양식에서 사용되는 속성을 표현하는데 어려움이 있다는 단점이 있으며, 문서의 재사용이 불가능하다는 특징이 있다.[2]가기.png HTML에 대해 자세히 보기
  • XML(Extensible Markup Language) : 홈페이지 제작에 사용되는 확장된 HTML 언어이다. HTML 언어는 미리 정의된 태그만 사용할 수 있지만, XML 언어는 필요한 태그를 개발자가 새로 정의하여 사용할 수 있다. 다양한 시스템을 연계하여 데이터를 주고받기 위해 XML 기반의 SOAP 또는 REST 방식을 사용한다. HTML에서 가지고 있던 단점들을 모두 보완하였고 대용량의 복잡한 구조를 가진 문서를 작성하는데도 쉽게 사용 가능하다. 하지만 그로 인해 문서를 작성하는 것이 복잡하다는 단점이 있다.가기.png XML에 대해 자세히 보기

분류[편집]

복잡하고 다양한 환경 및 요구에 적합한 메타데이터를 구축하는 것이 중요하기 때문에, 분야에 따라서 사용되는 메타데이터의 종류는 다양하다. 메타데이터가 정의되는 범위에서도 분류가 나뉜다. 대표적인 분류에는 FRBR과 NISO가 있다.

  • FRBR : FRBR에서 말하는 메타데이터는 이용자가 제안하고 있는 검색 기준에 의거하여 검색을 실시하고 정보자원의 정체성을 확인하고 이용자가 원하는 정보인지 확인을 해야하는 식별가능성이 있어야 한다. 또 이용자가 원하고 있는 적합한 정보를 선택해야하며 선택된 정보를 획득할 수 있어야 한다.
  • NISO : NISO에서 말하는 메타데이터는 정보자원을 적합한 기준에 따라 분류해 탐색을 해야하며, 이용자와 카테고리에 따라서 각 정보자원을 연결하고 조직해야 한다. 또 통합적으로 검색 용이성을 가져야 하고 각 메타데이터를 구별가능한 언어가 존재해야한다. 마지막으로 메타데이터는 손상가능성이 높기 때문에 다양한 기법을 통해 지속적으로 사용가능할 수 있도록 해야한다고 말한다.

원론적으로 FRBR과 NISO는 같은 의미를 내포 하고 있지만 NISO가 메타데이터가 '데이터를 위한 데이터'라고 여겨지며 하나의 정보자원으로 여겨 분석을 통한 장기적인 보존이 필요하다고 평가받는다. 따라서 NISO는 FRBR보다 더 포괄적인 의미의 메타데이터라고 할 수 있다.

표준화[편집]

메타데이터가 지니는 검색과 관리의 효율성에 따라 여러 MARC, DC, MODS, ONIX 등의 메타데이터 포맷이 도서관 분야에서 적용되고 있으며, 다른 분야에서도 CERIF, INDEX, GDAS와 같은 다양한 형식의 메타데이터 포맷이 개발되어 이를 토대로 하는 시스템이 구축되고 있다. 그러나 서로 상이한 환경과 요구에 따라 개발된 메타데이터 구조와 형식은 오늘날 메타데이터 간의 상호운영성을 저해하는 요소로 작용한다. 서로 다른형식의 메타데이터를 사용할 경우 데이터 요소와 표현의 불일치에 따라 동일한 내용의 정보자원이 상이한 형식으로 표현되며 다른 형식의 메타데이터에는 접근할 수 없기 때문이다. 이는 동일한 도메인에서만 발생하는 것이 아니라 서로 다른 도메인 간에도 동일하게 적용되어 데이터의 중복, 오류 등의 비효율성을 누적시키는 결과로 이어진다. 메타데이터 표준화는 이러한 문제점을 극복하고 시스템 간 정보자원의 상호운영성을 확보하기 위한 것으로서, 표준화가 이루어질 경우 메타데이터와 해당 정보자원 관리 및 검색 측면에서의 효율성이 증가된다.[3]

종류[편집]

  • 기술용 메타데이터
정보자원의 검색을 목적으로 한 메타데이터이다. 기술용 메타데이터의 목적은 어떤 자원을 어떻게 찾아내는지의 발견, 어떤 자원을 다른 유사한 자원과 어떻게 구분하는지에 대한 식별 그리고 어떤 자원이 특정 자원을 만족시킨다는 사실을 어떻게 결정하는지의 목적을 충족시키는 선정 등이 있다. 전통적인 도서관 편목에서의 메타데이터는 기본적으로 기술적인 것들이다.
  • 관리용 메타데이터
자원의 관리를 어떻게든 쉽게 하기 위한 메타데이터이다. 어떤 객체가 언제 어떻게 작성되었는지, 주 내용에 대한 접근을 관리하는 책임은 누가 가지며, 접근이나 이용에 대한 어떤 제약이 적용될 수 있는지를 포함한다. 그러나 일반적으로 기술용과 관리용 사이의 경계는 쉽게 정의하기 힘들며 그 기준은 메타데이터 이용자의 시각에 따라 결정되는 경우가 많다.
  • 구조용 메타데이터
복합적인 디지털 객체들을 함께 묶어주기 위한 메타데이터이다. 물리적인 파일과 페이지, 페이지의 장, 장과 전체로서의 책 사이의 관계를 기록하기 위해 필요하다. 구조용 메타데이터는 수치 데이터세트와 통계 데이터세트의 데이터 요소의 순서와 포맷을 문서화하며, 그 목적이 어떤 엔티티의 이용이 가능하도록 하는 것이다.

활용 및 사례[편집]

활용
  • 디지털 음원시장 : 디지털 음원이 대중화 되면서 메타데이터의 필요성 및 중요성이 가속되어가고 있다. 메타데이터는 음원 시장의 기본적인 요소이다. 음원 공급자는 메타데이터가 없으면 매출을 만들어 낼 수 없다. 곡 제목, 음악가를 비롯해 음원에 담겨 있는 모든 정보를 품고 있는 것이 메타데이터이기 때문이다. 음원 검색뿐만 아니라 이용자에게 새로운 음원을 추천할 때도 메타데이터 시스템을 토대로 추천한다. 차트와 이용자의 검색패턴을 이용하여 최근 음원의 인기 여부 또한 메타데이터를 기반으로 판단한다.
  • 차세대 스마트 방송 : 차세대 스마트 방송 핵심은 영상 콘텐츠에 포함된 메타데이터를 활용하는 것이다. 시청자가 단순히 영상을 보고 끝내는 것이 아닌 영상에 포함된 작품 정보, 상품 정보 등의 다양한 메타데이터를 통해 새로운 부가 가치를 만들어 낸다. 유튜브와 같은 포털 사이트에서 소비되는 콘텐츠 대다수는 방송과 관련되어 있다. 옷, 상점, 여행지 등의 메타데이터를 추출하여, 애플리케이션 등 새로운 사업 모델을 만들어 내는 생태계로 진입하고 있다.
  • 소셜네트워크서비스(SNS) : 사용자가 자발적으로 구축한 수많은 메타데이터를 통해, 효율적인 서비스를 제공하는 것이 소셜네트워크서비스이다. 사용자는 메시지를 주고받을 사진, 영상 혹은 텍스트만을 생성하는 것 같지만, 실제로는 사용자/내용/네트워크 구성에 대한 메타데이터 등 약 50가지 이상의 데이터가 함께 기록된다. 누적된 메타데이트의 활용도는 무궁무진하다.
사례
  • 행정안전부 범정부 데이터 플랫폼 구축사업
데이터의 생성단계부터 표준화하고 품질 검증을 거쳐 개방하기 위해 범정부 데이터 플랫폼 구축을 시도한다. 약 700개의 공공기관이 보유한 공공데이터의 소재와 메타데이터정보를 관리한다. 모든 공공기관에 메타데이터를 관리할 수 있는 메타데이터관리시스템을 구축하여 범정부적 메타데이터를 통합하고 메타데이터사전을 마련하고 용어, 형식 등 표준화를 위한 기틀을 다진다.[4]
  • 힌트체인의 해먹
푸드 블록체인 프로젝트 힌트체인(Hintchain)은 블록체인 앱 해먹을 출시했다. 해먹은 2014년 출시해 유지 중인 레시피 서비스 '해먹남녀'에 블록체인 기술을 적용해 힌트토큰을 리워드로 사용한다. 이용자들은 취향 정보 제공과 활동을 통해 토큰 보상과 맞춤형 서비스를 받게 되며, 파트너사들은 체계화된 메타데이터를 통해 취향과 수요를 파악, 맞춤형 상품과 서비스를 제공한다.[5]
  • 아이온커뮤니케이션즈 아카이브 시스템
아이온커뮤니케이션즈에서 제작 및 판매되고 있는 모든 컨텐츠 관리 시스템은 메타데이터를 기반한 콘텐츠 제작 및 관리에 중점을 두고 있다. 여러 가지 콘텐츠 관리 시스템 비정형 데이터 관리에 목적이 있는 아카이빙 시스템은 여러 포맷 및 유형의 비정형 데이터에서 의미 있는 메타데이터를 추출하여 관리하는데 초점이 맞추어져 있다. 축적된 데이터를 의미 있게 포맷화하고 연결하고 공유함으로써 관리되고 있는 모든 콘텐츠가 의미 있는 관계를 가짐으로써 사용자가 의도한, 또는 새로운 형태로 재활용 될 수 있도록 관리체계를 가질 수 있다.

각주[편집]

  1. 메타데이터〉, 《IT정보기술》
  2. 나셀프, 〈메타데이터란 무엇일까? 개념과 특징 이해하기!〉, 《네이버블로그》, 2018-06-26
  3. 고영만, 〈메타데이터 표준화와 메타데이터 레지스트리
  4. 배민욱 기자, 〈700개 공공기관 데이터 한눈에...'국가데이터맵'구축〉, 《뉴시스》, 2018-07-29
  5. 코인니스, 〈힌트체인, 블록체인 기반 레시피 리뷰서비스 '해먹' 정식 출시〉, 《토큰포스트》, 2019-07-21

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 메타데이터 문서는 데이터에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.