데이터 편집하기
최신판 | 당신의 편집 | ||
1번째 줄: | 1번째 줄: | ||
'''데이터'''(data)란 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다. '데이타'가 아니라 '데이터'가 올바른 표기법이며, '''자료'''(資料)라고도 한다. | '''데이터'''(data)란 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다. '데이타'가 아니라 '데이터'가 올바른 표기법이며, '''자료'''(資料)라고도 한다. | ||
− | + | * '''데이터'''(data) : 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다. | |
+ | * '''[[데이터베이스]]'''(database) : 데이터를 모아둔 집합이다. '''DB'''라고 한다. | ||
+ | * '''[[데이터베이스 관리 시스템]]'''('''DBMS''', database management system) : [[데이터베이스]]를 체계적으로 관리하기 위한 [[시스템]]이다. | ||
+ | * '''[[정보]]'''(情報, information) : 특정한 목적에 맞게 데이터를 정리하여 의미 있는 내용을 이끌어 낸 것을 말한다 | ||
== 어원 == | == 어원 == | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
'데이터' 혹은 '데이타' 등으로 불리거나 쓰이는데, 옛날에는 '데이타'로 많이 표기했고 외래어 표기법으로는 '데이타'가 맞으나, 현재는 '데이터'로 쓰인다. 국립국어원의 표준국어대사전에는 데이터로 표기했다. 영어권에서도 주요 사전에 실리는 발음은 여전히 /ˈdeɪtə/(데이타)이지만 21세기 들어와서 /ˈdætə/(다다) 또는 /ˈdɑːtə/(다타)라고 읽는 경우가 늘어나고 있다. [[구글]]에 data pronunciation(데이터 발음)을 검색해봐도 dayta가 맞는가 dahta가 맞는가 질문글이 많이 올라와 있다.<ref name="데이터 나무위키">〈[https://namu.wiki/w/데이터#fn-1 데이터]〉, 《나무위키》</ref><br> | '데이터' 혹은 '데이타' 등으로 불리거나 쓰이는데, 옛날에는 '데이타'로 많이 표기했고 외래어 표기법으로는 '데이타'가 맞으나, 현재는 '데이터'로 쓰인다. 국립국어원의 표준국어대사전에는 데이터로 표기했다. 영어권에서도 주요 사전에 실리는 발음은 여전히 /ˈdeɪtə/(데이타)이지만 21세기 들어와서 /ˈdætə/(다다) 또는 /ˈdɑːtə/(다타)라고 읽는 경우가 늘어나고 있다. [[구글]]에 data pronunciation(데이터 발음)을 검색해봐도 dayta가 맞는가 dahta가 맞는가 질문글이 많이 올라와 있다.<ref name="데이터 나무위키">〈[https://namu.wiki/w/데이터#fn-1 데이터]〉, 《나무위키》</ref><br> | ||
20번째 줄: | 17번째 줄: | ||
== 연구방법론의 용어 == | == 연구방법론의 용어 == | ||
연구에 직간접적으로 이용되는 일체의 자료이다. 어떤 연구의 결과가 얼마나 유용할지는 그 자료의 질적 적절성이 중요하다. 또한 연구에 필요한 정보들을 수집하는 과정을 가리켜서 자료수집이라고 부른다. 자료수집에는 사례연구법(case study), 질문지법(survey), 참여관찰법(observation/participation), 면접법(interview), 실험법(experiment) 등이 있다.<ref name="데이터 나무위키"></ref> | 연구에 직간접적으로 이용되는 일체의 자료이다. 어떤 연구의 결과가 얼마나 유용할지는 그 자료의 질적 적절성이 중요하다. 또한 연구에 필요한 정보들을 수집하는 과정을 가리켜서 자료수집이라고 부른다. 자료수집에는 사례연구법(case study), 질문지법(survey), 참여관찰법(observation/participation), 면접법(interview), 실험법(experiment) 등이 있다.<ref name="데이터 나무위키"></ref> | ||
− | |||
<table border="1" align="center" tdalign="center" style="text-align:center;"> | <table border="1" align="center" tdalign="center" style="text-align:center;"> | ||
<tr bgcolor="#B2EBF4"> | <tr bgcolor="#B2EBF4"> | ||
69번째 줄: | 65번째 줄: | ||
=== 디지털 데이터 === | === 디지털 데이터 === | ||
− | 디지털 데이터에서는, 디지털 시스템이기 때문에 당연히 최소 정보 구분 단위가 [[비트]](Bit)이지만, 실제로는 효율성과 편의성을 위해 입출력을 위한 최소 크기는 비트 8개의 모임인 | + | 디지털 데이터에서는, 디지털 시스템이기 때문에 당연히 최소 정보 구분 단위가 [[비트]](Bit)이지만, 실제로는 효율성과 편의성을 위해 입출력을 위한 최소 크기는 비트 8개의 모임인 바이트(Byte)나, CPU가 한 번에 처리할 수 있는 워드(Word) 단위가 된다.<ref name="데이터 나무위키"></ref> |
=== 프로그램 데이터 === | === 프로그램 데이터 === | ||
108번째 줄: | 104번째 줄: | ||
=== 그래프 데이터 === | === 그래프 데이터 === | ||
* 데이터 개체 간의 관계나 데이터 자체를 그래프로 표현하는 경우에 사용하는 데이터 세트 | * 데이터 개체 간의 관계나 데이터 자체를 그래프로 표현하는 경우에 사용하는 데이터 세트 | ||
− | + | == 순서 데이터 == | |
− | 데이터 개체의 속성이 시간 또는 공간적인 순서와 연관되는 데이터 세트 | + | * 데이터 개체의 속성이 시간 또는 공간적인 순서와 연관되는 데이터 세트 |
− | + | === 연속 데이터 === | |
* 트랜잭션 데이터에서 시간 성분을 추가적으로 고려한 것 | * 트랜잭션 데이터에서 시간 성분을 추가적으로 고려한 것 | ||
* 고객의 시간에 따른 구매 경향 예측과 같은 응요에서 사용될 수 있음 | * 고객의 시간에 따른 구매 경향 예측과 같은 응요에서 사용될 수 있음 | ||
− | + | === 서열 데이터 === | |
* 데이터 개체들 사이에 순서가 존재하는 데이터 | * 데이터 개체들 사이에 순서가 존재하는 데이터 | ||
− | + | === 시계열 데이터 === | |
* 연속 데이터의 특수한 경우 | * 연속 데이터의 특수한 경우 | ||
* 시간에 따른 속성의 변화를 관찰한 데이터 집합 | * 시간에 따른 속성의 변화를 관찰한 데이터 집합 | ||
− | + | === 공간 데이터 === | |
− | * 위성 사진 분석 데이터와 같이 각 데이터 개체가 공간 상의 위치 정보와 연관이 되는 데이터 집합 | + | * 위성 사진 분석 데이터와 같이 각 데이터 개체가 공간 상의 위치 정보와 연관이 되는 데이터 집합 |
+ | ex)지구 상의 지점에 따른 온도 | ||
== 빅데이터 == | == 빅데이터 == | ||
− | + | 빅데이터는 기존 데이터베이스 관리도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형 또는 데이터베이스 형태가 아닌 비정형의 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다. | |
+ | |||
{{각주}} | {{각주}} | ||
133번째 줄: | 131번째 줄: | ||
== 같이 보기 == | == 같이 보기 == | ||
* [[빅데이터]] | * [[빅데이터]] | ||
− | |||
− | |||
− | |||
− | |||
− |