데이터 편집하기

이동: 둘러보기, 검색

경고: 로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다. 로그인하거나 계정을 생성하면 편집자가 아이디(ID)으로 기록되고, 다른 장점도 있습니다.

편집을 되돌릴 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 저장해주세요.
최신판 당신의 편집
1번째 줄: 1번째 줄:
 
'''데이터'''(data)란 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다. '데이타'가 아니라 '데이터'가 올바른 표기법이며,  '''자료'''(資料)라고도 한다.
 
'''데이터'''(data)란 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다. '데이타'가 아니라 '데이터'가 올바른 표기법이며,  '''자료'''(資料)라고도 한다.
 
+
* '''데이터'''(data) : 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다.
 +
* '''[[데이터베이스]]'''(database) : 데이터를 모아둔 집합이다. '''DB'''라고 한다.
 +
* '''[[데이터베이스 관리 시스템]]'''('''DBMS''', database management system) : [[데이터베이스]]를 체계적으로 관리하기 위한 [[시스템]]이다.
 +
* '''[[정보]]'''(情報, information) : 특정한 목적에 맞게 데이터를 정리하여 의미 있는 내용을 이끌어 낸 것을 말한다
 
== 어원 ==
 
== 어원 ==
{{테두리|
 
* '''데이터'''(data) : 어떤 값을 포함하고 있는 가공되지 않은 1차 자료를 말한다.
 
* '''[[데이터베이스]]'''(database) : 데이터를 모아둔 집합이다. '''DB'''라고 한다.
 
* '''[[데이터베이스 관리 시스템]]'''('''DBMS''', database management system) : [[데이터베이스]]를 체계적으로 관리하기 위한 [[시스템]]이다.
 
* '''[[정보]]'''(情報, information) : 특정한 목적에 맞게 데이터를 정리하여 의미 있는 내용을 이끌어 낸 것을 말한다.
 
}}
 
 
'데이터' 혹은 '데이타' 등으로 불리거나 쓰이는데, 옛날에는 '데이타'로 많이 표기했고 외래어 표기법으로는 '데이타'가 맞으나, 현재는 '데이터'로 쓰인다. 국립국어원의 표준국어대사전에는 데이터로 표기했다. 영어권에서도 주요 사전에 실리는 발음은 여전히 /ˈdeɪtə/(데이타)이지만 21세기 들어와서 /ˈdætə/(다다) 또는 /ˈdɑːtə/(다타)라고 읽는 경우가 늘어나고 있다. [[구글]]에 data pronunciation(데이터 발음)을 검색해봐도 dayta가 맞는가 dahta가 맞는가 질문글이 많이 올라와 있다.<ref name="데이터 나무위키">〈[https://namu.wiki/w/데이터#fn-1 데이터]〉, 《나무위키》</ref><br>
 
'데이터' 혹은 '데이타' 등으로 불리거나 쓰이는데, 옛날에는 '데이타'로 많이 표기했고 외래어 표기법으로는 '데이타'가 맞으나, 현재는 '데이터'로 쓰인다. 국립국어원의 표준국어대사전에는 데이터로 표기했다. 영어권에서도 주요 사전에 실리는 발음은 여전히 /ˈdeɪtə/(데이타)이지만 21세기 들어와서 /ˈdætə/(다다) 또는 /ˈdɑːtə/(다타)라고 읽는 경우가 늘어나고 있다. [[구글]]에 data pronunciation(데이터 발음)을 검색해봐도 dayta가 맞는가 dahta가 맞는가 질문글이 많이 올라와 있다.<ref name="데이터 나무위키">〈[https://namu.wiki/w/데이터#fn-1 데이터]〉, 《나무위키》</ref><br>
  
20번째 줄: 17번째 줄:
 
== 연구방법론의 용어 ==
 
== 연구방법론의 용어 ==
 
연구에 직간접적으로 이용되는 일체의 자료이다. 어떤 연구의 결과가 얼마나 유용할지는 그 자료의 질적 적절성이 중요하다. 또한 연구에 필요한 정보들을 수집하는 과정을 가리켜서 자료수집이라고 부른다. 자료수집에는 사례연구법(case study), 질문지법(survey), 참여관찰법(observation/participation), 면접법(interview), 실험법(experiment) 등이 있다.<ref name="데이터 나무위키"></ref>
 
연구에 직간접적으로 이용되는 일체의 자료이다. 어떤 연구의 결과가 얼마나 유용할지는 그 자료의 질적 적절성이 중요하다. 또한 연구에 필요한 정보들을 수집하는 과정을 가리켜서 자료수집이라고 부른다. 자료수집에는 사례연구법(case study), 질문지법(survey), 참여관찰법(observation/participation), 면접법(interview), 실험법(experiment) 등이 있다.<ref name="데이터 나무위키"></ref>
 
 
<table border="1" align="center" tdalign="center" style="text-align:center;">  
 
<table border="1" align="center" tdalign="center" style="text-align:center;">  
 
<tr bgcolor="#B2EBF4">  
 
<tr bgcolor="#B2EBF4">  
69번째 줄: 65번째 줄:
  
 
=== 디지털 데이터 ===
 
=== 디지털 데이터 ===
디지털 데이터에서는, 디지털 시스템이기 때문에 당연히 최소 정보 구분 단위가 [[비트]](Bit)이지만, 실제로는 효율성과 편의성을 위해 입출력을 위한 최소 크기는 비트 8개의 모임인 [[바이트]](Byte)나, CPU가 한 번에 처리할 수 있는 [[워드]](Word) 단위가 된다.<ref name="데이터 나무위키"></ref>
+
디지털 데이터에서는, 디지털 시스템이기 때문에 당연히 최소 정보 구분 단위가 [[비트]](Bit)이지만, 실제로는 효율성과 편의성을 위해 입출력을 위한 최소 크기는 비트 8개의 모임인 바이트(Byte)나, CPU가 한 번에 처리할 수 있는 워드(Word) 단위가 된다.<ref name="데이터 나무위키"></ref>
  
 
=== 프로그램 데이터 ===
 
=== 프로그램 데이터 ===
108번째 줄: 104번째 줄:
 
=== 그래프 데이터 ===
 
=== 그래프 데이터 ===
 
* 데이터 개체 간의 관계나 데이터 자체를 그래프로 표현하는 경우에 사용하는 데이터 세트
 
* 데이터 개체 간의 관계나 데이터 자체를 그래프로 표현하는 경우에 사용하는 데이터 세트
=== 순서 데이터 ===
+
== 순서 데이터 ==
데이터 개체의 속성이 시간 또는 공간적인 순서와 연관되는 데이터 세트
+
* 데이터 개체의 속성이 시간 또는 공간적인 순서와 연관되는 데이터 세트
==== 연속 데이터 ====
+
=== 연속 데이터 ===
 
* 트랜잭션 데이터에서 시간 성분을 추가적으로 고려한 것
 
* 트랜잭션 데이터에서 시간 성분을 추가적으로 고려한 것
 
* 고객의 시간에 따른 구매 경향 예측과 같은 응요에서 사용될 수 있음
 
* 고객의 시간에 따른 구매 경향 예측과 같은 응요에서 사용될 수 있음
==== 서열 데이터 ====
+
=== 서열 데이터 ===
 
* 데이터 개체들 사이에 순서가 존재하는 데이터
 
* 데이터 개체들 사이에 순서가 존재하는 데이터
==== 시계열 데이터 ====
+
=== 시계열 데이터 ===
 
* 연속 데이터의 특수한 경우
 
* 연속 데이터의 특수한 경우
 
* 시간에 따른 속성의 변화를 관찰한 데이터 집합
 
* 시간에 따른 속성의 변화를 관찰한 데이터 집합
==== 공간 데이터 ====
+
=== 공간 데이터 ===
* 위성 사진 분석 데이터와 같이 각 데이터 개체가 공간 상의 위치 정보와 연관이 되는 데이터 집합<br>예) 지구 상의 지점에 따른 온도
+
* 위성 사진 분석 데이터와 같이 각 데이터 개체가 공간 상의 위치 정보와 연관이 되는 데이터 집합
 +
ex)지구 상의 지점에 따른 온도
  
 
== 빅데이터 ==
 
== 빅데이터 ==
[[빅데이터]]는 기존 데이터베이스 관리도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형 또는 데이터베이스 형태가 아닌 비정형의 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다. 기존의 데이터는 일정한 형식에 맞게 정리하여 체계적으로 관리할 수 있었으나, [[소셜 네트워크 서비스]](SNS), [[자율주행 자동차]], 기타 각종 기계장치 등에서 생성된 방대한 양의 비정형 데이터는 새로운 접근 방법을 필요로 하게 되었다. 빅데이터는 기존의 [[오라클]](Oracle) 등 관계형 [[데이터베이스 관리 시스템]](RDBMS)으로는 분석이 어려워, 새로운 빅데이터 분석 도구가 필요하게 되었다. '빅데이타'가 아니라 '빅데이터'가 올바른 표기법이다.{{자세히|빅데이터}}
+
빅데이터는 기존 데이터베이스 관리도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형 또는 데이터베이스 형태가 아닌 비정형의 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다.  
 +
 
  
 
{{각주}}
 
{{각주}}
133번째 줄: 131번째 줄:
 
== 같이 보기 ==
 
== 같이 보기 ==
 
* [[빅데이터]]
 
* [[빅데이터]]
* [[데이터베이스]]
 
* [[데이터베이스 관리 시스템]]
 
* [[정보]]
 
 
{{데이터|검토 필요}}
 

해시넷에서의 모든 기여는 다른 기여자가 편집, 수정, 삭제할 수 있다는 점을 유의해 주세요. 만약 여기에 동의하지 않는다면, 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다 (자세한 사항은 해시넷:저작권 문서를 보세요). 저작권이 있는 내용을 허가 없이 저장하지 마세요!

취소 | 편집 도움말 (새 창에서 열림)