의견.png

차트

해시넷
skim2456 (토론 | 기여)님의 2021년 8월 9일 (월) 12:11 판
이동: 둘러보기, 검색

차트(chart)는 어떤 자료의 분석 결과를 알아보기 쉽게 일정한 양식의 그림으로 나타낸 표이다. 차트는 의료, 항공, 통계자료 등에서 공공기관 뿐만 아니라 평소에도 흔히 쓰이게 된다. 하나의 그림이나 표 나타내기 때문에 알고 싶은 결과를 한눈에 볼 수 있다. 도표에는 막대그래프, 꺾은선 그래프, 원그래프 등 다양한 방법으로 표현 가능하다. 도표 라고도 부른다[1]

개요

차트는 매우 다양한 형태를 취할 수 있지만 차트에 데이터에서 의미를 추출하는 기능을 제공하는 공통 기능이 있다. 일반적으로 사람은 테긋트보다 그림에서 의미를 더 빨리 추론 할 수 있으므로 일반적으로 차트의 데이터는 그래프의 데티어가 참조하는 내용의대한 간결한 설명을 제공한다. 수평 및 수직 축이 사용되는 경우 일반적으로 각각 x 축 및 y 축이라고한다. 각 축에는 규모,주기적인 눈금으로 표시되며 일반적으로 숫자 또는 범주 표시와 함께 표시된다. 각 축에는 일반적으로 표시되는 차원을 간략하게 설명하는 레이블이 외부 또는 옆에 표시된다. 척도가 숫자 인 경우 레이블은 종종 괄호 안에 해당 척도의 단위가 붙는다. 예를 들어, "이동 거리 (m)"는 일반적인 x 축 레이블이며 미터 단위로 표시된 이동 거리가 차트 내 데이터의 수평 위치와 관련되어 있음을 의미한다. 그래프 내에서 그리드 데이터를 시각적으로 정렬하는 데 도움이되는 줄 수가 나타날 수 있다. 그리드는 규칙적이거나 중요한 눈금에서 시각적으로 강조하여 향상시킬 수 있다. 강조된 선을 주 그리드 선이라고하고 나머지는 보조 그리드 선이라고한다. 차트의 데이터는 모든 형식으로 표시 될 수 있으며 개별 텍스트를 포함 할 수 있다. 라벨 차트에서 표시된 위치와 관련된 데이텀을 설명한다. 데이터는 연결되거나 연결되지 않은 점 또는 모양, 색상 및 패턴의 조합으로 나타날 수 있다. 추론 또는 관심 지점을 그래프에 직접 오버레이하여 정보 추출을 더욱 지원할 수 있다.차트에 나타나는 데이터에 여러 변수가 포함 된 경우 차트에는 범례 (키). 범례에는 차트에 나타나는 변수 목록과 그 모양의 예가 포함된다. 이 정보를 통해 각 변수의 데이터를 차트에서 확인 할 수 있다.[2]

종류

막대그래프

막대 그래프

막대 그래프는 범주 데이터를 요약하는 방법입니다. 막대 그래프에서는 동일한 너비의 여러 막대를 사용하여 데이터를 표시하며, 각 막대는 특정 범주를 나타냅니다. 각 막대의 높이는 특정 집계(예: 나타내는 범주에 있는 값의 합계)에 비례합니다. 분석을 만들 때 적용된 경우 막대 그래프에서는 추가 정보를 참조선이나 여러 곡선 유형에 표시할 수 있습니다. 예를 들어 이러한 선 또는 곡선은 데이터 포인트가 특정 다항식 곡선에 따라 얼마나 잘 조정되는지를 보여주거나, 데이터를 설명하고 시각화 위에 곡선 또는 직선을 표시하는 모델에 샘플 데이터 포인트 모음을 맞추어 해당 모음을 요약합니다. 일반적으로 분석에서 필터링된 값에 따라 곡선의 모양이 변경됩니다. [3]

장점
  • 독자에게 익숙하다.
  • 시각화 중 가장 정확한 전달이 가능한 길이를 이용하였기 때문에, 값의 정확한 전달이 가능하고 읽기 쉽다.
  • 거의 대부분의 데이터셋을 커버할 수 있다.
  • 음수도 나타낼 수 있다.
단점
  • 누적 막대 그래프의 경우, 각 비율을 정확히 파악하기 어렵다.[4]

히스토그램

분포표를 그래프로 나타낸 것이다. 보통 히스토그램에서는 가로축이 계급, 세로축이 도수를 뜻하는데, 때때로 반대로 그리기도 한다. 계급은 보통 변수의 구간이고, 서로 겹치지 않는다. 그림에서 계급(막대기)끼리는 서로 붙어 있어야 한다. 히스토그램은 일반 막대그래프와는 다르다. 막대그래프는 계급 즉 가로를 생각하지 않고 세로의 높이로만 나타내지만 히스토그램은 가로와 세로를 함께 생각해야 한다[5]

장점
  • 쉽고 유용하다
  • 대부분의 데이터셋에 적용 가능하다
  • 용량이 큰 데이터도 한 눈에 요약해준다
  • 분포의 모양, 중심, 치우침 정도, 퍼짐 정도를 파악할 수 있다
  • 데이터의 범위를 파악 가능하다
단점
  • 데이터가 항상 재가공(구간별 빈도수 요약)되어 표현된다
  • 도표에서 정확한 데이터를 재현할 수 없다.
  • 여러 카테고리를 비교하기에 한계가 있다.[6]

라인차트

라인 차트

선도표, 라인 차트(line chart)는 직선 세그먼트로 연결된 '마커'(marker)라는 이름의 일련의 데이터 지점으로 정보를 표시하는 차트의 일종이다. 수많은 분야에서 일반화된 기본적인 유형의 차트이다. 측정 지점이 정렬되고(일반적으로 x축 값으로 정렬) 직선 세그먼트와 함께 병합된 것을 제외하고는 산점도와 비슷하다. 선도표는 시간 간격에 따라 데이터의 경향(트렌드)을 시각화하기 위해 종종 사용되는데 이를 시계열이라고 하며, 이에 따라 선은 시간 순서에 따라 표현되기도 한다. 이러한 경우에는 실행 도표(런 차트, run chart)라고 부른다.[7]

장점
  • 시간에 따른 숫자형 변수의 변화를 잘 보여줌
  • 데이터 바깥으로 외삽(Exrapolation)이 가능함
  • 내삽(Interpolation)을 통해 결측치 예측이 가능함
  • 두 개(이상)의 카테고리의 관계를 비교해볼 수 있음
단점
  • 선분이 여러개 있을 때, 쉽게 어수선해져 가독성이 낮아짐
  • 특정 시점의 데이터 포인트의 정확한 값을 알기 어렵다.[8]

원 그래프

원그래프(영어: Pie chart)는 전체에 대한 각 부분의 비율을 부채꼴 모양으로 백분율로 나타낸 그래프이다. 각 부채꼴의 중심각이 전체에서 차지하는 비율을 나타내며, 비율을 한눈에 볼 수 있다는 장점이 있다. 전체적인 비율을 쉽게 파악할 수 있어서 언론사에서 통계 수치를 공개할 때 자주 활용된다. 원그래프는 수치데이터를 표현한다. 먼저 전체에 대한 각 항목의 백분율을 계산한다. 그 다음 항목이 차지하는 백분율만큼 원을 나눈다. 마지막으로 각 항목의 명칭, 백분율을 적는다. 원그래프를 나누어 나온 백분률의 합이 100%가 되는지 확인해야 한다.[9]

장점
  • 독자에게 익숙하다
  • 시각적으로 단순하다
  • 비율 데이터의 완결성을 테스트하기에 좋다
단점
  • 각도를 이용하기 때문에 정확한 값을 전달하기 어렵다
  • 5개 이상의 카테고리를 전달하기 힘들다
  • 만드는 사람의 의도에 따라 메세지가 많이 달라질 수 있다.[10]

꺾은선그래프

꺽은선그래프

선 그래프 또는 꺾은 선 그래프는 수량을 점으로 표시하고 그 점들을 선분으로 이어 그린 그래프를 말한다.불필요한 부분을 생략하고 자세히 그래프를 그릴 때는 물결선을 긋는다.선 그래프는 연속적 자료를 다루거나 통시적 자료를 다룰 경우, 동일하거나 일련의 관찰대상의 추이를 비교할 경우, 추세(trend)를 관찰할 경우에 쓰이는 그래프이다. 시간에 따라 뭔가가 지속적으로 변화하는 것을 기록할 때 굉장히 유용하다. 숫자로만 적으면 지속적으로 변화하는 것의 흐름을 정확히 파악하기가 어렵기 때문에 이런 상황에서 꺾은선그래프가 유용하다.[11]

장점
  • 조사하지 않은 중간의 값도 대략 예측할 수 있다.
단점
  • 세로 눈금 한 칸의 크기를 너무 작게 하면 눈금 그리기가 어렵고 그래프가 너무 커지며, 너무 크게 할 경우 수량을 표시하기 힘든 단점이 있다.[12]

산점도

산점도

산점도(散點圖)는 가로축(X축)과 세로축(Y축)을 설정한 좌표평면 상에서 각각의 관찰값들을 점이나 X 문자로 표시하는 방식을 말한다. 물론 두 축이 의미하는 바가 무엇인지부터 확실하게 정의되어야 한다. 산점도는 나중에 회귀 분석(regression)을 할 때 굉장히 중요해진다. 수치를 표시하고 비교하는 데 사용되어 추세 외에도 데이터 클러스터의 모양을 보여드리고 데이터 클라우드에서 각 데이터 지점의 관계를 나타낼 수 있습니다.[13]

장점
  • 그리기가 쉽다
  • 자료를 읽어내기가 쉽다
  • 도표에서 데이터를 정확하게 재현가능하다
  • 비선형(non-linear) 관계를 보여주기에 최적이다
  • 값의 범위, 최저, 최소값을 탐색할 수 있다
단점
  • (한계점) 두 변수가 수치적으로 얼마나 상관있는지 말해주지 못한다
  • 2개 이상의 변수의 관계를 탐색할 수 없다
  • 겹쳐그려지는 문제가 발생할 수 있다.인용 오류: <ref> 태그를 닫는 </ref> 태그가 없습니다
장점
  • 카테고리별로 색상을 다르게하면 4개의 변수를 시각화 할 수 있다.
  • 복잡한 데이터셋을 시각화할 수 있다
  • 핵심 변수를 한 눈에 추론할 수 있다
  • 표를 읽는 것보다 트랜드 파악에 수월하다
단점
  • 원들이 겹쳐져 정보가 소실되기 쉽다
  • 0 혹은 음수의 자료들의 전달이 어려울 수 있다.인용 오류: <ref> 태그를 닫는 </ref> 태그가 없습니다
장점
  • 계절, 시간 등 순환하는 카테고리에 강점
  • 방위 표현에 강점
단점
  • 정렬 순서에 민감하여 모양이 많이 달라질 수 있다.인용 오류: <ref> 태그를 닫는 </ref> 태그가 없습니다

장점 각 세션의 크기를 대비함으로써 직관적으로 문제점을 파악 할 수 있다. 단점 무질서한 카테고리 또는 프로세스 관계가 없는것은 표현이 힘들다.[14]

워드 클라우드 차트

워드 클라우드 차트

워드클라우드 차트는 각 단어의 중요도(인기도)를 한눈에 알아볼 수 있도록 높은 시각적 효과를 제공하는 차트이다. 단어의 중요도는 데이터에 나타난 단어의 빈도수가 얼마나 높은지 혹은 단어에 주어진 수치값(가중치)이 얼마나 큰지에 따라서 결정되며 차트 상에는 단어의 크기와 색상을 달리하여 표현된다. 워드클라우드 차트는 노드의 series 속성값에 노드를 설정하여 생성할 수 있다. 차트에 표현되는 단어의 크기는 노드에 정의되는 다음 두 속성에 의해서 결정됩니다.[15]

장점
  • 대량 텍스트에서 키워드를 추출 할 수 있다.
단점
  • 데이터 너무 적거나 데이터 구분이 뚜렷하지 않는 텍스트에 적용되지 않는다.[14]

간트차트

간트 차트

간트 차트란 미국의 헨리 간트(H. L. Gant)가 1919년 창안한 관리 도표로 작업계획과 작업 실적을 비교해 작업진도를 관리·통제하는 진척관리에 이용된다. 간트 차트는 한 축에 시간의 흐름을 표시하고 다른 한 축에 생산 사이클에서 요구되는 과업들을 표시, 전체 생산 공정의 일정계획을 수립할 수 있고 핵심과업이나 지체작업을 손쉽게 파악할 수 있다. 간트는 과업의 성과뿐 아니라 생산일정계획의 작업순위를 결정할 수 있는 기준이 확립되어야 한다고 주장했는데, 생산과업의 작업순위가 효과적으로 계획·조정·수행되려면 최적 타이밍 결정이 우선되어야 한다고 보았다. 일정 계획이 수립되어 있지 못하면 병목현상이 발생하고 비효율이 내재돼 전체 시스템의 기능을 저하시킨다는 것이다.[16]

장점
  • 전체 일정을 한눈에 볼 수 있다
  • 각 업무사이의 관계를 보여줄 수도 있다.
단점
  • 변화 또는 변경에 약하다.
  • 일정계획에 있어서 정밀성을 기대하기 어렵다.
  • 작업상호간의 유기적인 관계가 명확치 못하다.[17]

각주

  1. 도표(diagram / graph / chart )〉, 《사이언스올》, 2015-09-09
  2. 차트〉, 《HiSoUR》
  3. 막대 그래프란?〉, 《TIBC》
  4. 막대 차트 (Bar Chart)〉, 《위키독스》
  5. 히스토그램〉, 《위키백과》
  6. 히스토그램 (Histogram)〉, 《위키독스》
  7. 선도표〉, 《위키백과》
  8. 라인 차트 (Line Chart)〉, 《위키독스》
  9. 원그래프〉, 《위키백과》
  10. 파이/도넛 차트 (Pie/Donut Chart)〉, 《위키독스》
  11. 선그래프〉, 《readonly》
  12. 제3교실플러스, 〈꺽은선그래프 배우기 〉, 《네이버 블로그》, 2012-08-27
  13. 산점도〉, 《나무위키》
  14. 14.0 14.1 시각화 차트 종류 14 종: 한 눈에 들어오는 가치를 잡아주기〉, 《파인리포트》
  15. 글쓴이, 〈[링크 글제목]〉, 《출처》, 20xx-xx-xx
  16. 간트차트〉, 《네이버 지식백과》
  17. 간트 차트〉, 《위키백과》

참고자료

같이 보기


  의견.png 이 차트 문서는 솔루션에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.