검수요청.png검수요청.png

그래프

해시넷
이동: 둘러보기, 검색

그래프(graph)란 여러 가지 자료를 분석하여 각각의 값이 차지하는 상대적 비중이나 시간에 따른 값의 변화를 직선이나 곡선을 사용하여 표시한 도표를 말한다. 차트(chart)라고도 한다. 원그래프, 막대그래프, 꺾은선 그래프 등이 있다.

개요[편집]

한자어로는 도표라고 한다. 수집된 통계 자료들을 단순히 표로 나열하는 것은 구체적인 수치를 파악할 수 있어서 좋지만, 가독성이 떨어진다. 하지만 이러한 자료들을 점, 선 등을 사용한 그래프로 바꿔서 표현하면 한눈에 알아보기도 좋고, 변화 추세와 경향성을 파악하는 데 도움이 된다. 또한, 직관적이고 이해하기 쉽기 때문에 자료를 지켜보는 사람들도 쉽게 통계정보를 받아들일 수 있다. 이러한 장점 덕분에 많은 신문기사나 서적, 논문, 자료 등에서 애용한다. [1]

그래프를 처음 만들기 시작할 때, 가장 먼저 생각해야 할 것은 그래프를 만드는 목적이다. 목적을 분명히 안 후에는, 어떤 분석 타입이 그 목적을 가장 잘 달성할 수 있는지가 중요하다.

시간에 따른 트렌드

시간이 경과함에 따른 그 트렌드를 추적하는 방법은 데이터를 분석하는 데에 있어 가장 많이 사용하는 방법 중 하나이다.

비교와 순위 매기기

데이터를 분석하는 또 다른 방법은 비교하고 순위를 메기는 것이다. 고객들이나 국가들을 비교하고 순위를 메길 때, 하나 혹은 둘 이상의 기준을 가지고 그 순위를 메긴다. 이렇게 순위를 매김으로써 각 고객들이나 국가들의 현재 위치와 어떻게, 얼마나 하고 있는지에 대해 알 수 있다.

연관성

측정하는 두 대상들 사이의 관계를 알고 있으면 아주 유용하다. 그 대상들 사이의 관계를 알 기 위해서 간단한 연관분석(correlation analysis)부터 시작해야 한다. 단순히 연관분석을 해서 그 대상들 간의 관계가 뚜렷하게 나오지는 않을 수 있다. 하지만 어떤 관계가 있을 것이라는 것을 암시해 주기 때문에 우리가 어느 정도 그 관계를 추측할 수 있다.

분포

분포(Distribution) 분석은 데이터 값들이 전체 범위들 사이에서 얼마나 퍼져있는지 보여주는 방법이다.

파트 투 호운

타블로(Tableau Software) 회사에 따르면, 두 가지 이유로 파트 투 허울 분석을 할 때 파이 차트 사용을 피하라고 한다.

  • 인간의 시각적 기능은 기본적으로 부분(area)을 추정하는 것을 못한다.
  • 바로 옆에 있는 조각들(slices)만을 분석할 수 있다.
지리 데이터

지도를 사용하는 것은 장소를 보여줄 때 아주 좋은 방법이다. 그러나 좀 더 깊은 분석을 위해서는, 그 지도에 다른 차트들을 추가하면 더 효과가 있다.[2]

활용[편집]

막대그래프[편집]

막대 그래프(Bar Chart)란 통계를 낼 때 사물의 양을 막대 모양의 길이로 나타낸 그래프를 말한다. 크고 작음을 한눈에 이해할 수 있기 때문에 이해하기에 가장 편리하다. 막대를 세로로 할 수 있고 가로로 할 수도 있다. 가독성 면에선 항목이 적을수록 가로가 좋고 항목이 많을수록 세로가 좋다. 막대그래프와 히스토그램은 주로 공시적 자료를 다룰 경우 쓰이는 그래프이다. 연속적 자료의 경우 히스토그램이라고 부르고, 불연속적(=이산적) 자료의 경우 막대그래프라고 부른다. 시각적으로 보아 둘 사이의 차이점은 막대들의 모양으로, 막대가 서로 붙어 있으면 히스토그램, 서로 떨어져 있으면 막대그래프이다.

그리는 방법
  • 막대가 세로 방향일 때를 기준으로 가로축에는 항목을, 세로축에 표시할 값의 범위와 이에 따른 눈금을 표시하고, 알맞게 막대를 그린다.
  • 모든 막대가 서로 떨어져 있는 경우도 있지만, 몇 개의 막대를 하나의 묶음으로 만들어서 여러 개의 묶음으로 표시하는 경우도 있다. 후자의 경우는 구별을 위하여 각 묶음 사이의 간격이 드러나게 해야 하며, 묶음의 각 막대 사이에 간격을 두는 경우 그 간격과 묶음 간의 간격이 눈에 띄게 차이 나게 그려야 한다. 또, 묶음의 각 막대의 색을 서로 달리하여 각 막대가 무엇을 의미하는지 정확히 알 수 있게 해야 한다. 예를 들어 각 학년별 남학생 수와 여학생 수를 알고 싶다고 할 때, 학년별로 막대를 묶어서 학년의 개수만큼 묶음을 만든 후, 각 묶음의 막대가 남학생, 여학생의 수를 의미하게 할 수 있다. 이때 남학생에 해당하는 막대는 A 색, 여학생에 해당하는 막대는 B 색으로 하여 서로 구분되게 한다.
  • 막대를 가로 방향으로 그리는 경우에는 항목을 표시하는 축이 세로축, 값을 표시하는 축이 가로축이 된다. 즉 각 요소(축, 값 표시, 항목 표시 등)의 배치, 막대의 방향 등이 세로 막대그래프와 가로, 세로가 반대라고 생각하면 된다.
  • 누적된 값을 비교하고 싶으면 누적 막대그래프를 그릴 수 있다. 각 항목별로 한 막대 위에 다른 막대를 그리는 식으로 여러 개의 막대를 누적해서 그리는 방법으로, 상술한 몇 개의 막대를 묶어 표현하는 방법과 어느 정도 비슷하다고 할 수 있다. 이 방법을 학년/성별 학생 수를 구하는 위 예시에 적용하자면 각 학년별로 남학생 수에 해당하는 막대 바로 위에 여학생 수에 해당하는 막대를 그려서 각 학년별 학생의 수를 비교할 수 있다.
  • 특정 몇몇 항목의 값이 다른 항목들의 값과 크게 차이 나는 경우 물결무늬로 그 중간을 생략할 수 있다. 물론 그 중간에 해당하는 값을 가진 항목이 없어야 한다. [3]

선 도표[편집]

선 그래프(Line Chart) 또는 꺾은 선 그래프는 수량을 점으로 표시하고 그 점들을 선분으로 이어 그린 그래프를 말한다. 시간에 따라 뭔가가 지속적으로 변화하는 것을 기록할 때 유용하다. 조사하지 않은 중간의 값도 대략 예측할 수 있다는 장점이 있다. 선 그래프는 연속적 자료를 다루거나 통시적 자료를 다룰 경우, 동일하거나 일련의 관찰대상의 추이를 비교할 경우, 추세(trend)를 관찰할 경우에 쓰이는 그래프이다. 이 그래프는 시각적으로 좋은 모양새를 만드는 것이 중요하다.[4]

역사

초기에 알려진 선도표 중 일부는 일반적으로 프랜시스 혹스비, 니콜라스 사무엘 크루퀴우스, 요한 하인리히 람베르트, 윌리엄 플레이페어에 의해 착안되었다.[5]

면적 그래프[편집]

일반적으로 통계 그래프라고 하면 선 그래프나 막대그래프를 많이 사용한다. 그러나 선이나 점이 아닌 도형의 면적을 이용하여 통계 수치의 크기를 나타낼 수도 있는데 이를 면적 그래프(Area Chart) 또는 면적 도표라 한다. 선 그래프나 막대그래프는 변화의 추이를 살펴보는데 유용한 반면, 면적그래프는 두 개 이상의 자료를 비교할 때 용이하게 쓰인다.[6]

원 그래프/파이도[편집]

원그래프(Pie chart)는 전체에 대한 각 부분의 비율을 부채꼴 모양으로 나타낸 그래프이다. 각 부채꼴의 중심각이 전체에서 차지하는 비율을 나타내며, 비율을 한눈에 볼 수 있다는 장점이 있다. 전체적인 비율을 쉽게 파악할 수 있어서 언론사에서 통계 수치를 공개할 때 자주 활용된다.

작성법

원그래프는 수치데이터를 표현한다. 먼저 전체에 대한 각 항목의 백분율을 계산한다. 그다음 항목이 차지하는 백분율만큼 원을 나눈다. 마지막으로 각 항목의 명칭, 백분율을 적는다. 원그래프를 나누어 나온 백분율의 합이 100%가 되는지 확인해야 한다.[7]

산점도[편집]

산점도(Scatter Plot)에서 데이터점의 분포를 살펴봄으로써 변수 간의 상관성을 초혼할 수 있다. 변수 간의 상호 관계가 존재하지 않으면 산점도에서는 이산점을 랜덤하게 분포하는 것으로 표현되다는 반면에 어떤 연관성이 있으면 대부분의 데이터점은 상대적으로 밀집되어 어떤 추세로 나타날 것이다.[8]

산점도(scatter plot, scatterplot, scatter graph, scatter chart, scattergram, scatter diagram)는 가로축(X축)과 세로축(Y축)을 설정한 좌표평면 상에서 각각의 관찰 값들을 점이나 X 문자로 표시하는 방식이다. 물론 두 축이 의미하는 바가 무엇인지부터 확실하게 정의되어야 한다. 산점도는 나중에 회귀 분석(regression)을 할 때 굉장히 중요하다. 특정 관찰 값의 정보를 표시하려면 소괄호를 치고 X축 값과 Y축 값을 쉼표로 구분하여 표기하면 된다. 산점도는 관찰 값이 특정 범위에 지나치게 몰려 있을 때 읽기 어렵다. 이 경우는 별도로 이 부분만 확대시켜서 추가 산점도를 그려야 한다. 또한 X축과 Y축 중 어느 하나에도 질적 자료가 들어가면 안 된다. 만일 X축(독립변인)이 질적 자료일 경우에는 산점도와 회귀분석을 쓰는 것보다는 차라리 분산분석(ANOVA), Y축(종속변인)이 질적 자료일 경우에는 로짓분석(logistic regression), 둘 다 질적 자료일 경우에는 교차 표 분석(cross tabulation)을 쓰는 것이 좋다.[9]

버블 차트[편집]

버블 차트(Bubble Chart)란 데이터의 흐름을 평가하는 시스템 분석에 사용하는 차트의 하나이다. 선이나 화살표로 이어지는 주석이 붙은 원(풍선 모양)으로 프로그램이나 시스템 내에서 동작 대상이 되거나 이동하는 데이터에 적용되는 조작, 절차를 나타내는 것을 말한다. 계통도나 플로차트 대신 버블 차트를 사용하는 것은 각 부분 간의 구조적, 순차적 또는 절차상의 관계를 주안점으로 하지 않고 주로 전체의 각 개념이나 부분 간의 연관을 기술하기 위해서이다. [10]

버블 차트는 데이터 포인트가 거품으로 대체되는 분산형 차트의 변형으로 간주될 수 있다. 마이크로 소프스에서 설명하는 것처럼 데이터에 각각 값 집합이 포함된 세 개의 데이터 시리즈가 있는 경우 분산형 차트 대신 거품형 차트를 사용할 수 있다.[11]

방사형 그래프[편집]

방사형 그래프(Rader Chart)는 한 사이클 수치의 변화를 나타내는 데 사용될 수 있고 특정 대상 주요 변수의 상대적인 관계를 나타내는 데도 사용된다. 방사형 그래프는 재무분석에서 자주 사용되고, 기업 부채 능력, 운영 능력, 영리 및 발전능력 등의 지표를 분석하기 위함이다.[8]

방사형차트는 4~5개 또는 그 이상의 항목에 대해 2~4개 정도의 업체를 비교하는데 유용하다. 예를 들면 당사, 업체 1위, 업체평균에 대해서 재무비율 분석을 하는 것이다. 3개 업체의 영업체의 영업이익률, 총자산수익률, 총자산회전율, 유동비율, 부채비율, 매출액 성장률 등을 비교할 때 사용하면 가독성이 좋다. 비교하는 항목이 더 많아져도 유용하다.[12]

프레임 다이어그램[편집]

프레임 다이어그램(Frame Diagram)은 트리 구조로 계층적 구조를 표시하는 시각화 방법의 일종으로 계층적 관계를 분명하게 보여준다.[8]

깔때기 도표[편집]

1984년 Light와 Pillemer에 의해 소개된 깔때기 도표(Funnel Plot)는, 분포가 깔때기와 같다고 하여 붙여진 이름이다. 주로 문헌 고찰, 메타 분석, 연구분야의 정밀도를 분석하는 보조 장치로 사용되는 도표이다. 본 목적을 초월하는 용도로 사용되며 여러 분야에서 발전될 가능성이 높은 기법이다.[13]

깔때기 도표는 한층한층 분석하는 과정에서 사용된다. 이로써 총 값(맨 꼭대기)에서 무관심한 부분을 끊임없이 제거하고 결국 관심의 값을 얻는 과정이다. 사다리꼴 면적으로 어떤 고리의 업무량과 위의 고리 사시의 차이를 표시한다.[8]

워드 클라우드 차트[편집]

워드 클라우드 차트(Word Cloud Chart)는 텍스트 데이터를 시각화할 수 있다. 텍스트 값을 표시하며 크기는 측정값을 기반으로 한다. 사용 시간, 사전 군, 중요도별 또는 상황별 등 측정하려는 모든 사항이 측정값이 될 수 있다. 다양한 다양한 모양, 글꼴, 레이아웃 및 색 구성표로 차트를 사용자가 지정할 수 있다. 이는 시가화 번들에 포함되어 있다.

요구사항

워드 클라우드 차트에는 하나의 차원과 하나의 측정값이 있어야 한다.

사용시기

워드 클라우드 차트를 사용하면 측정값에 대해 값의 중요성을 시각화하고 식별할 수 있다. 측정값에 대해 더 중요한 값이 클라우드에 더 크게 표시된다. [14]

간트 차트[편집]

간트 차트(Gantt chart)는 현대 기업 프로젝트 관리 분야에서 가장 광범위적으로 운영하는 차트이다. 이 차트는 관리자가 작업 프로세스를 명확하게 파악할 수 있도록 지원함으로써 기업의 운영 효율성을 향상시킨다. [8]

간트 차트(Gantt chart)는 프로젝트 일정관리를 위한 바(bar) 형태의 도구로서, 각 업무별로 일정의 시작과 끝을 그래픽으로 표시하여 전체 일정을 한눈에 볼 수 있다. 또한 각 업무(activities) 사이의 관계를 보여줄 수도 있다.

역사

최초의 간트 차트는 카롤 아다미키(Karol Adamiecki)가 하모노그램(Harmonogram)이라는 이름으로 고안하였다. 아다미키는 1931년까지 이것을 발표하지 않았기 때문에 결국 헨리 간트(Henry Gantt)의 이름이 붙게 되었다. 헨리 간트는 자신이 고안한 차트를 1919년 엔지니어링 매거진(The Engineering Magazine)에 "Work, Wages and Profit"이라는 제목으로 발표하였다. 1980년대에 들어서 개인용 컴퓨터를 써서 간트 차트를 쉽게 만들 수 있게 되었다. 이러한 응용 프로그램은 프로젝트 일정 관리에 주로 사용되었다. 1990년대 후반에서 2000년대까지 간트 차트는 협업 소프트웨어 등 웹 기반에서 가장 흔한 차트가 되었다. [15]

지도/맵[편집]

지도는 구역 지도, 포인트 맵, 플로 맵 등 3가지로 나뉘고 색상을 사용하여 지도 파티션에 있는 특정 범위의 값의 분포를 나타내는 지도이다.[8]

열지도[편집]

열지도(heatmap)는 지리적 구역에 있는 각 점의 가중치를 나타내고 특별히 하이라이트 형식으로 방문객이 자무 방문하는 영역 및 방문객이 있는 지리적 영역을 표시한다. 열지도의 색상은 일반적으로 밀도를 의미한다. [8]

각주[편집]

  1. 그래프 나무위키 - https://namu.wiki/w/%EA%B7%B8%EB%9E%98%ED%94%84
  2. Cheon, 〈데이터 분석 종류에 따른 올바른 차트 타입 고르기〉, 《브런치》, 2016-08-05
  3. 막대 그래프 나무위키 - https://namu.wiki/w/%EB%A7%89%EB%8C%80%20%EA%B7%B8%EB%9E%98%ED%94%84
  4. 선 그래프 나무위키 - https://namu.wiki/w/%EC%84%A0%20%EA%B7%B8%EB%9E%98%ED%94%84
  5. 선도표 위키백과 - https://ko.wikipedia.org/wiki/%EC%84%A0%EB%8F%84%ED%91%9C
  6. 두산백과, 〈면적그래프〉, 《네이버 지식백과》
  7. 원그래프 위키백과 - https://ko.wikipedia.org/wiki/%EC%9B%90%EA%B7%B8%EB%9E%98%ED%94%84
  8. 8.0 8.1 8.2 8.3 8.4 8.5 8.6 skila, 〈간트 차트 외에 14가지 데이터 시각화 차트도 추천! 한 눈의 들어오는 가치를 잡아주기〉, 《개인 블로그》, 2019-11-14
  9. 산점도 나무위키 - https://namu.wiki/w/%EC%82%B0%EC%A0%90%EB%8F%84
  10. IT용어사전, 〈버블 차트〉, 《네이버 지식백과》
  11. 버블 차트 위키백과 - https://en.wikipedia.org/wiki/Bubble_chart
  12. DY경영연구소, 〈엑셀차트〉, 《네이버 블로그》, 2020-05-03
  13. 박세훈, 〈(SAS 프로그래밍) Funnel Plot - 깔때기 도표 (이론)〉, 《SYS 코리아》
  14. 워드 클라우드 차트〉, 《클릭》
  15. 간트 차트 위키백과 - https://ko.wikipedia.org/wiki/%EA%B0%84%ED%8A%B8_%EC%B0%A8%ED%8A%B8

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 그래프 문서는 수학에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.