검수요청.png검수요청.png

"데이터 사이언스"의 두 판 사이의 차이

해시넷
이동: 둘러보기, 검색
(데이터 사이언스 구성원)
(참고자료)
36번째 줄: 36번째 줄:
 
* 〈[https://ko.wikipedia.org/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0_%EC%82%AC%EC%9D%B4%EC%96%B8%EC%8A%A4 데이터 사이언스]〉, 《위키백과》
 
* 〈[https://ko.wikipedia.org/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0_%EC%82%AC%EC%9D%B4%EC%96%B8%EC%8A%A4 데이터 사이언스]〉, 《위키백과》
 
* 〈[https://media.fastcampus.co.kr/knowledge/data-science/datascience/ 데이터 사이언스 이상과 현실? 비즈니스에서 데이터 사이언티스트의 역할]〉, 《패스트캠퍼스》, 2021-05-07
 
* 〈[https://media.fastcampus.co.kr/knowledge/data-science/datascience/ 데이터 사이언스 이상과 현실? 비즈니스에서 데이터 사이언티스트의 역할]〉, 《패스트캠퍼스》, 2021-05-07
 +
* Tidyverse Korea, 〈[https://statkclee.github.io/data-science/ds-education.html#4_%EB%8D%B0%EC%9D%B4%ED%84%B0_%EC%82%AC%EC%9D%B4%EC%96%B8%EC%8A%A4_%EC%9E%91%EC%97%85%ED%9D%90%EB%A6%84%EB%8F%84 데이터 과학 (Data Science)]〉, 《깃허브》, 2020-07-06
  
 
==같이 보기==
 
==같이 보기==

2021년 7월 16일 (금) 11:48 판

데이터 사이언스(Data Science)란 데이터 마이닝(Data Mining)과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야다.

개요

데이터 사이언스는 데이터를 통해 실제 현상을 이해하고 분석하는 방법론을 통합으로 하는 개념으로 정의할 수 있다. 데이터의 구체적인 내용이 아닌 서로 다른 성질의 내용이나 형식의 데이터에 공통으로 존재하는 성질, 또는 그것들을 다루기 위한 기술의 개발에 착안점을 둔다는 특징을 가진다. 사용되는 기술은 여러 분야에 걸쳐있으며 수학, 통계학, 계산기 과학, 정보공학, 패턴 인식, 기계 학습, 데이터마이닝, 데이터베이스 등과 관련이 있다. 데이터 사이언스는 생물학, 의학, 공학, 사회학, 인문학과 등의 여러 분야에 응용되고 있다.[1]

데이터 사이언티스트

데이터에서 통계나 머신러닝(Machine Learning) 기술을 활용하여 비즈니스 기회를 찾고, 이를 현실화 하는 사람이 바로 데이터 사이언티스트(Data Scientist)이다. 데이터 사이언스에서 '사이언스(Science)'는 과학을 말한다. 과학은 가설을 세우고, 실험을 설계한 뒤 수행하고, 그 결과를 분석하는 과정을 계속 해서 반복한다. 즉, 데이터 사이언티스트는 실험을 통해 문제를 개선하고 그 개선 결과를 분석하여 다음 실험과 액션을 도출하는 사람을 말한다. [2]

데이터 사이언스 작업흐름도

데이터 사이언스 구성원

주로 데이터 사이언스 팀은 크게 4가지의 역활로 나눌 수 있다.

  • 데이터 엔지니어(Data Engineer) : 기본적으로 대량의 데이터를 수집, 저장, 관리하는 역할이 주된 업무로 한다. 이를 위해서 SQL(Structured Query Language)이 기본 기술이고 데이터 수집과 자동 처리룰 위해서 자바(Java), 스칼라(Scala), 파이썬(Python)이 주된 기술로 전산 기본기가 특히 중요하다.
  • 데이터 분석가(Data Analyst) : 대쉬보드를 생성하고, 가설 검정, 데이터 시각화를 주된 업으로 하며 일차적으로 누군가 혹은 특정 장소에 저장된 데이터를 바탕으로 탐색적 데이터 분석을 수행하는 것을 업으로 한다. 이런 업무를 무리없이 수행하기 위해서 엑셀(Excel) 혹은 구글 쉬트와 같은 스프레이쉬트를 자유자제로 다룰 수 있는 기본기가 필요하고, 데이터를 추출하기 위해서 SQL 쿼리 기술, 대쉬보드 작성을 위해 루커(looker), 타블로(Tableau), 파워 BI(Power BI)를 활용할 수 있어야 한다.
  • 데이터 사이언티스트 : 오랫동안 통계학을 공부하여 실험을 설계하고 운영하며 결과를 토대고 인과(causality)를 추론하고 전통적인 기계 학습(Traditional Machine Learning) 즉 정형 RDBM(Relational Database Management System)에서 SQL을 사용해서 데이터를 추출하여 통계 모형 개발을 개발하는 업무를 주로한다.
  • 기계 학습 과학자(Machine Learning Scientist) : 예측과 분류를 주된 업으로 하고 최근 들어 강조되고 있는 비정형 데이터 이미지와 텍스트를 딥러닝(Deep Learning) 방법론을 활용하여 개발하는 작업을 주된 업무로 한다. 이를 위해서 R과 파이썬을 주된 프로그래밍 언어로 강한 통계, 확률, 미적분, 선형대수 지식을 갖춰야 한다.[3]

데이터 사이언스 응용 분야

데이터는 산업의 필수 요소이기 때문에, 오늘날 세계에서 가장 인기 있는 분야인 데이터 사이언스는 많은 응용 분야를 가지고 있다.

은행

금융

제조업

수송

의료

전자 상거래

각주

  1. 데이터 사이언스〉, 《위키백과》
  2. 데이터 사이언스 이상과 현실? 비즈니스에서 데이터 사이언티스트의 역할〉, 《패스트캠퍼스》, 2021-05-07
  3. Tidyverse Korea, 〈데이터 과학 (Data Science)〉, 《깃허브》, 2020-07-06

참고자료

같이 보기


  검수요청.png검수요청.png 이 데이터 사이언스 문서는 프로그래밍에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.