검수요청.png검수요청.png

더그 커팅

해시넷
heewonkim (토론 | 기여)님의 2021년 1월 29일 (금) 12:05 판
이동: 둘러보기, 검색
더그 커팅 (Douglass Read Cutting)
아파치 소프트웨어 재단 (Apache Software Foundation)
스탠포드 대학 (Stanford University)

더그 커팅(Douglass Read Cutting)은 소프트웨어 디자이너이자 오픈 소스 검색 기술의 옹호자이자 창안자이다. 루씬(Lucene)을 설립하고, 마이크 카파렐라(Mike Cafarella)와 같이 아파치 너치(Nutch)등 오픈 소스 검색 기술 프로젝트를 모두 설립했으며, 현재는 아파치 소프트웨어 재단(Apache Software Foundation)을 통해 관리되고 있다. 더그 커팅과 마이크 카파렐라는 아파치 하둡(Apache Hadoop)의 공동 창립자이다.[1]

생애

더그 커팅은 1981년에 스탠포드 대학(Stanford University)에 입학했고, 1985년에 언어학 학사 학위를 받았다. 루씬(Lucene)을 개발하기 전에 더그 커팅은 팰로앨토 연구소(Xerox PARC)에서 검색 기술 직책을 맡아 수집 / 분석 알고리즘(Scatter/Gather algorithm) 및 계산 양식(computational stylistics) 대해 연구했다. 더그 커팅은 익사이트(Excite), 비트윈(V-Twin)에서 검색 엔진의 수석 디자이너로 일했었고, 텍스트 검색 프레임워크의 주요 저자였던 애플(Apple Inc.)에서도 일했다.[1]

경력

  • 1981년 - 스탠포드 대학교 입학
  • 1985년 - 언어학 학사 학위 취득
  • 1986년 - 스코틀랜드 에든버러의 음성 기술 연구 센서에서 연구 조교
  • 1987년 - 팰로앨토 연구소(Xerox PARC)에서 연구원 취직
  • 1992년 - 애플(Apple Inc.)에서 첨단 기술 그룹 수석 기술자
  • 1996년 - 익사이트(Excite)에서 수석 엔지니어
  • 2000년 - 인프라서치(InfraSearch)에서 수석 엔지니어
  • 2001년 - 그랜드 센트럴에서 수석 엔지니어
  • 2001년 - 아파치 소프트웨어 재단 커미터(Committer)
  • 2005년 - 인터넷 아카이브에서 검색부분 이사를 담당
  • 2006년 - 야후의 기술 담당
  • 2009년 - 아파치 소프트웨어 재단의 디렉터(Director), 이사회에 선출[1]
  • 2009년 - 클라우데라(Cloudera) 수석 설계사
  • 2016년 - 오픈 소스 소프트웨어 연구 센터(CROSS)의 조언자
  • 2010년 - 아파치 소프트웨어 재단의 회장으로 선출
  • 2019년 - 웰컴 트러스트(Wellcome Data Labs)의 조언자, 자문 그룹 회원
  • 2020년 - 카머스 에너지의 오픈 소스 전략에 대한 자문에 대한 조언자 [2]

수상 및 영예

  • 2015년 - 구글 오'리얼리 오픈 소스 어워드(Google O'Reilly Open Source Award) 상을 받았다.[1]

주요 활동

오픈 소스 프로젝트

검색 인덱서인 루씬(Lucene)과 스파이더 또는 크롤러인 아파치 너치(Nutch)는 오픈 소스 일반 검색 플랫폼의 두 가지 핵심 구성 요소로, 먼저 웹에서 콘텐츠를 탐색한 다음 검색 기능을 한 인덱스로 구조화한다. 이러한 두 프로젝트는 리눅스, MySQL등 일반적인 오픈 소스 소프트웨어 프로젝트의 리더가 되어 이러한 오픈 소스 소프트웨어 프로젝트의 개념과 기능을 검색의 영역까지 수직으로 확장시켰다.[1]

맵리듀스 패러다임 사용

2004년 12월, 구글 리서치(Google Research)는 대규모 서버 클러스터에서 대규모 계산을 사소하게 병렬화 할 수 있는 맵리듀스(MapReduce)알고리즘에 대한 논문을 발표했다. [1] 이러한 맵리듀스는 더욱 효율적인 분산 처리가 가능하다. 이 때 더그 커팅과 마이크 카파렐라는 이러한 구글에서 논문으로 발표한 맵리듀스 기반으로 분산 파일 시스템으로 NDFS(Nutch Distributed File System)를 본격적으로 작업하기 시작한다. 2005년 12월에 NDFS는 더그 커팅이 자신의 아들이 가지고 놀던 코끼리 인형의 이름에서 따와 하둡(Hadoop)프레임워크라고 이름을 붙인다. 하둡은 20개의 노드에서 안정적으로 실행되는 모습을 보인다. 이때 야후!(Yahoo!)도 구글과 같은 분산 파일 시스템을 고민하던 중이였고, 자연스럽게 하둡에 관심을 두게 되었고 본격적으로 2006년 더그 커팅을 하둡 프로젝트에 합류시킨다. 2007년에 페이스북(Facebook), 트위터(Twitter), 링크드인(Linkedin)과 같은 소셜네트워크서비스, SNS에서 하둡을 적용하면서 새로운 시대인 빅데이터 시대를 대표하는 오픈 소스로 자리매김 하게 되었다.[3]

각주

  1. 1.0 1.1 1.2 1.3 1.4 1.5 Doug Cutting〉, 《Wikipedia》
  2. Doug Cutting〉, 《linkedin》
  3. 루나, 〈빅데이터 시대를 열다, 하둡을 창시한 더그 커팅〉, 《브런치》, 2020-04-16

참고자료


  검수요청.png검수요청.png 이 더그 커팅 문서는 컴퓨터에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.