검수요청.png검수요청.png

왓슨

해시넷
leod0904 (토론 | 기여)님의 2020년 7월 14일 (화) 15:59 판
이동: 둘러보기, 검색
왓슨(Watson)
왓슨(Watson)
IBM(아이비엠)

왓슨(Watson)은 인간의 자연어 형식의 질문들에 답할 수 있는 인공지능 컴퓨터이다. 시험 책임자 데이비드 페루치(David Ferrucci)가 주도한 아이비엠(IBM)의 딥큐에이(DeepQA) 프로젝트를 통해 개발되었다.

개요

왓슨은 사람의 목소리를 인지하고 인간이 묻는 질문의 답을 찾아 음성으로 답한다. 인간을 닮은 컴퓨터 튜링의 기계인 인공지능은 아이비엠 연구소가 개발한 왓슨에 의해 현실화되었다. 인간의 언어로 묻는 질문을 알아듣고 빠른 시간 안에 답을 찾아내어 음성으로 답하는 왓슨 컴퓨터는 인간의 지능과 닮았을 뿐만 아니라 속도와 정확성에서는 인간의 능력을 앞섰다. 아이비엠의 초대 회장 토머스 왓슨(Thomas John Watson)에서 이름을 따온 왓슨은 "고도의 자연 언어처리, 정보수집, 지식재현, 사고, 기계학습을 질문-응답 영역에 적용한 것"이라고 한다. 왓슨은 파워 세븐(power 7) 프로세서와 아이비엠의 딥큐에이 소프트웨어를 결합했다. 90개의 아이비엠 파워 750(Power 750) 서버로 구성되고, 총 2880개의 파워세븐 코어 프로세서가 작동하며 18테라바이트의 램을 이용한다.

역사

2004년 아이비엠 연구책임자가 동료들과 식사를 하는 도중에 미국의 텔레비전 퀴즈쇼인 제퍼디 게임을 시청하느라 모두 침묵에 빠진 것에 주목했다. 식사 중이던 레스토랑 손님들이 다들 텔레비전 앞으로 모여들었다.[1] 2005년 아이비엠 연구팀 이사 폴 혼은 찰스 리켈에게 개발자들을 배정해 주면서, 제퍼디에서 인간을 이기는 왓슨 개발을 해보라고 지시했다. 1년 뒤인 2006년 아이비엠 개발부서의 수석 매니저 데이비드 페루치가 최초의 테스트를 하였다. 테스트에서 경쟁자인 사람 중에서 최고 득점자는 왓슨보다 절반의 시간 만에 95%를 맞추었는데, 왓슨은 15%만 맞추었다. 2007년 왓슨 개발팀은 이 문제를 해결하기 위해 3년에서 5년의 개발 기간과 15명의 연구자를 배정받았다. 2008년 개발팀은 제퍼디 챔피언과 겨룰 수 있는 수준으로 왓슨을 개발했다. 그리고 2010년, 마침내 왓슨은 인간 경쟁자를 이겼다. 왓슨은 4테라바이트의 디스크 공간의 구조화/비구조화된 콘텐츠에 접근하였는데 경기가 치러지는 동안에는 인터넷에 연결되지 않았다. 각 단서마다 왓슨의 가장 가능성 있는 세 개의 응답이 텔레비전 화면에 띄워졌고, 게임 신호 장치에서 자신과 경쟁하는 사람들을 지속해서 앞질렀다. 하지만 몇 개의 낱말로 된 몇 개의 단서만 가지고 있는 일부 분류에 응하는 데에는 문제가 있었다.[2]

작동 방식

질문이 왓슨에게 주어졌을 때, 질문의 주요 특성을 추출하기 위해 질문을 분석한다. 답변을 포함할 가능성이 있는 구문의 자료나 정보의 모음을 찾아서 일련의 가설을 생성한다. 다양한 추론 알고리즘을 사용하여 질문의 언어와 각 가능성 있는 응답 언어 간의 비교를 수행한다. 이 단계는 서로 다른 비교를 수행하는 수 백개의 추론 알고리즘이 사용되기 때문에 매우 어려운 작업이다. 어떤 것은 시간과 공간의 특징을, 어떤 것은 맥락 정보와 관련된 정보 소스를 찾는다. 각 추론 알고리즘은 각각 집중하는 영역에 기반하여 질문에 의해 가능 답변이 추론되는 정도를 점수로 만들어 낸다. 각 결과 점수는 왓슨이 훈련 기간 동안 해당 도메인에서 두 개의 유사한 구문 간의 추론을 생성할 때, 얼마나 잘 수행된 알고리즘인지를 알게 되는 통계 모델에 의해 가중치가 부여된다. 이 통계 모델은 왓슨이 질문에 대한 답변 후보들에 대한 신뢰도를 요약할 때 사용된다. 왓슨은 다른 답변들보다 강력한 후보라고 생각하는 답변을 찾을 때까지 각 답변 후보에 대해 이 과정을 반복한다.[3]

서비스

2014년 1월 클라우드 기반의 왓슨 코그니티브 컴퓨팅의 개발과 상용화를 전담하는 사업 조직인 아이비엠 왓슨이 신설되었다. 현재 왓슨은 개발자들이 쉽게 코그니티브 애플리케이션을 작성할 수 있도록 왓슨 디벨로퍼 클라우드를 통해 응용 프로그램 인터페이스(API) 형태로 제공하고 있으며, 깃허브(GitHub)를 통해서 샘플 코드(sample code)도 제공하고 있다.

  • 언어(language) : 알케미 언어(alchemy language)는 텍스트, URL을 통해 키워드와 감정, 정보를 파악한다. 컨버세이션(conversation)은 사용자와 자연어로 상호작용할 수 있도록 지원하며 다큐먼트 컨버세이션은(document conversation) 기존의 문서를 사용자가 필요한 형식으로 변환한다. 7개의 언어로 도메인별 전문 번역을 제공하며, 자연어 분류(natural language classifier)를 통하여 문장을 파악하고 어느 주제에 속하는지를 분류할 수 있다. 성격 분석 기능(personality insights)은 소셜미디어나 텍스트를 분석하여 개인 성향을 분석하고, 리트리브 앤드 랭크(retrieve and rank)는 사용자의 질문에 가장 연관성이 높은 결과를 보여준다. 톤 애널라이저(tone analyze)는 언어학적 분석을 통해 커뮤니케이션 안의 텍스트에서 감정, 사회적 경향, 글의 스타일을 추출한다.
  • 말하기(speech) : 스피치 투 텍스트(speech to text)는 음성을 텍스트로 변환하고, 텍스트 투 스피치는(text to speech) 텍스트를 음성으로 변환한다.
  • 이미지(visoin) : 비주얼 인식(visual recognition)을 통하여 50개 이상의 이미지를 트레이닝하면 왓슨이 스스로 학습하고 학습한 결과를 토대로 사진의 대상이 학습한 대상과 유사한지 확인한다.
  • 데이터 분석(data insights) : 알케미데이터 뉴스(alchemydata news)는 매일 생산되는 25만에서 30만개의 뉴스와 블로그 기사를 통해 60일 분량을 분석하여 주제, 키워드, 감정 정보 등을 파악한다. 디스커버리(discovery)는 애플리케이션에 연계하여 더 나은 의사결정을 위해 패턴, 추세 및 통찰력을 식별할 수 있도록 지원하는 인지적인 검색과 컨텐츠 분석 엔진이다. 트레이드오프 애널리틱스(tradeoff analytics)는 사용자의 고려요소를 분석하여 최선의 선택을 하도록 돕는다.
  • 체화된 인지(embodied cognition) : 프로젝트 인투(project intu)는 다양한 인지 서비스를 다양한 장비, 공간 및 물건과 통합할 수 있도록 지원한다.[3]


적용 분야

의료·헬스케어

임상 의사 결정 지원시스템(CDSS)은 환자 특이적인 사정과 권고안을 주기 위한 목적으로 정보화된 지식 데이터베이스 기반에, 환자 개개인의 특징을 접목시킨 임상적 의사결정을 직접적으로 돕기 위해 고안된 임의의 소프트웨어 또는 환자의 돌봄 과정에서 진단이나 치료와 관련된 임상적 의사결정을 개선하기 위해 고안된 임의의 시스템을 뜻한다. 임상 의사 결정 지원시스템이 사용되는 분야는 크게 두 가지로 나눈다. 첫째, 의학적 관리 분야로 헬스케어를 위한 정보를 검색하거나 의료인에 의해 요구된 정보를 제공하기 위한 분야이다. 둘째, 임상적 분야로서 환자를 진단하고 치료하기 위한 약물 제조에 대한 경고 및 조언 기능에 초점을 맞춘 분야이다. 임상 의사 결정 지원시스템은 특정 환자와 관련된 주의, 경고, 추적조사, 임상예측규칙, 계산, 알고리즘 및 리마인더를 발생시킨다. 이러한 시스템은 급성 또는 이차적 진료, 예방, 진단 시 질병 관리, 영상의 인식 및 해석 등에서 사용된다. 미국의 경우 전자식 건강기록(EHR)을 의무화하고 있으며, 모든 헬스케어 시설에 전자식 건강기록을 의무화했을 때의 목표는 수집된 환자 데이터를 임상 의사 결정 지원시스템을 통해 분석하여 더 우수하고 저렴한 헬스케어를 추진하는 것이다. 우리나라의 경우 대부분의 상급종합병원에서 전자의무기록을 도입하고 있음으로 왓슨과 같은 컴퓨터를 이용한다면 한국인의 질병을 체계적으로 분석하고 치료 경과 등을 파악할 수 있을 것으로 예상된다.

데이터마이닝(data mining)이란 대량의 데이터로부터 쉽게 드러나지 않는 유용한 정보들을 추출하는 과정을 뜻한다. 데이터마이닝을 효과적으로 수행하기 위해서는 시계열분석 등 각종 통계기법과 데이터베이스 기술뿐만 아니라 산업공학, 신경망, 인공지능, 전문가 시스템, 퍼지이론, 패턴인식, 기계학습, 불확실성 추론, 정보검색에 이르기까지 각종 정보기술들을 사용하게 된다. 데이터마이닝을 흔히 데이터베이스에서 지식발견, 혹은 지식 추출, 정보 수확, 정보 고고학, 데이터 패턴 처리 등으로도 통용된다. 의료산업에서 데이터마이닝은 병원에서 진료진에 의해 작성된 각종 기록, 각종 장비에서 측정된 환자의 생체정보, 환자에게 투약된 약, 각종 시술을 바탕으로 하여 환자의 질병에 대한 치료 경과, 약품의 효과 등을 데이터마이닝을 통해 추출해 낼 수 있다.[4]

  • 가천대 길병원 : 2012년 한국 가천대학교 길병원은 국내 최초로 메모리얼슨론케터링(MSK)암센터에서 아이비엠 왓슨을 도입하였다. 유방암, 폐암, 대장암, 직장암, 위암 치료에 활용하고 있다. 레지던트 생활을 하며 암 환자의 진료를 터득하여 현재도 교육을 받고 있다. 선진 의료기관의 자체 제작 문헌과 290종의 의학 저널, 200종의 교과서의 전문자료를 습득하였다. 왓슨은 의료진의 소견서와 진단서에 나타난 정형 및 비정형 자료의 의미와 맥락을 분석하고 이를 이용하여 환자의 특성에 맞는 맞춤치료 옵션을 제안한다.[5][6]
  • 언더아머(under armour) : 미국 스포츠웨어 브랜드인 언더아머는 자사 헬스케어 앱 유에이레코드(UA Record)에 왓슨 기술을 적용했다. 수면, 운동, 활동, 영양 정보를 추적하여 개인의 건강관리사, 운동 트레이너 역할을 수행한다. 향후에는 아이비엠이 보유하고 있는 빅데이터를 언더아머 사용자들이나 전문 선수들의 코칭에 사용할 수 있는 앱이 제작될 계획이다. 또한 날씨가 운동 성과나 코칭 활동에 미치는 영향 등 부가적인 데이터 분석 기능도 포함될 예정이다.[7]

유통

  • 노스페이스 : 아웃도어 브랜드 노스페이스는 2015년 온라인 쇼핑몰 도우미 플루이드리테일(Fluid Retail)을 선보였다. 방문자가 쇼핑 중 던진 질문을 분석하여 구매 결정을 도는 서비스이다. 소비자들의 온라인 쇼핑 패턴을 분석하고 유통기업과 연계하여 소비자가 필요로하는 정보를 제공한다. 또한 방대한 분량의 상품 정보, 리뷰, 전문가 코멘트 등을 분석하여 고객의 니즈에 최적으로 부합하는 상품을 매칭한다.[8]
  • 메이시스 : 백화점 체인 메이시스(Macy's)는 오프라인 매장 탐색용 웹서비스 메이시스온콜(macy's on call)을 출시했다. 방문객은 매장별 제품 위치, 서비스, 시설 관련 질문을 하여 답을 들을 수 있다. 이 서비스는 아이비엠의 왓슨이 제공하는 자연어 처리 응용 프로그램 인터페이스를 이용한다. 왓슨은 기계 학습을 통해 대화를 많이 할수록 맞춤형 대답을 더 잘하게 된다. 왓슨이 학습한 내용은 소비자 참여 플랫폼인 세티스피(satisfy)의 솔루션을 통해 정리된다. 이로 인해 백화점 측면에서는 상담 인원 확보, 고객 안내를 위한 사이니지 배치 등의 부담에서 벗어날 수 있다.[9]
  • 롯데 : 롯데그룹은 2016년 12월 26일 한국 아이비엠과 클라우드 기반 인지 컴퓨팅 기술인 아이비엠 왓슨 솔루션을 제공하는 계약을 체결했다. 이 계약으로 가장 먼저 구축할 영역은 지능형 쇼핑 어드바이저와 지능형 의사결정 지원 플랫폼이다. 지능형 쇼핑 어드바이저는 챗봇을 기반으로 한 애플리케이션으로 백화점 등 유통 관련 계열사에 도입하여 고객이 챗봇과의 대화를 통해 상품을 추천하고 매장을 설명하는 등의 서비스를 받아볼 수 있도록 한다. 지능형 의사결정 지원 플랫폼은 식품 계열사의 신제품 개발을 위한 전략 수립에 활용한다. 왓슨을 통해 외부 시장 데이터와 내부 시스템의 매출·제품 정보 등을 분석하여 신사업을 개발하고 출시하기 위한 의사결정에 도움을 받는다. 2017년 롯데제과는 왓슨의 도움을 받아 '빼빼로 깔라만시 상큼요거트'와 '빼빼로 카카오닙스'를 출시했다. 인공지능을 활용한 과자 출시는 처음이다. 왓슨을 이용하여 8만여 개의 식품 관련 인터넷 사이트에 게재된 약 1000만 건의 정보를 수집하고 수집된 데이터의 노출 빈도, 관련성 등 항목별로 분석하여 카테고리별로 현재 소비자들이 좋아하거나 인기를 끌 가능성이 높은 소재와 맛을 도출해냈다.[10][5]

금융

스위스 보험사 스위스리(Swiss Re)는 2015년 10년 왓슨을 활용하여 보험설계사의 가격 위험 예측과 의사결정 근거를 강화한 보험인수 솔루션을 만들기 시작했다. 스페인의 카이샤뱅크(CaixaBank)는 2014년 10월 아이비엠과 파트너십 이후 외국인 증권거래업무 솔루션에 왓슨을 적용했다. 미국 세무법인 에이치앤알블락(H&R Block)은 지점 1만여 곳에서 왓슨 기술을 사용한을 방안을 협의했다. 왓슨은 고객 서류에서 누락될 수 있는 공제 및 감면 금액을 찾아내어 회계사의 일을 돕는다. 현대카드는 2016년 8월 첫 한국어 왓슨 기반 챗봇 서비스인 현대카드 버디를 베타 서비스로 시작했다. 현대카드 버디는 모바일 앱, 웹사이트, 소셜 채널에서 고객의 신용카드, 혜택과 사용 조건, 장단기 대출 서비스와 컬처 프로젝트 등 부가 서비스 문의에 답하고 있다.[3]

법률·행정

  • 베이커호스테틀러(BakerHostetler) : 미국 로펌 베이커호스테틀러는 2016년 5월부터 왓슨을 기반으로 한 법률 자문솔루션 로스를 사용 중이다. 회사에서 로스쿨을 갓 졸업한 신임 변호사의 일인 법률 리서치 업무를 맡아 기존 소요시간을 20~30% 줄였다. 로스는 자연어처리와 머신러닝 기술로 일반적인 법률 자문과 자연어 기반의 질문에 답하는 역할도 수행한다.
  • 호주 특허청 : 호주 특허청은 2015년 2년 행정업무에 왓슨을 시범 도입하였다. 방대한 특허 데이터와 업무 처리 과정을 학습하여 특허 심사청구자에게 맞춤 조언을 제공하고, 해당 특허의 적합성을 판단하는 특허심사관의 업무를 지원하는 역할을 맡았다.[3]

로봇·SW업계

  • 소프트뱅크(SoftBank) : 일본의 소프트뱅크는 2015년 2월 아이비엠과 제휴했다. 왓슨을 기반으로 휴머노이드 로봇인 페퍼에 탑재될 인공지능을 개발하고 현지 파트너, 개발자, 기업으로 왓슨을 확장한다는 구성을 제시했다. 이를 위해 왓슨에 일본어를 지원하기 위한 학습을 수행하고 왓슨 응용 프로그램 인터페이스를 활용한 앱 개발 환경을 구축하며 교육, 은행, 보험, 소매, 의료 분야 클라우드서비스를 제공한다.
  • 오토데스크(Autodesk) : 제조설계 및 3D 그래픽 소프트웨어업체인 오토데스크는 2016년 10월 구독형 제품 공급 모델을 도입하면서 왓슨을 활용한 옷토(Otto)를 만들었다. 옷토는 온라인 실시간 고객지원 채널로 1.5일이 걸렸던 고객의 이슈 해결 시간을 필수정보 입력 시간만큼 줄였다.[3]

문화

  • 영화 : 왓슨은 영화 예고편을 제작하였다. 예고편을 제작하기 위해 100개의 공포 영화 예고편을 분석하고, 학습된 정보를 바탕으로 예고편에 사용할 장면 10개를 추출했다. 시스템이 영화를 보기 시작해서, 90분 영상에서 6분 영상을 추출하고, 추출된 영상을 편집자가 수정하여 최종 예고편 영상으로 완성되는 데 약 24시간이 걸렸다. 일반적으로 10~30일 걸리는 것을 고려할 때, 단순한 수작업 시간을 줄이는데 인공지능이 활용될 수 있는 가능성을 보여주었다.
  • 음악 : 왓슨 비트(beat)를 통해 음악가가 노래를 작곡하는 데에도 협력했다. 왓슨은 5년간의 문화 데이터를 수집하고 분석하여 각 연도의 감성 레벨(emotional temperature)을 파악하였고, 뉴욕 타임스 기사, 영화 대본, 노래 가사, 트위터나 블로그 등 소셜 미디어에 게시된 코멘터리를 살펴본 뒤, 왓슨 비트 기술을 통해 빌보드 차트 상위에 기록되었던 음악을 분석하여 5년간의 음악 트렌드를 알렉스 다 키드(Alex da kid)에게 알려주어 작곡하는 것을 지원했다.[3]

블록체인

  • 글로벌 컨테이너 운송 기업인 머스크라인(Maersk Line)과 아이비엠이 왓슨 기반 블록체인 기술을 컨테이너 화물 추적 시스템에 적용했다. 블록체인 기술의 도입으로 물류 운송에 필요한 서류 작업이 사라지고 운송 속도가 한층 빨라질 전망이다. 월마트(Wal-Mart)를 비롯하여 400여개의 고객사가 해당 서비스를 이용하기 위해 가입하였다.[11]
  • 아이비엠의 왓슨 헬스 인공지능 사업부가 미국 에프디에이와 함께 블록체인 기술을 이용하여 의료 연구 및 기타 목적용으로 환자 데이터를 안전하게 공유하기 위해 2년간의 공동 개발 계약을 체결했다. 전자 의무 기록(EMR)은 인구 통계, 치료 및 유전자 정보 등을 포함하여 많은 데이터를 담고 있으며, 생체 의료 연구용 보관소로도 쓰일 수 있다. 하지만 전자 의무 기록의 데이터는 매우 민감하므로 의사와 의사 결정을 돕는 연구 및 임상용 정보 공유에서 거의 진척이 없었다. 아이비엠의 연구원들은 블록체인 기술이 변경할 수 없는 분산형 원장에 모든 거래의 감사 추적을 보존함으로써 데이터 교환의 책무성과 투명성을 정립한다고 생각했다.[12]

각주

  1. 왓슨 나무위키 - https://namu.wiki/w/%EC%99%93%EC%8A%A8(%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5)
  2. 왓슨 위키백과 - https://ko.wikipedia.org/wiki/%EC%99%93%EC%8A%A8_(%EC%BB%B4%ED%93%A8%ED%84%B0)
  3. 3.0 3.1 3.2 3.3 3.4 3.5 김천순, 〈[https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201714669705069&dbt=NART IBM Watson 작동방식에 대한 이해 및 사례 소개]〉, 《한국IBM》, 2017-01-31
  4. 이창현, 〈[의료산업과 왓슨(watson)]〉, 《정보통신산업진흥원》
  5. 5.0 5.1 임민철 기자, 〈IBM AI 왓슨의 비즈니스 활용사례 대방출〉, 《지디넷코리아》, 2017-11-14
  6. 가천대 길병원, 〈(가천대 길병원) 암 치료의 동반자, 인공지능 왓슨〉, 《네이버 블로그》, 2017-02-03
  7. 더보안, 〈IT이슈 :: IBM의 인공지능 플랫폼 왓슨〉, 《네이버블로그》, 2016-01-28
  8. 김소연, 〈Retail과 인지컴퓨팅의 결합, Virtual Shopping Assistants의 시대가 오는가?〉, 《버티컬플랫폼》, 2014-04-29
  9. 박창선 IT칼럼니스트, 〈빅데이터부터 AI...메이시 백화점의 데이터 사랑〉, 《디지털투데이》, 2016-07-25
  10. 이희수 기자, 〈AI 도움받아 만든 '빼빼로' 나왔다〉, 《매일경제》, 2017-09-27
  11. 박근모 기자, 〈IBM AI 왓슨 '블록체인 기술', 머스크 물류운송 시스템 적용〉, 《디지털투데이》, 2017-03-08
  12. Lucas Mearian, 〈'환자 데이터, 안전하게' IBM 왓슨과 FDA의 블록체인 공동 연구〉, 《CIO》, 2017-01-13

참고자료

같이 보기


  검수요청.png검수요청.png 이 왓슨 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.