㈜해시넷이 2019년 10월 15일(화)에 2019년 해시넷 블록체인 콘퍼런스를 진행합니다.

검수요청.png검수요청.png

뉴머라이

해시넷
이동: 둘러보기, 검색
뉴머라이(Numrai) 로고
뉴머라이(Numrai) 로고와 글자

뉴머라이(Numerai)는 과적합(overfitting)을 방지하고 기계 지능 간의 협동을 이끌어내는 암호화폐이다.[1] 쉽게 말하자면 인공지능을 사용하는 헤지펀드이다. 단위는 NMR이다. 뉴머라이 회사는 헤지펀드암호화폐 기반 예측 시장을 운영하는 스타트업이다. 이 기업의 공동창업자는 리처드 크레이브프레드 에르샘이다. 이들은 지난 2017년 에어드랍을 통해서 자체 암호화폐인 뉴머라이토큰을 발행했다.[2] 이들은 2017년 6월부터 전문가들을 대상으로 주가를 예측하고, 그것이 맞으면 돈을 지급하고 틀리면 돈을 잃는 예측시장 프로토콜 이레이저(Erasure)를 운영했다. 뉴머라이를 창업한 리처드 크레이브는 데이터 과학자들에게 뉴머라이토큰을 지급해 프로토콜을 지금까지 운영했다고 설명했다.[3] 뉴머라이와 유사한 블록체인 기반의 예측 플랫폼으로 어거(Augur), 엔도르(Endor), 노시스(Gnosis)가 있다.

개요[편집]

기계 학습(Machine Learning) 간의 경쟁(competition)은 의도적인 과적합(overpfitting)에 취약하다. 이런 상황에서 뉴머라이는 과적합을 경제적으로 불합리하게 만드는 새로운 경매방식에 사용할 수 있는 새로운 암호화폐 뉴머라이 토큰을 제시한다. 이 새로운 경매방식은 데이터 과학자들이 새로운 데이터에 대한 자신의 예측모델 성능에 대한 자신감 정도를 표현할 수 있게 하여 최적의 입찰을 이끌어낸다. 이러한 경매에 따라 뉴머라이 토큰 또한 경제적 가치를 지니게 된다. 뉴머라이는 인공지능이 펀드를 운영하는 방식으로 이뤄지며, 인간이 모델(엔진)을 마들고 이에 기반하여 투자를 진행한다. 뉴머라이에서 사용하는 투자 모델은 21가지 수치 값을 통해 1과 0의 결과를 예측한다. 다양한 회사들에 대하여 21개의 투자 지표를 모으고, 그 지표를 분석하여 구매 여부를 결정한다. 여기서 구매하면 1을, 구매하지 않으면 0을 선택한다.[4]

등장배경[편집]

일반적으로 기계학습 알고리즘의 정확도를 측정하는 방식은 데이터를 훈련 데이터와 테스트 데이터로 나누는 것이다. 훈련 데이터를 바탕으로 훈련한 모델의 정확도는 해당 모델이 한 번도 본적 없는 테스트 데이터를 통해 측정한다. 하지만 데이터 과학자가 테스트 점수 형태로 테스트 데이터에 대한 피드백을 받아 이를 모델 선정하는 데 사용 한다면 테스트 데이터를 과적합한 모델이 나올 위험이 있다. 이는 새로운 데이터에 대한 모델의 성능을 저하시킨다.

과적합 곡선

이러한 과적합 문제를 "적응형 데이터 분석(Adaptive Data Analysis)"라고 한다. 적응형 데이터 분석으로 도출한 모델은 성능 저하부터 아예 쓸 수 없게 되는 등 다양한 문제가 있다. 그러나 뉴머라이의 경우, 적응형 데이터 분석은 과거 데이터를 과적합 하여 실제로 예측할 때는 성능이 감소할 때 일어난다. 기계 학습 경쟁은 과거 데이터에 기반한 예측률에 따라 승자가 결정되므로 과거 데이터를 과적합할 유인이 있다. 그 결과 의도적으로 과적합을 하게 된다. 뉴머라이에게 꼭 필요한 것은 과거 데이터에만 잘 들어맞는 모델이 아니라 새로운 데이터에서 잘 작동하는 고성능 모델이다.

현재 이러한 제곧된 데이터(holdout)의 재사용(reuse)에 대한 최상(state of the art)의 해결책은 노출 되는 정보량을 제한하는 것이다. 이러한 해결책은 과학적 발견에는 충분할 수 있지만 기계학습 토너먼트에서 순위를 매기거나 사용자들에게 좋은 경험을 제공하는 데 있어서 상당한 걸림돌이 된다. 따라서 뉴머라이 측은 데이터 과학자들이 자신의 모델에 대한 자신감의 정도를 나타낼 수 있는 새로운 시스템을 제안했다. 데이터 과학자들은 새로운 암호화폐인 뉴머레어를 사용하여 자신들의 예측에 대해 배탱함으로 신규 토너먼트에 참여할 수 있다. 이러한 경매 방식은 새로운 데이터에 대핸 모델 성능에 대한 정확한 예측에 대해 보상한다. 데이터 과학자들은 뉴머라이를 통해 자신의 모델의 실제 성능에 대해서 어느 정도 자신감이 있는 지를 나타낼 수 라있다. 그 정도에 대해 표현하면 올바른 모형을 더욱 강조할 수 있어 헤지펀드 자체의 성능 또한 개선할 수 있다.

그렇다면 모델을 어떻게 만들까? 예전에는 인간의 지식을 통해 규칙을 만들고 이를 토대로 모델을 개발했다. 그러나 현대는 기계 학습의 시대가 도래하였다. 기초적인 데이터를 제공하고, 단순 계산을 빨리 하는 GPU를 개발시키면 기계가 최적의 방정식을 찾아낸다. 기계가 스스로 데이터의 특성을 학습하게 만드는 것이다. 모델을 만드는 학습 알고리즘은 너무다 다양하기 때문에 튜닝을 어떻게 했느냐에 따라 천차만별의 결과가 나온다. 또한 기계적으로 기계학습에 매달리면 데이터의 일부분에만 집착해서 전체적인 그림을 못 보게 되는(과적합)도 발생한다.

따라서 뉴머라이는 다양한 사람들에게 인공지능 모델을 제출하게 만들고, 그 성능을 평가해서 돈을 나누어 준다. 스팀잇에서 양질의 글을 올리면 보상을 주는 것처럼 뉴머라이에서는 좋은 모델이 많은 보상을 가져간다. 그에 더해 자신이 만든 모델이 확실하다고 생각하면 자신이 만든 모델로 운용하는 데 돈을 베팅할 수 있다. 한 마디로 좋은 인공지능을 만들어서 뉴머라이 네트워크에 올리면 돈을 준다. 그리고 이 인공지능에 투자하면 기본금에 이익금을 더해서 준다. 또한 뉴머라이는 다양한 인공지능으로 분산투자를 하기 때문에 헤지펀드가 가능하다.

운영 방식[편집]

뉴머라이는 예측 시장을 확장하여 세계적으로 더 많은 헤지펀드를 끌어들이는 것이 목표이다. 샤용자는 뉴머라이 토큰을 걸고 결과를 예측한다. 이 예측이 맞은 자신이 건 토큰을 포함해 보상을 받고, 반대로 틀리면 베팅한 토큰을 모두 잃게 된다. 또한 이에 대해 뉴머라이 창립자인 크레이프는 "돈을 걸고 예측하는 모델이 아무 것도 걸지 않고 예측하는 모델보다 결과의 정확도나 성과가 대체로 더 낫다"면서 "돈이 걸리는 순간 사람들은 함부로 예측하지 않게 되기 때문이다"고 말했다. 누구나 예측시장에 참여하면서 데이터 과학자들은 자신들의 예측값을 헤치전드에 판매할 수 있다. 그뿐만이 아니라 지금까지 가격이 어떻게 변했는지 또 자신들이 얼마나 정확하게 예측해왔는지 보여주는 데이터를 파냄 상품의 홍보 수단으로 사용할 수 있다.

먼저 데이터 과학자들이 뉴머라이의 데이터를 바탕으로 예측 모델을 만들면 뉴머라이 측이 이 모델을 구매하여 외부에 공개하며, 예측 시장에 참여한 금융 기관과 헤지펀드들에게 해당 모델을 확인하게끔 한 뒤 가장 정확해 보이는 예측에 돈을 거는 식으로 운영한다. 데이터 과학자들은 이 과정에서 자신들의 예측 정확도에 따라 평판을 얻게 된다. 지금까지 헤지펀드나 투자자들이 데이터 과학자의 실적을 제대로 판단할 수 있는 근거가 없었다면, 이제는 뉴머라이가 아무나 마음대로 바꿀 수 없는 데이터를 도대로 이 과학자들이 그동안 한 예측이 얼마나 정확했는지, 혹은 얼마나 잘못 되었는 지를 직접 확인할 수 있다.

또한 데이터 과학자들이 판매한 예측이 틀린 경우, 헤지펀드는 예측을 물리고 내기를 파기할 수 있다. 이런 과정을 통해서 헤지펀드의 위험은 줄이고, 나머지 이용자들의 위험은 반대로 늘어나게 된다. 그러나 일반 이용자들의 예측도 전체 프로토콜 차원에서는 보호 받는다. 과거에 누가 어떤 예측을 했고 그 결과가 모두에게 공개되지만, 현재 시장 참여자들이 건 예측은 아무나 볼 수 없으며 돈을 주고 예측값을 사야만 그 결과를 확인할 수 있다. 이렇게 예측값을 사는 데 든 돈은 모델을 만들고 예측 값을 구해낸 과학자들에게 보상으로 지급된다. 2018년 10월 기준으로 뉴머라이에 검증된 계정은 44,500개로 2017년 출시 당시 계정이 19,000개였던 것에 비하면 두 배 이상 늘어났다. 또한 뉴머라이의 예측 시장에 등록 되는 예측은 매주 약 1천여 건으로 2018년 10월 기준으로, 각종 예측과 내기에 걸린 판돈만 100만 달러가 넘는다.

뉴머라이는 이러한 성과를 인정 받아 2019년 처음으로 밴처캐피털의 투자 대가로 지분(주식)을 양도하지 않고 투자를 받아 화제가 되었다. 그리고 이들은 뉴머라이 토큰 1,100만 달러(한화 약 125억 원) 가량을 패러다임과 플레이스홀더 등 투자자들에게 판매하여 주목 받았다. 그 중 플레이스홀더의 파트너 조엘 모네그로가 주식이 아닌 토큰을 받고 뉴머라이에 투자한 이유에 대해 다음과 같이 설명했다. "우리는 탈중앙화된 크립토 네트워크에 투자하는 최선의 방법은 네트워크를 사서 자본화하는 것이라고 생각한다. (중략) 시간이 흘러 데이터를 사고 파는 사용자들이 점점 증가하면 우리 같은 거대 금융 투자자의 역할은 점점 줄어들 것이다. 네트워크가 자체적으로 운영되는 단계에 일면 우리는 점진적으로 역할을 줄이고 빠져나오면 된다," 그러면서 모네그로는 "기존에 뉴머라이가 자체 자금으로 발전시켜 온 아이디어를 앞으로는 이레이저가 발전 시켜 나갈 것이며, 올해(2019년) 하반기 출시 예정인 퍼블릭 블록체인 위에서 누구나 예측 정보를 사고팔 수 있게 될 것"이라고 말했다.

이처럼 플레이스홀더와 패러다임은 뉴머라이 토큰을 사들여 모회사인 뉴머라이보다 이레이저 프로토콜에 직접 투자하는 쪽을 선택했다. 이에 대해 뉴머라이 창립자인 크레이브는 이 두 벤처캐피털이 뉴머라이와 이레이저를 믿어준 덕분이라고 말했다. 그러면서 2019년 하반기 이레이저가 출시되면 사용자들은 자신들의 암호화폐 지갑을 이레이저에 직접 연결할 수 있게 된다고 말했다. 플레이스홀더의 모네그로는 결과적으로 모든 사용자가 자신들의 조사, 예측에 대한 증명 가능한 자취를 남기게 될 것이라고 덧붙였다. 이들은 이레이저 출시 이후 예측 정보 판매는 더욱 활성화 되고, 이레이저의 네트워크는 데이터의 분산 저장을 위한 P2P 분산형 파일시스템(IPFS)를 더욱 강화할 것이라고 말했다.

특징[편집]

뉴머라이는 이더리움 ERC-20을 기반으로 한 토큰이다. 이더리움 토큰은 이더리움 블록체인 상에서 실행하는 스마트 계약의 형태로 표현 된다. 누구나 뉴머라이 스마트 계약의 소스 코드를 확인할 수 있다. 새로 생산한 뉴머라이 토큰은 모두 뉴머라이 회사에게 전달된다. 뉴머라이의 이더리움 스마트 게약은 뉴머라이 토큰의 총량을 2,100만 개로 제한하고 있다. 뉴머라이는 기존 참가자의 과거 순위에 따라 백만 개의 뉴머라이 토큰을 기존 데이터 과학자들에게 분배할 것이다. 앞서 언급한 바와 같이 처음으로 분배한 이후, 토큰 갯수가 최대치에 달할 때까지 스마트 계약에 따라 매주 정해진 갯수의 뉴머라이 토큰을 생산할 것이다. 뉴머라이 기계학습 경쟁에서 뛰어난 성과를 보이는 데이터 과학자들이 지속적으로 뉴머라이 토큰을 얻을 수 있다.

예측에 자신 있다면 데이터 과학자는 뉴머라이 이더리움 스마트 계약으로 뉴머라이 토큰을 보낸다. 이 토큰을 받은 스마트 계약은 이 과학자가 보낸 뉴머라이 토큰을 t 시간 동안 동ㄱ결한다. 이 때 t는 새로운 데이터에 대한 모넬 성능을 평가하기 위해 필요한 시간이다. t 시간이 흐른 뒤, 뉴머라이는 새로운 데이터에 대한 모델의 성능 정보가 담긴 메세지를 네트워크에 보낸다. 걍매 방식에 따라 예측 성능이 좋은 데이터 과학자는 보상을 받는 동시에 베팅에 사용한 뉴머라이도 돌려 받지만, 그렇지 못한 과학자들은 베팅에 참가하기 위해 낸 뉴머라이 토큰을 잃게 된다. 이러한 비가역적인 뉴머라이 토큰의 소멸은 이더리움 블록체인에서 누구나 확인할 수 있다.

경매[편집]

대부분의 토너먼트는 상금의 정해진 총량이 없다. 뉴머라이는 데이터 고학자들에게 이 상금을 나누어준다. 또한 과학자들은 경매에 참여할 수 있다. 경매는 (c,s)의 형태를 갖는데 여기서 c는 데이터 과학자가 1달러를 확득하기 위해 거는 뉴머라이 토큰의 양으로 자신이 한 예측에 대한 자신감(confidence)의 정도를 나타낸다. 또한 s는 베팅하는 뉴머라이 토큰의 양(stake)를 나타낸다. 특정 시간동안 s는 이더리움 계약에 동결되어 있으며, 뉴머라이 회사를 포함해 그 누구도 그 자산에 접근할 수 없다. 일정한 시간이 지난 후 "다중단위(multiunit) 더치경매"에 의해 보상(payout)이 정해진다.

경매방식[편집]

경매 방식은 다중단위 더치경매에 추가적인 규칙을 추가시켜 사용한다. 모델 성능은 특정 시간이 지난 후 평가 받는다. 성능을 평가하는 기준은 이원 분류 문제에 적합한 로그 손실(logloss) 을 사용한다. 로그 손실이 ―ln(0.5)보다 작으면 예측 성능이 좋은 것이며 ―ln(0.5)보다 높으면 예측 성능이 나쁜 것으로 평가한다. 데이터 과학자들은 자신감 c가 높은 순으로 내림차순 정렬하여 순위를 매긴다. 이 순위에 따라 데이터 과학자의 예측 성능이 좋은 경우 s/c를 보상을 받으며 성능이 나쁘면 베팅했던 s를 잃게 된다. 이 과정은 정해진 상금이 고갈될 때까지 계속해서 진행 된다.

경매 예시[편집]

총 상금이 3,000달러이며 시간 t가 지났다고 가정하고, 다음과 같은 베팅 결과가 나왔다고 생각해보자.

뉴머라이 경매 예시
자신감 c 베팅량 s s/c Logloss < - In(0.5) 데이터 과학자
5 100000 2000 NO WSX
4 2000 500 YES XIRAX
1.5 3000 2000 YES PHIL_CULLITON
1 5000 2000 NO DAENRIS
0.5 300 600 YES ABRIOSI

WSX는 Logloss < - In(0.5)를 달성하지 못했으므로 그가 걸었던 1만 뉴머라이는 소멸된다. 그러나 XIRAX는 500 달러의 보상과 함께 베팅하는 데 사용한 뉴머라이 토큰을 돌려 받는다. PHIL_CULLITON은 2천 달러를 받고 뉴머라이 토큰을 돌려 받는다. 또한 DAENRIS의 뉴머라이 토큰은 없어진다. ABRIOSI는 상금 고갈로 인해 베팅했던 600 달러보다 적은 500 달러를 돌려받게 된다. ABRIOSI 아래의 모든 참가자들은 자신의 뉴머라이 토큰을 돌려 받고 보상은 받지 않게 된다.

뉴머라이 토너먼트 참가하는 법[편집]

  • 뉴머라이 홈페이지에 가입한다.
  • 데이터 세팅을 다운 받는다.
  • example_model.py 혹은 example_model.r 을 참고하여 예측값을 만든다.
  • 예측값(prediction.csv)을 업로드한다. 업로드하고 기다리면 화면 좌측 상단의 Performance에 모델의 결과값이 나온다.

스테이킹 분석[편집]

모델이 새로운 데이터에 대해 Logloss < - In(0.5)의 조건을 달성할 확률이 p라고 하자. p가 낮다면 모델이 과적합할 확률이 크다는 뜻이다. 여기서 s가 데이터 과학자가 베팅한 뉴머라이 토큰의 총량이라고 하자. 또한 e는 뉴머라이 토큰과 달러의 교환 비율, c는 자신감의 정도라고 하자. 데이터 과학자는 예상 이익이 0보다 크면 베팅을 클 경우 뉴머라이 토큰을 갖고 베팅을 할 것이다. 만약 데이터 과학자가 s를 베팅한 후 Logloss ≥―In(0.5)가 되면 데이터 과학자는 s/e를 잃게 된다. 만약 데이터 과학자가 s를 베팅한 후 Logloss < - In(0.5)가 되면 데이터 과학자는 s/c를 얻게 된다. 따라서 자신감 척도 c를 바탕으로 s 뉴머라이 토큰을 베팅한 경우 얻을 수 있는 예상 수익은 다음과 같다.


뉴머라이수식1.PNG


따라서 데이터 과학자는 아래와 같은 조건을 만족하는 경우 베팅 한다.


뉴머라이수식2.PNG


위 조건들은 다음과 같이 표현할 수 있다.

뉴머라이수식3.PNG

이는 데이터 과학자가 자신의 예측 정확도에 대한 스스로의 평가를 자발적으로 공개하는 것을 뜻한다. 보상을 극대화시키고자 하는 과정에서 데이터 과학자는 새로운 데이터에 대한 자신의 모델 성능에 대한 정보를 밝힌다. 토너먼트가 반복 될수록, 베팅을 과하게 하거나 너무 적게 하는 전략은 적절한 전략이 아니기 때문에 시간이 갈수록 데이터 과학자들의 벹이 전략은 결국 p를 좀 더 정확하게 반영하는 방향으로 갈 것이라고 볼 수 있다.

자신의 예측에 대한 높은 확신(자신감)이 있을 수록 경매에 참여한 동기가 크므로 다음과 같은 사항을 관찰할 수 있다.

  • p가 높을수록 데이터 과학자는 높은 c를 제출할 것이고 이에 따라 경매에서 더 많은 보상을 얻을 수 있다.
  • 고정된 p에 대해서, 지나치게 높은 자신감을 표현하면 E(c,s)<0가 되어 모델 성능에 비해 지나치게 높은 자신감 척도 c를 제출하는 전략은 과거 데이터에선 높은 정확도를 보이지만 새로운 데이터에는 일반화 되지 않는 (낮은 p) 경우에는 Logloss < - In(0.5) 혹은 E(c,s)<0이 된다.
  • 뉴머라이 토큰은 데이터 과학자가 달러를 얻는 데 쓸 수 있으므로 환욜은 e>0일 것이다.
  • 뉴머라이 토큰은 p를 가진 데이터 과학자에게 유리하넫 이는 높은 자신감이 있을 때 많은 보상을 받을 수 있기 때문이다.
  • p=1를 가진 데이터 과학자의 예상 가치는 E(c,s)=s/c이다. 이러한 데이터 과학자에게 뉴머라이 토큰의 가치는 뉴머라이가 지급하는 모든 미래 보상의 합이다.

경매의 목적은 베팅한 뉴머라이 토큰량을 최대한으로 늘리는 것이 아니라 좀 더 높은 정확도의 예측 사항을 얻는 것이다. 경매는 수익을 극대화 할 필요는 없지만 데이터 과학자로 하여금 스스로 자신의 모델에 대한 정보를 밝히게 하는 것이 중요하다. 차 최고가 입찰경매에서 약 우월한 전략은 솔직하게 베팅하는 것이지만 차 최고가 입찰경매는 참가자들 간의 모의에 취약하고, 최고가 입창결매는 이 부분이 덜 취약하기 때문에 단순함을 위해 오수벨(Ausubel) 경매 대신 더치경매방식을 사용한다.

동영상[편집]

각주[편집]

  1. 뉴머라이 백서 번역본〉, 2017-02-20
  2. Leigh Cuen, 〈암호화폐 기반 예측시장 ‘뉴머라이’ 토큰판매로 $1100만 유치〉, 《코인데스크코리아》, 2019-03-26
  3. Nikhilesh De, 〈뉴머라이, 암호화폐 기반 주가 예측시장 대중에 공개〉, 《코인데스크코리아》, 2018-10-09
  4. tmkor,〈AI 블록체인 햇지펀드 numerai 토너먼트 참가해보기!〉, 《스팀잇》

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 뉴머라이 문서는 암호화폐 종류에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.