의견.png

레피아

해시넷
greenwood26 (토론 | 기여)님의 2020년 9월 15일 (화) 13:55 판 (RSA K (for External Knoledge Management))
이동: 둘러보기, 검색
레피아(Repia)

레피아(Repia)란 ㈜레피아에서 순수 자체 기술로 개발한 개발한 검색엔진이다.

개요

레피아는 국내 최초의 검색 솔루션이었던 까치네가 1995년 개발 및 서비스를 실시한 이후로 1999년 금강개발산업이 인수해 사내 벤처기업 형태로 운영하다가 현대백화점측에 인수되고 2000년에 까치네가 'e-현대백화점'으로 바꾸고 인터넷 쇼핑몰 운영사로 바꾸자 연구진 일부가 나와서 2000년 부터 주식회사 ㈜레피아컴을 설립 하였다. 검색 솔루션(Solution)인 레피아서치서버가 순수 자체기술로 개발되어서 외국산 검색엔진들에 비해 커스터마이징이 용이하며, 하루에 수백만 검색 쿼리를 처리하는 포털 사이트의 검색서비스에 사용되었던 컴포넌트(Component)들로 구성돼 대용량의 콘텐츠트래픽을 안정적으로 지원한다. 또, 검색속도와 검색 결과의 정확성, 웹 기반의 시스템 관리 툴, API 제공을 통한 유연한 확장성을 가지고 있다. 2004년도에는 데스크톱 검색보다 앞선 기능으로 인트라넷 내부의 PC와 파일서버에 있는 자료를 수집해 개인별, 그룹별, 자료유형별로 권한을 가지고 검색할 수 있는 제품을 개발했다. 레피아서치서버는 멀티프로세스 방식의 강력한 자료 수집기(Spider)와 정형 및 비정형 문서를 동일한 컬렉션과 파티션 단위로 관리할 수 있는 색인기(Indexer)를 제공해 사용자들에게 실시간 검색과 정확한 검색결과를 제공한다. 이 솔루션은 관리자가 그룹화한 검색대상 자료들로 부터 추출된 전체 단어들과 관련 정보를 '컬렉션'이라는 단위로 관리할 수 있도록 해 용이성을 높였다. 2005년 당시 레피아서치서버는 재정경제부, 통일부, 농림부 등 공공기관과 LG투자증권, 대우증권, 신세계건설, LG산전, 한국과학기술원, 숭실대, 광운대 등과 같은 교육기관까지 150여 곳에 구축되었고, 현재까지 더 많은 지자체, 대학, 기관, 기업에서 이용되고 있다.[1]

연혁

  • 1995년 12월 : 국내 최초 인터넷 검색엔진 개발 및 서비스 실시 - 인터넷 검색엔진 "까치네" 개발 및 운영
  • 2000년 04월 : 주식회사 ㈜레피아컴 설립
  • 2001년 10월 : 중소기업청 "기술혁신 중소기업(INNO-BIZ기업)" 선정
  • 2002년 04월 : 정보통신부 "우주신기술(IT)" 인증
  • 2003년 05월 : 제 4회 대한민국 디지털 경쟁력 향상대회 "통합검색엔진기술 부문" 대상 수상
  • 2004년 07월 : 한국인터넷 진흥원 “전파식별(RFID) 검색시스템 시범 구축 업체” 로 선정
  • 2005년 02월 : 국내 최초의 검색전문기기 “Repia Search Appliance S/E/K 시리즈” 출시
  • 2006년 07월 : 통합검색엔진 Repia Search Server(RSS) v3.0 출시
  • 2007년 07월 : 통합검색엔진 Repia Search Appliance(RSA) v3.5 출시
  • 2008년 03월 : 하나TV 통합검색시스템 수주
  • 2008년 05월 : 두산 인프라코어 통합검색시스템 구축
  • 2008년 07월 : 국가보훈처 통합검색엔진 구축
  • 2008년 08월 : 통합검색엔진 Repia search Apliance(RSA) ‘Good Software 인증’ 획득
  • 2008년 11월 : 현대해상 통합검색시스템 구축
  • 2009년 01월 : 현대하이카자동차손해사정 통합검색시스템 수주
  • 2009년 04월 : 레미안 홈페이지 통합검색시스템 수주
  • 2009년 06월 : 국세청 통합검색시스템 업그레이드 수주
  • 2009년 08월 : 인천광역시청 통합검색시스템 업그레이드 수주
  • 2009년 10월 : 농촌진흥청 통합검색시스템 업그레이드 수주, 중앙선거관리위원회 통합검색시스템 업그레이드 수주
  • 2010년 03월 : 서울시 E-TAX 통합검색시스템 수주
  • 2011년 03월 : 현대오토에버 제안문서관리시스템 구축 (검색엔진 기반 개발)
  • 2012년 01월 : ㈜레피아로 법인 변경 및 통합검색엔진 Repia Search Server (RSS) v4.0 출시
  • 2013년 02월 : 세종특별자치시 구축 및 대전광역시청 업그레이드, 우리투자증권 뉴스시황 검색엔진 업그레이드
  • 2013년 08월 : 미래창조과학부 검색엔진 구축 (win-back case)
  • 2013년 11월 : 울산광역시청 홈페이지 검색엔진 구축
  • 2014년 06월 : 기초과학연구원 내부사이트 검색엔진 구축
  • 2015년 04월 : 천안시 홈페이지 검색엔진 구축
  • 2015년 06월 : 한국건강가정진흥원 검색엔진 구축
  • 2015년 12월 : 전북교육청 홈페이지 통합검색엔진 구축
  • 2016년 04월 : 모바일광주 포털 서비스 사이트 통합검색엔진 구축
  • 2016년 05월 : 한국해양과학기술원 홈페이지 검색엔진 구축
  • 2016년 06월 : 한국공항공사 홈페이지 검색엔진 재구축
  • 2017년 01월 : 경제교육포털 홈페이지 검색엔진 구축
  • 2017년 08월 : 한양대학병원 홈페이지 통합검색엔진 구축
  • 2017년 12월 : 대전광역시의회 홈페이지 검색엔진 구축
  • 2018년 01월 : 농림축산식품부 홈페이지 통합검색엔진 구축
  • 2018년 02월 : 경남창원시청 홈페이지 통합검색엔진 구축
  • 2018년 03월 : 한국문화예숭위원회 홈페이지 검색엔진 구축 [2]

특징

RSS

레피아서치서버(RSS, Repia Search Server)는 하루 수백만 검색쿼리를 처리하는 포탈사이트의 검색 서비스에 사용되는 검색엔진 컴포넌트 위에 개발된 Repia Search Server/Enterprise는 대용량의 콘텐츠 및 트래픽을 안정적으로 지원하며, 정확한 검색결과를 신속하게 제공한다.

RSS 구조
  • 고성능 실시간 검색 서비스 : 레피아서치서버는 분산·병렬처리 기법을 적용한 자료수집기, 색인기, 쿼리 프로세스(Query Process)로 구성되어 있으며, 이를 통해 사용자들에 대한 안정적이고 확장성 있는 실시간(Real Time) 검색서비스를 제공한다.
  • 프로토콜 기반 구조(Decoupled Protocol based Architecture) : 레피아서치서버의 서버내 각 구성요소인 웹스파이더, DB스파이더, 쿼리 프로세스 등은 독립적으로 동작하는 한편, 효율적인 프로토콜의 기반 위에서의 상호연동이 되도록 설계 되었다. 레피아서치서버는 이를 통해 최고 수준의 시스템 확장성을 제공한다.
  • 플러그인 구조(Plugin Architecture) : 레피아 서치서버는 성능 향상 모듈이나 새로운 기능을 추가할 경우, 기존 시스템(Legacy System)의 수정없이 바로 플러그인하여 설치할 수 있도록 제공된다.
  • 분산 검색서버 지원 : 레피아서치서버는 컬렉션과 검색서버를 지역네트워크(Local Network) 또는 인터넷에 연결된 다중 서버상에 분산 배치할 수 있으며, 이를 통한 부하균형 기술을 적용하여 시스템의 성능 및 확장성을 보장한다.
RSS의 분산 검색서버 지원 도식도
  • 자료수집 측면에서 특징 : 오라클(Oracle), DB2, Infomax, Sybase, MSSQL 등에 저장되어 있는 정형화된 자료를 수집한다. 또, 웹 페이지, HWP, MS-WORD, PDF, PPT, Excel 등의 형태로 저장되어 있는 비정형화된 자료를 수집한다. 프로세스 개수 및 자료수집 속도를 적절하게 설정하여 시스템 자원을 활용할 수 있다. 수집대상 자료의 갱신(Upadate) 주기에 따라 시간대별/일별/월별로 조정 가능하다. 자료보유 웹서버에 동시에 접근할 수 있는 자료수집기의 개수를 조정하여 부하를 조절한다. 세션(Session)을 통한 인증, 쿠키(Cookie)를 이용한 인증, 서버 인증 등 사용자 인증 정보를 필요로 하는 자료를 수집한다.
  • 색인 측면에서의 특징 : 정형 또는 비정형과 같은 자료의 구조 또는 웹문서, HWP, PDF 등과 같은 자료의 유형에 관계없이 독립 또는 통합 컬렉션을 생성시킬 수 있다. 하나의 컬렉션은 관리자가 정의한 복수개의 파티션으로 세분화한다. 색인대상 자료의 제목, 본문, 대표단어, 작성자와 같은 메타데이터 필드의 색인여부와 중요도를 조정하여 고품질의 인덱스를 생성할 수 있다. 색인 주기를 자료수집 시스템과 연동하영 시간대별/일별/월별로 조정할 수 있다. 데이터의 발생 이벤트를 감지하여 실시간 색인 처리 기능을 제공한다. 어절단위 색인과 형태소 단위 색인을 지원한다. HWP, PDF, 파워포인트, 워드, 엑셀, HTML 문서와 같은 비정형 문서는 색인과정에서 문서 필터기를 통하여 본문 텍스트와 메타데이터 정보를 추출한 후 전문 검색이 가능하다. 웹문서에 링크되어 있는 BMP, JPG, GIF와 같은 이미지 파일, MP3, MIDI 등의 음악 파일, AVI, MPEG 등의 동영상파일 등을 각종 멀티 미디어 파일들의 정보를 추출하여 정교한 검색이 가능하다.
JSP 툴킷 개요도
  • 고객 맞춤화 측면에서의 특징 : 웹기반의 관리자 인터페이스를 통하여 검색 화면 디자인을 커스터마이징할 수 있다. 검색엔진이 설치된 웹서버에 전달되는 환경 변수 수정을 통하여 확장된 검색결과 출력형태를 커스터마이징 할 수 있다. 자바서버페이지(JSP, Java Server Page) 툴킷을 활용하여 사용자는 최소의 비용 및 시간 투자로 완벽하게 검색 화면 디자인 및 결과 출력 형태를 커스터마이징 할 수 있다. 검색 메뉴란 검색입력 화면상에서 사용자가 선택할 수 있는 특정 검색범위를 말하며, 관리자가 현재 등록되어 있는 컬렉션들과 컬렉션 내의 파티션 목록을 사용하여 한 개 이상의 검색 메뉴를 등록할 수 있다. 검색 대상 컬렉션 및 파티션들을 출력화면에 어떠한 형태로 섹션을 구성하여 표시할 것인가를 지정할 수 있으며, 각 세션별로 정렬방법, 출력개수, 출력 요약문 크기, 미리보기 요약문 크기 등을 조정할 수 있다. 검색 결과 정렬 개수, 멀티 섹션 검색시 페이지별 출력 개수, 미리보기 요약 크기, 검색 결과 개수 제한, 타겟 설정, 하이라이팅 기능 등을 조정할 수 있다.

RSA

Repia Search Appliance의 약자로 일체형 통합지식 검색 시스템으로 웹사이트 및 기업이나 조직 내/외부에서 생산되는 유용한 정보를 체계적으로 수집, 분류, 활용할 수 있는 통합지식 검색 시스템 구축에 필요한 최적의 하드웨어에 솔루션을 임베디드한 일체형 전문기기이다.

RSA S (for Web Site Search)

전문화된 웹사이트 통합 검색시스템으로 웹사이트를 방문하는 고객들이 원하는 정보를 쉽고 빠르게 찾을 수 있도록 지원해주는 우수한 웹사이트 검색서비스 솔루션으로 공공기관 및 기업의 고객서비스 비용을 절감하여 고객만족도를 증대시켜준다.

RSA for Web Site Search
  • 정확한 검색결과 제공 : 고객이 입력한 검색어와 상품/서비스간의 유의어 그룹핑 설정 기능과 검색결과 최상의 노출 컨텐츠 조절 기능 및 다양한 검색기능으로 빠르고 효율적인 검색결과를 보장한다. 정형화된 자료 뿐만 아니라 웹문서와 같이 고품질의 인덱스 생성에 필요한 제목, 저작자, 대표단어 등의 메타데이터 정보에 제공하지 못하는 비정형 자료에 대해서도 메타데이터 필드별 색인 여부와 가중치 조절 기능을 통하여 정확한 검색 결과를 보장한다.
  • 검색행위를 분석한 고객서비스 지원 : 검색로그 분석 기능을 활용한 서비스 이용 성향 분석을 지원한다. 검색서비스를 이용한 사용자들에 대한 다양한 입력 검색어, 검색어 수, 검색횟수, 접속등의 로그에 대한 분석을 통하여 서비스 이용 성향을 분석하여 바로가기, 프로파일, 컨텐츠 검색, 검색결과 최상위 조절기능 등을 지원한다.
  • 네비게이션 서비스 지원 : 충분한 검색결과를 제공한다. 단순한 웹페이지, 문서파일 텍스트 뿐만 아니라 카테고리별 검색 결과 서비스 관련 카테고리/장르로 직접 이동할 수 있도록 지원한다.
  • 정형화된/비정형화된 자료 통합 검색 : 정형화된 자료와 비정형화된 자료에 대한 통합검색을 지원한다. 구자료와 실시간으로 입력되는 신규자료에 대한 통합검색을 할 수 있다. HWP, PDF, 엑셀, 파워포인트, 워드, HTML, XML, TIFF등 다양한 유형의 파일 포맷을 지원한다.
  • 웹 기반의 통합관리 인터페이스 기능 제공 : 자료 수집기, 색인기, 검색기등 모든 컴포넌트를 웹기반으로 제어하도록 지원한다. 다양한 검색기능, 바로가기 기능, 동의어/유의어 그룹핑, 컨텐츠 검색기능, 최상위 노출 컨텐츠 기능 등을 웹기반으로 제어할 수 있도록 지원한다.
  • 유지 보수 극대화 방안 : 통합 검색 엔진 이상/장애 발생시 시스템이 자동적으로 관리자에게 장애 유형과 장애 대책 사항 등을 관리자 이메일로 발송하여 즉각적으로 처리 가능하게 한다.

RSA K (for External Knoledge Management)

외부의 유용한 정보를 체계적으로 수집 및 관리할 수 있는 시스템으로 기업이나 조직 외부에서 생산되는 유용한 정보를 체계적으로 수집, 분류, 분배, 활용할 수 있도록 지원하는 외부지식관리 전문기기 이다.

RSA for External knowledge Management
  • 동적 스케쥴링 기법을 적용한 고속 병렬자료 수집 : 관리자가 지정한 내/외부 웹사이트에 있는 웹문서에서 유용한 정보영역만을 선별적으로 수집하고, 수집된 정보들은 관리자가 지정한 규칙에 의해서 자동 분류되어 저장된다. 수집시 유휴시간을 최소화 하여 고속수집이 가능하도록 동적 스케쥴링 기법을 적용하여 병렬적으로 수집한다.
  • 중복문서 수집 제어 : 일반적인 자료수집 알고리즘으로 구동시 동적 웹페이지를 중복으로 수집되는 경우가 빈번하게 발생함으로 관리자가 중복문서 수집을 쉽게 제어할 수 있는 기능을 제공한다.
  • 인증필요 웹사이트 자료 수집 : 접근시 사용자 인증 또는 쿠키값을 요구하는 웹사이트의 자료도 운영자가 쉽게 제어할 수 있는 기능을 제공한다.
  • 무한루프 상황 탐지 및 제외 : 자료수집기가 동적 웹페이지 자료수집시 빈번하게 발생할 수 있는 무한루프 상황을 자동 타지하여 빠져 나갈 수 있는 기능을 제공한다.
  • 불필요한 영역 추출 및 자료 삭제 처리 : 관리자가 정교하게 수집대상 및 수집제외 영역을 설정할 수 있도록 지원하며 수집된 자료에서 유용한 정보영역만을 정의하여 불필요한 영역의 데이터는 수집 및 저장되지 않도록 한다.
  • 웹사이트별 수집일정 차별화 및 모니터링 : 수집대상 웹사이트별 자료수집 일정을 스케쥴링 할 수 있으며, 수집된 자료들에 대한 상태를 모니터링 할 수 있도록 합니다.
  • 쉽고 편리한 웹기반의 시스템 통합관리 : 자료수집기, 분류기, 데이터베이스 관리기등 모든 컴포넌트를 웹기반으로 관리자가 쉽고 편리하게 제어할 수 있도록 지원한다.
  • 장애발생 예방 및 신속한 장애대처 방안 제공 : 웹기반으로 하드웨어, 소프트웨어 상태를 실시간으로 모니터링 할 수 있도록 지원하며, 예외상황 발생시 예외상황 종유와 긴급대처 방안을 이메일로 자동 발송하여 담당자가 신속하게 장애에 대처 할 수 있도록 지원한다.
  • 유연한 시스템 통합성 제공 : 풍부한 시스템 구축 및 운영 경험을 기반으로, 고객이 보유하고 있거나 도입하려는 시스템과 완벽하게 통합되어 구동될 수 있도록 지원한다.
  • 완벽한 커스터마이징 서비스 제공 : 원천기술을 자체 보유하고 있으므로 고객의 어떠한 요구사항이라도 저렴한 비용으로 안정되게 구현될 수 있도록 지원한다.

RSA E (for Enterprise Search)

내/외부의 유용한 정보와 지식자산을 통합검색할 수 있는 시스템으로 조직이나 기업에서 필요로 하는 내/외부 정보와 지식자산을 효과적으로 수집, 색인, 검색 그리고 조회할 수 있도록 지원해주는 엔터프라이즈 검색 전문기기이다.

RSS for Enterprise Search
  • 정확한 검색결과 제공' :
  • 검색결과 그룹핑 :
  • 바로가기 서비스 :
  • 컨텐츠 가이드 서비스 :
  • 자동 한자/한글 전환 검색 :
  • 권한별(보안) 검색 :
  • 원문 미리보기 :
  • 정교한 확장검색 기능 제공 :
  • 웹기반의 시스템 통합관리 :
  • 장애발생 예방 및 신속한 장애대처 방안 제공 :
  • 유연한 시스템 통합성 제공 :
  • 검색대상 컨텐츠 :

REKMS

조직이나 기관에서 필요로 하는 외부의 지식을 체계적으로 수집, 분석, 분배, 활용하기 위해 최적화된 시스템이다.

REKMS
  • 정형화된/비정형화된 정보수집 및 분류 :
  • 인증 사이트 정보 수집 :
  • 완벽한 고객맞춤화 :
  • 프로토콜 기반구조 :
  • 플러그인 구조 :
  • 가치창출의 극대화 :
  • 기대효과 :

RWDS

효과적인 디렉토리 관리 시스템으로 검색엔진 기반의 대형 포탈 사이트의 일반적인 디렉토리 엔진과는 달리 웹문서, 일반문서, 이미지, 사운드, 동영상 등의 브로드밴드 데이터에 대한 디렉토리를 통합 구축할 수 있으며, 디렉토리 내의 데이터 및 디렉토리 구조 자체에 대한 관리가 브라우저 상에 트리구조 기반으로 구현되어 디렉토리 관리를 획기적으로 효율화시킬 수 있는 시스템이다.

RWDS 시스템 구성도
  • 디렉토리 서비스 측면 :
  • 디렉토리 관리자 측면 :
  • 기대효과 :

기능

  • 확장성과 안정성이 검증된 솔루션 : 1TB의 데이터량(Volume of Data)를 보장하고 초당조회수(Queries per Second)는 대략 100 QPS정도이며 데이터의 신선도(Freshes of Data)는 1분 미만이다. 탑재되는 시스템의 CPU개수, 메모리 크기, 하드디스크 유형 등에 따라 최적화 할 수 있다.
  • 정형/비정형 자료에 대한 통합 검색 : 정형화된 자료와 비정형화된 자료에 대한 통합 검색이 가능하고 구자료와 실시간으로 입력되는 신규자료에 대한 통합 검색이 가능하다. HWP, PDF, XLS, PPT, WORLD, HTML, XML, TIFF 등 다양한 유형의 파일 포맷을 지원한다.
  • 유연한 시스템 통합성 : Window/UNIX/LINUX 등 다양한 운영체제를 지원한다. C, JAVA 기반의 소프트웨어 개발자 키트(SDK, Software Developer Kit)등 다양한 개발자 키트를 지원한다. 검색을 위해 CGI, JSP, ASP, PHP, C/S 인터페이스를 위한 API를 지원한다.
  • 정확한 검색결과 제공 : 사용자에게 세분화된 검색영역 설정 기능과 정확한 검색결과 제공을 위해서 컬렉션, 파티션 2단계 계층(Two level Hierachy)구조의 색인 파일을 생성하고 검색 범위 설정을 지원한다. 고성능의 정교한 형태소 분석 기술을 이용하여 정확한 자료 검색이 될 수 있도록 지원한다. 신조어, 고유명시, 지역명칭, 이름등 자동 등록을 통해 색인을 지원한다. 신규자료가 등록/수정/삭제 되었을 때 즉시 색인 데이터베이스에 반영하고 색인 데이터베이스 갱신시 전체가 아닌 등록/수정/삭제 정보만을 색인 데이터베이스에 즉시 반영한다.
  • 다양한 검색기능 제공 : 정형/비정형 자료 전체를 통합 검색하거나 컬렉션/파티션별로 세분화해서 검색할 수 있으며 자료 유형에 따은 선택 검색 기능을 제공한다. AND, OR, NOT등의 불린(boolean) 검색 연산자를 이용하여 보다 정교한 검색을 지원한다. 와일드 카드 연산자인 '*', '?'를 이용하여 보다 정교한 검색을 지원한다. 사용자가 입력한 질의어와 유사함 의미를 가진 동의어를 추천해주는 서비스를 지원한다. 유의어 확장 연산자는 '@'이다. 검색결과 출력시 날짜별 정렬, 중요도별 정렬 기능을 제공한다. 검색결과 페이지에서 '미리보기' 기능을 통하여 웹문서와 HWP, PDF, Word, PPT 등과 같은 일반문서의 본문 내용을 텍스트 형식으로 조회하거나 별도의 뷰어 프로그램과 연동할 수 있다. 검색창에 검색어를 입력시 관련된 단어를 자동으로 추천하여 검색어를 완성할 수 있도록 지원한다. 사용자의 인기검색어 분석을 통하여 검색결과 상단에 바로가기 기능이나 풍부한 검색결과를 제공하는 컨텐츠 가이드 서비스 기능을 제공한다. 검색대상 자료의 생성일 기준으로 기간을 정하여 검색할 수 있다. 일정기간 검색 통계분석을 통한 인기검색어 리포트를 지원한다.
  • 웹기반의 통합관리 제공 : 자료 수집기, 색인기, 검색기 등 모든 컴포넌트를 웹기반으로 제어할 수 있도록 지원한다. 검색서비스를 이용한 사용자들에 대한 입력 검색어, 검색어수, 검색횟수, 접속IP 등 다양한 로그의 분석을 통하여 서비스 이용 성향을 분석한다.

각주

  1. 씨엘, 〈(월요기획-검색솔루션)주요업체(2)〉, 《네이버 블로그》, 2005-01-24
  2. ㈜레피아 공식홈페이지 - http://www.repia.com/

참고자료

같이 보기


  질문.png 이 문서는 로고가 필요합니다.  

  의견.png 이 레피아 문서는 솔루션에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.