"웹개방성"의 두 판 사이의 차이

2020년 7월 30일 (목) 14:04 판

웹 개방성(Web Openness)이란 웹에 공개된 정보에 이용자가 아무런 제약 없이 접근하여 이용할 수 있는 것을 의미하며, 웹사이트의 정보를 자유롭게 공개ㆍ공유하여 정보의 투명성과 개방성이 향상되는 것을 말한다.

개요

우리나라는 세계에서 가장 빠른 인터넷 환경과 전세계 4위에 달하는 스마트폰 보급률로 정확한 정보를 쉽고 빠르게 얻을 수 있는 훌륭한 정보 환경에서 살고 있다. 그만큼 좋은 정보들에 정확하게 접근하는 것 역시 중요하다. 검색이 정확히 이뤄지지 않는 정보들은 쓸모없는 정보와 다를 바 없기 때문이다. 무슨 말인가 싶겠지만, 이것이 바로 현재 우리나라 인터넷 환경이 직면한 상황이다. 우리는 구글, 네이버, 다음 등의 포털사이트에서 많은 양의 데이터를 검색하며 살고 있지만, 실제로는 매우 제한적인 검색이 이뤄지고 있다. 그 이유는 검색엔진 배제선언에 있다. 일반적으로 검색로봇이 웹사이트의 정보를 수집하는 알고리즘에서 검색엔진 배제선언을 하게 되면, 웹사이트에 검색로봇의 접근을 막아 정보를 수집할 수 없게 되는 것이다. 그래서 2011년에 행정안전부, 현 행정자치부에서 검색로봇 배제 표준 적용방법 가이드라인을 배포했다. 웹 개방성의 수준을 체계적으로 강화해 개인정보와 같은 중요 정보는 검색할 수 없도록 하고, 필요한 자료는 효율적으로 개방할 수 있게 만드는 가이드라인이지만, 대부분의 웹 사이트에서는 이러한 가이드라인을 준수하는 비율이 낮다.^[1] 단순히 검색엔진에 키워드를 입력하는 것만으로도 웹사이트 내의 내용을 모두 찾을 수 있으면, 웹 개방성이 높은 것으로, 해당 웹사이트에 일일이 접속해 원하는 내용을 찾아야 하면 웹 개방성이 낮은 것으로 간주한다. 국내의 웹 개방성은 낮은 편으로, 국내의 대학교, 학술/연구기관은 정보접근을 완전 차단하여 검색으로 정보를 찾을 수 없게 해뒀다. 정보를 얻는 대부분의 사람들의 특성 상 양질의 정보가 있더라도 얻기 힘들다.^[2] 이처럼, 웹 개방성이 낮으면 양질의 자료가 있더라도 검색으로 자료를 찾을 수 없기에 검색으로 나온 자료만을 사용하거나, 양질의 자료를 얻고싶다면 일일이 다 뒤져서 정보를 찾아야 하는 수고스러움을 동반한다. 그러므로 웹 개방성을 높혀 양질의 정보를 공유하는 것이 중요하다.

웹사이트 개방 확인 방법

문서 접근 완전 허용

문서 접근 부분 차단

robots.txt 파일

로봇 차단을 확인할 때는 웹 사이트에 접속한 후 브라우저 주소창에 해당 웹 사이트의 주소 뒤에 /robots.txt를 추가로 입력하고 엔터키를 누른 뒤 해당 페이지에 나타나는 결과에 따라 로봇을 배제하는지 안 하는지 여부를 확인할 수 있다. robots.txt가 존재하지 않는다면 화면에 Not Found라는 글자가 출력되고, 이는 모든 로봇에 대한 문서 접근을 허용하는 형태이다. 또 다른 형태로는 User-Agent와 Allow가 출력된다. User-Agent에서 *은 모든 로봇을 지칭하는 뜻이며, Allow에서 /는 모든 디렉터리에서 로봇의 접근을 허용한다는 뜻이다. Allow 대신 Disallow:/ 형태로 되어있으면, 검색 로봇이 모든 문서에 접근할 수 없도록 차단한 상태이다. 부분적으로 차단도 가능하다.^[3]

웹 개방성의 필요성

웹 개방성 평가 목적 및 기대효과

웹에 공개된 정보는 높은 사회, 경제적 가치를 지닌 중요한 자산으로 합리적인 정보 공개가 필요. 웹사이트의 정보 접근성 향상과 정보 개방에 대한 정보 제공자 측의 인식 제고 및 개선이 목적 정보 개방에 대한 공공과 민간 기업 등 정보 제공자 측의 인식 개선과 참여 공유 투명성 제고 정보 공개로 사용자의 합리적인 정보 활용도 향상 정보의 자유로운 흐름 측면에서의 웹 정보 접근성 향상 효율적인 웹 정보 제공이 가능하며 이를 통한 비용 절감 효과 기대 향상된 각 웹사이트의 정보 제공으로 스마트 미디어 시대의 웹 서비스를 선도 개방된 정보를 사회ㆍ경제적 가치가 높은 자산으로 활용하여 새로운 경제적 효과 창출

웹 개방성 지수

웹 개방성 지수란 웹 개방성을 평가하기 위해 웹 발전연구소에서 최초로 개발한 평가모형으로, 웹사이트의 검색엔진 접근 차단, 특정 페이지 접근 차단, 페이지별 정보 수집 거부 등을 평가해 점수화한 것이다.

각주

↑ 써미, 〈(최신 웹 기술 사례) 웹 개방성의 이해와 필요성〉, 《네이버 블로그》, 2016-05-11
↑ 강일용, 〈여전히 형편없는 국내 웹개방성... 대학, 연구기관 78%가 검색 제한〉, 《아이티동아》, 2013-03-11
↑ 광고컬럼, 〈23. 검색이 잘 되는 비밀! 웹 개방의 필요성〉, 《플레이디》, 2013-10-04

^[1]

참고 자료

웹 소울 랩 - http://www.websoul.co.kr/consulting/woi.asp

같이 보기

이 웹개방성 문서는 인터넷에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.

개발 : 프로그래밍, 소프트웨어, 데이터, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷^□^■^⊕, 모바일, 사물인터넷, 게임, 메타버스, 디자인

인터넷	PC통신 • 그누텔라 • 네트워크 • 다크넷 • 다크웹 • 딥웹 • 무선인터넷 • 슈퍼피어 • 스타링크 • 아르파넷 • 아이투피(I2P) • 엑스트라넷 • 오버레이 네트워크 • 오투오(O2O) • 오프라인 • 온라인 • 온오프라인 • 유선인터넷 • 인터넷 • 인트라넷 • 초고속 인터넷 • 토어(토르) • 표면웹 • 프리넷 • 피투피(P2P) • 하이브리드 피투피(P2P) • 홈네트워크

인터넷 기술	ARP • DNS • FTP • G-클라우드 • HTTP • HTTPS • IPFS • IPv4 • IPv6 • IRC • IRI • ISBN • LDAP • MOIP • OpenSSL • OSI 7 계층 • RFC • RFID • SFTP • SOAP • SSH • SSL • SSO • TCP • TCP/IP • TLS • UCI • UDP • URI • URL • URN • VoIP • 강화 내부 게이트웨이 라우팅 프로토콜 • 검색 • 검색엔진 • 게이트웨이 • 경계 경로 프로토콜 • 내부 게이트웨이 라우팅 프로토콜 • 네아로 • 다운로드 • 데몬 • 라우팅 정보 프로토콜 • 백엔드 • 사물인터넷 • 서버 • 서버-클라이언트 • 서브넷마스크 • 세션 • 식별자 • 아이피(IP) • 업로드 • 에듀테크 • 온프레미스 • 원격 프로시저 호출(RPC) • 유비쿼터스 • 인터넷 기술 • 자율시스템 • 정보기술 • 정보통신 • 채팅 • 챗봇 • 최단경로 우선 프로토콜(OSPF) • 쿠키 • 크롤링 • 클라이언트 • 키워드 • 텔넷 • 토폴로지 • 트래픽 • 패킷 • 포털 • 포트 • 프런트엔드 • 프로토콜 • 프록시 • 해시태그

이메일	IMAP • POP3 • SMTP • 계정메일 • 네이버 메일 • 센드메일 • 스팸 • 스팸메일 • 스팸필터링 • 아웃룩 익스프레스 • 웹메일 • 이메일 • 지메일 • 한메일 • 핫메일

웹	KWCAG • WCAG • 서핑 • 시맨틱 웹 • 오프라인 웹 • 웹 • 웹 1.0 • 웹 2.0 • 웹 3.0 • 웹개방성 • 웹서비스 • 웹접근성 • 웹접근성 인증마크 • 웹주소 • 웹페이지 • 웹표준 • 웹호환성 • 피드

웹사이트	BBS • GNB • LNB • UI/UX • 게시판 • 관리자 사이트 • 그래픽 사용자 인터페이스(GUI) • 누리집 • 대시보드 • 랜딩 템플릿 • 랜딩 페이지 • 마이홈피 • 메뉴 • 모달창 • 미니홈피 • 방명록 • 배너 • 사용자 경험(UX) • 사용자 인터페이스(UI) • 왼쪽메뉴 • 웹기획 • 웹사이트 • 웹서비스 • 웹페이지 • 인터페이스 • 쪽지 • 커뮤니티 • 탑메뉴 • 탭메뉴 • 템플릿 • 팝업 • 페이지뷰 • 홈페이지 • 화면

웹브라우저	넷스케이프 • 모자이크 • 브라우저 • 브레이브 브라우저 • 블록체인 브라우저 • 사파리 • 삼성인터넷 • 스윙 • 엣지 • 오시리스 • 오페라 • 웨일 • 웹브라우저 • 인터넷 익스플로러(IE) • 크롬 • 파이어폭스 • 판도브라우저

인터넷 서비스	Mail.ru • 구글 • 구글 미트 • 구글챗 • 구글 행아웃 • 깃허브 • 네이버 • 네이버 카페 • 넷플릭스 • 다음 • 라이코스 • 레진코믹스 • 멜론 • 바이두 • 바이트댄스 • 비트토렌트 • 빌리빌리 • 소리바다 • 스포티파이 • 아마존 웹서비스(AWS) • 애플 • 야후 • 야후재팬 • 얀덱스 • 에버노트 • 에어비앤비 • 왓챠 • 웹툰 • 유튜브 • 인터넷 서비스 • 잼라이브 • 줌 • 카카오 • 탑툰 • 텐센트 • 팟캐스트 • 패스 • 페이오니아 • 페이팔 • 해시넷 • 화상통화 • 화상회의

인터넷쇼핑	11번가 • 그립 • 네이버 쇼핑 • 네이버 쇼핑 라이브 • 라이브방송 • 라이브커머스 • 모바일쇼핑 • 스쉐라이브 • 스타일쉐어 • 아마존 • 알리바바 • 오픈마켓 • 옥션 • 온라인쇼핑 • 위메프 • 이베이 • 인터넷쇼핑 • 인터파크 • 전자상거래 • 지마켓 • 징동닷컴 • 카카오 쇼핑 • 카카오 쇼핑 라이브 • 커머스 • 쿠팡 • 쿠팡 라이브 • 타오바오 • 티몬

소셜 네트워크	SNS(소셜 네트워크 서비스) • 구글 블로거 • 네이버 밴드 • 네이버 블로그 • 링크드인 • 마이크로블로그 • 맞팔 • 블로그 • 소셜 네트워크 • 웨이보 • 인스타그램 • 트루스소셜 • 트위터 • 팔로우 • 페이스북 • 플리커 • 핀터레스트

메신저	골프메신저 • 님버즈 • 대화방 • 두레이 • 디스코드 • 딩톡 • 라인 • 라인웍스 • 메신저 • 버디버디 • 스냅챗 • 스노우 • 스카이프 • 슬랙 • 아이씨큐(ICQ) • 왓츠앱 • 웹메신저 • 위챗 • 잔디 • 직톡 • 카카오워크 • 카카오톡 • 카톡방 • 큐큐(QQ) • 탱코 • 텔레그램 • 틱톡 • 페이스북 메신저 • 플로우

도메인	네임서버 • 다국어도메인 • 도메인 • 레지스트라 • 레지스트리 • 아이피 • 인터넷주소 • 인터넷키워드 • 한글인터넷주소 • 후이즈

호스팅	메일호스팅 • 서버호스팅 • 웹호스팅 • 코로케이션 • 클라우드 • 파킹 • 포워딩 • 호스팅

위키	나무위키 • 더위키 • 리그베다위키(엔하위키) • 리브레위키 • 머니파이 • 미디어위키 • 바다위키 • 아이티위키 • 요다위키 • 우만위키 • 위키 • 위키낱말사전 • 위키독스 • 위키문법 • 위키문서 • 위키문헌 • 위키미디어재단 • 위키백과 • 위키스 • 위키엔진 • 위키원드 • 위키트리 • 위키휴가 • 제이위키 • 제타위키 • 중국위키 • 팬덤(위키아) • 한국위키미디어협회 • 항공위키 • 해시넷위키

인터넷 사용자	가입 • 가입자 • 강퇴 • 계정 • 관리자 • 네트워크 관리자 • 네티즌 • 누리꾼 • 대기자 • 데이터베이스 관리자 • 등록자 • 디지털 원패스 • 로그아웃 • 로그인 • 방문자 • 블로거 • 블록체인 관리자 • 비회원 • 사용자 • 사이트 관리자 • 서버관리자 • 시삽 • 시스템 관리자 • 아이디(ID) • 웹관리자 • 웹마스터 • 유튜버 • 접속자 • 차단 • 최고관리자 • 탈퇴 • 탈퇴자 • 회원 • 휴면 • 휴면계정

인터넷 단체	IANA • ICANN • W3C • 다르파 • 유럽입자물리연구소(CERN)

위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반

↑ 스마트인컴, 〈10명 중 9명이 쓰던 '파란 인터넷'이 몰락하고 있다는데, 이유가..〉, 《네이버 포스트》, 2019-05-31

[1] 써미, 〈(최신 웹 기술 사례) 웹 개방성의 이해와 필요성〉, 《네이버 블로그》, 2016-05-11

[2] 강일용, 〈여전히 형편없는 국내 웹개방성... 대학, 연구기관 78%가 검색 제한〉, 《아이티동아》, 2013-03-11

[3] 광고컬럼, 〈23. 검색이 잘 되는 비밀! 웹 개방의 필요성〉, 《플레이디》, 2013-10-04

[4] 스마트인컴, 〈10명 중 9명이 쓰던 '파란 인터넷'이 몰락하고 있다는데, 이유가..〉, 《네이버 포스트》, 2019-05-31

[1]

[2]

[3]

[1]

@@ 3번째 줄: / 3번째 줄: @@
 == 개요 ==
 우리나라는 세계에서 가장 빠른 인터넷 환경과 전세계 4위에 달하는 스마트폰 보급률로 정확한 정보를 쉽고 빠르게 얻을 수 있는 훌륭한 정보 환경에서 살고 있다. 그만큼 좋은 정보들에 정확하게 접근하는 것 역시 중요하다. 검색이 정확히 이뤄지지 않는 정보들은 쓸모없는 정보와 다를 바 없기 때문이다. 무슨 말인가 싶겠지만, 이것이 바로 현재 우리나라 인터넷 환경이 직면한 상황이다. 우리는 구글, 네이버, 다음 등의 포털사이트에서 많은 양의 데이터를 검색하며 살고 있지만, 실제로는 매우 제한적인 검색이 이뤄지고 있다. 그 이유는 검색엔진 배제선언에 있다. 일반적으로 검색로봇이 웹사이트의 정보를 수집하는 알고리즘에서 검색엔진 배제선언을 하게 되면, 웹사이트에 검색로봇의 접근을 막아 정보를 수집할 수 없게 되는 것이다. 그래서 2011년에 행정안전부, 현 행정자치부에서 검색로봇 배제 표준 적용방법 가이드라인을 배포했다. 웹 개방성의 수준을 체계적으로 강화해 개인정보와 같은 중요 정보는 검색할 수 없도록 하고, 필요한 자료는 효율적으로 개방할 수 있게 만드는 가이드라인이지만, 대부분의 웹 사이트에서는 이러한 가이드라인을 준수하는 비율이 낮다.<ref>써미, 〈[https://blog.naver.com/PostView.nhn?blogId=tsome_&logNo=220706992710&categoryNo=27&parentCategoryNo=0 (최신 웹 기술 사례) 웹 개방성의 이해와 필요성]〉, 《네이버 블로그》, 2016-05-11</ref> 단순히 검색엔진에 키워드를 입력하는 것만으로도 웹사이트 내의 내용을 모두 찾을 수 있으면, 웹 개방성이 높은 것으로, 해당 웹사이트에 일일이 접속해 원하는 내용을 찾아야 하면 웹 개방성이 낮은 것으로 간주한다. 국내의 웹 개방성은 낮은 편으로, 국내의 대학교, 학술/연구기관은 정보접근을 완전 차단하여 검색으로 정보를 찾을 수 없게 해뒀다. 정보를 얻는 대부분의 사람들의 특성 상 양질의 정보가 있더라도 얻기 힘들다.<ref>강일용, 〈[https://it.donga.com/13450/ 여전히 형편없는 국내 웹개방성... 대학, 연구기관 78%가 검색 제한]〉, 《아이티동아》, 2013-03-11</ref> 이처럼, 웹 개방성이 낮으면 양질의 자료가 있더라도 검색으로 자료를 찾을 수 없기에 검색으로 나온 자료만을 사용하거나, 양질의 자료를 얻고싶다면 일일이 다 뒤져서 정보를 찾아야 하는 수고스러움을 동반한다. 그러므로 웹 개방성을 높혀 양질의 정보를 공유하는 것이 중요하다.
+== 웹사이트 개방 확인 방법 ==
+[[파일:문서 접근 허용.jpg|썸네일|200픽셀|문서 접근 완전 허용]]
+[[파일:문서 접근 부분 차단.jpg|썸네일|200픽셀|문서 접근 부분 차단]]
+=== robots.txt 파일 ===
+로봇 차단을 확인할 때는 웹 사이트에 접속한 후 브라우저 주소창에 해당 웹 사이트의 주소 뒤에 /robots.txt를 추가로 입력하고 엔터키를 누른 뒤 해당 페이지에 나타나는 결과에 따라 로봇을 배제하는지 안 하는지 여부를 확인할 수 있다. robots.txt가 존재하지 않는다면 화면에 Not Found라는 글자가 출력되고, 이는 모든 로봇에 대한 문서 접근을 허용하는 형태이다. 또 다른 형태로는 User-Agent와 Allow가 출력된다. User-Agent에서 *은 모든 로봇을 지칭하는 뜻이며, Allow에서 /는 모든 디렉터리에서 로봇의 접근을 허용한다는 뜻이다. Allow 대신 Disallow:/ 형태로 되어있으면, 검색 로봇이 모든 문서에 접근할 수 없도록 차단한 상태이다. 부분적으로 차단도 가능하다.<ref>광고컬럼, 〈[https://www.playd.com/contents/business/AD_column.html?type=view&page=&no=153 23. 검색이 잘 되는 비밀! 웹 개방의 필요성]〉, 《플레이디》, 2013-10-04</ref>
 == 웹 개방성의 필요성 ==

위키

이름공간

변수

보기

더 보기

검색