본문 바로가기
IT 인터넷

아카이브 사이트 주소와 사용방법

2022. 8. 31.
반응형

웹페이지 아카이브(박제) 방법을 알아보겠습니다. 아카이브는 커뮤니티 글, 개인 블로그 글 등 웹페이지의 다양한 문서를 이미지 형태로 보존하는 것으로 단순히 기록을 남기기 위한 목적부터 고소를 위한 증거 보존의 목적까지 다양한 이유로 사용됩니다

archive.today

archive.today는 archive.is , archive.ph와 동일한 사이트입니다. 아카이브는 원본 게시글의 삭제 여부와 상관없이 확인할 수 있어야 하기에 물리적인 서버가 필요합니다. 서버를 무료로 제공하는 아카이브 사이트가 몇 군데 있는데 archive.today가 한국어로 되어 있어 가장 사용하기 편리합니다

 

운영자 말로는 한 달에 250만원의 유지비가 들어간다고 하네요

archive.today 사용방법

아카이브 하려는 웹페이지 링크를 복사해 archive.today에 입력하기만 하면 됩니다. 페이지 변환 과정이 보이고 몇 분 정도 기다리면 아카이브 된 웹페이지를 확인할 수 있습니다

 

웹페이지 url 입력
아카이브 성공

상단의 '공유'를 누르면 축약된 아카이브 링크가 제공되며 웹사이트 링크를 검색하는 방식으로도 보존된 웹페이지 목록을 확인할 수 있습니다

예를 들어 medicalnewstoday라는 주소를 검색하자 2835개의 아카이브된 웹페이지를 확인할 수 있었습니다

유튜브와 인스타그램 아카이브

archive.today로는 유튜브나 인스타그램을 아카이브하는 게 불가능한데 thefact.io라는 신생 아카이브 서비스를 이용하면 유튜브 댓글과 인스타그램 페이지를 아카이브 할 수 있습니다

 

유튜브 영상의 경우 웨이백머신을 이용해야 합니다

 

thefact.io는 블록체인을 이용하기에 누구도 삭제할 수 없는 완벽한 아카이브로 생각할 수 있으나 프라이빗 블록체인 형태로 관리자는 게시글을 삭제할 수 있는 것 같습니다

트위터와 네이버 블로그 아카이브

아카이브 서비스마다 웹페이지를 보존하는 방식이 다른데 이로 인해 몇몇 웹페이지는 아카이브가 어려울 수 있습니다

 

특히 트위터 같은 경우 리트윗 숫자를 표시되지 않는 등 아카이브가 완벽하지 않고 네이버 블로그 같은 경우 암호화가 되어 있어 종종 한글이 깨지는 일이 발생합니다

 

네이버 블로그는 웨이백머신을 사용하는 것을 추천합니다

 

이 외에 커뮤니티 사이트를 아카이브 할 경우 해당 커뮤니티 사이트가 아카이브 크롤링 봇의 IP주소를 차단했다면 아카이브가 불가능하며 오류가 뜹니다

 

하지만 아카이브 서비스 제공자들은 대부분 크롤링 봇의 IP주소를 주기적으로 변경하기에 몇 주에서 몇 달 뒤 다시 아카이브를 시도하면 성공할 확률이 높습니다

아카이브 삭제

아카이브를 삭제하는 방법은 현실적으로 없다고 보면 됩니다. 원치 않는 내용이 박제되어 삭제하고 싶은 경우, 저작권 침해인 경우 등 다양한 이유로 아카이브를 삭제하고 싶을 수 있으나 아카이브 서비스는 대부분 해외에 운영되고 있기에(archive.today의 경우 프랑스) 강력범죄와 관련된 심각한 사안이 아닌 이상 국제공조가 이뤄지지 않습니다

 

하지만 저작권 침해의 경우 DMCA(미국의 디지털 밀레니엄 저작권법)에 따라 구글 검색 결과에 아카이브 페이지가 표시되지 않도록 할 수는 있습니다

반응형

댓글