Archive.today

Cet article est une ébauche concernant Internet et un site web.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.



Adresse	Site officiel
Publicité	non
Type de site	Archivage web
Langue	anglais
Inscription	non
Lancement	2012
État actuel	actif
modifier

Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données est situé en France, dans le Nord-Pas-de-Calais^{[réf. nécessaire]}. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Particularité

Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt^[1]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.