Archivix

Восстановление публичных веб-сайтов из онлайн-сервиса Wayback Machine

Пэт-проект

 Веб-разработка

Автоматизированное восстановление любого архивированного публичного веб-сайта из онлайн-сервиса «веб-архив» (Wayback Machine)

archivix.ru

Настройка воркера

Конфигурация парсера

Отчёты по слиянию

Гибко настраиваемый парсер с основными возможностями:

  • загрузка произвольных или всех TIMESTAMP'ов и SNAPSHOT'ов
  • слияние всех SNAPSHOT'ов в статический рабочий локальный сайт
  • корректировка и преобразование кодировки набора символов элемента и изменение соответствующих meta-тэгов
  • замена дубликатов элементов более новыми (исходя их датирования timestamp'ов)
  • нормализация относительных (relative links) и абсолютных ссылок (absolute links) в элементах
  • аннулирование «веса» внешних ссылок или их очистка/замена
  • аннулирование контактной информации в протоколах (mailto, ftp, irc, file, tel, skype, steam, bitcoin, tg, sms и т.п.) или их очистка/замена
  • удаление кодов для подтверждения прав, систем аналитики и других необязательных сторонних ресурсов
  • инъекция собственных объектов в элементы (sticky-сообщений, кодов для подтверждения прав, трекеров, редиректов... и т.п. (meta attrs)) или изменение существующих (контактная информация, текстовое содержимое... и т.п.)
  • создание .htaccess, robots.txt, sitemap.xml

Примеры восстановлений