Archivix
Восстановление публичных веб-сайтов из онлайн-сервиса Wayback Machine
Пэт-проект
Веб-разработка
Автоматизированное восстановление любого архивированного публичного веб-сайта из онлайн-сервиса «веб-архив» (Wayback Machine)
archivix.ru
Настройка воркера
Конфигурация парсера
Отчёты по слиянию
Гибко настраиваемый парсер с основными возможностями:
- загрузка произвольных или всех TIMESTAMP'ов и SNAPSHOT'ов
- слияние всех SNAPSHOT'ов в статический рабочий локальный сайт
- корректировка и преобразование кодировки набора символов элемента и изменение соответствующих meta-тэгов
- замена дубликатов элементов более новыми (исходя их датирования timestamp'ов)
- нормализация относительных (relative links) и абсолютных ссылок (absolute links) в элементах
- аннулирование «веса» внешних ссылок или их очистка/замена
- аннулирование контактной информации в протоколах (mailto, ftp, irc, file, tel, skype, steam, bitcoin, tg, sms и т.п.) или их очистка/замена
- удаление кодов для подтверждения прав, систем аналитики и других необязательных сторонних ресурсов
- инъекция собственных объектов в элементы (sticky-сообщений, кодов для подтверждения прав, трекеров, редиректов... и т.п. (meta attrs)) или изменение существующих (контактная информация, текстовое содержимое... и т.п.)
- создание .htaccess, robots.txt, sitemap.xml