Представьте ситуацию: вы создаете сайт. Нанимаете веб-мастера или делаете его сами, потратив на это много денег и личного времени. Размещаете свое детище на хостинге и любовно заполняете его информацией, не задумываясь о том, что нужно сохранить копию сайта, чтобы не потерять данные.
В один день, не очень для вас прекрасный, вы заходите на свой сайт, а он не работает. Вы начинаете узнавать, в чем дело, и, о ужас, сгорел дата-центр или полетел хостинг. А может, к вам забрался вирус и уничтожил данные. Потеря информации на сайте сравнима с потерей информации на компьютере. Так как же сохранить копию сайта?
Вам будет интересно:Лучшие CMS для создания сайта: обзор, сравнение и отзывы
Разберемся сначала с определением. Процесс архивирования веб-сайтов — это сохранение текущей версии страницы или сайта в архиве для последующей работы с ним. Для данных целей используется специализированное программное обеспечение. Крупнейшей компанией в мире является Internet Archive, о которой мы поговорим ниже.
Для частного архива вы можете воспользоваться офлайн-браузерами, которые были специально созданы для работы в офлайн-режиме. Они помогут создать локальные копии отдельных веб-страниц или сайтов целиком. К ним, например, относятся:
- Кросс-платформенный HTTrack-браузер, который поддерживает 29 мировых языков и способен возобновлять прерванные закачки, обновлять зеркало сайта.
- Условно бесплатный Offline Explorer, который позволяет скачивать не только файлы или страницы, но и целые сайты из Интернета по протоколам FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
- Менеджер закачек Free Download Manager. Он интегрируется со всеми браузерами, имеет встроенный FTP, поддерживает протокол BitTorrent, может создавать torrent-файлы, перехватывать ссылки из буфера обмена.
- Teleport Pro с закрытым исходным кодом для Windows. Программа позволяет скачивать сайты целиком.
- Свободная консольная неинтерактивная программа для загрузки файлов и сайтов из Интернета Wget. Программа поддерживает протоколы HTTPS, HTTP, FTP, а также может работать через HTTP прокси-сервер. Подходит для Linux.
Вам будет интересно:Бесплатный HTTPS-сертификат: инструкция по получению
Создание резервной копии на хостинге
Можно настроить резервное копирование сайта на вашем хостинг-провайдере. Для этого вам нужно зайти в админпанель, в раздел создания резервных копий. У каждого хостинга своя админпанель, и тяжело сказать, где именно у вашего размещается этот раздел. Если не можете разобраться, напишите в техническую поддержку.
Создание резервной копии плагинами
Если ваш сайт размещается на CMS-платформе, такой как, например, WordPress, вы можете сохранить копию сайта, установив плагин wp-db-backup (ru.wordpress.org/plugins/wp-db-backup/) или похожие на него. Правильно настроив плагин, вы будете получать бэкап сайта каждый день или каждую неделю, как пожелаете.
Как сохранить копию сайта на компьютер
На компьютер можно сохранить сайт, используя FTP-клиент. Если вы пользуетесь программой FileZilla, то создайте на своем компьютере папку "Бэкап" (имя папки может быть любым). Подключитесь к серверу через FTP-клиент и простым перетаскиванием сделайте полный бэкап сайта в папку "Бэкап".
Кроме этого, можно воспользоваться сервисом Site2ZIP (сайт в архив), программой для скачивания WinHTTrack WebSite Copier. Как посмотреть сохраненную копию сайта? Для этого нужно открыть папку, в которой был сохранен сайт, и кликнуть на файл index.html.
" class="page-contents-link">Интернет-архив
В Сан-Фарнциско в 1996 году Брюстер Кейл основал некоммерческую организацию "Архив Интернета". Он собирает копии всех веб-страниц, аудио- и видеозаписи, графические файлы и программы. Здесь очень долго хранятся архивы собранного материала и имеется к своим базам бесплатный доступ для всех желающих.
Если вы задаетесь вопросом о том, как открыть сохраненную копию сайта, то перейдите по адресу archive.org/web/ и в соответствующем поле введите адрес сайта или страницы. В конце 2012 года размер Интернет-архива составлял 10 петабайт - это 10 000 терабайт! А к середине 2016 года в нем накопилось 502 млрд копий веб-страниц.
Кэширование сайта поисковыми системами
Сохраненная копия сайта Google — это не что иное, как кэш страниц сайта, который был сделан поисковой системой. Любой пользователь в любой момент может использовать для своих нужд копию страницы. Сохранение их на серверах поисковых систем занимает много ресурсов, и для этого выделяется немало денег, но такая помощь окупает себя, так как мы все равно заходим на поисковые системы. Правда, этот способ подходит только для существующих сайтов или для тех, которые были удалены недавно. Если же это произошло достаточно давно, то поисковая система стирает данные.
Специализированный поисковик
Кроме того, что вы можете вручную искать кэшированные страницы в Google или "Яндексе", вы можете воспользоваться специализированным поисковиком cachedview.com. У него есть аналог: cachedpages.com.
Если вы хотите сохранить копию сайта или его отдельной страницы, вы можете сделать это самостоятельно и бесплатно на сайте archive.is. Кроме этого, там есть и глобальный поиск по версиям, которые были когда-либо сохранены пользователем.
Создание веб-архива в национальных библиотеках
На сегодняшний день перед национальными библиотеками стоит задача создания архивов интернет-документов, которые являются частью научного, культурного и исторического наследия человечества. Но это очень проблематично.
Проведенные исследования выявили, что количество веб-документов в Сети растет экспоненциально, и в среднем документ живет от одного до четырех месяцев. В качестве единицы учета архива веб-документов удобнее всего использовать веб-сайт. Процесс создания фонда состоит в создании копии или "зеркала" сайта. Так как информация на нем изменяется со временем, библиотеке нужно создавать зеркала одного и того же веб-сайта с определенной периодичностью.
Так, в Швеции 60 000 сайтов, что в 20 раз превышает количество традиционных печатных изданий. Экземпляры печатных документов в библиотеке Швеции занимают 1,7 км полок в год. Веб-архив занял бы 25 км полок! Сейчас их архив содержит 138 млн файлов общим весом 4,5 гигабайта.
Интернет растет каждый день. Есть множество компаний и сайтов, которые заботятся о том, чтобы сохранять копии веб-страниц в своих архивах. Но не стоит полагаться только на них. Делайте своевременные бэкапы, и вы не потеряете свой сайт никогда.