Как посмотреть информацию на удаленных страницах?

7 августа 2015 | Автор: | Категория: Полезно знать

Получить доступ к удалённой с сайта информации можно несколькими способами.

1) Первый способ — использовать архив веб страниц.

Для этого, нужно перейти на сайт http://archive.org/web/, в строку поиска вставить нужный url и выполнить поиск. Появится календарь, на котором можно выбрать дату, когда был сделан архив сайта.

Веб архив

Как видно на скриншоте, на мой блог бот заходит не очень часто, в этом году он побывал там всего 2 раза и последняя копия, которую можно просмотреть была создана 14 марта. Наверное, из-за того, что я стал редко писать и инфа на блоге не обновляется. Вообще, на более популярные сайты бот ходит чаще.

Владелец сайта может запретить ботам веб-архива сканировать сайт. Сделать это можно добавив в файл robots.txt строки:

User-agent: ia_archiver
Disallow: /

В таком случае, после удаления сайта его содержимое нельзя будет посмотреть через веб-архив.

2) Второй способ – использовать кэш поисковых систем.

В этом случае можно посмотреть, как выглядела веб-страница, когда бот поисковой системы в последний раз сканировал ее. Получить ссылку на кешированную страницу в гугле можно выполнив поиск страницы в поисковике. Затем нажать на зелёную стрелочку возле урла и выбрать Сохраненная копия.

Google кэш

Либо перейти по ссылке, после параметра cache: заменить мою ссылку, на ту, которую хотите посмотреть.

Таким же образом можно посмотреть кэшированную копию страницы в поисковых системах: bing.com, yahoo.com, yandex.ru, rambler.ru, mail.ru.

Насчёт постоянной ссылки, где можно бы было просто меня url – не скажу, а вот стрелочка в результатах поиска и предложение посмотреть кэш страницы есть во всех перечисленных поисковиках.

Минус данного метода в том, что кэш не будет храниться вечно, как в случае с веб-архивом. Когда бот поисковой системы придет на страницу и увидит, что её нет — кэш обновится. Так что данный метод годится только в краткосрочной перспективе.

Если Ваша страница была удалена, к примеру, неделю назад можно вначале попробовать посмотреть её кэш через гугл. Если его бот уже побывал на сайте, то использовать другие поисковые системы. т.к. их боты с разной частотой могут посещать Ваш сайт и есть вероятность, что где-то ещё сохранилась нужна копия страницы.

На этом все, если знаете ещё какие-то способы получить доступ к удаленному контенту делитесь в комментариях;)

Метки: 

Комментарии к "Как посмотреть информацию на удаленных страницах?"

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *