Андрей Смирнов
Время чтения: ~8 мин.
Просмотров: 0

Как найти архивные копии сайтов интернета или машина времени для сайтов

1482761171145812120.png

Существует настоящая, реальная машина времени, в которой можно ненадолго вернуться в прошлое и увидеть, например, как выглядел тот или иной сайт несколько лет назад. Думаете, никому не нужны копии сайтов многолетней давности? Ошибаетесь! Для очень многих людей сервис по архивированию информации весьма полезен.

Во-первых, это просто интересно! Из чистого любопытства и от избытка свободного времени можно посмотреть, как выглядел любимый, популярный ресурс на заре его рождения.

Во-вторых, далеко не все веб-мастера ведут свои архивы. Знать место, где можно найти информацию, которая была на сайте в какой-то момент, а потом пропала, не просто полезно, а очень важно.

В-третьих, само по себе сравнение является важнейшим методом анализа, который позволяет оценить ход и результаты нашей деятельности. Кстати, при проведении анализа веб-ресурса очень эффективно использовать ряд методов сравнения.

Поэтому наличие уникальнейшего архива веб-страниц интернета позволяет нам получить доступ к огромному количеству аудио-, видео- и текстовых материалов. По утверждению разработчиков, В«интернет-архивВ» хранит больше материалов, чем любая библиотека мира. Мы попали в правильное место!

Что нужно, чтобы найти копии сайтов интернета?

Для того, чтобы отправиться в прошлое, нужно перейти на сайт https://web-beta.archive.org/ и воспользоваться поисковой строкой.

Простой поиск в архиве сохраненных сайтов выдает нам ссылки на все сохраненные копии запрашиваемой страницы.

1482761210112020772.png

Из этого скриншота видно, что сайт http://pikabu.ru был создан в 2009 году. Переключаясь на нужный нам год, можно увидеть даты, выделенные кружочками, это и есть даты сохранения копии сайта. Например, в 2009 году, пока можно будет увидеть только две копии от 28 и 29 июня.

Конечно, это потрясающий ресурс! Ведь здесь индексируются и архивируются все сайты интернета! Это не только скриншоты… Имея в руках такой инструмент, можно восстановить массу потерянной со временем информации.

Надо заметить, что, безусловно все восстановить однозначно не получится, так как если на страницах сайта используются элементы Java Script, или скрипты или графика взяты со стороннего сервера, то на восстановление такой информации рассчитывать не придется. Поэтому к сохранению данных своего сайта нужно относиться с особенным вниманием, несмотря ни на что.

Берегите себя и своих близких!

15

Смотрим кэшированные документы

Иногда вы делаете кой-какие изменения на своём сайте (с целью улучшения SEO-показателей) и, что весьма логично, вам хочется узнать, как поисковики отнесутся к этим изменениям — улучшат/ухудшат ранжирование страниц(ы) или же всё оставят без изменений?

Для того, чтобы узнать, «увидели» или нет поисковые роботы внесённые вами изменения, необходимо проверить «свежесть» страницы вашего сайта в поисковом индексе. Т.е. нужно понять — обновилась ли страница в кэше поисковика после ваших изменений или нет?

Кэш поисковой системы — это почти то же самое, что и её индекс. Это копии документов сайта от определённого числа (обычно, от момента последнего посещения поисковым роботом), которые хранятся у поисковиков. Чем-то он напоминает кэш-память браузера.

Как посмотреть кэш страницы сайта?

Все основные поисковики охотно предоставляют возможность просмотреть кэш веб-документов в их индексе. Сделать это можно вручную или по-быстрому.

По-быстрому — проще всего при помощи специальных сервисов и дополнений для браузеров, почитайте эти статьи (там всё просто):

  • RDS bar в Хроме.
  • Page Promoter в Firefox.

Но и вручную уметь это делать также полезно, потому как плагины иногда глючат, сервисы недоступны и т.п.

Да, и увидеть кэш документа не получится, если он вообще не проиндексирован. Про то, как проверить индексацию в Яндексе, Гугле, Mail.ru и Bing.com — здесь.

Просмотр кэша страницы вручную

В Google

На странице с выдачей (SERP) следует навести мышку на конкретный результат выдачи и кликнуть «Сохраненная копия»:

Просмотр кэшированного документа в Google

Естественно, запрос можно сформировать как угодно. На картинке приведён пример просмотра кэша конкретной страницы —  http://web-ru.net/category/internet/.

Интересно, что прямо сейчас после клика по ссылке «Сохраненная копия» меня перекинуло на документ 404-й ошибки в Google:

404 в Google

Бывает и такое. Но, как правило, это временное явление. Обычно же просмотр страницы из кэша выглядит как-нибудь так. Т.е. он представляет из себя html-фрейм, в который загружен весь сайт.

У каждой из этих 4-х поисковых систем сверху можно обнаружить надпись вроде такой «по состоянию на 9 окт 2012 15:13:22 GMT». Т.е. отображается веб-страница такой, какой она была 9 октября 2012 года.

Кэш в Яндексе

Смысл тот же: вводим запрос, наводим курсор на один из результатов выдачи и кликаем на «Копия»:

Посмотрим кэш страницы в Яндекс

Для Bing.com

Нужно кликнуть на маленькую стрелочку, расположенную около URL-адреса страницы:

Кэш документав Bing.com

В Mail.ru

В этой поисковой системе лучше смотреть кэш отдельных страниц, а не, например, категорий. Просто потому что в Мэйле при запросе, содержащем URL категории, могут быть выведены ссылки на несколько статей этой категории, а не на саму категорию. Хотя Mail.ru как поисковик пока особо не интересен, и можно об этом вообще не думать. Ну а в целом, всё то же:

Кэш документа сайта в Mail.ru

Кстати, если в Гугле, Яндексе и Bing ввести «человеческий» запрос и посмотреть кэшированный документ, то этот запрос будет выделен на открытом сайте жёлтым цветом. Примерно так:

Выделенный запрос в кэше страницы в Гугле

Это может быть способом посмотреть, например, как оптимизированы тексты на сайтах ваших конкурентов

Таким образом, зная дату и время занесения страницы в кэш Google, Yandex и т.д. можно понять, известно ли поисковой системе о произошедших на ней изменениях или пока ещё нет.

—>

  • 9.pngПартнерская программа криптовалютного казино BitStarzBitStarz — это криптовалютное онлайн казино, которое появилось в сети 4 года назад….
  • 7.pngДобавляем сайт в поиск Mail.ru. Обзор инструментов для вебмастераДавненько я уже собирался ознакомиться с инструментами для вебмаст…
  • 5.pngЧто такое склейка доменов и главное зеркало сайта?…u по всем запросам выдаётся новый ресурс — B.ru. А старый постепенно выкидывается из
  • 16.pngНовое в Интернете и SEO. Изменения в Яндексе и Google. Осень 2012…ематика доноров. Что ещё… впервые взломали один из моих
  • 11.pngКак скачать и установить Денвер (Denwer) на локальный компьютер и запустить сайт. Видео урок…Данный процесс довольно прост и занимателен и состоит из трёх шагов: —
2 мая 2016 09:40

—> ib_345843_index.jpg —>

Сервисы и трюки, с которыми найдётся ВСЁ.

Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход.

Всё, что попадает в интернет, сохраняется там навсегда. Если какая-то информация размещена в интернете хотя бы пару дней, велика вероятность, что она перешла в собственность коллективного разума. И вы сможете до неё достучаться.

Поговорим о простых и общедоступных способах найти сайты и страницы, которые по каким-то причинам были удалены.

1. Кэш Google, который всё помнит

Google специально сохраняет тексты всех веб-страниц, чтобы люди могли их просмотреть в случае недоступности сайта. Для просмотра версии страницы из кеша Google надо в адресной строке набрать:

http://webcache.googleusercontent.com/search?q=cache:http://www.iphones.ru/

Где http://www.iphones.ru/ надо заменить на адрес искомого сайта.

2. Web-archive, в котором вся история интернета

Во Всемирном архиве интернета хранятся старые версии очень многих сайтов за разные даты (с начала 90-ых по настоящее время). На данный момент в России этот сайт заблокирован.

3. Кэш Яндекса, почему бы и нет

К сожалению, нет способа добрать до кэша Яндекса по прямой ссылке. Поэтому приходиться набирать адрес страницы в поисковой строке и из контекстного меню ссылки на результат выбирать пункт Сохраненная копия. Если результат поиска в кэше Google вас не устроил, то этот вариант обязательно стоит попробовать, так как версии страниц в кэше Яндекса могут отличаться.

4. Кэш Baidu, пробуем азиатское

Когда ищешь в кэше Google статьи удаленные с habrahabr.ru, то часто бывает, что в сохраненную копию попадает версия с надписью «Доступ к публикации закрыт». Ведь Google ходит на этот сайт очень часто! А китайский поисковик Baidu значительно реже (раз в несколько дней), и в его кэше может быть сохранена другая версия.

Иногда срабатывает, иногда нет. P.S.: ссылка на кэш находится сразу справа от основной ссылки.

5. CachedView.com, специализированный поисковик

На этом сервисе можно сразу искать страницы в кэше Google, Coral Cache и Всемирном архиве интернета. У него также еcть аналог cachedpages.com.

6. Archive.is, для собственного кэша

Если вам нужно сохранить какую-то веб-страницу, то это можно сделать на archive.is без регистрации и смс. Еще там есть глобальный поиск по всем версиям страниц, когда-либо сохраненных пользователями сервиса. Там есть даже несколько сохраненных копий iPhones.ru.

7. Кэши других поисковиков, мало ли

Если Google, Baidu и Yandeх не успели сохранить ничего толкового, но копия страницы очень нужна, то идем на seacrhenginelist.com, перебираем поисковики и надеемся на лучшее (чтобы какой-нибудь бот посетил сайт в нужное время).

8. Кэш браузера, когда ничего не помогает

Страницу целиком таким образом не посмотришь, но картинки и скрипты с некоторых сайтов определенное время хранятся на вашем компьютере. Их можно использовать для поиска информации. К примеру, по картинке из инструкции можно найти аналогичную на другом сайте. Кратко о подходе к просмотру файлов кэша в разных браузерах:

Safari

Ищем файлы в папке ~/Library/Caches/Safari.

Google Chrome

В адресной строке набираем chrome://cache

Opera

В адресной строке набираем opera://cache

Mozilla Firefox

Набираем в адресной строке about:cache и находим на ней путь к каталогу с файлами кеша.

Что делать, если вообще ничего не помогло

Если ни один из способов не дал результатов, а найти удаленную страницу вам позарез как надо, то остается только выйти на владельца сайта и вытрясти из него заветную инфу. Для начала можно пробить контакты, связанные с сайтом на emailhunter.com.

Рейтинг автора
5
Подборку подготовил
Илья Коновалов
Программист и опытный пользователь интернета
Написано статей
179
Ссылка на основную публикацию
Похожие публикации