ТаблицейБлоками.Приложение Д: Клоакинг Doorways дорвей клоачные скрипты |
Последняя модификация: 10.08.2014 г
Страница загружена с адреса: http://webdesign.site3k.ru/conjuncture/append/d/cloak.html
Сразу оговорюсь здесь не будут приводиться клоачные скрипты, так как если благодаря данному материалу какие-то из них приобретут большую популярность, все поисковики включат в своих роботов функции по их отлову и, содержащие их страницы вскоре будут исключены из поисковых баз, а включение этих скриптов в страницы потеряет всякий смысл (впрочем, кое-что, я все таки привел, получив «добро» поисковых систем). Расскажу только о том, что это такое, для чего и как может использоваться. Если же, после прочтения материала, вы захотите иметь эти скрипты, вам придется изобрести их самостоятельно. Комментировать ваши скрипты я тоже не стану, так что не высылайте их мне по почте. Если хотите обсудить, обращайтесь на www.searchengines.ru. Этот сайт целиком посвящен подобным вопросам и ваши скрипты будут проанализированы на его форуме (но не ищите там готовых скриптов, так как они могут там размещаться только как материал для обсуждения и не слишком откровенничайте: супермодератором форума является Александр Садовский менеджер поисковой системы Яндекс).
Во-первых, клоакинг и дорвеи вещи различные, но, настолько взаимосвязанные, что в разговоре о них не имеет смысла отделять одно от другого.
Клоакинг от англ. to cloak (скрывать, маскировать) это подмена одних страниц другими, в зависимости от посетителя. Например, при попадании посетителя на сайт, скриптом главной страницы определяется используемый им браузер, после чего все динамические ссылки страницы меняют свое значение так, чтобы указывать на каталог сайта, оптимизированный, именно под этот браузер. Например:
<A href= javascript:window.location = navigator.appName + /MyLinkFile.html;> Перейти </A>
Подобные «оптимизации» можно устраивать не только для наилучшего отображения страниц в браузере, но и для «наилучшей индексации» в поисковых системах, показывая поисковым роботам одни страницы, а живым посетителям совершенно другие. Для определения типа посетителя используется поле USER_AGENT http-запроса или IP-адрес (адреса поисковиков приходится знать заранее и постоянно обновлять). Многие считают определение поисковиков по их адресам самым надежным способом, но мне это кажется тотальным заблуждением: Этот адрес постоянно меняется, а прозевать его изменение значит рассекретить свою клоачную страницу, после чего она исключается из поисковой базы и, создаваемый ей вес автоматически исчезнет. Придется делать новую страницу, причем, как можно раньше и, ждать почти месяц, пока она вновь поднимет вес сайта. Но сначала обнаружить рассекреченность страницы!
Использование USER_AGENT, считаясь менее надежным, на самом деле таковым вряд ли является. Если роботы начнут выдавать себя за нормальный браузер, они не смогут корректно обрабатывать файлы robot.txt а это не выгодно ни посетителям, ни владельцам серверов, ни владельцам сайтов (больший трафик на линии, увеличение времени индексации, уменьшение скорости получения страниц с сайтов) никому. Конечно, возможен вариант, когда при чтении robot.txt поисковик честно сообщает свое имя, а при чтении остальной информации, выдает себя за IE или Mozillo я бы именно так и делал, но, по каким-то, никому не известным причинам, поисковые роботы самоуверенны и откровенны до безобразия и, по уверению людей, использующих USER_AGENT, он работает безупречно.
Дорвей (Doorway) входная дверь страница максимально настроенная на соответствие поисковому запросу посетителя поисковой системы с той целью, чтобы оказаться первой в результатах поиска. Алчность многих сайтостроителей привела к такой ситуации что, не используя дорвеи, невозможно даже надеяться на то, что ваша страница, как бы точно она не отражала требуемый посетителю контекст, окажется в результатах поиска, хотябы, на сотой странице. Ведь ваша ценнейшая страница, посвященная кактусам, может упоминать слово кактус всего пару раз, а в остальных случаях, говорить либо о необходимой им почве, либо об условиях роста, либо использовать личные местоимения (их, они и т. д.), либо обходится выражениями типа «эти растения» Да и называться страница может «Наши шипованные питомцы», в то время как на тысячах чужих дорвеев, под названием «Кактус, кактус, и еще раз, кактус» слово «кактус» будет упоминаться по сотне раз, да еще и в заголовках. Эти страницы вообще могут состоять из одних слов «кактус»! Тупой робот поисковой системы, естественно, оценит, какое место этому слову отводится на этих страницах и сочтет их гораздо точнее соответствующими поисковому запросу (а вашу, содержащую реальную информацию, неизбежно сочтет третьесортной).
Конечно, такие страницы не предназначены для живого читателя. Тут-то и применяются клоачные технологии. Поэтому, дорвеи и клоакинг это темы, раздельное рассмотрение которых уместно только для уточнения их отдельных аспектов (или в очень коротких статьях, принятых практически на всех сайтах), но не для данного материала, предназначенного для широкого освещения этого вопроса (и тем более не для этого сайта, назначение которого глобальные исследования с последующим изложением всех полученных данных в рамках одной Web-страницы).
В зависимости от того, будет ли отображаться Doorway посетителю или нет, дорвеи делятся на 2 типа: отображаемые и неотображаемые Doorways.
Для того чтобы оптимизировать страницу для поисковых систем часто используется следующие честные приемы:
«Примеры Doorways смотрите <a href=MySample.html>Здесь</a>»,
«Здесь вы можете просмотреть примеры <a href=MySample.html>Doorways</a>»,
Нечестные приемы, используемые для поднятия релевантности страницы:
h1, h2, h3, h4 {font-size:12pt; font-weight:normal} b, strong, i, em, u {font-weight:normal; text-decoration:none; font-style:normal}
<html> <!--#if expr="$HTTP_USER_AGENT=/Mozilla/" --> <!--#include virtual="для_браузеров.txt"--> <!--#else --> <!--#include virtual="для_поисковиков.txt"--> <!--#endif --> </html>
Боже, надоумь поисковые системы прикидываться Internet Explorer-ом. Неужели нам мало теневой экономики, так у нас будет еще и теневой Интернет?
Yandex, Апорт и Punto надеются уберечь пользователей своих поисковых систем от такого надувательства с помощью учета ссылочной популярности страницы если на страницу ссылаются, то она важна, независимо от примененного клоакинга, если нет ее позиция в результатах поиска окажется гораздо ниже (но ведь все-таки выше чем без клоакинга!). Рамблер уповает на посещаемость если страница не интересна, то на нее второй раз не придут, посещаемость будет ниже, а значит и позиция в результатах поиска (но, опять же, выше чем без клоакинга!). И, конечно же, все применяют карательные меры, выявляя спам... Но это не уловимо, никто же не запретит определять тип браузера!
Создание неотображаемых релевантных страниц проще, чем создание отображаемых. Достаточно чтобы текст страницы состоял из ключевых слов и словосочетаний, оформленных как заголовки и выделенных различными способами. При этом повторяемость слова не должна превышать 10 процентов текста, для чего достаточно включить в Doorways 10 12 ключевых слов и словосочетаний (тогда повторяемость каждого из них не превысит 10%). Для того чтобы живой посетитель не был шокирован полученной страницей, применяется переброска на нормальную страницу:
<img src="11" border="0" onError="document.writeln('<h1 align=center>Сайт переехал, <a href=\'Ваш_настоящий_файл\'>жми сюда!</a></h1>');">
(При этом никакого рисунка под наванием 11 на сайте не должно быть).
Лично я двумя руками (и другими конечностями) за то, чтобы пользователь поисковых систем находил именно то, что ищет. Если для этого требуется Doorways и клоакинг – пусть будут Doorways и клоакинг. Если можно обойтись без них (ну, без клоагинга, надеюсь, а без дорвеев…) – безопасней обходиться без них. Если же Doorways и клоакинг применяется не по делу (текст не соответствует ключевым словам, что часто используется для увеличения показания счетчиков посещаемости или показа рекламы), то такие сайты (а не только страницы), нужно рубить на корню.