Дорвеи и текстовка. Анонс эксперимента.

Опубликовано tulvit - чт, 06/05/2010 - 01:49

Факторов, влияющих на автобан или вылет дора из индекса, великое множество. Но основной, конечно же, это текстовка, т.е. контентная составляющая.

Цель эксперимента – выявить лучший источник контента для дорвеев. В идеале добиться того, чтобы фильтр за текст не налагался вообще.

Будет протестировано использование шести разных вариантов текстовок, по три дора на каждый вариант:

  • 3 дора на генерированном контенте
    Использоваться будет встроенный в RedButton генератор.
  • 3 дора на синонимизированном контенте
    Синонимизировать буду с помощью AllSubmitter-а.

  • 3 дора на транслите
    Перевод с английского на русский гуглом. Будет найден такой тип контента, при котором полученный перевод остается читаемым и морфологически правильным. Т.е. «сложные» статьи не подходят, нужно будет найти «simple English text», может форумы, детские сайты, обучающие ресурсы и т.д.

  • 3 дора на копипасте
    Чистый копипаст.

  • 3 дора без контента
    Точнее без текстового контента. Только картинки, ролики с ютуба и т.д.

  • 3 дора на унике
    Писать самому, парсить закрытые для индексации ресурсы (группы в вконтакте, сайты с запретом в роботсе ботов яндекса).

Для чистоты эксперимента никаких дорогенераторов использовано не будет. Все дорвеи будут сделаны вручную, на CMS Drupal.

Немного о самом подходе к созданию дорвеев. Все дорвеи будут иметь разные шаблоны. Структура – что-то среднее между новостным сайтом и блогом. Если не вчитываться в контент, то сходу сказать, что это дорвеи, будет трудно. Прикручу комментарии, всякие фичи типа «топ новостей», голосование и т.д. Т.е. фактически банить кроме как за контен не за что. Чего и добиваемся.

Небольшое отступление на тему технической реализации. Друпал «из коробки» достаточно ограничен по функциональности, надо ставить и настраивать кучу модулей. Делать это 18 раз подряд никакого желания нет. Поэтому на локалхосте создам некую дорвейную сборку, забэкаплю, и потом просто разверну на восемнадцати сайтах, подкручивая некоторые модули по отдельности, чтобы каждый дор был хоть как-то уникален по своей структуре.

Сколько будет страниц на каждом доре, не знаю. Не меньше 100 точно. Скорее всего от 500, в идеале около 1000 и больше. Сказывается то, что все посты будут создаваться руками, а 1000 постов на 18 сайтах – это 18к публикаций. Даже если в минуту постить по три новости (форматирование, нормальный заголовок и т.д.), то это займет 18к/(3*60)=100 часов чистого времени. Так что скорее всего буду заполнять каждый сайт по мере попадания страниц в индекс, ибо зачем заполнять дор на 1к страниц, если еще даже опубликованные 100 не проиндексировались. Также вполне возможно, что будет настроена отложенная публикация, т.е. 100 страниц не сразу создаются, а автоматически по 5-15 в сутки.

Ключи буду собирать сам и объединять с паблик базами. Помимо автоматической чистки, все кеи просмотрю вручную, чтобы не было мусора. Ключи для доров пересекаться не будут, т.е. вся база поделится на 18 частей (чтобы в топе по нч не висело более одного моего дора).

Никакой пересылки юзверей на платник поначалу стоять не будет. Поставлю только тогда, когда дорвеи полностью проиндексируются и пойдет трафик.

Да, забыл про тематику сказать. Тематику выбрал дэйтинг, как одну из самых сложных, трафикогенерирующих и денежных. По поводу сложности, бытует мнение, что сайт подвергается той или иной проверке в зависимости от ключевых слов. Т.е. ПС слишком затратно каждый сайт скрупулезно изучать на сгенерированность, поэтому были выделены тематики, наиболее популярные у дорвейщиков, и сайты по ним анализируются тщательнее, нежели по другим. Иными словами, если дор на какую-то узкую тематику не вылетел из-за текстовки, то использую эту же текстовку, только для дэйтинг ключей, дор улетит в бан в считанные дни, если не часы.

Что сделано на данный момент? Пока только зарегистрированы и привязаны к хостингу домены, доделывается сборка Drupal, подобраны шаблоны.

Планы примерно такие: на днях залить и настроить движок на всех 18-ти дорах, написать приветственную страницу аля «Скоро здесь будет лучший сайт знакомств», дождаться пока все доры влезут в индекс главной страницей (если главная страница какого-то сайта упорно не хочет лезть в индекс, то он удаляется и заместо него создается новый), подождать несколько апов, и уже только тогда начинать заполнять контентом.

По каждому дору будет вестись детальная статистика, в какой ап сколько страниц влезло, когда вылетело и т.д. Логи сервера буду бегло просматривать, на детальный ежедневный анализ сил не хватит, только если напишу под это дело скрипт (скорее всего так и поступлю).

Еще не совсем определился по поводу оптимизации каждой страницы под конкретный ключевик. Нужная плотность ключевого слова в тексте будет достигнута только в дорах на сгенерированном контенте, во всех остальных случаях надо будет вставлять в каждый пост пару предложений с ключевыми фразами самому, или ограничиться тем, что ключ будет только в тайтле и названии статьи. Как буду делать в итоге, решу после анализа серпа.

О результатах эксперимента напишу, как только все доры забанятся, т.е. не раньше чем через месяц.

Добавить комментарий

You must have Javascript enabled to use this form.