О сайтах и не о сайтах

Теперь и в tg!

tg

Переехал с твиттера на t.me/tulvit_blog, если что.

Дорвеи и текстовка. Результаты эксперимента.

Около двух месяцев назад я анонсировал эксперимент «дорвеи и текстовка». Что ж, пора поделиться результатами.

В двух словах о самом эксперименте. Было сделано суммарно 18 дорвеев, протестированы шесть вариантов текстовок (по три дора на каждый).

Домены брались нулевые, на которые вешались заглушки «сайт в разработке» на срок примерно полторы-две недели, до тех пора пока эти самые заглушки не попадут в индекс. После чего выжидалось какое-то время (от нескольких дней), и доры начинали заполняться контентом, по 10+ постов в сутки.

Количество страниц у каждого дора небольшое, 100+ самих статей, плюс навигация по страницам, рубрикам и тегам.

Слива трафика не было чисто принципиально, чтобы не нарушать чистоту эксперимента.

  • 3 дора на генерированном контенте

    На всех трех дорах текстовка делалась по одной схеме. Было взято 100+ метров текстовки (источники точно не вспомню, но их было много, в основном книги в txt). 100 метров текста разбивалось на пять равных частей, на основе каждой полученной текстовки генерировался дорвей на несколько сотен страниц доргеном RBT с разной степенью уникализации. В итоге получилось пять сгенерированных дорвеев из исходника в 20+ метров для каждого, и на основе их контента и заполнялись три экспериментальных дора. Т.е. на конечном дорвее подряд шли статьи, сгенерированные из разных текстовок с разной степенью уникализации. Сделано это было с целью понизить вероятность распознавания сгенерированного текста Яндексом.

    #1 дорвей
    1АП – 7 страниц
    2АП – 2 страницы
    3АП – 2 страницы
    4АП – 3 страницы
    5АП – 4 страницы

    #2 дорвей
    1АП – 4 страницы
    2АП – 5 страниц
    3АП – 5 страниц
    4АП – 5 страниц
    5АП – 9 страниц

    #3 дорвей
    1АП – 53 страницы
    2АП – 10 страниц
    3АП – 7 страниц
    4АП – 5 страниц
    5АП – 9 страниц

    До сих пор в индексе у каждого <10 страниц, полностью не вылетел ни один дор.

  • 3 дора на синонимизированном контенте

    Синонимизировал исключительно AllSubmitter-ом.

    #1 дорвей
    В качестве текстовки использовался сервис Гугл Новости (агрегатор новостников).
    1АП – 7 страниц
    2АП – 1 страница
    3АП – 0 страниц
    4АП – 0 страниц
    5АП – 2 страницы

    #2 дорвей
    В качестве текстовки использовались адалт рассказы.
    1АП – 21 страница
    2АП – 93 страницы
    3АП – 0 страниц

    #3 дорвей
    В качестве текстовки использовался сервис Яндекс Новости (агрегатор новостников), адалт рассказы. Вся текстовка была перемешана.
    1АП – 83 страницы
    2АП – 138 страниц
    3АП – 0 страниц

    В итоге из трех доров на данный момент в индексе только один с двумя страницами (без главной).

  • 3 дора на транслите

    Перевод с английского на русский Гуглом.

    #1 дорвей
    В качестве текстовки использовался сервис Гугла «Поиск по блогам».
    1АП – 14 страниц
    2АП – 0 страниц

    #2 дорвей
    В качестве текстовки использовался агрегатор новостей Гугла.
    1АП – 0 страниц

    #3 дорвей
    В качестве текстовки использовались сервисы Гугла «Гугл Новости» и «Гугл Блоги», примерно в равных пропорциях.
    1АП – 3 страницы
    2АП – 0 страниц

    Из трех доров на транслите не выжил никто.

  • 3 дора на копипасте

    #1 дорвей
    В качестве текстовки использовался сервис «Яндекс Новости». Статьи подбирались тематические.
    1АП – 72 страницы
    2АП – 145 страниц
    3АП – 98 страниц
    4АП – 0 страниц

    #2 дорвей
    В качестве текстовки использовались адалт рассказы.
    1АП – 10 страниц
    2АП – 0 страниц

    #3 дорвей
    В качестве текстовки использовался сервис «Яндекс Новости», адалт рассказы, анекдоты и т.д.
    1АП – 10 страниц
    2АП – 9 страниц
    3АП – 9 страниц
    4АП – 9 страниц
    5АП – 10 страниц

    Из трех доров выжил только один, количество страниц в индексе у которого не более 10.

  • 3 дора без контента

    Имеется ввиду в виду без текстового контента. Только тайтлы и альты к картинкам.

    #1 дорвей
    Контент – ролики с ютуба. По одному на пост.
    1АП – 120 страниц
    2АП – 186 страниц
    3АП – 230 страниц
    4АП – 0 страниц

    #2 дорвей
    Контент – ролики с ютуба и картинка, спарсенные с Гугл Картинок по англоязычным запросам.
    1АП – 75 страниц
    2АП – 182 страницы
    3АП – 222 страницы
    4АП – 0 страниц

    #3 дорвей
    Из контента только картинки, по 2-6 на пост, одна в анонсе, остальные под катом. Прописанные альты.
    1АП – 57 страниц
    2АП – 124 страницы
    3АП – 152 страницы
    4АП – 0 страниц

    Все три дора вылетели полностью.

  • 3 дора на унике

    Контент уникальный. Источник – обсуждения во вконтакте. Объем контента на каждый пост от 0.2к до 2к символов. Использовался кат для постов больше 600 символов.

    #1 дорвей
    1АП – 15 страниц
    2АП – 99 страниц
    3АП – 124 страницы
    4АП – 0 страниц

    #2 дорвей
    1АП – 28 страниц
    2АП – 186 страниц
    3АП – 236 страниц
    4АП – 0 страниц

    #3 дорвей
    1АП – 65 страниц
    2АП – 128 страниц
    3АП – 10 страниц
    4АП – 10 страниц
    5АП – 10 страниц

    Из трех доров на унике два вылетело, один остался с 10 страницами в индексе.

Апдейты указались не все, а только значащие. Однако указанные апдейты для каждого дора идут один за другим, чтобы лучше прослеживалась статистика. Изначально каждый дорвей был в индексе страницей-заглушкой.

Все дорвеи были на одном хостинге, на одном ip. На всех стояла статистика LI, и все были добавлены в панель вебмастера Яндекса. Средняя продолжительность пребывания уника на страницах дорвея, а также количество просмотренных им страниц, отлична от нуля. Кто-то даже участвовал в опросах (на многих дорвеях был установлен модуль опросов).

Часть доров побанилась, часть попала под АГС. Некоторые фильтровались сразу, некоторые успели полностью проиндексироваться.

Писать какие-то абстрактные выводы исходя из результатов эксперимента на тему «какая текстовка лучше», не буду. Эта тема отдельно поста, здесь же только результаты эксперимента.

Комментарии

Все побанилось это ясно и было неизбежно, лучше скажи какая была посещалка - может хоть она порадовала?
Теперь ты понял что не надо тратить на доры свое время?

Посещалка была мизерная, соотношение (уников в день)/(страниц в индексе) примерно 1/10, хотя при желании с чищенными ключами можно добиться 1/1 и выше. Добиться посещаемости задачи как таковой не было, т.к. изначально станиц было очень мало, надо 1-5к хотя бы, а у меня было чуть больше сотни.
/Теперь ты понял что не надо тратить на доры свое время?
Скорее наоборот) Эксперимент было проведен с целью не тратить в будущем деньги и время впустую. Например, автоматизировать создание доров на транслите, синонимайзе, публичных генераторах уже не буду, хотя хотел, а это заняло бы гораздо больше времени и финансов. Сейчас хоть ситуация прояснилась. Более того, наконец-то начал хотя бы примерно понимать фильтры яндекса и способы их обхода. А это однозначно плюс. Сам эксперимент считаю очень успешным.

Ну-ну!
А время уходит...

Будем надеяться на лучшее=)

ИМХО, делать упор на дорвеи с последующим вкладыванием полученных средств в развитие СДЛ более целесообразно (с временной точки зрения в том числе), чем пытаться поднять СДЛ-ли с нуля без затрат чисто за счет хорошего контента и прочего.

Да и если абстрагироваться от финансов, дорвеестроительство требует хорошего знания seo, программирования и т.д. Приобретенные навыки лишними никогда не окажутся, а скорее всего пригодятся и не раз. Например, делая СДЛ на Drupal-е, все никак не мог заставить себя вдоль и поперек изучить структуру используемой базы MySQL, что рано или поздно сказалось бы. А теперь делая дорвеи на этой CMS, ее придется изучить вдоль и поперек, что несомненно плюс.

Не думаю что у тебя получится дорить на друпале. Так скажем, хоть и знаком поверхностно с ним, но имеется опыт на ДЛЕ. Опыт из двух частей. ))
1) Создание СДЛ - медленно
2) Создание ГС
О пункте 1.
Сайты благополучно живут в Яндексе уже более года, даже приусловии добавления по 0,5-2 статьи в месяц. Успешно двигаются в ТОП по НЧ. Текст рерайт и синонимизация. Так же живет один сайт эро.
Пункт 2.. ммм.. вот тут уже начинается пляска. Начинает с анализа ссылок и заканчивает анализом картинок (я так думаю). Так даже скажем, один сайт эротубовый. Нашел норм скриптик, неДЛЕ. До тех пор пока был полностью на англ. Всё норм, кушались все. Как только начал описание делать по русски, страницы со свистом начали вылетать. Так на данный момент из 4000 осталось 650, пока осталось..
Возможно это и не касается темы но мне так думается, это еще зависит и от структуры сайта. Т.е. использование нестандартных шаблонов, или попросту переделанных.
Иэх.. наговорил... надеюсь поймете. Хотел сказать пару слов, а может выйти статья )))))

/Не думаю что у тебя получится дорить на друпале.
Крайне надеюсь на обратное=)

/Т.е. использование нестандартных шаблонов, или попросту переделанных.

Я с шаблонами не заморачиваюсь пока, беру готовые. Если пробить популярный шаблон хотя бы по копирайтам, то в выдаче чаще всего можно найти кучу сайтов сделанных на нем, и это без учета того, что большинство трут копирайты. Так что не считаю, что использование паблик шаблонов может послужить причиной для наложения фильтров, как один из множества факторов может быть и да, но как основной - точно нет.

А так, использую Drupal для доров не потому, что это "трастовый двиг и доры не будут вылетать", просто сам дор представляю сначала в голове, как он должен выглядеть, какая структура, какая внутренняя оптимизация и т.д., и только потом пытаюсь все эти частенько несвязные мысли хоть как-то реализовать. При таком подходе все доргены отметаются сразу, писать самому дорвейную CMS накладно, да и не имеет по большому счету особого смысла, поэтому остановился на Drupal. ИМХО, на нем можно реализовать практически любую идею, да и просто это мой любимый движок, в других разбираться лениво.

Почему посещаемость то такая слабенькая получается, в чём тогда смысл дора?

РЦБ, этот эксперимент был направлен не на получение максимального кол-ва трафика, а на определение того типа контента, который будет проходить через большинство фильтров. Поэтому и страниц на дорах было мало, и ключи далеки от идеала. Отсюда и мизерный траф. А так, конечно, трафа должно быть много. Из мыслей на вскидку - загонять максимальное количество страниц в индекс (от нескольких тысяч), довести до идеала внутреннюю структуру (в том числе и перелинковкой с нужными анкорами), собрать свою персональную базу кеев (заточенных именно под определенный тип доров, т.к. например я пока не планирую насыщать саму текстовку ключами, поэтому и манипулировать остается не особо и много чем, тайтлами и внутренней перелинковкой в основном), делать доры на отстоявшихся доменах, возможно даже прокаченных внешними ссылками и т.д. Поле для дальнейших действий и экспериментов очень велико=)