О сайтах и не о сайтах

Теперь и в tg!

tg

Переехал с твиттера на t.me/tulvit_blog, если что.

Сапофильтр для наращивания ТИЦ

Сразу хотелось бы сказать, что я не гарантирую работу данного фильтра. Это больше теория, т. к. экспериментальных данных у меня нет.

Дело в том, что к этому фильтру я пришел не так давно и протестировал всего-лишь на одном сайте. Однако буквально через несколько дней после начала закупки произошел ап тиц, в котором сайт хоть и получил +10, но из-за каких именно ссылок, сказать затруднительно (помимо купленных по фильтру, были еще сапоссылки для позиций, статейные бэки, постовые и немного естественных).

В планах было развивать идею дальше, тестировать фильтр на выборке как минимум из десяти сайтов. Тогда бы у меня на руках были бы точные данные. Но надоело. Надоело ставить свою деятельность (а также потенциальный доход) в зависимость от какой-то пузомерки (ТИЦ) какого-то сайта (Яндекса). Поэтому все свои работы по наращиванию ТИЦ'а я прекратил, и многообещающий фильтр так и остался не у дел.

К слову, немного о тех фильтрах, которые я использовал ранее:

  • Дешевые ссылки со всех сайтов подряд.
  • Дешевые ссылки с только что добавленных в систему сайтов.
  • Дешевые ссылки с тематичных сайтов.
  • Ссылки с СДЛ.
  • Ссылки с тематичных СДЛ.
  • Ссылки с прямых конкурентов продвигаемому сайту.

И тому подобные вариации. Когда-то это и давало прогнозируемый плюс в районе +10-30 ТИЦ за ~10-30 рублей в сутки, но сейчас все эти фильтры нежизнеспособны (затраты на ТИЦ не отбиваются продажей же ссылок).

Единственный 100% работоспособный фильтр — это скупка тематики для сайтов из ЯК. Стабильный плюс каждый ап. Но велика вероятность обнуления за накрутку. Мне обнулили. Еще бы — было на сайт ~30 естественных беков за пару лет, а потом за неделю появилось еще пару сотен, и главное доноры все как на подбор, из той же категории каталога, что и акцептор.

Но это все прошедший этап.

Прежде чем расскажу о самом фильтре, небольшая теоретическая вставка, необходимая для понимания работы этого самого фильтра. Все это ни в коей мере не претендует на истину в последней инстанции — только что логические измышления на тему.

Итак, что же такое ТИЦ. Тематический индекс цитирования. Ключевое слово — тематический.

Тематика сайтов определяется либо вручную (вплоть до очень узких тематик, например «Спортивный туризм») либо автоматически алгоритмами.

Процент сайтов в ЯК по грубым прикидкам где-то 0.5%. Плюсуем сюда сайты вне каталога, но все также с вручную установленной тематикой (не прошедшие в каталог сайты, плюс сайты в других сервисах Яндекса, например Яндекс Маркет или Яндекс Новости), получаем где-то ~1% размеченных сайтов.

Т. е. ничтожно малое количество сайтов, чтобы в зависимость от них ставить весь алгоритм расчета ТИЦ.

Получается, что упор идет не на ручное, а на автоматическое определение тематики. Ну автоматическое, так автоматическое. Никто не против.

Но ИИ пока еще вроде не существует, насколько я знаю. Как же в таком случае определить тематику сайта? Ну, предположим по тайтлу, по плотности определенных слов с ярко выраженной тематикой. Но это на словах хорошо — на деле труднее.

Возьмем этот блог.

Тайтл - «tulvit.ru блог вебмастера | Создание сайтов, работа и бизнес в интернете.». Так какая тематика у сайта? Блогинг? Сайты? Работа? Бизнес? Интернет?

Ок, анализируем меню — но здесь тоже нет определенности. SEO, SMO, PHP, Linux, дизайн, мотивация, эффективность, маркетинг...

Ладно, проанализируем теги заголовков - «AdWords и VseMayki.», «Прошло три года», «Копируем зарубежные идеи», «Бросил курить»...

Последняя попытка — слова с наибольшей плотностью. Но и здесь однозначности особой не видно — сайт, трафик, блог, рунет, партнерский, книга, маркетинг, объявление, партнер, английский, магазин...

И такая ситуация с большинством сайтов. Даже еще хуже. Взять тот же хабр — тайтл «хабр», а посты на главной от системного администрирования до тайм менеджмента.

Т. е. тематику сайта можно определить только общую, например «авто» или «интернет» (путем анализа наиболее частотных слов с выраженной тематикой на всем сайте, а не только на главной странице). Но погрешность все равно будет большая.

Какие из этого можно сделать выводы? «Палить из пушки по воробьям» можно (например, сайты с определенной алгоритмами тематикой «адалт» не пускать по детским ключевым словам в топ, даже если они являются наиболее релевантными), но использовать для точного расчета тематического индекса цитирования — скорее всего нет.

Следовательно, в расчете ТИЦ тематика сайта играет не главную роль. Главную роль играет тематика документа.

А вот тут уже с определением тематики все становится просто как дважды два. Берем документ, берем тайтл, убираем пересечение с тайтлом главной страницы, выделяем наиболее частотные слова, убираем из этих наиболее частотных слов слова без тематики (предлоги, наречия и т. д.) - и все, оставшиеся слова и определяют тематику документа. До кучи добавляем анализ частотности слов в тексте документа (за вычетом пересечений с другими страницами, чтобы меню/слоган и т. д. не смазывали общую картину). В результате получаем достаточно точное определение тематики. Ну а если и ошиблись (какая-то погрешность все равно будет) — ну и ладно, это всего лишь неправильно определенная тематика документа, а не всего сайта, не велика потеря.

Собственно, звучит красиво. И логически правильно. Представим себе форум по программированию. В курилке появляется тема «Подскажите обои, решил в квартире ремонт сделать». В ходе бурной дискуссии о разновидности обоев, кто-то кидает ссылку на магазин обоев (или сайт про обои). Вопрос — это ссылка тематическая или нет? Учтется ли она при расчете ТИЦ'а? Если исходить из тематики сайта — нет, не учтется, т. к. не тематическая. Если исходить из тематики документа — тематичней просто и быть не может, вес передаст максимальный. И именно последний вариант я считаю наиболее справедливым при расчете ТИЦ, особенно учитывая тот факт, что большинство естественных ссылок, это UGC, форумы/блоги, где как раз строгого соответствия тематики ресурса нет.

Ок, идем дальше. Тематика-тематика-тематика... Значит, в расчете ТИЦ'а главное значение предается тематике документа, а не сайта. Более чем логично будет предположить, что определяется тематика документа не только донора, но и акцептора (ссылаться-то могут не только на главную страницу). Ну и для полноты картины упомянем и то, что и анкор ссылки должен быть тематичный, а не «здесь»/«тут» или другие высокочастотные слова.

Резюмируя. Для того, чтобы ссылка максимально учлась в расчете ТИЦ'а, должны быть выполнены следующие пункты:

  • Ярко выраженная тематика документа донора.
  • Аналогично ярко выраженная тематика документа акцептора, совпадающая с тематикой документа донора.
  • Ярко выраженный анкор ссылки, совпадающий по тематике с тематиками документов донора и акцептора.

Простой пример. У нас есть сайт про авто. На этом сайте есть статья про Mazda RX-8. Ищем другой сайт про авто, ищем на нем также статью про Mazda RX-8 и размещаем в этой статье ссылку с анкором вида «Еще информация про #Mazda RX-8#». Такая ссылка даст максимальный вес в плане передачи ТИЦ. Логика, думаю, понятна.

Ну а теперь вернемся к нашему сапофильтру. При подборе доноров доступен инструмент «Ключевые слова», где можно указывать определенные слова, которые должны встречаться либо во всем теле документа, либо только в тайтле.

Подбор доноров в сапе по ключевым словам.

Соответственно, наши действия для наращивания ТИЦ следующие. На площадке-акцепторе выбираем несколько статей с наиболее выраженной тематикой («морда» редко имеет ярко выраженную тематику), на них мы и будет закупать ссылки. Под каждую такую статью составляем свои анкоры, где в качестве текста ссылки лучше использовать вариацию тайтла статьи. Далее идем в сапу и закупаем ссылки на тех страницах доноров, тайтлы которых совпадают с тайтлами наших статей (ну или не совпадают, но крайне тематичные им). Для разбавления ссылочного можно закупиться ссылками и без точного совпадения тайтлов, а просто если в тексте доноров встречаются нужные слова.

При необходимости расширяем тематику, если доноров не хватает. Или наоборот сужаем, если доноров слишком много. К примеру, сайтов в сапе, где в тайтле встречается «Mazda RX-8» - больше 500. Так что еще и повыбирать придется. Ну и стандартную проверку страниц плагином для сапы под FireFox никто не отменял, конечно.

В заключении повторюсь — это всего лишь теория. Неопробованная из-за потери интереса к наращиванию ТИЦ'а. Впрочем, если у вас нет своего фильтра, то советую использовать именно этот. Он всяко лучше «волшебных каскадов». Т. к. как минимум логически обоснован.

Комментарии

А я сапу бомблю только для продвижения в поисковиках, как инструмент поднятия тиц вообще не расматриваю. Уж слишком много там ка...шек. Сори конечно за выражение, но факт

Да и хороших доноров тоже хватает. Многие топовые сайты продают ссылки в сапе, особенно в некоммерческих тематиках. Главное уметь отсеивать ГС и закупаться только на СДЛ (на СДЛ с точки зрения Яндекса).

Твитанул, отличный пост.

Cпасибо =)

А какой примерный бюджет должен быть для поднятия ТИЦ до 10-20?

splik, честно - без понятия. Какие-то средние цифры может и есть, но на небольшой выборке все равно затраты для одних и тех же результатов будут разниться в разы. Здесь также, как и с доходом с сайта с тиц10-20 - может быть и $3-4 в сутки, а может и меньше $0.5.

Дважды поднимал ТИЦ с помощью САПЫ и дважды он обнулялся. ИМХО для поднятия ТИЦ нужны другие способы.

Пилот, если предположить, что Яндекс автоматически не определяет сапоссылки как спамссылки (что технически достаточно просто, но недальновидно), то сапа - это всего лишь сервис, позволяющий автоматизированно размещать свою ссылку на стороннем ресурсе. Т. е. сапоссылка ничем кардинально не отличается от размещенной вручную. Поэтому, ИМХО, не в сапе дело.

Ну уж лучше хотя бы теория, чем ожидание, пока кто-то что-то удосужится сделать на практике, поэтому спасибо за статью!

Скажите - стоит ли начинать торговать ссылками на сапе?или подождать пока посещалка доростет до того чтобы поставить рекламу от яндекса?
у сайта pr=3.у некоторых страниц 2 или 1.

слить сайт в жопу яндекса не хочется.. по некоторым запросам на первой странице выдачи нахожусь.
вот http://php-include.ru
сам в сео не очень,я прогер..
спасибо.

Основная ценность при продаже ссылок, это ТИЦ ресурса. У вас он нулевой, так что смысла добавлять сайт в сапу ровно никакого.

Но даже если и появится ТИЦ, сапа все равно много не даст, темпы раскупки ссылок сейчас сильно снизились. Можно пойти в биржи вечных ссылок, но это превращать сайт в помойку.

А так, если честно, будущего у сайта (в плане успешной монетизации) не вижу. Трудно сказать почему (можно, конечно, назвать с сотню причин, но они все будут весьма и весьма субъективными), просто не вижу.