В поисках контента

Добыча контента

Доброго времени суток. Пожалуй каждый, кто хоть как то связан с web бизнесом задавался вопросом — «А откуда собственно брать контент (текст) на сайт?!». Этим вопросом задался и я. Т.к. я только начинаю вливаться в сателлитостроение — для меня этот вопрос очень важен. Перечитав кучу блогов, постов на форуме,  смог выделить для себя основные направления добычи контекста:

  • Копи-паст. Метод примитивно прост — ищем сайт с подходящей тематикой и в наглую передираем текст оттуда. Можно так же сливать его по RSS (если конечно «донор» и Ваш сайт поддерживают его). Из плюсов такого метода — бесплатно и быстро. Минусов больше — хозяин «донора» может и пожаловаться, текст не уникален, с вероятностью 99% в сграбленном тексте попадутся «левые» ссылки. Да и в конце концов — не красиво это :) Хотя у меня есть два таких сайта — в индексе уже больше месяца, количество страниц только прибавляется, копеечка в sape бежит :)
  • Синонимайз. Метод очень похож на предыдущий — ищем донора, копируем с него текст. Дальше этот текст прогоняем через специальную программу синонимайзер. Суть работы программы очень проста — замена слов на синонимы по словарю, т.е. допустим у Вас было слово «автомобиль», а программа заменила его на слова «машина». По идее текст становиться почти уникальным, но в придачу к этому в 99% случаев практически не читаемым. К сожалению яндекс такие вещи уже давно умеет определять — так что я считаю что метод практически умер. Хотя если после машинного синонимайза пройтись по тексту «ручками» — можно получить неплохие результаты.
  • Рерайт. Смысл этого метода опять же довольно прост, но требует уже большего количества времени. Смысл сводится к тому — что бы написать взятую откуда-либо статью своими словами. Например Вы взяли предложение «Красная машина очень быстро ехала по шоссе», взяли и переписали это предложение своими словами, получилось что то типа «Автомобиль красного цвета мчался на огромной скорости по шоссе». Смысл текста в принципе то и не изменился — а вот уникальность стала 100% (я не говорю про конкретно этот пример). Из плюсов — на выходе практически всегда уникальный текст, который очень хорошо держится в индексе Яндекса. Из минусов — на такую обработку текста уходит довольно много времени. Подходит если нужно переделать 5, ну пускай 10 статей, но если их 200 — я бы застрелился :)
  • Копирайт. Самый трудный способ добычи контекста. Больше всего подходит для очень беленьких СДЛ. Смысл в том — что статью/обзор вы полностью пишите сами. Сами думаете, сами подбираете термины. Из плюсов — абсолютная уникальность текста, из минусов — огромные затраты по времени.
  • Скан. Довольно популярный метод. Смысл сводится к тому что Вы находите книгу по нужной Вам тематике, проверяете уникальность текста (например или просто Яндексом или Advego Plagiatus или DC Finder), сканируете, распознаете, редактируете и размещаете на сайте. Из плюсов этого метода стоит отметить бесплатность (если дома есть залежи «уникальных» книг по тематике), довольно большая скорость «добычи» текста, почти всегда (если правильно выбрали книгу) 100% уникальность текста. Из минусов — в самом плохом случае можно получить по балде от автора книги (поэтому ставим флаг Private Person на домене), т.к. он явно будет против такого размещения его книги в интернете, нужно наличие сканера, прямых рук и этих самых «уникальных» книг.
  • Покупной контент. Обобщенная тематика. Сюда я отнесу все вышеперечисленное, но купленное за деньги. Плюсы очевидны — минимальные трудозатраты, из минусов — нужно где то взять бабло для покупки всего этого безобразия.

Вот основные способы добычи текста на сайт. Я сознательно не стал описывать варианты с переводом текста с языка на язык, т.к. обычно результат не читаем без основательной корректировки.Так же не стал описывать контент, который генерируют посетители (форумы, доски объявлений) — это будет тема отдельной статейки.

Новичкам бы я советовал для начала купить чуть-чуть «скана», т.к. ценник не так уж сильно кусается, а результат почти всегда положительный.

Ну что же — на сегодня это все, хоть и не спалил всяких «тем», но новичкам думаю такой обзор будет полезен.

До новых встреч :)

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.