WordPress: создание автонаполняемого сайта
Привет друзья и для начала небольшое лирическое отступление для тех кто не в курсе названия сегодняшнего поста.
Автонаполняемый сайт — сайт который автоматически наполняется за счет контента, который грабится с других сайтов. Грабить — это не от русского слова ограбление, хотя по сути близко. Грабить — grab(хватать) копировать контент с других сайтов, забирая его из RSSлент, в которые транслируются свежие публикации.
Если не сильно отодвинуть в сторону вопросы морали и авторского права, то остается большой сегмент контента, который можно грабить без больших угроз получить по голове: анонсы, новости, пресс-релизы.
На основе сграбленных новостей можно сделать как весь сайт целиком, так и отдельный раздел на существующем сайте. Например на сайте, посвященному боксу, сделать раздел спортивных новостей. А на сайте про актеров- новости из мира кино. За счет публикаций новостей можно попробовать ловить ситуативный трафик, с этих страниц можно торговать ссылками, с них можно проставлять перелинковку на свои продвигаемые страницы.
Дабы не поймать санкций от поисковиков за копипаст, лучше использовать много и разных источников. Кроме того, грабинг можно делать в полуавтоматическом режиме, добавляя в новости перед публикацией небольшие правки и переписывая заголовки для уникализации. Важно! Многие сайты отдают в RSSленту не полные версии постов, а анонсы. Пользы от пары предложений грабберу не много. Чтобы урезанные RSSленты превратить в полные, есть несколько сервисов, один из них FeedEx.
Указываем ему ссылку на урезанную ленту и ждем чуда :-)
Поэтому для дальнейшего наполнения своего сайта будем использовать не оригинальную RSSленту источника, а ленту созданную с помощью FeedEx. Важно! В процессе вытягивания полных версий постов, FeedExможет добавить в содержимое поста блоки рекламы, меню, рубрики и т.п., поэтому тщательно подбирайте источник, чтобы мусора на выходе было минимально. Тогда такие
ленты можно публиковать в блоге на автомате. Если же наполняется сайт-говносайт, то на такие мелочи можно смело махнуть рукой. Для белых и пушистых сайтов все равно придется перед публикацией все новости вычитывать, лишнее удалять и уникализировать.
Перейдем к настройкам FeedWordPress
В поле New source вставляем ссылку на RSSленту и жмем Add– добавляем. В зависимости от сайта, парсер может увидеть несколько вариантов отображения ленты, выбираем ту, в которой контент есть, а ошибок нет.
Первый вариант наиболее полный, во втором варианте урезанный анонс, третий вариант выдал ошибку. Выбираем первый вариант :-) Жмем Use this feed. В списке лент для грабинга появилась новая лента, жмем Update Nowи делаем пробный импорт.
Как видно — добавилось 5 новых постов и 0 существующих обновилось. Останется только зайти в эти 5 постов, сделать правку/вычитку и наслаждаться растущему сайту. Если же наполнение нужно на автомате, то стоит включить автоматическое обновление.
На вкладке Feeds & Updatesнастраиваем автообновление. Возможны следующие вариант — обновление по крону (расписанию), обновление до или после загрузки страницы сайта.
Тот кто знает, что такое крон, сможет самостоятельно настроить это, а для простых пользователей с головой хватит варианта обновления после загрузки страницы. Это означает, что как только какой либо посетитель сайта загружает страницу, плагин пытается обновить ленты.
Дабы не задолбить хостинг, ставится тайм-аут ожидания, по умолчанию 60 минут.
Очень важные настройки находятся в разделе Posts& Links
Мы выбираем, что делать с новыми постами: публиковать немедленно, ставить в список ожидающих публикации, записывать как черновик или же записывать как скрытый пост. Кроме этого, при изменении содержимого оригинального поста мы можем выбрать — обновлять наш пост с ним или оставлять без изменений.
Важно! Если вы изменяете сграбленные посты, обязательно включите опцию No, leave the syndicated copy unmodified иначе все правки при обновлении будут потеряны.
Далее, Permalinks point to— на что указывает ссылка поста: на оригинальный сайт или на пост на вашем блоге. Понятно, что стоит включить указание на свой блог. В разделе Categories& Tagsвы настраиваете, в какие рубрики будут публиковаться новости, будут ли это существующие или новосозданные рубрики.
Теперь только остается подобрать побольше тематических источников и наблюдать, как активно наполняется сайт.
Фишка для тех, кто не боится php
В каждом посте в метаполе syndication_permalinkсохраняется ссылка на оригинал. Если грабится контент с сайтов, за публикацию которого могут нажаловаться хостеру, то стоит в конце постов добавлять ссылку на первоисточник. Для этого после вывода контента в single.phpдобавляется :
ID, ‘syndication_permalink’, true);
if($image !== ») { ?>
Ну я то думаю вы не боитесь php???♣
__
Пост создан при поддержке artnetdesign.ru, где можно заказать такую услугу, как Создание сайтов на самых приятных для вас условиях.