Top

X-parser — парсер контента на все случаи.

x-parser

X-parser — парсер контента на все случаи.

Когда речь заходит о парсинге контента на ум приходит крылатая фраза — парсить надо парсерами! про один из достойных парсеров пойдёт речь в этой статье.

X-parser настройка и запуск.

X-parser — это парсер контента из поисковых систем с минимальными настройками. Точнее, настроек достаточно для получения приемлемого результата, но даже новичок в них не запутается. Основное предназначение программы — парсить текст и целые статьи из различных поисковых систем(которых к слову на данный момент 15 шт уже встроенных, но есть возможность добавить свои. Как — расскажем). Чтобы начать парсинг вам нужно сделать 3 простых действия:

  1. Указать ключи, по каким парсить контент.
  2. Выбрать Поисковую систему, откуда парсить.
  3. Выбрать, в каком виде сохранять готовый результат.

Конечно, потребуется небольшая настройка — ввести ключ от сервиса решения капчи(если не хотите гадать её вручную). Но давайте рассмотрим эти 3 простых шага, чтобы даже у простых пользователей не осталось вопросов.

Парсинг по ключевым словам.

В главное окно программы нужно вставить ключевые слова. Просто, не правда ли? Тут же можно протестировать работу — для этого есть специальная кнопка, очень упрощает проверку настроек поисковых систем перед запуском парсинга.

Настройка поисковых систем.

Тут немного сложнее, а именно предстоит выбрать, из какой ПС будут браться ссылки на контент. Более подробно можно почитать на сайте автора. От себя лишь добавлю, что если результатом парсинга должен стать простой текст, то не вижу особого смысла использовать самые популярные ПС — Яндекс и Гугл — этим вы обречёте себя на использование прокси и антикапчи. Стоит поискать ПС, которую можно парсить без этих сложностей(и она там есть;-) ). Но если требуются качественные статьи, то выбирайте самые популярные ПС — можно долго спорить о релевантности выдачи в них, но по опыту — статьи из Яндекса хорошо индексируются и ранжируются в ГУГЛ, и наоборот.

Как сохранить результат?

Тут огромный выбор настроек. Начиная от формирования Тайтла и содержимого, заканчивая выбором имени файла. Снова отправлю вас на сайт автора программы, где хорошо расписаны форматы вывода X-parser(просто посмотрите, что означают макросы и выберите подходящий вариант или составьте свой). В итоге вы можете настроить программы как на получение простой текстовки «всё в кучу в одном фале», так и отдельных статей с полным содержимом(картинки, разметка, видео и тд.) Кто заботится о интеллектуальных правах на контент может добавить макрос вывода URL источника статьи.

После того, как все настройки проверены и сохранены, а так же протестирована выдача ПС — можете смело запускать парсинг. Скорость работы зависит от мощности компьютера и интернет-канала.

 

Фишки X-parser.

Среди основных возможностей притаилась приятная фишка — парсинг контента не по ключевым словам, а по готовым ссылкам — для этого нужно просто вместо ключей указать ссылки и отключить использование ПС. Эта функция может пригодиться для парсинга статей конкурентов, которых можно найти в ТОПе выдачи с помощью программы Serp Parser.

Еще одной приятной фишкой можно считать добавление своих ПС. К примеру, вам хочется быстро и много парсить Яндекс без капчи и проксей. Скажете это невозможно? Всё относительно. Для этого вам потребуется любой сервис продажи XML-лимитов и немного денег. Рассмотрим на примере сервиса xmlproxy.ru, который я могу смело рекомендовать(лимитов хватит на всех, цена гуманная). Нужно всего лишь зарегистрироваться и пополнить баланс, а после этого в настройках ПС X-parser`а добавить новую ПС, и прописать 1 строчку(взял в ЛК сервиса) — https://xmlproxy.ru/search/xml?user=USERNAME&key=USERKEY.  Всё! Данный сервис полностью копирует XML.Яндекс, а цена запроса составляет 5 руб за 1000.

Заключение.

Конечно, в рамках 1 статьи сложно рассказать о функционале X-parser, я намеренно упустил некоторые моменты и целую вкладку «Фильтры» — новичкам она не к чему, а олды — сами всё знают. Если вас до сих пор смущает парсер бинга в доргене Зевс — попробуйте этот парсер, у вас появятся сразу 2 типа контента — готовые статьи и «текстовка для генератора».

Эта программа тоже прошла испытание временем(более 10 лет сайту) — автор своевременно выпускает обновления(если поменялась вёрстка) и учитывает пожелания клиентов. А в следующий раз речь пойдёт о другой годной программе этого автора — Пингвин.