Парсинг статей с выдачи Google

ОБЯЗАТЕЛЬНО ПРОЧТИТЕ ПЕРЕД ПОКУПКОЙ!

ВАЖНО: Парсинг ссылок производится в 1 поток и с паузой 5000 мс (5 секунд)! При такой паузе Google не забанит. Если вы получили бан (например, когда парсили ранее без паузы), то придется ждать около суток.

При парсинге выдачи Google, ссылки на главные страницы сайтов фильтруются.

В примере (ниже) использовалось 5 ключевиков:
Яблоки
Томаты
Киви
Бананы
Апельсины

Было обработано по 11 страниц выдачи на каждый ключевик (итого 55 страниц). С них собрано 372 ссылок за 5 минут. В итоге был получен 141 txt-файл с контентом за 11 минут 39 секунд (вместе со сбором ссылок).

Как использовать:
– Распаковать полученный zip-архив;
– Открыть файл проекта в программе Content Downloader II (меню – файл – загрузить проект (Ctrl+O));
– Перейти во вкладку ссылки (открыта по умолчанию) и нажать кнопку {key};
– В появившееся окно ввести нужные ключевые запросы (в столбик);
– Закрыть окно с запросами и нажать “добавить ссылки” – “используя диапазон”;
– Нажать F5 (начнется сбор ссылок, а затем автоматически будут скачаны и сами статьи на диск).

Скачать пример результатов парсинга: файлы txt, разложенные по папкам согласно запросу Google

Купить файл проекта (277 рублей)

При возникновении предложений или вопросов, прошу обращаться в Skype smartbyte_support.

Спасибо!

Автор: admin, 20 June 2012
Рубрики: Купить готовые проекты
Tags:
Есть 13 коммент. к сообщению: “Парсинг статей с выдачи Google”
  1. Виталий says:

    Добрый день а какая разница между этим проектом и выложенным тут http://sbfactory.ru/cd/?p=359

    • Василий says:

      Старый работает через задницу, вроде, и не умеет раскладывать по папкам. Пошел покупать, поддержу автора, заодно посмотрим к утру, что за зверь.

      • Василий says:

        Купил, загрузил, добавил ключей и… ничего. Не работает оно, толи у меня лыжи плохо смазаны. Тупо на этапе сбора ссылок ничего полезного не происходит.

  2. Андрей says:

    У меня тоже ничего не срабатывает 🙁
    И ссылки не скачиваются, и контент.

    • Василий says:

      У меня со второго раза все начало получаться. Не уверен, в причинах, но сначала прям с либреоффиса копировал ключи, а потом прогнал их через блокнот. Еще установил оперу на всякий случай и перезагрузился =) Но это все вилами по воде писано.

      Андрей, а вы пробовали стандартные яблоки-груши прогнать? Они точно работают. У меня, по крайней мере.

  3. Андрей says:

    Ну, значит всё работает!! А меня, по ходу, Гугл временно завалил (забанил). Самое время помыться.Спасибо).

  4. Пробую приобрести данный продукт – а мне в ответ “данный продукт снят продавцом с продажи”.

    Так можно его приобрести или нет???

  5. Агрис says:

    Как приобрести файл проекта?

    • admin says:

      Прошу обратиться в Skype smartbyte_support или ICQ 571-880-051
      Спасибо!

  6. Стас says:

    Знаю решение для парсинга Гугля без выдержки времени, но точно не проверял еще, можно просмотреть все результаты с тысяч страниц, неужели проблема настолько актуальна?

  7. Yura says:

    Проект рабочий, хоть и не без изъяна. Для корректной работы нужно кодировать запрос в urlencode. Проблема возникает именно из-за бана. Пробовал увеличивать таймаут до 7 сек. (что при моем количесве запросов очень много), пробовал указывать корридор 3500-7000. Все равно бан! Нужна поддержка antigate!

  8. Andrey says:

    а есть актуальный проект? который сейчас работает?

Написать комментарий

Последние статьи

css.php