Парсинг статей с выдачи Google

ОБЯЗАТЕЛЬНО ПРОЧТИТЕ ПЕРЕД ПОКУПКОЙ!

ВАЖНО: Парсинг ссылок производится в 1 поток и с паузой 5000 мс (5 секунд)! При такой паузе Google не забанит. Если вы получили бан (например, когда парсили ранее без паузы), то придется ждать около суток.

При парсинге выдачи Google, ссылки на главные страницы сайтов фильтруются.

В примере (ниже) использовалось 5 ключевиков:
Яблоки
Томаты
Киви
Бананы
Апельсины

Было обработано по 11 страниц выдачи на каждый ключевик (итого 55 страниц). С них собрано 372 ссылок за 5 минут. В итоге был получен 141 txt-файл с контентом за 11 минут 39 секунд (вместе со сбором ссылок).

Как использовать:
– Распаковать полученный zip-архив;
– Открыть файл проекта в программе Content Downloader II (меню – файл – загрузить проект (Ctrl+O));
– Перейти во вкладку ссылки (открыта по умолчанию) и нажать кнопку {key};
– В появившееся окно ввести нужные ключевые запросы (в столбик);
– Закрыть окно с запросами и нажать “добавить ссылки” – “используя диапазон”;
– Нажать F5 (начнется сбор ссылок, а затем автоматически будут скачаны и сами статьи на диск).

Скачать пример результатов парсинга: файлы txt, разложенные по папкам согласно запросу Google

Купить файл проекта (277 рублей)

При возникновении предложений или вопросов, прошу обращаться в Skype smartbyte_support.

Спасибо!

Есть 13 коммент. к сообщению: “Парсинг статей с выдачи Google”

Виталий says:

26 July 2012 at 13:33

Добрый день а какая разница между этим проектом и выложенным тут http://sbfactory.ru/cd/?p=359

Reply
- Василий says:
  
  27 July 2012 at 15:59
  
  Старый работает через задницу, вроде, и не умеет раскладывать по папкам. Пошел покупать, поддержу автора, заодно посмотрим к утру, что за зверь.
  
  Reply
  - Василий says:
    
    28 July 2012 at 11:25
    
    Купил, загрузил, добавил ключей и… ничего. Не работает оно, толи у меня лыжи плохо смазаны. Тупо на этапе сбора ссылок ничего полезного не происходит.
    
    Reply
    - Василий says:
      
      28 July 2012 at 15:41
      
      Проблема мистическим образом разрешилась.
      
      Reply
Андрей says:

28 July 2012 at 12:52

У меня тоже ничего не срабатывает 🙁
И ссылки не скачиваются, и контент.

Reply
- Василий says:
  
  28 July 2012 at 15:41
  
  У меня со второго раза все начало получаться. Не уверен, в причинах, но сначала прям с либреоффиса копировал ключи, а потом прогнал их через блокнот. Еще установил оперу на всякий случай и перезагрузился =) Но это все вилами по воде писано.
  
  Андрей, а вы пробовали стандартные яблоки-груши прогнать? Они точно работают. У меня, по крайней мере.
  
  Reply
Андрей says:

28 July 2012 at 18:40

Ну, значит всё работает!! А меня, по ходу, Гугл временно завалил (забанил). Самое время помыться.Спасибо).

Reply
Андрей В says:

10 September 2012 at 12:18

Пробую приобрести данный продукт – а мне в ответ “данный продукт снят продавцом с продажи”.

Так можно его приобрести или нет???

Reply
Агрис says:

13 January 2013 at 19:17

Как приобрести файл проекта?

Reply
- admin says:
  
  7 April 2013 at 2:34
  
  Прошу обратиться в Skype smartbyte_support или ICQ 571-880-051
  Спасибо!
  
  Reply
Стас says:

5 April 2013 at 16:11

Знаю решение для парсинга Гугля без выдержки времени, но точно не проверял еще, можно просмотреть все результаты с тысяч страниц, неужели проблема настолько актуальна?

Reply
Yura says:

12 August 2013 at 18:24

Проект рабочий, хоть и не без изъяна. Для корректной работы нужно кодировать запрос в urlencode. Проблема возникает именно из-за бана. Пробовал увеличивать таймаут до 7 сек. (что при моем количесве запросов очень много), пробовал указывать корридор 3500-7000. Все равно бан! Нужна поддержка antigate!

Reply
Andrey says:

24 February 2014 at 12:21

а есть актуальный проект? который сейчас работает?

Reply

Написать комментарий

универсальный парсер контента

Парсинг статей с выдачи Google