ОБЯЗАТЕЛЬНО ПРОЧТИТЕ ПЕРЕД ПОКУПКОЙ!
ВАЖНО: Парсинг ссылок производится в 1 поток и с паузой 5000 мс (5 секунд)! При такой паузе Google не забанит. Если вы получили бан (например, когда парсили ранее без паузы), то придется ждать около суток.
При парсинге выдачи Google, ссылки на главные страницы сайтов фильтруются.
В примере (ниже) использовалось 5 ключевиков:
Яблоки
Томаты
Киви
Бананы
Апельсины
Было обработано по 11 страниц выдачи на каждый ключевик (итого 55 страниц). С них собрано 372 ссылок за 5 минут. В итоге был получен 141 txt-файл с контентом за 11 минут 39 секунд (вместе со сбором ссылок).
Как использовать:
– Распаковать полученный zip-архив;
– Открыть файл проекта в программе Content Downloader II (меню – файл – загрузить проект (Ctrl+O));
– Перейти во вкладку ссылки (открыта по умолчанию) и нажать кнопку {key};
– В появившееся окно ввести нужные ключевые запросы (в столбик);
– Закрыть окно с запросами и нажать “добавить ссылки” – “используя диапазон”;
– Нажать F5 (начнется сбор ссылок, а затем автоматически будут скачаны и сами статьи на диск).
Скачать пример результатов парсинга: файлы txt, разложенные по папкам согласно запросу Google
Купить файл проекта (277 рублей)
При возникновении предложений или вопросов, прошу обращаться в Skype smartbyte_support.
Спасибо!
Добрый день а какая разница между этим проектом и выложенным тут http://sbfactory.ru/cd/?p=359
Старый работает через задницу, вроде, и не умеет раскладывать по папкам. Пошел покупать, поддержу автора, заодно посмотрим к утру, что за зверь.
Купил, загрузил, добавил ключей и… ничего. Не работает оно, толи у меня лыжи плохо смазаны. Тупо на этапе сбора ссылок ничего полезного не происходит.
Проблема мистическим образом разрешилась.
У меня тоже ничего не срабатывает 🙁
И ссылки не скачиваются, и контент.
У меня со второго раза все начало получаться. Не уверен, в причинах, но сначала прям с либреоффиса копировал ключи, а потом прогнал их через блокнот. Еще установил оперу на всякий случай и перезагрузился =) Но это все вилами по воде писано.
Андрей, а вы пробовали стандартные яблоки-груши прогнать? Они точно работают. У меня, по крайней мере.
Ну, значит всё работает!! А меня, по ходу, Гугл временно завалил (забанил). Самое время помыться.Спасибо).
Пробую приобрести данный продукт – а мне в ответ “данный продукт снят продавцом с продажи”.
Так можно его приобрести или нет???
Как приобрести файл проекта?
Прошу обратиться в Skype smartbyte_support или ICQ 571-880-051
Спасибо!
Знаю решение для парсинга Гугля без выдержки времени, но точно не проверял еще, можно просмотреть все результаты с тысяч страниц, неужели проблема настолько актуальна?
Проект рабочий, хоть и не без изъяна. Для корректной работы нужно кодировать запрос в urlencode. Проблема возникает именно из-за бана. Пробовал увеличивать таймаут до 7 сек. (что при моем количесве запросов очень много), пробовал указывать корридор 3500-7000. Все равно бан! Нужна поддержка antigate!
а есть актуальный проект? который сейчас работает?