Парсинг контактов из сайтов, собранных из выдачи Google (макрос [CRAWLER])

Используйте макрос шаблона вывода [CRAWLER] для поиска контактных данных на различных сайтах.

Просто добавьте следующий код в шаблон вывода и парсите контакты с любого сайта во вкладке «Контент»

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
[CRAWLER]
 
{STARTURL}SELF{/STARTURL}
 
{CRAWLDEPTH}2{/CRAWLDEPTH}
{MAXIMAL_QUERIES}10{/MAXIMAL_QUERIES}
{QUERIES_PAUSE}1000{/QUERIES_PAUSE}
 
{TARGET_URL_ANCHORS}Контакт|||Связатсья|||Связь{/TARGET_URL_ANCHORS}
{TARGET_PAGE_TITLES}Контакт|||Связаться|||Связь{/TARGET_PAGE_TITLES}
 
{FINISH_RULES}{/FINISH_RULES}
 
{WHAT_TO_FIND}emails,phones{/WHAT_TO_FIND}
 
{EXTRACTPHONES_PARAMS}[LENGTH]10-10[/LENGTH][EXCEPTHTMLANDSCRIPTS][ALLOW][/ALLOW]{/EXTRACTPHONES_PARAMS}
 
{ADDITIONAL_PARAMETERS}
<!--|proceed_start_url|!-->
<!--|start_from_mainpage|!-->
add_mainpage
allow_subdomains
do_not_add_empty_result
can_harvest_non_target_pages
<!--|do_not_filter_start_url_once|!-->
{/ADDITIONAL_PARAMETERS}
 
{RESULT_TEMPLATE}{URL}[CSVCS]{ANCHOR}[CSVCS]{TITLE}[CSVCS]{EMAILS}[CSVCS]{PHONES}{/RESULT_TEMPLATE}
{RESULTS_SEPARATOR}[CSVLB]{/RESULTS_SEPARATOR}
 
[/CRAWLER]

Для работы данного макроса нужно использовать актуальную версию Content Downloader с типом лицензии ULTIMATE!

Ссылки на сайты для парсинга с них контактов (e-mail или телефонов) можно собирать с выдачи Google по нужным ключевым запросам.

Content Downloader

Результат сбора контактных данных




1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 2, средний балл: 5,00)

Загрузка...
Автор: admin, 16 июля 2020
Рубрики: Парсинг
Метки: , , , ,

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php