Задание динамических границ парсинга

Порядок задания динамических границ парсинга:

— если в списке ссылок главного окна программы нет ни одного элемента, то добавьте хотя бы один (F8)
— откройте редактор шаблона вывода (соответствующая кнопка на панели инструментов главного окна Content Downloader или ctrl+f2) и на панели инструментов редактора шаблона вывода нажмите кнопку «задание динамических границ парсинга» (помечена зеленым маркером на скриншоте 1)
— Нажмите кнопку «задать динамические границы парсинга (ctrl+e)(помечена красным маркером на скриншоте 1)

скриншот 1:
Content Downloader

В открывшемся окне задания границ парсинга:

— выделите в коде начало парсинга (откуда хотите брать контент) и нажмите кнопку «задать начало парсинга»
— выделите в коде конец парсинга (до куда хотите брать контент) и нажмите кнопку «задать конец парсинга»
— после задания начала и конца парсинга нажимаем на одну из кнопок «вставить макрос заданной динамической границы парсинга в шаблон вывода…» (кнопки помечены красным маркером на скриншоте 2) и задаем следующую динамическую границу парсинга (если потребуется)
— после задания всех динамических границ парсинга жмем кнопку «ГОТОВО!» (помечена синим (бирюзовым) маркером на скриншоте 2, эта кнопка располагается правее кнопок «вставить макрос заданной динамической границы парсинга в шаблон вывода…»)

скриншот 2:
Content Downloader

Если вам требуется задать одну из динамических границ парсинга с помощью регулярного выражения, активируйте «RegExpr mode» с помощью соответствующей галочки (помечена золотисто-зеленоватым маркером на скриншоте 3):

скриншот 3:
Content Downloader

После выполнения всего вышеперечисленного:

— делаем предпросмотр результата парсинга контента (ctrl+f2)
— готово, динамические границы парсинга заданы


Дополнительно:

— Для парсинга всех найденных регулярным выражением вхождений (аналогично повторяющимся границам парсинга), с включенным «RegExpr mode», замените значение «[NIL]» в соответствующем текстовом поле (помечено зеленым маркером на скриншоте 3) на нужный вам разделитель вхождений, найденных заданным регулярным выражением в коде WEB-документа;
— Номер тега начала и конца парсинга (выделены зелеными маркерами на скриншоте 2) указывают на то, сколько раз встретилось начало парсинга от начала кода документа, до фактического места задания начала парсинга, и сколько раз встретился конец парсинга от начала парсинга, до фактического места задания конца парсинга;
— Если в тексте начала или конца парсинга есть динамическая часть, которая изменяется от одного документа к другому, то закомментируйте ее макросом {skip} (например: div id={skip});
— Динамических границ парсинга может быть задано сколько угодно штук;
— Для выделения динамической границы парсинга в тексте шаблона вывода, кликнете в ее пределы левой кнопкой мыши с зажатым ctrl или выберите нужную динамическую границу парсинга из списка.


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 4, средний балл: 4,25)

Загрузка...
Автор: admin, 8 декабря 2013
Рубрики: Парсинг

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php