Задание динамических границ парсинга

Динамические границы парсинга работают аналогично обычным и имеют несколько дополнительных возможностей, например:
– Можно задать неограниченное количество динамических границ парсинга
– В качестве значений параметров динамической границы (номер начала парсинга, начало парсинга, номер конца парсинга, конец парсинга) можно указывать любые обычные границы парсинга.
– Можно указать в качестве контента для извлечения другую границу парсинга (обычную или повторяющуюся)
– Можно извлекать нужные данные с помощью регулярных выражений

Макросы динамических границ парсинга могут прописываться в шаблоне вывода или в шаблоне повторяющихся границ в неограниченном количестве.

Синтаксис макроса динамических границ парсинга (без дополнительных параметров)

1
2
[[[n|начало||m|конец]]]
[[[0|начало||0|конец]]]

Где n, начало, m, конец – параметры, соответствующие параметрам обычных границ парсинга (n, m – номера вхождений для начала и конца парсинга).


Порядок задания динамических границ парсинга:

– если в списке ссылок главного окна программы нет ни одного элемента, то добавьте хотя бы один (F8)
– откройте редактор шаблона вывода (соответствующая кнопка на панели инструментов главного окна Content Downloader или ctrl+f2) и на панели инструментов редактора шаблона вывода нажмите кнопку “задание динамических границ парсинга” (помечена зеленым маркером на скриншоте 1)
– Нажмите кнопку “задать динамические границы парсинга (ctrl+e)(помечена красным маркером на скриншоте 1)

скриншот 1:
Content Downloader

В открывшемся окне задания границ парсинга:

– выделите в коде начало парсинга (откуда хотите брать контент) и нажмите кнопку “задать начало парсинга”
– выделите в коде конец парсинга (до куда хотите брать контент) и нажмите кнопку “задать конец парсинга”
– после задания начала и конца парсинга нажимаем на одну из кнопок “вставить макрос заданной динамической границы парсинга в шаблон вывода…” (кнопки помечены красным маркером на скриншоте 2) и задаем следующую динамическую границу парсинга (если потребуется)
– после задания всех динамических границ парсинга жмем кнопку “ГОТОВО!” (помечена синим (бирюзовым) маркером на скриншоте 2, эта кнопка располагается правее кнопок “вставить макрос заданной динамической границы парсинга в шаблон вывода…”)

скриншот 2:
Content Downloader

Если вам требуется задать одну из динамических границ парсинга с помощью регулярного выражения, активируйте “RegExpr mode” с помощью соответствующей галочки (помечена золотисто-зеленоватым маркером на скриншоте 3):

скриншот 3:
Content Downloader

После выполнения всего вышеперечисленного:

– делаем предпросмотр результата парсинга контента (ctrl+f2)
– готово, динамические границы парсинга заданы


Если нужно вычислять динамические границы парсинга из определенного кода, используйте параметр {{{[CONTENT]КОД[/CONTENT]}}}, где вместо КОД можно использовать границу парсинга или, например, код цикла повторяющейся границы парсинга [VALUE]

1
2
[[[2|tricast1st||0|ast3r{{{[CONTENT]<CD_GRAN_20!>[/CONTENT]}}}]]]
[[[2|tricast1st||0|ast3r{{{[CONTENT][VALUE][/CONTENT]}}}]]]




Дополнительно:

– Для парсинга всех найденных регулярным выражением вхождений (аналогично повторяющимся границам парсинга), с включенным “RegExpr mode”, замените значение “[NIL]” в соответствующем текстовом поле (помечено зеленым маркером на скриншоте 3) на нужный вам разделитель вхождений, найденных заданным регулярным выражением в коде WEB-документа;
– Номер тега начала и конца парсинга (выделены зелеными маркерами на скриншоте 2) указывают на то, сколько раз встретилось начало парсинга от начала кода документа, до фактического места задания начала парсинга, и сколько раз встретился конец парсинга от начала парсинга, до фактического места задания конца парсинга;
– Если в тексте начала или конца парсинга есть динамическая часть, которая изменяется от одного документа к другому, то закомментируйте ее макросом {skip} (например: div id={skip});
– Динамических границ парсинга может быть задано сколько угодно штук;
– Для выделения динамической границы парсинга в тексте шаблона вывода, кликнете в ее пределы левой кнопкой мыши с зажатым ctrl или выберите нужную динамическую границу парсинга из списка.


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 6, средний балл: 4.33)

Loading...
Автор: admin, 8 December 2013
Рубрики: Парсинг
Написать комментарий

Последние статьи

css.php