Параметр конца обычных границ парсинга [AUTO] (автоматический поиск закрывающего HTML-тега)

Если, допустим, парсим статью или какой-либо контент содержащийся, например, в HTML-теге div, а в этом теге div содержится еще неопределенное количество вложенных тегов div, то, соответственно, мы не можем корректно определить конец парсинга </div> для всех страниц сайта (так как его номер по счету на разных страницах сайта будет отличен).

Для решения таких задач существует параметр конца обычной границы парсинга [AUTO]. Он может быть вставлен в начало текста конца любой обычной границы парсинга через контекстное меню или сочетание клавиш ctrl+u (смотрите скриншот ниже). После параметра [AUTO] прописывается название нужного HTML-тега, например: div, p, table и так далее. При этом начало границы парсинга задается обычным образом!

Как работает эта функция: Программа в коде WEB-документа сперва находит начало границы парсинга, затем начинает дальше идти по коду считая открывающиеся и закрывающиеся теги div. Как только функция высчитает, что основной HTML-тег (с нужным контентом) закрылся (</div>), то определит его, как конец парсинга и возьмет из него нужный нам контент!

Примечание: Параметр [AUTO] не был введен в алгоритмы повторяющихся границ парсинга (в повторяющихся границах парсинга параметр [AUTO] не работает)!

Content Downloader

Спасибо за внимание! =)

1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 5, средний балл: 5,00)
Загрузка...
Автор: admin, 15 августа 2016
Рубрики: Новости
Метки: , ,

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php