Если, допустим, парсим статью или какой-либо контент содержащийся, например, в HTML-теге div, а в этом теге div содержится еще неопределенное количество вложенных тегов div, то, соответственно, мы не можем корректно определить конец парсинга </div> для всех страниц сайта (так как его номер по счету на разных страницах сайта будет отличен).
Для решения таких задач существует параметр конца обычной границы парсинга [AUTO]. Он может быть вставлен в начало текста конца любой обычной границы парсинга через контекстное меню или сочетание клавиш ctrl+u (смотрите скриншот ниже). После параметра [AUTO] прописывается название нужного HTML-тега, например: div, p, table и так далее. При этом начало границы парсинга задается обычным образом!
Как работает эта функция: Программа в коде WEB-документа сперва находит начало границы парсинга, затем начинает дальше идти по коду считая открывающиеся и закрывающиеся теги div. Как только функция высчитает, что основной HTML-тег (с нужным контентом) закрылся (</div>), то определит его, как конец парсинга и возьмет из него нужный нам контент!
Спасибо за внимание! =)
Новости RSS



Рубрики:
Теги:
С вопросами о покупке (или другими организационными), вы можете в любое время обращаться по Телефону +7 983 381 3211 или Телеграм @ContentDownloaderX1 (Сергей Владимирович)
WBApp (дополнение для Content Downloader) - парсинг с выполнением WEB-скриптов, с возможностью имитации кликов по элементам страниц, произведение прокрутки страниц, заполнение текстовых полей и многое другое...