Параметр конца обычных границ парсинга [AUTO] (автоматический поиск закрывающего HTML-тега)

Параметр конца обычных границ парсинга [AUTO] (автоматический поиск закрывающего HTML-тега)

Если, допустим, парсим статью или какой-либо контент содержащийся, например, в HTML-теге div, а в этом теге div содержится еще неопределенное количество вложенных тегов div, то, соответственно, мы не можем корректно определить конец парсинга </div> для всех страниц сайта (так как его номер по счету на разных страницах сайта будет отличен).

Для решения таких задач существует параметр конца обычной границы парсинга [AUTO]. Он может быть вставлен в начало текста конца любой обычной границы парсинга через контекстное меню или сочетание клавиш ctrl+u (смотрите скриншот ниже). После параметра [AUTO] прописывается название нужного HTML-тега, например: div, p, table и так далее. При этом начало границы парсинга задается обычным образом!

Как работает эта функция: Программа в коде WEB-документа сперва находит начало границы парсинга, затем начинает дальше идти по коду считая открывающиеся и закрывающиеся теги div. Как только функция высчитает, что основной HTML-тег (с нужным контентом) закрылся (</div>), то определит его, как конец парсинга и возьмет из него нужный нам контент!

Content Downloader

Спасибо за внимание! =)

1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 1, средний балл: 5.00)
Loading...
Вы можете пропустить до конца и оставить ответ. Pinging в настоящее время не доступны.
Есть 6 коммент. к теме: “Параметр конца обычных границ парсинга [AUTO] (автоматический поиск закрывающего HTML-тега)”
  1. Максим says:

    Обновление супер! Спасибо!

  2. Djah says:

    Сергей, круто.
    Спасибо.

  3. Андрей says:

    Сергей, дай бог вам здоровья)))
    вот это действительно нужная штука

    Скажите будет ли работать форум (хотя бы для чтения)

    • admin says:

      Взаимно! Спасибо!

      Постараемся восстановить BD форума (не обещаю).

Написать комментарий к Максим

Пожалуйста, ознакомьтесь с правилами комментирования (причина УДАЛЕНИЯ некоторых комментариев)

Добавить изображение к комментарию (jpg)