Поиск конца обычных границ парсинга в обратном направлении (параметр инверсия)

Допустим, имеем следующий HTML-код:

1
2
3

...
<img src="URL" class="BIG">
...

И нам нужно спарсить URL только той картинки, которой присвоен class BIG (что стоит после нужного нам URL), зацепившись за " class="BIG". То есть, пойти от начала WEB-документа до " class="BIG" и потом обратно (к началу документа) до src=" и взять код между этими границами – URL.

Для решения подобных задач нужно использовать инверсию. Эта опция есть у каждой обычной границы парсинга.

Включить эту опцию для нужной или нужных границ парсинга вы можете в инструменте задания границ парсинга (ctrl+f1). Кнопка включения/выключения инверсии располагается на верхней панели инструментов и имеет иконку в виде английской буквы i (хоткей ctrl+i).

Итак, чтобы решить нашу задачу, в инструменте задания границ парсинга (ctrl+f1) включаем инверсию (ctrl+i), выделяем в коде " class="BIG" и жмем “задать начало парсинга” (f1). Затем выделяем src=" и жмем “задать конец парсинга” (ctrl+f2). ГОТОВО! В итоге у нас спарсится желанный URL!

Поясняю алгоритм: Content Downloader (при включенном параметре “инверсия” у определенной границы парсинга) ищет начало парсинга “как обычно”. Как только программа нашла в коде WEB-документа начало парсинга, поиск конца парсинга начинается не к концу документа, а к началу документа (в обратном направлении).

Желаем вам успехов и приятной работы!

(оценок: 4, средний балл: 4.75)

Есть 5 коммент. к сообщению: “Поиск конца обычных границ парсинга в обратном направлении (параметр инверсия)”

гость says:

10 July 2014 at 19:45

Спасибо, давно и часто не хватало этой функции!!

Reply
- admin says:
  
  11 July 2014 at 1:34
  
  Пожалуйста.
  
  Reply
- admin says:
  
  11 July 2014 at 1:39
  
  Если вам что-то еще требуется, пожалуйста, предлагайте http://forum.sbfactory.ru/showthread.php?t=13&page=70
  Спасибо!
  
  Reply
MAX3000 says:

11 July 2014 at 19:33

Отличная доработка! Давно ждал! Спасибо!

Reply
- admin says:
  
  14 July 2014 at 2:08
  
  Спасибо! Давно хотел сделать)
  
  Reply

Написать комментарий

универсальный парсер контента

Поиск конца обычных границ парсинга в обратном направлении (параметр инверсия)