Архивы рубрики: ‘Новости’

Создание комбинаций из значений циклов выбранных повторяющихся границ парсинга

Допустим, первая повторяющаяся граница парсинга парсит значения:
серебристый
белый

Вторая повторяющаяся граница парсит следующие значения:
S
M
L

Чтобы получить результат вида:
серебристый;S
серебристый;M
серебристый;L
белый;S
белый;M
белый;L (more…)

В инструмент задания границ парсинга (ctrl+f1) добавлена панель управления прокси

Content Downloader X1 версии 11.1.0000010 (06.09.2016)

– В инструмент задания границ парсинга добавлена панель управления прокси;
– Несколько других доработок.

Content Downloader
(more…)

Доработка функции поиск-замены

Здравствуйте!

Доработана функция поиск-замены. Обновление сборки реализовано без изменения номера текущей версии программы (для скачивания обновленной сборки: главное меню – файл – центр обновлений -> кнопка “обновить через сайт”).

Суть этого обновления заключается в изменении алгоритмов работы с массивом значений {skip(1)}, {skip(2)}, {skip(3)}… Теперь этот массив сбрасывается при каждом выполнении замены подстроки (ранее сбрасывался только при переходе к следующему правилу поиск-замены).

Поэтому стало возможным выполнять схемы типа: (more…)

Функции поиск-замены в Content Downloader


(more…)

Парсинг характеристик товаров с Яндекс Маркета


(more…)

Параметр конца обычных границ парсинга [AUTO] (автоматический поиск закрывающего HTML-тега)

Если, допустим, парсим статью или какой-либо контент содержащийся, например, в HTML-теге div, а в этом теге div содержится еще неопределенное количество вложенных тегов div, то, соответственно, мы не можем корректно определить конец парсинга </div> для всех страниц сайта (так как его номер по счету на разных страницах сайта будет отличен).

Для решения таких задач существует параметр конца обычной границы парсинга [AUTO]. Он может быть вставлен в начало текста конца любой обычной границы парсинга через контекстное меню или сочетание клавиш ctrl+u (смотрите скриншот ниже). После параметра [AUTO] прописывается название нужного HTML-тега, например: div, p, table и так далее. При этом начало границы парсинга задается обычным образом!

Как работает эта функция: Программа в коде WEB-документа сперва находит начало границы парсинга, затем начинает дальше идти по коду считая открывающиеся и закрывающиеся теги div. Как только функция высчитает, что основной HTML-тег (с нужным контентом) закрылся (</div>), то определит его, как конец парсинга и возьмет из него нужный нам контент!

Content Downloader (more…)

Анализатор контента границ парсинга

Content Downloader

Content Downloader (more…)