Архивы рубрики: ‘Новости’

Вставка в шаблон одной повторяющейся границы парсинга смежных значений из любых других повторяющихся границ

Content Downloader
(more…)

Создание комбинаций из значений циклов выбранных повторяющихся границ парсинга

Допустим, первая повторяющаяся граница парсинга парсит значения:
серебристый
белый

Вторая повторяющаяся граница парсит следующие значения:
S
M
L

Чтобы получить результат вида:
серебристый;S
серебристый;M
серебристый;L
белый;S
белый;M
белый;L (more…)

В инструмент задания границ парсинга (ctrl+f1) добавлена панель управления прокси

Content Downloader X1 версии 11.1.0000010 (06.09.2016)

– В инструмент задания границ парсинга добавлена панель управления прокси;
– Несколько других доработок.

Content Downloader
(more…)

Доработка функции поиск-замены

Здравствуйте!

Доработана функция поиск-замены. Обновление сборки реализовано без изменения номера текущей версии программы (для скачивания обновленной сборки: главное меню – файл – центр обновлений -> кнопка “обновить через сайт”).

Суть этого обновления заключается в изменении алгоритмов работы с массивом значений {skip(1)}, {skip(2)}, {skip(3)}… Теперь этот массив сбрасывается при каждом выполнении замены подстроки (ранее сбрасывался только при переходе к следующему правилу поиск-замены).

Поэтому стало возможным выполнять схемы типа: (more…)

Функции поиск-замены в Content Downloader


(more…)

Парсинг характеристик товаров с Яндекс Маркета


(more…)

Параметр конца обычных границ парсинга [AUTO] (автоматический поиск закрывающего HTML-тега)

Если, допустим, парсим статью или какой-либо контент содержащийся, например, в HTML-теге div, а в этом теге div содержится еще неопределенное количество вложенных тегов div, то, соответственно, мы не можем корректно определить конец парсинга </div> для всех страниц сайта (так как его номер по счету на разных страницах сайта будет отличен).

Для решения таких задач существует параметр конца обычной границы парсинга [AUTO]. Он может быть вставлен в начало текста конца любой обычной границы парсинга через контекстное меню или сочетание клавиш ctrl+u (смотрите скриншот ниже). После параметра [AUTO] прописывается название нужного HTML-тега, например: div, p, table и так далее. При этом начало границы парсинга задается обычным образом!

Как работает эта функция: Программа в коде WEB-документа сперва находит начало границы парсинга, затем начинает дальше идти по коду считая открывающиеся и закрывающиеся теги div. Как только функция высчитает, что основной HTML-тег (с нужным контентом) закрылся (</div>), то определит его, как конец парсинга и возьмет из него нужный нам контент!

Content Downloader (more…)