SBFactory – парсер контента, программа для наполнения интернет магазинов

В WBAppCEF добавлен инструмент XPath and JS Builder

WBAppCEF Подробнее »

В инструмент задания границ парсинга добавлен движок браузера CHROMIUM

CHROMIUM

Content Downloader X1 версии 11.1.1111111 (03.08.2020)

– В инструмент задания границ парсинга добавлен движок браузера CHROMIUM!

Выбор движка браузера (Chromium/Internet Explorer) для инструмента задания границ парсинга осуществляется в настройках программы (ctrl+8).

С CHROMIUM Получать данные элементов WEB страницы (для поиска в коде) можно так:
1) Поместите курсор над нужным элементом
2) Нажмите F4 (так как Event на клик мышкой в CEF нет, поэтому пришлось сделать через такой хоткей)

И еще такой момент, мне непонятно, читают ли вообще люди посты или нет. Если прочитали, оставьте любой комментарий (регистрация не требуется)!

Всем спасибо! Подробнее »

Добавлена возможность парсить контактные данные с любых сайтов (макрос шаблона вывода [CRAWLER])



Смотреть справку по макросу [CRAWLER]

Подробнее »

Content Downloader X1 версии 11.1.1110078 (Millenium Falcon) (09.03.2020)

– Устранен appcrash при парсинге с использованием библиотеки Clever Internet Suite;
– Добавлены функции фильтрации повторяющихся границ парсинга (http://sbfactory.ru/cd/?p=5526);
– Оптимизирована функция преобразования сохраняемого контента в CSV формат;
– Незначительно оптимизирован процесс вычисления контента обычных границ парсинга;
– При использовании [COMBO_n] в повторяющихся границах теперь можно одновременно использовать и [VALUE_n] ([VALUE_n] в этом случае будет выводить цикл с индексом, соответствующим основному (где используется [COMBO_n] и [VALUE_n]));
– Дополнительные настройки сканера сайтов в группу “Парсинг [PARAM]” добавлена опция “не добавлять ссылки без [PARAM]”;
– В сканере сайтов оптимизирована функция поиска ссылок между заданными границами (кнопка “FIND”);
– JSON POST данные теперь не нужно брать в [JSONREQUEST] (формирование JSON POST запроса в случае определения JSON POST данных теперь происходит автоматически);
– В функции поиск-замены добавлена возможность раскодирования BASE64;
– Теперь в параметре конца границ парсинга можно использовать [JSONAUTO] (автоматический поиск закрывающей фигурной или квадратной скобки, http://sbfactory.ru/cd/?p=5563);
– Макросы шаблона вывода [WBAPP] теперь вставляются с параметром [GETRESULT] и без параметра [ONETHREAD];
– Внутри макроса шаблона вывода [GENERATE] теперь можно использовать макросы [MATH] и [IF1];
– Оптимизирована функция вычисления динамических границ парсинга;
– Доработан макрос строки заголовка для генерации названий столбцов CSV (http://sbfactory.ru/cd/?p=4535);
– Во вкладку “Контент” добавлены инструменты для быстрой вставки и настройки часто используемых макросов шаблона вывода;
– Несколько других доработок.

WBAppCEF 2.00

– Добавлено событие [WAITFORRESPONSE] (ожидание ответа на запрос к нужному URL);
– Добавлено событие [SCROLLBYSCREENTHENRETURN] (прокрутка WEB страницы вниз на высоту эркна и повтор событий);
– Добавлено событие [SKIP] (пропуск вложенных событий);
– ДОбавлено событие [SETZOOM] (установка скалирования отображения WEB страницы);
– В Javascript Manager добавлена функция создания скрипта на основе XPath из буфера обмена);
– Вставляемые в Javascript значения [PARAM] и [CDDATA] (передача данных из Content Downloader) теперь могут быть и многострочными;
– Множество других доработок.

Подробнее »

Система помощи Content Downloader значительно доработана

Подробнее »

Теперь можно более удобно парсить парсить из XML/YML

Парсинг XML элементов (характеристик товаров) в CSV с помощью макроса шаблона вывода [XMLELEMENTSTOCSV].
Подробнее »

Теперь можно полноценно парсить в XML/YML


Подробнее »