Модуль парсера WEB контента в редакторе CSVPRO является пробным инструментом. Если он будет востребован, добавим в него много различных функций для удобного сбора информации. Таким образом можно будет быстро пополнять или обновлять данные в CSV таблицах с товарами.
Открыть парсер можно так.
Далее указываете столбец таблицы, в котором расположены URL адреса товаров.
Затем указываете, какие данные брать из кода WEB-страниц товаров и в какие столбцы таблицы их вставлять.
Правила поиск-замен для извлечения удобно брать из инструмента задания границ парсинга Content Downloader
После выполнения всех настроек жмите кнопку «Запуск» и таблица должна заполниться/обновиться согласно введенным настройкам.
Если результат парсинга оказался некорректным, после его завершения, нажмите кнопку отмены.
Все настройки парсера будут сохраняться при перезапуске программы. Далее, если потребуется, сделаем функции сохранения и загрузки проектов модуля парсера.
ВАЖНО: На данный момент в программе для подгрузки WEB контента используются прямые GET запросы (без выполнения Javascript). Если нужно, добавим в программу возможность использования модуля WBAppCEF (парсинг с помощью движка браузера с выполнением всех Javascript и эмуляцией нужных действий).
Пишите в комментариях, если нужны доработки.
Спасибо!!!
Установка модуля WBAppCEF
В программе CSVPRO предусмотрено использование модуля браузера WBAppCEF. Он не включен в стандартную версию и устанавливается отдельно (чтобы снизить размер базового архива программы).
Данный модуль позволяет парсить WEB страницы с использованием движка браузера Chromium. WBAppCEF взят из Content Downloader и поддерживает проекты .wbapp. Таким образом можно парсить сайты с выполнением всех Javascript на WEB-страницах и автоматически выполнять действия (например, клики, вставку текста и прочие).
Для установки модуля скачайте его здесь (клик)
Распакуйте архив таким образом, чтобы его содержимое располагалось примерно так: Папка с программой CSVPRO\WBAppCEF\.
После этого модуль будет работать.
Перевод CSV таблиц через Google Translate с использованием WBAppCEF WBAppCEF
1) Установите модуль WBAppCEF (клик для справки)
2) Скачайте wbapp проекты переводчика (архив, клик), разархивируйте его и поместите файлы wbapp, например, в папку C:\Content
3) Настройте модуль парсера CSVPRO согласно инструкции ниже
Откройте модуль парсера так
После запуска перевода каждая ячейка таблицы будет переводиться отдельно. Переведенные ячейки будут подсвечиваться светло-зеленым цветом.
Добрый день. Спасибо за полезное обновление.
Нужно сохранение проектов сделать, также думаю что пока можно добавить шаблон вставки
[GETHTML]:[0]START|||[0]END, чтобы быстро добавлять. В идеале конечно, попозже, встроить инструмент задания границ с заменами.
Здравствуйте.
Пожалуйста.
Услышал…
06.01.2023 (3.007)
— В модуль парсера добавлены функции сохранения, загрузки и создания проектов;
— Несколько других доработок.
https://sbfactory.ru/csvpro_website/download_update/