Парсер WEB контента

Модуль парсера WEB контента в редакторе CSVPRO является пробным инструментом. Если он будет востребован, добавим в него много различных функций для удобного сбора информации. Таким образом можно будет быстро пополнять или обновлять данные в CSV таблицах с товарами.


Открыть парсер можно так.

Открыть парсер WEB-контента


Далее указываете столбец таблицы, в котором расположены URL адреса товаров.

Настройка парсера CSV


Затем указываете, какие данные брать из кода WEB-страниц товаров и в какие столбцы таблицы их вставлять.

Настройка парсера товаров

Правила поиск-замен для извлечения удобно брать из инструмента задания границ парсинга Content Downloader

Задание границ парсинга

После выполнения всех настроек жмите кнопку «Запуск» и таблица должна заполниться/обновиться согласно введенным настройкам.


Если результат парсинга оказался некорректным, после его завершения, нажмите кнопку отмены.

Отменить парсинг


Все настройки парсера будут сохраняться при перезапуске программы. Далее, если потребуется, сделаем функции сохранения и загрузки проектов модуля парсера.

ВАЖНО: На данный момент в программе для подгрузки WEB контента используются прямые GET запросы (без выполнения Javascript). Если нужно, добавим в программу возможность использования модуля WBAppCEF (парсинг с помощью движка браузера с выполнением всех Javascript и эмуляцией нужных действий).

Пишите в комментариях, если нужны доработки.

Спасибо!!!


Установка модуля WBAppCEF


В программе CSVPRO предусмотрено использование модуля браузера WBAppCEF. Он не включен в стандартную версию и устанавливается отдельно (чтобы снизить размер базового архива программы).

Данный модуль позволяет парсить WEB страницы с использованием движка браузера Chromium. WBAppCEF взят из Content Downloader и поддерживает проекты .wbapp. Таким образом можно парсить сайты с выполнением всех Javascript на WEB-страницах и автоматически выполнять действия (например, клики, вставку текста и прочие).

Для установки модуля скачайте его здесь (клик)

Распакуйте архив таким образом, чтобы его содержимое располагалось примерно так: Папка с программой CSVPRO\WBAppCEF\.

После этого модуль будет работать.


Перевод CSV таблиц через Google Translate с использованием WBAppCEF WBAppCEF


1) Установите модуль WBAppCEF (клик для справки)
2) Скачайте wbapp проекты переводчика (архив, клик), разархивируйте его и поместите файлы wbapp, например, в папку C:\Content
3) Настройте модуль парсера CSVPRO согласно инструкции ниже


Откройте модуль парсера так

Открыть модуль парсера


Перевод CSV


Перевод CSV


Перевод CSV


Перевод CSV


Перевод CSV


После запуска перевода каждая ячейка таблицы будет переводиться отдельно. Переведенные ячейки будут подсвечиваться светло-зеленым цветом.

Перевод CSV


1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5,00 out of 5)

Загрузка...

Автор: admin, 04.01.2023
Рубрики: функции CSVPRO
3 комментария к сообщению: “Парсер WEB контента”
  1. Виталий:

    Добрый день. Спасибо за полезное обновление.
    Нужно сохранение проектов сделать, также думаю что пока можно добавить шаблон вставки
    [GETHTML]:[0]START|||[0]END, чтобы быстро добавлять. В идеале конечно, попозже, встроить инструмент задания границ с заменами.

Написать комментарий

Последние статьи