Как дополнить прайс поставщика

Допустим, есть прайс поставщика (таблица CSV) с неполной информацией о товарах.

CSV прайс поставщика

И нужно допарсить данные в прайс поставщика для загрузки товаров к себе в интернет-магазин.

Один из способов – спарсить все товары сайта в таблицу CSV и затем объединить полученную таблицу с прайсом поставщика по какому-либо ключевому значению (например, по столбцу с артикулами или наименованиями). -> Клик для справки


Второй способ (с которым не нужно парсить все товары сайта) – взять только нужные используя форму поиска товаров на сайте.

1) Подключаем CSV прайс поставщика в инструмент автоматизации (Shift+Ctrl+U) для того, чтобы сгенерировать список “ссылок” по количеству строк в подключаемом прайсе

Подключение прайса поставщика для автоматизации

В результате теста загрузки данных из прайса в список ссылок добавятся элементы типа

1
2
3
[BLANK]a[PARAM]:2
[BLANK]b[PARAM]:3
[BLANK]c[PARAM]:4

Где [BLANK] отключит режим загрузки ссылок (парсинг без отправки запроса), а в [PARAM] будет содержаться номер строки подключенного прайса поставщика (чтобы по номеру строки из прайса читать и записывать данные).

2) Теперь нам нужно узнать, как выглядит URL для запроса к форме поиска сайта. Заходим на сайт (откуда спарсить товары или ссылки на них), вводим поисковую фразу и ищем товар. После этого в адресной строке браузера мы должны получить URL для отправки запросов на нужном сайте.

Парсинг товаров по артикулу

3) Далее настроим подгрузку из и запись данных в CSV поставщика.

Пополнить прайс поставщика

1
2
3
4
5
[LOADCSV(1)]C:\content\STest.csv[/LOADCSV]▒
[PUTCSVDATA2(1)][PARAM]|3|{overwrite}[TOPASTE]▒
<GETMORECONTENT><URL=".../catalog/?query=[GETCSVDATA(1)][PARAM]|2[/GETCSVDATA]"><GMC_REPLACE>{break_if_nil}
{get}|...{get}</GMC_REPLACE><START="<div class={"}aheader{"}>{skip}<a href={"}"><STARTCOUNT="0"><END="{"}"><ENDCOUNT="0"><PARAMS=""></GETMORECONTENT>▒
[/PUTCSVDATA2]
[LOADCSV] – загружает в память CSV прайс поставщика
[GETCSVDATA] – берет артикул из второго столбца прайса поставщика и подставляет его в URL для поиска на сайте
GETMORECONTENT – загружает данные по URL и парсит нужную ссылку на товар из результатов поиска
[PUTCSVDATA2] – записывает полученный URL в третий столбец прайса поставщика.

Справка по макросам работы с подключаемыми CSV (клик)
Справка по макросу GETMORECONTENT (клик)


В результате парсинга мы дозапишем адреса нужных товаров в CSV прайс поставщика

результат парсинга данных в CSV прайс поставщика

Если кроме ссылок на товары требуется полностью заполнить прайс лист поставщика (например, допарсить картинки или характеристики), то подключите прайс с добавленными ссылками и допарсите по ним данные.


1 Star2 Stars3 Stars4 Stars5 Stars (Еще нет оценок)

Loading...
Автор: admin, 1 March 2021
Рубрики: Приемы парсинга
Tags: , , , , ,
Написать комментарий

Последние статьи

css.php