Допустим, есть прайс поставщика (таблица CSV) с неполной информацией о товарах.
И нужно допарсить данные в прайс поставщика для загрузки товаров к себе в интернет-магазин.
Один из способов – спарсить все товары сайта в таблицу CSV и затем объединить полученную таблицу с прайсом поставщика по какому-либо ключевому значению (например, по столбцу с артикулами или наименованиями). -> Клик для справки
Второй способ (с которым не нужно парсить все товары сайта) – взять только нужные используя форму поиска товаров на сайте.
1) Подключаем CSV прайс поставщика в инструмент автоматизации (Shift+Ctrl+U) для того, чтобы сгенерировать список “ссылок” по количеству строк в подключаемом прайсе
В результате теста загрузки данных из прайса в список ссылок добавятся элементы типа
1 2 3 | [BLANK]a[PARAM]:2 [BLANK]b[PARAM]:3 [BLANK]c[PARAM]:4 |
Где [BLANK] отключит режим загрузки ссылок (парсинг без отправки запроса), а в [PARAM] будет содержаться номер строки подключенного прайса поставщика (чтобы по номеру строки из прайса читать и записывать данные).
2) Теперь нам нужно узнать, как выглядит URL для запроса к форме поиска сайта. Заходим на сайт (откуда спарсить товары или ссылки на них), вводим поисковую фразу и ищем товар. После этого в адресной строке браузера мы должны получить URL для отправки запросов на нужном сайте.
3) Далее настроим подгрузку из и запись данных в CSV поставщика.
1 2 3 4 5 | [LOADCSV(1)]C:\content\STest.csv[/LOADCSV]▒ [PUTCSVDATA2(1)][PARAM]|3|{overwrite}[TOPASTE]▒ <GETMORECONTENT><URL=".../catalog/?query=[GETCSVDATA(1)][PARAM]|2[/GETCSVDATA]"><GMC_REPLACE>{break_if_nil} {get}|...{get}</GMC_REPLACE><START="<div class={"}aheader{"}>{skip}<a href={"}"><STARTCOUNT="0"><END="{"}"><ENDCOUNT="0"><PARAMS=""></GETMORECONTENT>▒ [/PUTCSVDATA2] |
[GETCSVDATA] – берет артикул из второго столбца прайса поставщика и подставляет его в URL для поиска на сайте
GETMORECONTENT – загружает данные по URL и парсит нужную ссылку на товар из результатов поиска
[PUTCSVDATA2] – записывает полученный URL в третий столбец прайса поставщика.
Справка по макросам работы с подключаемыми CSV (клик)
Справка по макросу GETMORECONTENT (клик)
В результате парсинга мы дозапишем адреса нужных товаров в CSV прайс поставщика
Если кроме ссылок на товары требуется полностью заполнить прайс лист поставщика (например, допарсить картинки или характеристики), то подключите прайс с добавленными ссылками и допарсите по ним данные.