Сопоставление товаров из разных интернет магазинов

Здесь описаны инструменты для поиска товаров по заголовкам или артикулам в другом интернет-магазине.

Например, у вас есть таблица с товарами и вам нужно подгрузить цены, картинки или другие характеристики из другого интернет-магазина. Проблема состоит в том, что заголовки товаров написаны по-разному.

Например, у вас в таблице заголовки выглядят так:
iPhone 12 black 128 gb
iPhone 11 white 256 gb
Телевизор LG 50UP75006LF

А в интернет-магазине, откуда вы хотите подгрузить данные, заголовки этих же товаров выглядят так:
Смартфон Apple iPhone 12 черный 128 ГБ
Смартфон Apple iPhone 11 белый 256 ГБ
4k Телевизор 50UP75006LF

Как видно, заголовки одних и тех же товаров в разных магазинах часто написаны по-разному и сравнивать их простым сопоставлением не удается. Нужны сложные алгоритмы.


Существует два способа сопоставления товаров по заголовкам или артикулам:

1) Парсинг поисковой формы сайта и обработка результатов выдачи с помощью макроса шаблона вывода [COMPARETITLES] (этот способ будет рассмотрен ниже)
2) Парсинг всех товаров или рубрики сайта в CSV и сравнение заголовков или артикулов товаров в редакторе таблиц CSVPRO (клик для изучения)

Начнем с описания параметров макроса [COMPARETITLES]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
[COMPARETITLES]
 
{TITLE1}Заголовок 1{/TITLE1}
{TITLE2}Заголовок 2{/TITLE2}
 
{REPLACEW}
Замена или удаление слов
{/REPLACEW}
 
{MINWORDSTOMATCH}3{/MINWORDSTOMATCH}
 
{PARAMETERS}Параметры сравнения{/PARAMETERS}
 
{IFMATCH}Что вывести, если заголовки совпали{/IFMATCH}
{IFNOTMATCH}Что вывести, если заголовки не совпали{/IFNOTMATCH}
 
[/COMPARETITLES]

В параметры {TITLE1} и {TITLE2} вставляются заголовки товаров для сравнения (могут использоваться макросы границ парсинга)

В параметр {REPLACEW} построчно вставляется список слов для замены или удаления.
Например, чтобы удалить слова из сравниваемых заголовков:
Слово1|
Слово2|

В параметре {MINWORDSTOMATCH} указывается минимальное число совпавших слов в обоих заголовках для положительного результата сравнения.

В параметре {PARAMETERS} через запятую перечисляются режимы сравнения заголовков (по словам и SKU):
words_one_way – достаточно, чтобы все слова одного из заголовков были в другом заголовке
words_two_way – необходимо, чтобы все слова заголовка 1 и заголовка 2 совпали
sku – достаточно, чтобы совпали артикулы товаров, находящиеся в заголовках
sku+color – нужно, чтобы совпали и артикулы и цвета

Также с параметрами sku и sku+color можно ДОБАВЛЯТЬ параметр sku_exact, например: {PARAMETERS}sku,sku_exact{/PARAMETERS}. Параметр sku_exact служит для включения режима точного совпадения извлеченных SKU (а именно, при сравнении артикулов будут учитываться не только буквы и цифры, а также и другие символы: ./-_). Сравнение извлеченных SKU в любых случаях является регистронезависимым.

Возможно совместное использование проверки по SKU и по словам, например, так:
{PARAMETERS}words_one_way,sku+color{/PARAMETERS}
Это самый универсальный вариант проверки заголовков товаров.


Алгоритм работы функции сравнения заголовков.

При работе функции в режимах words_one_way и words_two_way каждый заголовок бьется на отдельные слова (с предварительным удалением слов, перечисленных в параметре {REPLACEW}). Затем каждое слово первого заголовка сравнивается с каждым словом второго. Для быстрого составления списка слов для удаления исползуйте функции подсчета частотности слов в редакторе CSVPRO.

При работе функции в режиме sku из обоих заголовков извлекаются артикулы товаров и сравниваются друг с другом.

При работе функции в режиме sku+color из обоих заголовков извлекаются артикулы товаров и цвета и сравниваются друг с другом.


Данные методы сравнения заголовков позволяют достаточно эффективно и точно сравнивать товары.


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 5, средний балл: 4.80)

Loading...
Автор: admin, 6 March 2022
Рубрики: Новости
Написать комментарий

Последние статьи

css.php