Здесь описаны инструменты для поиска товаров по заголовкам или артикулам в другом интернет-магазине.
Например, у вас есть таблица с товарами и вам нужно подгрузить цены, картинки или другие характеристики из другого интернет-магазина. Проблема состоит в том, что заголовки товаров написаны по-разному.
Например, у вас в таблице заголовки выглядят так:
iPhone 12 black 128 gb
iPhone 11 white 256 gb
Телевизор LG 50UP75006LF
…
А в интернет-магазине, откуда вы хотите подгрузить данные, заголовки этих же товаров выглядят так:
Смартфон Apple iPhone 12 черный 128 ГБ
Смартфон Apple iPhone 11 белый 256 ГБ
4k Телевизор 50UP75006LF
…
Как видно, заголовки одних и тех же товаров в разных магазинах часто написаны по-разному и сравнивать их простым сопоставлением не удается. Нужны сложные алгоритмы.
Существует два способа сопоставления товаров по заголовкам или артикулам:
1) Парсинг поисковой формы сайта и обработка результатов выдачи с помощью макроса шаблона вывода [COMPARETITLES] (этот способ будет рассмотрен ниже)
2) Парсинг всех товаров или рубрики сайта в CSV и сравнение заголовков или артикулов товаров в редакторе таблиц CSVPRO (клик для изучения)
Начнем с описания параметров макроса [COMPARETITLES]
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | [COMPARETITLES] {TITLE1}Заголовок 1{/TITLE1} {TITLE2}Заголовок 2{/TITLE2} {REPLACEW} Замена или удаление слов {/REPLACEW} {MINWORDSTOMATCH}3{/MINWORDSTOMATCH} {PARAMETERS}Параметры сравнения{/PARAMETERS} {IFMATCH}Что вывести, если заголовки совпали{/IFMATCH} {IFNOTMATCH}Что вывести, если заголовки не совпали{/IFNOTMATCH} [/COMPARETITLES] |
В параметры {TITLE1} и {TITLE2} вставляются заголовки товаров для сравнения (могут использоваться макросы границ парсинга)
В параметр {REPLACEW} построчно вставляется список слов для замены или удаления.
Например, чтобы удалить слова из сравниваемых заголовков:
Слово1|
Слово2|
…
В параметре {MINWORDSTOMATCH} указывается минимальное число совпавших слов в обоих заголовках для положительного результата сравнения.
В параметре {PARAMETERS} через запятую перечисляются режимы сравнения заголовков (по словам и SKU):
words_one_way – достаточно, чтобы все слова одного из заголовков были в другом заголовке
words_two_way – необходимо, чтобы все слова заголовка 1 и заголовка 2 совпали
sku – достаточно, чтобы совпали артикулы товаров, находящиеся в заголовках
sku+color – нужно, чтобы совпали и артикулы и цвета
Также с параметрами sku и sku+color можно ДОБАВЛЯТЬ параметр sku_exact, например: {PARAMETERS}sku,sku_exact{/PARAMETERS}. Параметр sku_exact служит для включения режима точного совпадения извлеченных SKU (а именно, при сравнении артикулов будут учитываться не только буквы и цифры, а также и другие символы: ./-_). Сравнение извлеченных SKU в любых случаях является регистронезависимым.
Возможно совместное использование проверки по SKU и по словам, например, так:
{PARAMETERS}words_one_way,sku+color{/PARAMETERS}
Это самый универсальный вариант проверки заголовков товаров.
Алгоритм работы функции сравнения заголовков.
При работе функции в режимах words_one_way и words_two_way каждый заголовок бьется на отдельные слова (с предварительным удалением слов, перечисленных в параметре {REPLACEW}). Затем каждое слово первого заголовка сравнивается с каждым словом второго. Для быстрого составления списка слов для удаления исползуйте функции подсчета частотности слов в редакторе CSVPRO.
При работе функции в режиме sku из обоих заголовков извлекаются артикулы товаров и сравниваются друг с другом.
При работе функции в режиме sku+color из обоих заголовков извлекаются артикулы товаров и цвета и сравниваются друг с другом.
Данные методы сравнения заголовков позволяют достаточно эффективно и точно сравнивать товары.