Инструмент расширенного удаления дублей ссылок

Content Downloader (расширенное удаление дублей ссылок)

Давайте рассмотрим пример для лучшего понимания значимости этого инструмента. Предположим, в списке ссылок главного окна программы есть следующие URL-адреса товаров:

1
2
3
4
5
6
7
8
http://SBFactory.ru/cat1/?p=600
http://site.ru/cat2/?good=600
http://site.ru/cat3/?good=600
http://site.ru/cat4/?good=600
http://site.ru/cat5/?good=600
http://site.ru/cat6/?good=55555
http://site.ru/cat7/?good=7777777
http://site.ru/cat8/?good=88888888


Допустим, за ID товара в этих ссылках отвечает параметр good, а за рубрику – часть ссылок с cat. Соответственно, первые 4 адреса будут вести на один и тот же товар, и, пользуясь, стандартными функциями удаления дублей, мы не удалим ни одного из этих адресов, так как они будут являться разными (а нам нужно удалить первые три).

Инструмент расширенного удаления дублей ссылок был разработан специально для решения подобных задач. Суть его работы заключается в том, что он отправляет на проверку на дубли не всю ссылку целиком, а только определенную ее часть, “взятую” из нее методом применения к ссылке функции поиск-замены.

Примечание 1: Встроенными функциями поиск-замены можно обрезать текст или выбирать из него нужные части (справка по функциям поиск-замены программы).

Возвращаясь к нашей задаче, понимаем, что нам нужно отправлять на проверку на дубли ID товаров, взятые из оригинальных ссылок. Для этого достаточно применить к ним такое правило поиск-замены (вписав его в поле B (смотрите скриншот выше)):

1
?good={get}|{get}

После чего нажать на кнопку A и получить нужный результат:

1
2
3
4
http://SBFactory.ru/cat1/?p=600
http://site.ru/cat6/?good=55555
http://site.ru/cat7/?good=7777777
http://site.ru/cat8/?good=88888888

Примечание 2: Если результат применения функции к списку ссылок оказался не таким, каким вы его ожидали, то вернуть список ссылок главного окна программы к исходному виду можно через его контекстное меню (правый клик по списку ссылок -> отменить последнее действие).

Примеры правил поиск-замены:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Обрезать ссылку от начала до первого вхождения "подстрока":
{skip}подстрока|
 
Обрезать ссылку от начала до второго вхождения "подстрока":
{skip}подстрока|
{skip}подстрока|
 
Обрезать ссылку от ее конца до, например, первого слеша:
/{skip}|
 
Обрезать ссылку от ее конца, до второго слеша:
/{skip}|
/{skip}|
 
Взять текст, находящийся между "подстрока1" и "подстрока2":
подстрока1{get}подстрока2|{get}
 
Взять текст, который расположен от начала и до "вхождение1":
{get}вхождение1|{get}
 
Взять текст, который расположен в конце ссылки:
вхождение{get}|{get}
/{get}|{get}
 
Вставляйте оператор {reset_if_nil} на отдельной строке, если нужно вернуть к изначальному виду "опустевшую" ссылку в процессе применения к ней поиск-замен:
/{get}|{get}
{reset_if_nil}

Спасибо!

1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 7, средний балл: 5.00)
Loading...
Автор: admin, 20 November 2016
Рубрики: Функции обработки
Tags: , ,

Последние статьи

css.php