Новости | SBFactory - универсальный парсер контента, программа для наполнения интернет магазинов - Part 22

Архивы рубрики: ‘Новости’

Парсинг магазина, где у карточек товаров нет отдельных WEB-страниц

Карточка товара подгружается HTTP-запросом со страницы рубрики сайта и отображается в виде “всплывающего окна”. (more…)

Парсинг выдачи Google по списку ключевых слов


(more…)

Новые макросы шаблона вывода: [FILE] и [GETVALUE]

Вставка строк из файла на диске ([FILE]):

1
2
3
4
[FILE(путь к файлу|номер строки для вставки|сколько строк вставлять)]
[FILE(c:\file.txt|1|1)] - будет вставлена первая строка из файла c:\file.txt
[FILE(c:\file.txt|1|2)] - будут вставлены первая и вторая строки из файла c:\file.txt
[FILE(c:\file.txt|2|2)] - будут вставлены вторая и третья строки из файла c:\file.txt

Если параметр “номер строки для вставки”=0, то при первом вызове макроса из файла будет взята первая строка, при втором вызове макроса будет взята вторая строка и так далее:

1
2
3
[FILE(c:\file.txt|0|1)] - будет вставлена первая строка из файла c:\file.txt
[FILE(c:\file.txt|0|1)] - будет вставлена вторая строка из файла c:\file.txt
[FILE(c:\file.txt|0|1)] - будет вставлена третья строка из файла c:\file.txt

(more…)

Лицензионное соглашение

Лицензионное соглашение от 12.02.2017 (more…)

Передача адресов WEB-страниц из WBApp в Content Downloader (событие WBApp [GETCURRENTURL])

Например, в процессе выполнения списка событий WBApp делаются переходы по разным WEB-страницам и вам нужно вернуть в Content Downloader адрес(а) этих WEB-страниц. Для этого используйте событие WBApp – [GETCURRENTURL]. В момент выполнения этого события, в список передаваемых в Content Downloader ссылок, будет добавлена ссылка открытого в WBApp документа.

Событие [GETCURRENTURL] может быть вызвано сколько угодно много раз.

Как в программе Content Downloader выводить ссылки, полученные из WBApp:
Перейдите в программу Content Downloader, откройте редактор шаблона вывода (ctrl+2) и в нужные места вставьте макрос(ы), [WBAPPCURRENTURL(параметр)]. Где в качестве параметра могут быть использованы следующие значения:
1) ALL – для вывода списка всех переданных ссылок
2) 0 (цифра ноль) – для вывода последней переданной ссылки
3) Целые числа от 1 (включительно) – для вывода определенной ссылки из списка
(more…)

Экспресс-курс по изучению основ работы с Content Downloader

Парсинг ссылок

Парсинг во вкладке 'Ссылки' (парсинг отдельной рубрики сайта, парсинг по ключевым запросам, генерация списков ссылок с использованием нарастающих числовых значений и/или ключевых слов)
Сбор ссылок сканером сайтов (если вы парсите все рубрики сайта или весь сайт целиком)
Парсинг ссылок из XML-карты сайта (сбор ссылок со всего сайта, быстрый и простой метод)

Большинство сайтов имеют XML-карту, содержащую ссылки на статьи/товары и прочее. Обычно карта располагается по адресу http://SBFactory.ru/sitemap.xml (в корне). Просто попробуйте открыть подобный адрес у себя в браузере. Если карты сайта по такому адресу не будет, проверьте файл robots.txt (http://SBFactory.ru/robots.txt), в котором может быть строка Sitemap: http://sbfactory.ru/sitemap.xml и ей подобные.

Парсинг контента

Парсинг в CSV-файлы (пример парсинга товаров)
Парсинг текста/статей с картинками и без
Парсинг информации, доступной после клика по кнопке типа 'показать еще', парсинг информации, подгружаемой при прокрутке WEB-страницы вниз
(more…)

Генерация уникальных ID товаров или статей при парсинге контента


(more…)