Задание обычных границ парсинга внутри повторяющейся (когда нужно парсить несколько товаров с одной WEB-страницы)

Допустим, на странице располагается 10 товаров и нам нужно спарсить их характеристики. Например, каждый товар в коде WEB-страницы располагается между !—Блок товарa и !—Конец блока товарa. Зададим одну повторяющуюся границу так (задание повторяющихся границ парсинга), чтобы она брала содержимое этих 10 блоков (начало парсинга: !—Блок товарa, конец парсинга: !—Конец блока товарa).

Далее мы будем задавать обычные границы парсинга ВНУТРИ повторяющейся границы парсинга 1. Для этого нажмите кнопку «настройка повторяющихся границ» на панели инструментов главного окна программы. Откроется окно настройки повторяющихся границ, далее жмем на «редактировать шаблон повторяющихся границ 1». После этого жмем кнопку задать (смотрите скриншот 1). После нажатия на эту кнопку, откроется инструмент задания границ парсинга, в котором мы и зададим обычные границы парсинга для каждой характеристики товара (наименование, картинка, описание)(задание обычных границ парсинга).

скриншот 1:
Content Downloader

Затем открываем редактор шаблона вывода (кнопка на панели инструментов главного окна программы) и прописываем там макрос CD_CYCLE_GRAN_ALL! (как показано на скриншоте 2):

скриншот 2:
Content Downloader

В редакторе шаблона вывода нажимаем ctrl+5 (откроет окно настройки повторяющихся границ) и в самом нижнем окне с разделителем прописываем [CSVLB] (это нужно для того, чтобы каждый товар был на новой строчке).

После этих действий можно выполнить предпросмотр результата парсинга контента (ctrl+f2 из редактора шаблона вывода или главного окна программы). В окне предпросмотра мы должны увидеть примерно следующее:

скриншот 3:
Content Downloader

Готово!


Примечание 1: Если вы парсите товары в таблицу CSV, то не забудьте указать расширение сохраняемого документа, как csv (во вкладке «контент» главного окна программы). А еще лучше (перед началом настройки) сделать так: меню — файл — создать новый проект с базовыми настройками для CSV!

Примечание 2: Если вам нужно в каждый цикл повторяющихся границ вставить какие-либо данные (например, другие границы парсинга или макросы), вставляйте эти данные в шаблон соответствующей повторяющейся границы (shift+ctrl+5).


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 6, средний балл: 5,00)

Загрузка...
Автор: admin, 7 декабря 2013
Рубрики: Парсинг
4 комментария к сообщению: “Задание обычных границ парсинга внутри повторяющейся (когда нужно парсить несколько товаров с одной WEB-страницы)”
  1. seodamage:

    Отлично!Данная функция просто незаменима.

  2. Максим:

    Допустим есть 5 товаров с повторяющимися данными — это понятно, а ещё внутри каждого есть и данные повторяющиеся. Есть ли возможность спарсить и внутренние повторяющиеся вторым повторяющимся каким-то шаблоном?
    Получается есть общий повторяющийся шаблон, далее внутри обычные, а внутри какого-то определенного обычного нужен повторяющийся шаблон.

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php