Парсинг HTML-таблиц в CSV

Макросы [HORIZTABLE] и [VERTTABLE] преобразуют код HTML-таблиц сайта в формат данных для макроса [DYNAMICVALUES] (и сами запускают макрос [DYNAMICVALUES]). Поэтому, для вывода названий столбцов в результирующий CSV (при использовании [HORIZTABLE] и [VERTTABLE]) в строку заголовка (верхняя строка в редакторе шаблона вывода) нужно прописать [DYNAMICVALUES].

Макросом шаблона вывода [HORIZTABLE]HTML-код таблицы[/HORIZTABLE] парсятся такие таблицы («горизонтальные таблицы», наименования столбцов расположены (горизонтально) в верхней строке):

Наименование Картинка Вес
Товар 1 1.jpg 87 кг
Товар 2 2.jpg 88 кг

Макросом шаблона вывода [VERTTABLE]HTML-код таблицы[/VERTTABLE] парсятся таблицы такого вида («вертикальные таблицы», наименования рядов расположены (вертикально) в левом столбце):

Наименование Товар 1 Товар 2
Картинка 1.jpg 2.jpg
Вес 87 кг 88 кг

Макросы [HORIZTABLE] и [VERTTABLE] имеют дополнительные параметры (которые можно не использовать):
— [MIN]целое число от 1 до 100[/MIN] (минимальное количество ячеек в ряду или в столбце исходной HTML-таблицы необходимое для создания ряда ячеек в результирующем CVS-файле)(смотрите видео)
— [PREFIX]что добавить в начало каждого ряда ячеек в результирующий CSV-файл[/PREFIX] (смотрите видео)

В [PREFIX] может быть использован параметр [SINGLEUSE], когда в результат нужно вставить значение префикса всего один раз:

1
[PREFIX]что добавить в начало каждого ряда ячеек в результирующий CSV-файл[SINGLEUSE][/PREFIX]

В [PREFIX] также может быть использован параметр [RETAINEMPTYPREF]. В случае использования этого параметра и пустого значения [PREFIX], в начало каждого ряда ячеек итоговой таблицы CSV будет добавлена пустая ячейка:

1
[PREFIX]<CD_GRAN_10!>[RETAINEMPTYPREF][/PREFIX]

Где <CD_GRAN_10!> может иметь пустое или не пустое значение, но ячейка-префикс будет создана в любом случае!


Если таблицы не удается спарсить макросами [HORIZTABLE] и [VERTTABLE], то можете пробовать применить этот метод.

Если пары: имя характеристики: значение характеристики (например, наименование: товар 1) представлены не в виде таблицы, а, скажем, в виде списка, то парсить их можно таким способом

Также учтите, что при запуске парсинга, в строку заголовка (шапку CSV) оператор [DYNAMICVALUES] записывается в первичном виде. Подстановка значений [DYNAMICVALUES] в файл осуществляется только при завершении процедуры парсинга контента!


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 3, средний балл: 5,00)

Загрузка...
Автор: admin, 10 августа 2014
Рубрики: Парсинг
Метки: , , , ,
10 комментариев к сообщению: “Парсинг HTML-таблиц в CSV”
  1. Пётр:

    Здравствуйте! Спасибо за такую шикарную доработку!

  2. Дмитрий:

    Спасибо за урок.
    У Вас очень приятный голос и Вы очень классно объясняете.

  3. Dauren:

    Здравствуйте, программа просто супер! СПАСИБО!
    можете мне помочь? голову уже сломал себе(
    Вот пример:
    Цвет Черный, Красный
    Размер XL, L, M, S

    как можно сделать столбец Цвет и столбец Размер. и каждая модификация товара была в отдельной ячейке.
    ? размер
    ________
    М______
    L_______ ну типа так) пожалуйста помогите!

    • admin:

      Здравствуйте.

      Спасибо на добром слове!

      Пожалуйста, с подобными вопросами обращайтесь на форум http://forum.sbfactory.ru/ (ответ на вопрос системы NoSpam – АОЕи)(укажите, с какого адреса парсите и подробно опишите, что требуется получить на выходе (желательно пример CSV)).

      С уважением к вам, Сергей.

  4. [HORIZTABLE] и [VERTTABLE] — это крутизна , почему я раньше до них не добрался . У меня сейчас проэкт над которым я уже неделю мучаюсь , посмотрев это видео я понял , что теперь сделать его — раз плюнуть !!! Спасибо Сергею за этот парсер в целом (парсер решает кучу проблем , ускоряет наполнение сайта контентом). И за поддержку тоже спасибо , всегда быстро и качественно.

  5. Алексей:

    Сергей, на лицензии STANDART нельзя таблицы этими макросами спарсить? Подскажите, может есть что-то подобное и для стандарта?

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php