Парсинг HTML-таблиц в CSV

Парсинг HTML-таблиц в CSV

Макросы [HORIZTABLE] и [VERTTABLE] преобразуют код HTML-таблиц сайта в формат данных для макроса [DYNAMICVALUES] (и сами запускают макрос [DYNAMICVALUES]). Поэтому, для вывода названий столбцов в результирующий CSV (при использовании [HORIZTABLE] и [VERTTABLE]) в строку заголовка (верхняя строка в редакторе шаблона вывода) нужно прописать [DYNAMICVALUES].

Макросом шаблона вывода [HORIZTABLE]HTML-код таблицы[/HORIZTABLE] парсятся такие таблицы (“горизонтальные таблицы”, наименования столбцов расположены (горизонтально) в верхней строке):

Наименование Картинка Вес
Товар 1 1.jpg 87 кг
Товар 2 2.jpg 88 кг

Макросом шаблона вывода [VERTTABLE]HTML-код таблицы[/VERTTABLE] парсятся таблицы такого вида (“вертикальные таблицы”, наименования рядов расположены (вертикально) в левом столбце):

Наименование Товар 1 Товар 2
Картинка 1.jpg 2.jpg
Вес 87 кг 88 кг

Макросы [HORIZTABLE] и [VERTTABLE] имеют дополнительные параметры (которые можно не использовать):
– [MIN]целое число от 1 до 100[/MIN] (минимальное количество ячеек в ряду или в столбце исходной HTML-таблицы необходимое для создания ряда ячеек в результирующем CVS-файле)(смотрите видео)
– [PREFIX]что добавить в начало каждого ряда ячеек в результирующий CSV-файл[/PREFIX] (смотрите видео)


Если таблицы не удается спарсить макросами [HORIZTABLE] и [VERTTABLE], то можете пробовать применить этот метод.

Если пары: имя характеристики: значение характеристики (например, наименование: товар 1) представлены не в виде таблицы, а, скажем, в виде списка, то парсить их можно таким способом


1 Star2 Stars3 Stars4 Stars5 Stars (Еще нет оценок)

Loading...
Вы можете пропустить до конца и оставить ответ. Pinging в настоящее время не доступны.
Есть 8 коммент. к теме: “Парсинг HTML-таблиц в CSV”
  1. Zortexx says:

    Спасибо!

  2. Alisa says:

    Благодарю разработчика – обновления всегда полезны, а главное не думала что они так регулярны!!!

    • admin says:

      Здравствуйте!

      Большое вам спасибо за добрые слова.

      С уважением к вам, Сергей.

  3. Voton says:

    Здравствуйте.Хотел бы выразить слова благодарности автору. Буквально несколько дней стал обладателем программы Content Downloader ULTIMATE. Автор просто молодец! Такой инструмент должен быть у всех вебмастеров в своем арсенале. Программа делает удивительные вещи. Описать все ее возможности не смогу, так как их все не перечислить. Хотел бы просто сказать человеческое искреннее спасибо автору за софт.
    Единственное,конечно, не хватает в дополнении софта Smartrewriter, который очень востребован для работы. Но к сожалению в комплект не входит к Content Downloader ULTIMATE. Может автор софта, когда нибудь и включит в комплект с Content Downloader ULTIMATE, что будет очень здорово, так как наверное не один я нуждаюсь в данном софте Smartrewriter.

    Еще раз спасибо автору за программу! Доволен как слон.

    • admin says:

      Здравствуйте.
      Очень приятно, спасибо на добром слове. Макрос шаблона вывода синонимизации имеется: [SYN]текст[/SYN].
      С уважением к вам, Сергей.

  4. Жорик says:

    Большое спасибо Сергей. Хотелось бы еще обзорчик по автоматизации сбора информации (запуска по расписанию)

Написать комментарий к admin

Пожалуйста, ознакомьтесь с правилами комментирования (причина УДАЛЕНИЯ некоторых комментариев)

Добавить изображение к комментарию (jpg)