Для начала добавим адрес RSS ленты в список парсинга (клавиша F8):
Все RSS ленты состоят из периодически повторяющихся тегов и контента между ними. Посмотрите на следующий скриншот:
На рисунке показана часть кода RSS ленты. Ссылки на посты находятся в повторяющемся теге guid (выделено зеленым на первом скриншоте). Для получения этих ссылок необходимо использовать повторяющиеся границы парсинга (читать про повторяющиеся границы).
Задаем границы:
В итоге получим результат в виде списка ссылок на последние посты сайта:
Видео: пример парсинга ссылок с RSS лент
Прикрепленные файлы:
А как быть, если требуется запуск по расписанию? Ведь в данном случае материал будет дублироваться? Можно реализовать проверку url? Скажем если статья уже была сохранена, второй раз её брать не требуется?
поддерживаю, есть ли какое то решение ?
Здравствуйте.
Решение есть на главной странице системы помощи -> Как избежать повторной загрузки одних и тех же WEB-документов при следующем парсинге (во вкладке «контент»)
Также напоминаю, что вопросы задаются на форуме. Спасибо!
С уважением к вам, Сергей.