Парсинг

Парсинг одного WEB-документа в несколько разных файлов на диск (сохранение произвольных частей шаблона вывода в указанные файлы макросом [SAVETOFILE])

Как удалять HTML-теги при парсинге контента: все, кроме указанных, только указанные

Настройка сохранения результатов парсинга контента в файл(ы) на диск (задание имен сохраняемых документов, кодировки сохраняемых документов, парсинг в один файл/в отдельные файлы и другое)

Парсинг картинок по ключевым словам (Bing)

Парсинг телефонных номеров с Авито в виде текста (парсинг информации, которая подгружается при клике на кнопку)

Парсинг поиска Вконтакте (парсинг ссылок групп и анкет людей по ключевым словам)

Шаблон вывода

Парсинг ссылок из XML-карты сайта

Распознавание капчи с помощью сервиса Antigate

Загрузка документов (в которые парсим контент), файлов и картинок на FTP-сервер при парсинге контента

WBApp (только для ULTIMATE версий)

Парсинг в CSV всех характеристик товара РАЗОМ

Парсинг товаров интернет-магазинов в CSV

Знакомство с элементами интерфейса

Как парсить контент (основы)

Другие методы парсинга ссылок, методы добавления ссылок в программу, парсинг файлов с локального диска

Задание динамических границ парсинга

Задание обычных границ парсинга внутри повторяющейся (когда нужно парсить несколько товаров с одной WEB-страницы)

Задание повторяющихся границ парсинга

Задание обычных границ парсинга

Задание границ парсинга с использованием регулярных выражений в Content Downloader 8+

Запуск программы с передачей параметров (например, из командной строки или планировщика Windows с возможностью запуска по расписанию)

Как парсить несколько картинок с одной страницы с присвоением каждой уникального имени файла

Решение проблем с возможными “зависаниями” программы или с ошибками “out of memory”, “thread creation error…” при парсинге во вкладке “контент” или в сканере сайтов

Парсинг картинок и файлов

Загрузка и переименование картинок при парсинге контента с помощью макроса шаблона вывода <NIMG>

Основные понятия

Генерация списков ссылок с использованием заданных числовых и/или строковых значений (ключевых слов)

Как парсить контент, которого нет в коде страницы (контент подгружается скриптами в браузере)

Парсинг ссылок со страниц рубрики или выдачи (сбор ссылок во вкладке “ссылки”)

Макрос шаблона вывода [GETMORECYCLECONTENT]

Как парсить интернет-магазины в CSV файлы

Порядок выполнения функций при парсинге контента

Нужно знать

Загрузка изображений на сервер сразу при парсинге

Макрос для импорта произвольных полей в WordPress ([POSTMETA][/POSTMETA])

Макрос для импорта комментариев в WordPress ([COMMENT][/COMMENT])

Макрос для импорта рубрик в WordPress ([CATS][/CATS])

Автоматический парсинг в MYSQL-базу (обновление цен товаров, добавление записей и многое другое)

Макрос {skip} для функций поиск-замены

Макрос шаблона вывода GETMORECONTENT (для задания границ парсинга с разных url)

Регулярные выражения в функциях поиск-замены

Макрос шаблона вывода GETGOOGLEIMAGE (для загрузки картинок с Google)

Дополнительные макросы шаблона вывода

Парсинг файлов (загрузка файлов на диск – DOWNLOADFILE)

Парсинг файлов с локального диска

Макросы размножения статей в шаблоне вывода {пример1|пример2}

Автоподстановка ключевых слов в шаблон генерации ссылок ({key})

Повторяющиеся границы парсинга в Content Downloader

Парсинг автомобильных объявлений (bazar-auto_ru)

Парсинг интернет-магазина с наручными часами (mir4asov_ru)

Парсинг интернет-магазина с ЖК телевизорами (as-video_ru)

Подключение php скриптов к шаблону вывода (макрос PHP_SCRIPT, отправка POST и GET запросов)

Сохранение изображений при парсинге контента

Авторизация на сайтах

Методы добавления ссылок в список парсинга

Шаблон вывода

Как парсить контент в CSV файлы (также про автозамену переносов строк и символов ; (точки с запятой) при парсинге в CSV)

Задание обычных и повторяющихся границ парсинга (как парсить определенные части web-страниц)

Фильтры ссылок (отсеивание лишних ссылок при парсинге)

Сканер сайтов (сбор ссылок)


css.php