Решение проблем с кодировкой при парсинге

Следует понимать, что программа сначала получает от сайта код и потом сохраняет полученный и обработанный код на диск, как результат парсинга контента. Если есть проблемы с кодировкой при получении кода от сайта, они проявляются при задании границ парсинга и решаются выбором нужной кодировки во кладке “Контент” -> группа “Загрузка WEB-документа” (либо в инструменте задания границ парсинга).

Content Downloader

Content Downloader


Если проблем с кодировкой при задании границ парсинга нет, а есть проблемы именно при предпросмотре результатов парсинга (программа сохранила над диск данные в кодировке, которая не поддерживает символы юникод), выберите нужную кодировку во кладке “Контент” -> группа “Сохранение результата”.

Content Downloader

Content Downloader


Content Downloader


Важное примечание: Если вы планируете открывать полученные CSV в Microsoft Excel, то кодировку сохраняемого документа нужно выбрать не UTF-8 без BOM, а UTF-8 (подробнее читайте тут).


1 Star2 Stars3 Stars4 Stars5 Stars (Еще нет оценок)

Loading...
Автор: admin, 5 March 2019
Рубрики: Парсинг
Tags: ,

Последние статьи

css.php