Парсинг сайтов с экзотическими языками (китайский и прочие)

Первый способ (предпочтительный):

Во вкладке «контент» — группа «загрузка WEB-документа» выбрать кодировку CUSTOM. При выборе кодировке CUSTOM (пользовательская кодировка) откроется окно опций программы (ctrl+8) во вкладке «кодировки». Там укажите ID кодировки сайта, который парсите (список ID кодировок).

Также, чтобы результат парсинга «правильно сохранялся», необходимо сменить кодировку сохраняемого документа (вкладка «контент» — группа «сохранение результата») на UTF-8 без BOM.


Второй способ (если первый не помог):

Включить поддержку китайского (или другого нужного языка) для программ, не поддерживающих юникод (на примере Windows 7):

«Пуск» — «панель управления» — «язык и региональные стандарты» — вкладка «дополнительно» — группа «язык программ, не поддерживающих юникод» — кнопка «изменить язык системы» — выбрать нужный язык.


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 1, средний балл: 5,00)

Загрузка...
Автор: admin, 9 февраля 2013
Рубрики: Новости

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php