Нужно знать


Общее:

Для переноса программы на другой ПК или установки ее на новой OS (можно производить 1 раз в двое суток), активируйте программу на новом ПК обычным способом (в ходе активации программа вам предложит удалить привязку к старому оборудованию).

Ни в коем случае не теряйте ключ программы, процедура восстановления ключа платная (200 WMR);

— При обращении в тех поддержку не пишите сообщения типа «привет, тут?», а сразу описывайте суть проблемы.





Советы по управлению программой:

— Для сохранения/загрузки всех настроек программы используйте меню — «Файл» — «Сохранить/загрузить проект»;

— Чтобы сбросить все настройки программы и приступить к настройке парсинга нового сайта используйте меню — «Файл» — «создать новый проект (ctrl+n)»/»создать новый проект для парсинга в CSV (shift+ctrl+n)»;

— Для предпросмотра результата парсинга дважды кликните по ссылке из списка;

— Для запуска парсинга нажмите на панели инструментов кнопку «начать парсинг (F5)»;

— При парсинге загруженные элементы из списка ссылок удаляются (сверху);

— Для приостановки процесса парсинга используйте кнопку «приостановить парсинг». При повторном запуске прогресс начнется с 0% (так как при предыдущем запуске загруженные ссылки удалялись);

— Для сбора ссылок используйте вкладку «ссылки» или инструмент «сканер сайтов» на панели инструментов;

— Некоторые сайты могут «банить» из-за частых запросов программы к сайту. В этих случаях можно использовать следующие пути решения:
1) Выставить количество потоков — 1, паузу между запросами — 1000 мс (1 секунда) и более;
2) Меню — сервис — список прокси.

— Для удаления html-тегов из контента при парсинге, используйте макрос шаблона вывода [HTMTOTXT];

— Для синонимизации (замены слов на синонимы) нужных частей документов используйте макрос шаблона вывода [SYN]…[/SYN];

— Некоторые текстовые поля программы не имеют контекстного меню. Для копирования текста в буфер используйте ctrl+c, для вставки текста из буфера используйте ctrl+v;

— На одном ПК можно запускать несколько копий программы одновременно. ВАЖНО: Каждая копия должна быть запущена из отдельной папки!!!





Советы по управлению списком ссылок:

— Для удаления дублей ссылок кликните правой кнопкой мыши по списку ссылок и выберите соответствующий пункт меню;

— Для редактирования списка ссылок (например, для добавления ко всем ссылкам какой-либо части или удаления www) кликните правой кнопкой мыши по списку ссылок и выберите пункт меню «редактировать список»;

— Чтобы выделить элементы в списке ссылок используйте клавиши shift, ctrl + левая кнопка мыши (для удаления выделенных элементов нажмите клавишу Delete, для копирования выделенных ссылок в буфер обмена нажмите правой клавишей мыши по списку и в открывшемся меню выберите пункт «скопировать выделенное в буфер»);

— Для очистки списка ссылок используйте клавишу F7, для добавления ссылок используйте клавишу F8.





Советы парсингу картинок:

— Если картинка выводится скриптом (например, http://mdata.yandex.net/i?path=b0418095720__r.jpg), то, чтобы ее загрузить, включите галочку «загружать изображения, генерируемые php-скриптом» в: вкладка «контент» — группа «парсинг и обработка» — кнопка «настройка парсинга картинок…».





Советы парсингу в CSV-файлы:

— Перед началом настройки проекта для парсинга в CSV, проделайте следующие действия: меню — файл — создать новый проект для парсинга в CSV (это сбросит все настройки программы и выставит нужные опции для парсинга в CSV)


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 6, средний балл: 5,00)

Загрузка...
Автор: admin, 17 октября 2011
Рубрики: Парсинг
Метки:
6 комментариев к сообщению: “Нужно знать”
  1. Алексей:

    Есть ли возможность паузу между запросами задавать случайным выбором из диапазона 500—1500мс?

  2. Султан:

    Здравствуйте!

    Имеется ли возможность парсинга определенного количества символов?
    Я не имею ввиду кол-во символов в статье, а именно вот что:
    Дополнительные настройки границ парсинга => Обрезать n символов от конца.
    Так вот можете ли добавить функцию: Обрезать до N символов.
    Мне нужно 160 символов, а от конца считать в каждой статье — как гадать, ведь во всех статьях разное кол-во символов.

Написать комментарий

Вы должны войти чтобы добавить комментарий.

Последние статьи

css.php