Нужно знать


Общее:

Для переноса программы на другой ПК или установки ее на новой OS (можно производить 1 раз в трое суток), активируйте программу на новом ПК обычным способом (в ходе активации программа вам предложит удалить привязку к старому оборудованию).

Ни в коем случае не теряйте ключ программы, процедура восстановления ключа платная (200 WMR);

– При обращении в тех поддержку не пишите сообщения типа “привет, тут?”, а сразу описывайте суть проблемы.





Советы по управлению программой:

– Для сохранения/загрузки всех настроек программы используйте меню – “Файл” – “Сохранить/загрузить проект”;

– Чтобы сбросить все настройки программы и приступить к настройке парсинга нового сайта используйте меню – “Файл” – “создать новый проект (ctrl+n)”/”создать новый проект для парсинга в CSV (shift+ctrl+n)”;

– Для предпросмотра результата парсинга дважды кликните по ссылке из списка;

– Для запуска парсинга нажмите на панели инструментов кнопку “начать парсинг (F5)”;

– При парсинге загруженные элементы из списка ссылок удаляются (сверху);

– Для приостановки процесса парсинга используйте кнопку “приостановить парсинг”. При повторном запуске прогресс начнется с 0% (так как при предыдущем запуске загруженные ссылки удалялись);

– Для сбора ссылок используйте вкладку “ссылки” или инструмент “сканер сайтов” на панели инструментов;

– Некоторые сайты могут “банить” из-за частых запросов программы к сайту. В этих случаях можно использовать следующие пути решения:
1) Выставить количество потоков – 1, паузу между запросами – 1000 мс (1 секунда) и более;
2) Меню – сервис – список прокси.

– Для удаления html-тегов из контента при парсинге, используйте макрос шаблона вывода [HTMTOTXT];

– Для синонимизации (замены слов на синонимы) нужных частей документов используйте макрос шаблона вывода [SYN]…[/SYN];

– Некоторые текстовые поля программы не имеют контекстного меню. Для копирования текста в буфер используйте ctrl+c, для вставки текста из буфера используйте ctrl+v;

– На одном ПК можно запускать несколько копий программы одновременно. ВАЖНО: Каждая копия должна быть запущена из отдельной папки!!!





Советы по управлению списком ссылок:

– Для удаления дублей ссылок кликните правой кнопкой мыши по списку ссылок и выберите соответствующий пункт меню;

– Для редактирования списка ссылок (например, для добавления ко всем ссылкам какой-либо части или удаления www) кликните правой кнопкой мыши по списку ссылок и выберите пункт меню “редактировать список”;

– Чтобы выделить элементы в списке ссылок используйте клавиши shift, ctrl + левая кнопка мыши (для удаления выделенных элементов нажмите клавишу Delete, для копирования выделенных ссылок в буфер обмена нажмите правой клавишей мыши по списку и в открывшемся меню выберите пункт “скопировать выделенное в буфер”);

– Для очистки списка ссылок используйте клавишу F7, для добавления ссылок используйте клавишу F8.





Советы парсингу картинок:

– Если картинка выводится скриптом (например, http://mdata.yandex.net/i?path=b0418095720__r.jpg), то, чтобы ее загрузить, включите галочку “загружать изображения, генерируемые php-скриптом” в: вкладка “контент” – группа “парсинг и обработка” – кнопка “настройка парсинга картинок…”.





Советы парсингу в CSV-файлы:

– Перед началом настройки проекта для парсинга в CSV, проделайте следующие действия: меню – файл – создать новый проект для парсинга в CSV (это сбросит все настройки программы и выставит нужные опции для парсинга в CSV)


1 Star2 Stars3 Stars4 Stars5 Stars (оценок: 6, средний балл: 5.00)

Loading...
Автор: admin, 17 October 2011
Рубрики: Парсинг
Tags:
Есть 6 коммент. к сообщению: “Нужно знать”
  1. Алексей says:

    Есть ли возможность паузу между запросами задавать случайным выбором из диапазона 500—1500мс?

  2. Султан says:

    Здравствуйте!

    Имеется ли возможность парсинга определенного количества символов?
    Я не имею ввиду кол-во символов в статье, а именно вот что:
    Дополнительные настройки границ парсинга => Обрезать n символов от конца.
    Так вот можете ли добавить функцию: Обрезать до N символов.
    Мне нужно 160 символов, а от конца считать в каждой статье – как гадать, ведь во всех статьях разное кол-во символов.

    • admin says:

      Здравствуйте.
      Используйте для этого макрос шаблона вывода [COPY]

Написать комментарий

Последние статьи

css.php