Распознавание текста с картинки (с капчи) может производиться с помощью макроса шаблона вывода [CAPCHA]. Например:
1 | [CAPCHA]http://site.ru/capcha.jpg[/CAPCHA] |
Где http://site.ru/capcha.jpg – АБСОЛЮТНАЯ ссылка на картинку (относительные, такие как /capcha.jpg, макросом не обрабатываются).
После того, как картинка скачается на диск, программа ее отправит в сервис Antigate, подождет, пока капча распознается, и вернет ответ в виде текста с картинки!!!
Таким образом можно распознавать, к примеру, номера телефонов с Avito, которые подгружаются в виде изображения.
Если вам нужно будет отправить распознанный текст капчи методом POST (на сайт, который выдал капчу), то используйте для этого макрос шаблона вывода PHP_SCRIPT (с передачей в него необходимых POST-параметров).
Для того, чтобы начать пользоваться сервисом Antigate.com, необходимо там зарегистрироваться и внести туда немного денежек.
После внесения средств, вы получите ключ доступа, который нужно прописать в Content Downloader, в меню – настройка – опции программы – вкладка “антикапча (Antigate)”.
PS: Если вы парсите через WBApp, то там есть свои функции для распознавания и отправки ответа Antigate (видео с инструкцией по распознаванию капчи в WBApp есть на этой странице – http://sbfactory.ru/cd/?p=1515)