Архивы рубрики: ‘Новости’

Передача текстовых переменных из Content Downloader в WBApp через текст ссылок


(more…)

Автоматическая приостановка парсинга контента для ручного ввода каптчи


(more…)

Рендеринг (создание изображений) элементов WEB-страниц с помощью WBApp

(more…)

Обновление Content Downloader до версии 11.9955 (18.06.2015)

Всем привет.

Список изменений обновления Content Downloader до версии 11.9955 (18.06.2015):

– Файлы проектов WBApp для парсинга контента и ссылок (ctrl+w) теперь сохраняются в файлы проектов программы и загружаются из них;
– Несколько других доработок и исправлений.

(more…)

Замена умышленно-подмененных схожих по написанию символов английского/русского языка (a, c, e, o, p…) на оригинальные ([FIXLAYOUT])

Доброго вам дня!

FIX – исправить
LAYOUT – раскладка

Например, в русском тексте есть слово aпeльcин, которое читается вполне нормально, но не является русским словом (буквы a, e, c в нем английские). К такому методу уникализации контента прибегают некоторые сайты в сети. (more…)

Парсинг BASE64-картинок

Ниже предоставлен файл проекта для парсинга картинок, представленных в BASE64-кодировке:

<img src=”data:image/jpeg;base64,/9j/4QAYRXhpZgAASUkqAAgAAAAAAAAAAAAAAP/sABFEdWNreQABAAQAAAA8AAD/4QMraHR0cDovL25zLmFkb2JlLmNvbS94YXAvMS4wLwA8P3hwYWNrZXQgYmVnaW49Iu+7vyIgaWQ9Ilc1TTBNcENlaGlIenJlU3pOVGN6a2M5ZCI/PiA8e

AAAAAP/2Q==” alt=”Lorem ipsum”/>

Скачать файл проекта для парсинга BASE64-картинок (в программе: меню – файл – загрузить проект).

Пояснения:
1) Макрос [BASE64DECODE] декодирует BASE64-код (это и есть картинка) (обратите внимание, как задана граница парсинга 2 (ImageData));
2) Макрос [SAVETOFILE] сохраняет декодированный BASE64-код картинки в файл на диске (параметры {notcsv}{keepname} обязательны).
(more…)

Новый макрос шаблона вывода [HTMLDECODE]

Макрос [HTMLDECODE] предназначен для декодирования HTML-кодировки и доступен с версии 11.9949 (от 09.06.2015). (more…)