Баг-репорты Content Downloader

Баг-репорты Content Downloader

content downloader icoТак как тестирование программы занимает очень много времени, я прошу вас мне в этом немного помочь. Если при работе программы вы обнаружите какие-либо ошибки, то публикуйте их в комментариях.

No-Bugs-150x150

Правила cоставления баг-репорта:

1) Четко опишите название некорректно работающей функции;
2) Опишите последовательность действий (желательно по шагам), после которых возникает ошибка.

“Да будут изгнаны все вредные жуки!”


Для комментирования регистрация не требуется.

PS: Также вы можете уведомлять нас о возможных ошибках программы в этой теме на форуме.

Спасибо!

Комментирование закрыто, но вы можите поставить trackback со своего сайта.
Есть 1,412 коммент. к теме: “Баг-репорты Content Downloader”
  1. Petr says:

    При задании границ парсинга – wayback_archive_org/web/20120905200453/http_//gamepatrul_ru/simulyatory/1855-tom-clancys-hawx-skachat_html

  2. вова says:

    Чота вкладка ссылки не отдает ссылки и не грузит документ

    • admin says:

      Здравствуйте.

      Работает.

      Скриншот прилагаю.

      С уважением к вам, Сергей.

  3. вова says:

    Прогнал сори

  4. 111 says:

    Проверьте пожалуйста запись в файл. Неоднократно сталкивался с тем, что в один и тот же файл несколько раз записывается содержимое страницы. Похоже, при разрыве соединения и повторной загрузке, программа не очищает ранее загруженное, а продолжает писать. Выглядит это так: в случайном месте прерывается код страницы, и начинается с самого начала. В одном файле может быть несколько начал страницы “” например. Ошибка старая, несколько лет ей точно.

  5. 111 says:

    Помогите, какая-то беда с DYNAMICVALUES. Есть 70к файлов, сделал их парсинг, DYNAMICVALUES нормально отработали. Увидел всякие ошибки в исходных файлах, загрузил новые файлы на замену, и с тех пор DYNAMICVALUES в конце парсинга не отрабатывает. Один парсинг идет часов 6-7, я уже с бубном несколько раз делал этот парсинг, в итоге в файле в первой строке идут [CSVCS], именно в таком виде, незаменённые на настоящие разделители, и в конце [DYNAMICVALUES] – в точности то же самое, что в заголовке шаблона вывода. По какой-то причине замена шаблона на настоящие значения не срабатывает. Программа ошибок не выдает.

    • admin says:

      Здравствуйте.

      Сколько памяти при завершении занимает программа в диспетчере задач?

      С уважением к вам, Сергей.

      • 111 says:

        Запустил заново, отпишусь потом. Колонок в выдаваемом файле 1070, из них на DYNAMICVALUES приходится 1050. Сам файл выглядит нормальным, но без заголовков бесполезен 🙁

        • admin says:

          Здравствуйте еще раз.

          Подозреваю, что данная проблема возникает при переполнении памяти (процессам в Windows выделяется определенное количество памяти независимо от оперативной памяти ПК).

          Проследите, как растет занимаемая программой память при парсинге и, если можно, предоставьте краткий отчет (сообщите максимальное значение занимаемой программой памяти).

          Также сообщите, какая у вас OS и ее разрядность (32 или 64 бит).

          Используете ли антивирус? Какой?

          Спасибо!

          С уважением к вам, Сергей.

          • 111 says:

            Перескачал все файлы заново, нормально отработал парсинг. Видимо, что-то в файлах вызывало сбой DYNAMICVALUES. Конкретную причину уже не найдем, удалил все старые файлы, да и в любом случае их слишком много было (70тыс на 25гиг).
            После отработки парсинга: память 129мб, память частный рабочий набор 91мб, выделенная память 228мб.

        • admin says:

          Здравствуйте еще раз!

          Кажется, я понял, в чем была проблема! Видимо, вы открывали в каком-либо редакторе файл CSV (в который в это время шел парсинг) и в нем не могла произвестить перезапись строки заголовка при завершении парсинга.

          С уважением к вам, Сергей.

          • 111 says:

            Это исключено. Да и как бы я успел заблокировать файл между записью последней строки, и записью строки заголовков?
            В любом случае, неплохо было бы сделать вывод сообщения об ошибке и её причинах.

          • admin says:

            Если файл открыть в MS Excel и держать это окно открытым, то, пока оно открытое, в этот файл нельзя производить запись.

          • 111 says:

            Снова сделал парсинг того же ресурса (мне регулярно его надо делать), снова та же проблема. Файл точно никто не трогает, а программа не вставляет заголовок таблицы. Сделайте что-нибудь, пожалуйста.

          • 111 says:

            Запустил этот же проект на тех же файлах в старой версии 119999956 – нормально отработала. Где-то в новой версии добавлена ошибка.

  6. Жорик says:

    Добрый день, испытываю неудобство в следующем случае: если включить функцию очистки папки с контентом и запустить парсинг при этом иметь открытым фаил в csv exel то очистка не просходит, и никакого сообщения не появляется а просто начинается парсинг.
    Спасибо за чудесную программу и поддержку

  7. Данил says:

    Добрый день!

    Решил спарсить данные с повторяющимися границами в csv.
    Всего таких строк должно было получиться больше 250 тысяч.
    Content Downloader парсит корректно, но только 9999 строк.

    Это какое-то внутреннее ограничение программы, косяк или я что-то в настройках упустил?

    • admin says:

      Здравствуйте.

      Ограничение в ~10000 элементов имеет только <CD_CYCLE_GRAN_ALL!>. Макросы повторяющихся границ парсинга <CD_CYCLE_GRAN_1!>, <CD_CYCLE_GRAN_2!>… насколько я помню, таких ограничений не имеют. Используйте их!

      С уважением к вам, Сергей.

  8. Вадим says:

    Макрос [TRANSLITE] не транслитирирует украинскую букву “і”

  9. Вадим says:

    Здравствуйте, Сергей!
    Прошу подсказать в решении моей проблемы.
    Ни в коем случае не претендую что это баг, возможно это единичный случай.

    Дело в том, что программа очень долго запускается. При измерении, с момента клика по иконки и до загрузки самой программы проходит 30 минут.

    Данную особенность наблюдал ранее после 2-3х месяцев использования Windows, но теперь, сразу после переустановки ОС (одна и та же ОС, Win 8.1, Intel, 4Гб ОП), приходится ждать по 30 мин. запуск.

    Если подобное встречается только у меня, то прошу подтвердить это, чтобы быть спокоен и искать у себя причину.

    Заранее огромное спасибо.

    • 111 says:

      У меня на двух компах в течение 10сек запускается. Все равно дольше большинства приложений, конечно…

    • admin says:

      Здравствуйте.

      Я такой проблемы ранее не видел и не знаю, в чем ее причина. Возможно, сборка вашей OS отличается от оригинальной и там что-то “изменено”.

      С уважением к вам, Сергей.

  10. 111 says:

    При обнулении границы не снимается флажок обратного поиска i

  11. 111 says:

    Если в окне настройки поиск-замены слева нажать например вставку кода удаления всех тегов, то несмотря на включенный режим автообновления результатов, он не срабатывает, и нужно вручную их обновлять

  12. Александр says:

    При просмотре странички в браузере из лога, открывается новое окно со стартовой страницей браузера, а не та страничка которую я хотел просмотреть(

    • admin says:

      Здравствуйте.

      Прошу сообщить, какую при этом ссылку пытаетесь открыть (адрес)? Какая у вас OS и какой браузер используется по умолчанию?

      С уважением к вам, Сергей.

  13. Александр says:

    Любую ссылку пробовал после парсинга просмотреть из лога и постоянно открывает новое окно браузера со стартовой страницей.
    Если делать тоже замое из списка ссылок либо из списка при задании границ парсинга то все открывается как нужно.
    ОС Винда7 браузер ФФ

  14. Антон Смирнов says:

    Кажется не работает EXTRACTPHONES на этой странице . Как лучше собрать данные.

    • Антон Смирнов says:

      Да косяк. Ещё 8 добавляет на других сайтах. Какие есть варианты?

    • admin says:

      Здравствуйте.

      По вашей ссылке вот такая ошибка (смотрите прикрепленный скриншот).

      С уважением к вам, Сергей.

      • Антон Смирнов says:

        Странно. У меня всё работает. Попробуйте ещё раз.

  15. 111 says:

    Программа самостоятельно добавляет :443 как к ссылке, так и к заголовку Host для ссылок https. Вынесите пожалуйста самодеятельность в опции, чтобы была возможность отключить это.

    В частности, сейчас у меня проблема именно с заголовком Host. Если сайт получает там :443, он выдает ошибку. Браузер не отправляет :443 в заголовке Host!

    Проверьте: запрос Post на https://zakupki.mos.ru/api/Cssp/Customer/PostQuery, тело запроса например {“filter”:{“treePathIds”:null,”companyNameLike”:null,”companyInnLike”:null,”companyOgrnLike”:null,”companyKppLike”:null},”take”:”10″,”skip”:0,”order”:[{“field”:”Id”,”desc”:true}],”withCount”:true}

    Программа не может сейчас собрать эти данные, это очень плохо. Прошу исправить.

  16. Жорик says:

    Баг в Обработка и импорт в ЦМС.
    Фаилы подготовлены согласно инстукции, 1 строка заголовок
    Язык польский
    Фаилы в УТФ
    если без БОМ то при добавлении фаила спец символы польского языка из заголовка, такие как: ł ę ś первращаються в кракозябру
    Если с БОМ то спец символы из заголовка вырезаются
    Буду очень благодарен за фикс данного трабла
    Спасибо за прекрасную программу и поддержку!
    Денег Вам и хорошего настроения)!

    • Жорик says:

      Добрый день, очень нужен фикс проблемы. Хотя бы понимать что информация в туду или нет чтоб искать другие решения или подождать. Спасибо большое

      • admin says:

        Здравствуйте.

        Работы над модулем “Обработка и импорт в КМС” производиться пока не будут.

        С уважением к вам, Сергей.

  17. Артем says:

    Добрый вечер. Использую при парсинге WBApp со следующей надстройкой

    [GETHTML]
    [HTMLPOINT]
    [HTMLPOINTGET]
    [CLICK][href][N]1[/N][FULL]:ссылка на кнопку
    [WAIT]:2000
    [GETHTML]
    [HTMLPOINTCHECK]

    При небольшом количестве подгружаемой информации парсинг идет нормально. При большом количестве нажатия на кнопки происходят как положено, странички загружаются, но итог парсинга “Результирующий документ оказался пустым”. Подскажите, куда копать?

    • admin says:

      Здравствуйте.

      Смотрите скриншот.

      С уважением к вам, Сергей.

      • Артем says:

        Проверил, там нули.

        • admin says:

          Сообщите, пожалуйста. Сколько занимает памяти в диспетчере задач приложение WBApp.exe на момент близкий к завершению ее работы.

          Спасибо!

  18. Кирилл says:

    Добрый день. При парсинге картинок выдает ошибку DOWNLOADFILE (https: euro-lepnina .com /image/cache/780-975/data/D1522..jpg):
    Программе не удалось загрузить файл (Error connecting with SSL. Error connecting with SSL. error:14094410:SSL routines:SSL3_READ_BYTES:sslv3 alert handshake failure)

    Библиотека библиотеку Internet Explorer (DOM) подключил. Эффекта не дало.

    • admin says:

      Здравствуйте.

      Это из-за сертификата безопасности сайта. На данный момент он в программе не поддерживается и навряд ли будет введена его поддержка.

      С уважением к вам, Сергей.

    • admin says:

      Как вариант, делать скриншот картинки в WBApp:

      [CLICK][id][N]0[/N][FULL]:image
      [WAIT]:2000
      [CLICK][classname][N]1[/N][FULL][ET_RENDER]:ilightbox-image
      [WAIT]:2000

  19. Андрей says:

    Никак не могу отключить Планировщик!
    Вроде все отключил, все задания удалил.А он по прежнему всплывает в 15.28… и висит пока его ручками не закроешь.и как каждый день. Невозможно компьютер оставить на несколько дней.
    Пробовал переустановить – не помогает.
    Как это вылечить?

    • admin says:

      Здравствуйте.

      “Извне” программу может запускать системный планировщик Windows. Проверьте его!

      С уважением к вам, Сергей.

  20. DedGash says:

    Здравствуйте, Сергей, пользуюсь ContentDownloader уже второй год, все отлично, доволен, спасибо. Но вот не задача с синонимайзером, не знаю что делать 🙁
    Smartrewriter – Trojan.Win32.Generic!BT

    File name: SmartRewriterActivation.exe
    Detection ratio: 11 / 52
    virustotal com/en/file/9ea178d04e011b85b495dcf0be7f4afc648262c011dbe41e209ad16f2d86c443/analysis/

    File name: Smartrewriterpro.exe
    Detection ratio: 7 / 53
    virustotal com/en/file/357384e14f441b05f8fcfcc014956c2d8e96a47dfb0126a4871564200faec107/analysis/

    Спасибо!

    • admin says:

      Здравствуйте.

      Ориентируйтесь по показаниям топовых антивирусов (DrWEB, Kaspersky…)

      Установщик Smartrewriterpro.exe на сервере лежит НЕИЗМЕННЫМ с 2011 года!

      С уважением к вам, Сергей.