Пожелания и предложения по развитию программы Content Downloader

August 7th, 2010 1,522 коммент. »

content downloader ico Прошу излагать в комментариях свои пожелания по развитию программы Content Downloader. Все ваши предложения будут рассмотрены в кратчайший срок и, в случаях целесообразности их реализации, доработки будут осуществляться в ближайших обновлениях.

Для комментирования не требуется регистрация.

PS: Также вы можете оставлять предложения по развитию программы в этой теме на форуме.

Спасибо.

Рубрики: Новости

Теги: Content Downloader, пожелания и предложения

Вы можете оставить комментарий, или поставить трэкбек со своего сайта.

Есть 1,522 коммент. к теме: “Пожелания и предложения по развитию программы Content Downloader”

DEDuschka says:

1 November 2010 at 23:22

Еще раз хочу поблагодарить автора за его работу и внести предложение:
Все знают, насколько важны уникальные заголовки title. Поэтому хотелось бы видеть, несколько границ для задания заголовка. Трех-четырех хватит (сейчас одна). Тогда можно будет играться с заголовком, так же как и с основным контентом – резать, склеивать, переставлять и вставлять нужное, тем более с новой фишкой Вставка строк из файлов (при парсинге). Сейчас можно это сделать, не используя границы заголовка, а работая с основными границами, но тратить на это три четыре границы основных непозволительная роскошь их и так в последнее время не хватает надо бы добавить.

Reply
admin says:

1 November 2010 at 23:30

Спасибо.
Лучше добавить еще несколько обычных границ.

Reply
- DEDuschka says:
  
  1 November 2010 at 23:39
  
  Спасибо. Насыпьте еще “десяток” и пост обработка умрет как анахронизм. Для меня тогда лично блок заголовка будет не нужен совсем ИМХО.
  
  Reply
Александр says:

3 November 2010 at 8:13

Добавьте работу программу через прокси с авторизацией.

Reply
admin says:

3 November 2010 at 9:19

Существует множество готовых решений (утилит) для использования программы на ПК с интернетом через прокси.

Reply
Александр says:

3 November 2010 at 13:31

У меня проблема с программой. Почему-то парсит не до конца. К примеру, стоит в задаче 600 урлов для парсинга текста и сохранение в html. Сохраняет примерно около 590 файлов (иногда чуть больше, иногда чуть меньше). Все, на этом программа стопориться. Показывается, что идет парсинг, но он не идет. Долго ждал, толку ноль. Такое ощущение, что программа зависла или не хочет дальше парсить и такое наблюдается только в самом конце.

Reply
- admin says:
  
  3 November 2010 at 13:42
  
  Это происходит потому, что некоторые потоки не могут завершитсья (не получается загрузить веб-контент с сервера). В этом случае используйте меню – файл – сброс кнопок управления.
  
  В дальнейшем планирую устранить ошибку, прошу мне посодействовать в этом. Пожалуйста скиньте проблемные файлы проекта на admin@smartbyte.org
  
  Спасибо!
  
  Reply
mat says:

3 November 2010 at 14:43

В новой версии не очень понравился интерфейс массовой обработки файлов.
А в частности вкладка “автозаполнение полей”. Пользуюсь этой функцией постоянно, а с прокруткой стало немного не удобно.
Можно убрать прокрутку? За счет либо удлинения окна, либо сделать окно растягивающимся.

Reply
Se0mashines says:

3 November 2010 at 16:34

Как многие знают, существуют блоги, в которых короткая новость имеет маленькую картинку.

Хотелось, бы выдергивать эту картинку и вставлять например ее в начало записи. К тому же это будет полезно при парсинге видео – контента, где как правило в превью новости картинка с изображением кадра из видео, а перейдя на внутреннюю страницу, – само видео.

Reply
- admin says:
  
  3 November 2010 at 16:51
  
  Выдергивайте картинку с помощью задания границ парсинга.
  
  Reply
Se0mashines says:

3 November 2010 at 21:04

Чего – то я не понял как это сделать. Например перейдите на http://www.break.com . Ведь парсинг возможен только по конечным урам (где видео). А у нас картинка находится в короткой новости. Вот ее выдернуть и поставить перед спарсенной видео-страницей. Получается КАРТИНКА ВИДЕОКОНТЕНТ. Скажите подробнее как это сделать.

Reply
Admin says:

3 November 2010 at 21:33

Не досмотрел, что она на другом url.
Как вариант: сначала напарсить ссылки на эти картинки, сохранить их в файл, потом через макрос FILE (в шаблоне вывода) проставить их уже в готовые статьи ;).

Reply
Михаил says:

4 November 2010 at 4:00

Привет!
Относительно модуля обработки и импорта контента есть несколько предложений.
1. Автоматическая простановка тегов для всех файлов проекта (массовая).
2. Макросы Descriptions, Keywords и Title для вставки только текстового содержимого полей (без тегов). Сейчас есть , но такой вариант не всегда подходит.
3. Макросы nextpage и previouspage.
4. Возможность отключить добавление в строки со ссылкой на рубрику (ту что добавляется в конец документа).
Надеюсь, не утомил?

Reply
Михаил says:

4 November 2010 at 4:01

В п.1 имел в виду теги абзацев p

Reply
Михаил says:

4 November 2010 at 4:04

Упс! Теги не видно, отправлю заново.
1. Автоматическая простановка тегов p для всех файлов проекта (массовая).
2. Макросы Descriptions, Keywords и Title для вставки только текстового содержимого полей (без тегов). Сейчас есть CD_META!, но такой вариант не всегда подходит.
3. Макросы nextpage и previouspage.
4. Возможность отключить добавление в CD_CONTENT! строки со ссылкой на рубрику (ту что добавляется в конец документа).

Reply
Se0mashines says:

16 November 2010 at 0:56

Чего то не пойму. А можно ли в закладке “ссылки” добавить из буфера обмена свой список ссылок. Ну или из файла? Мне нужно это, так как парсер не смог яндекс выдачу пропарсить. Было бы неплохо, если загружать свой список ссылок из файла и буфера.

Reply
Se0mashines says:

16 November 2010 at 1:12

Сори за офтоп. Но разобрался:) Блин, в этой программе есть ВСЁ)))

Reply
- admin says:
  
  16 November 2010 at 8:27
  
  Не все, но многое.
  
  Reply
rPy3-200 says:

17 November 2010 at 14:16

Из описания программы, не понятно может ли она работать по расписанию. Вот что имеется в виду: Есть несколько сайтов по одной тематике (сайты обьявлений), есть желание собирать с них информацию и вываливать все на своем сайте, мне надо чтобы программа сама с заданой периодичностью парсила исходные сайты, и добавляла новые обьявления к себе в базу. Пока писал появился еще вопрос: можно ли парсить не в файлы а в базу данных, например технические характеристики для дальнейшего анализа.

Reply
- admin says:
  
  17 November 2010 at 15:06
  
  По расписанию не парсит. В базу выводить можно (создавать дамп, который потом загрузите на сервер).
  
  Reply
Se0mashines says:

18 November 2010 at 20:20

Кое что придумал.
1. Добавить парсинг вложенности. Например есть страница. http://www.kinopoisk.ru/level/1/film/447301/ На этой странице есть много дочерних вкладок(постеры, актеры, обои, слова). Посмторите на урлы этих вкладок. Там меняется одно число. Можно создать инструмент, который переходил бы на заданную вкладку, и выставив там границы, вставить спарсенный дополнительный материал в шаблон вывода.

Reply
- admin says:
  
  18 November 2010 at 21:19
  
  Спасибо, постараюсь что-нибудь придумать.
  
  Reply
  - GorSite says:
    
    24 December 2010 at 14:00
    
    По данному предложению ни чего не получилось придумать?
    
    Reply
    - Admin says:
      
      24 December 2010 at 14:34
      
      Пока нет и не скоро.
      
      Reply
Se0mashines says:

18 November 2010 at 21:16

Еще одна хорошая и нужная идея появилась. При вставке строк из файла, нужно сделать так, чтобы строки вставлялись рандомно, а не по порядку.

Reply
- admin says:
  
  18 November 2010 at 21:18
  
  Нет, так делать не стоит, последовательность важна при собирании контента из разных файлов. Просто перемешайте строки в файле…
  
  Reply
Pacifik says:

19 November 2010 at 12:21

Я так понял что в парсере есть встроенный синонимайзер. У меня есть база синонимов и база стоп слов (точнее несколько баз).
Есть ли возможность подключать эти базы в парсер?
Обязательно необходимо подключить базу стоп слов – так как она у меня большая и в ней содержатся многие слова и словосочетания которые нельзя синонимизировать. С нетерпением жду ответа, и если это есть в проге обязательно куплю для работы!

Reply
admin says:

19 November 2010 at 17:44

Привет, в парсере нет базы стоп слов, а в Smartrewriter есть, при покупке Content Downloader, отдам Smartrewriter бесплатно…

Reply
- Pacifik says:
  
  20 November 2010 at 20:46
  
  Понятно, неужели для вас так сложно прикрутить базу стоп слов к парсеру? Вы такие фичи делаете, а эту мелочь добавить забыли =)
  Синонимайзер не нужен в принципе. Так как удобнее работать только в одной программе, нежели делить эту работу на несколько. Вы представте нужно спарсить контент, дальше запустить синонимайзер, там пакетно обработать все файлы, потом возвращаться назад в парсер и там обрабатывать дальше тексты…
  То есть получается вместо нажатия всего одной кнопки в парсере, нужно использовать кучу кнопок в синонимайзере =)
  
  Reply
Помидор says:

20 November 2010 at 4:15

Поддерживаю, Se0mashines. Пригодилась бы возможность парсинга “вложенных страниц. Как раз задумывался над парсингом контента с Кинопоиска.

Reply