Файл проекта Content Downloader (требует последнюю версию программы):
– Файл проекта программы (меню – файл – загрузить проект)
Парсинг обсуждений Вконтакте
July 18th, 2011 3 коммент. »
Написать комментарий
Пожалуйста, ознакомьтесь с правилами комментирования (причина УДАЛЕНИЯ некоторых комментариев)
Плохой способ парсинга обсуждений 😉
Таким способом не будут парситься все старницы какого-то конкретного обсуждения, а возьмуться только те, которые видны (цифры сами, урлы).
К примеру, у обсуждения 100 страниц, видны допустим такие страницы 1,2,3,4,5,6 .. 100. Выходит спарсяться только страниц 1-6 и 100, а по идее нужно парсить с 1 по 100 страниц). Поэтому ручной парсинг лучше 🙂
Но все равно спасибо за видео. Новый способ получения урлов на группы 🙂
Просто это самый быстрый способ, можно и вручную нагенерировать страниц…
Только контента там очень мало. К примеру по авто нереально нарыть около 1 000 000 строк контента (это уже после чистки строк: удаление урлов, удаление спецсимволов, удаление строк короче 50 и т.д.). Вы не знаете другие закрытые сети, сайты, на которых огромное количество контента? 😉