При написании своего синонимайзера предо мной стал один очень серьезный вопрос – где взять базу синонимов. После многократных и неудачных попыток найти качественную базу синонимов в интернете я понял то, что надо браться за это дело самому. После многомесячного труда я, наконец, готов представить вам свою собственную базу синонимов в 58,5 тысяч записей (включая словоформы). Хочу отметить и то, что работы над улучшением и наполнением базы ведутся и по сей день.
Большинство пользователей признали ее одной из лучших баз. Главным достоинством базы синонимов является то, что я собирал ее вручную, тоесть вводил каждую запись с клавиатуры, что делает ее на порядок лучше остальных баз, напарсенных из словарей, при использовании которых на выходе получается нечитаемый текст, с кучей несогласованных словоформ.
При использовании моей базы вы получите максимально читабельный контент. Надо отметить то, что идеального контента вы все равно не получите, ведь это же программная обработка, но добиться хорошего результата сможете без проблем.
В базе почти все синонимы однозначные, то есть применимы во всех контекстах, например вероятность того что у вас на выходе будет предложение – “арбалет рос крепким и зеленым” очень низка (в примере слово “лук” было заменено на “арбалет” – что неприемлемо, чего практически нет в предлагаемой базе синонимов).
Еще одним достоинством базы является то, что практически нет таких записей, которые могут привести к несогласованию словоформ в тексте. Например “Машина ехал по дороге” (в примере слово “автомобиль” было заменено на “машина” – что неприемлемо).
Единственный минус данной базы заключается в том, что на выходе получается не всегда уникальный контент, но если применять базу с другими методами уникализации то проблема разрешается.
Для того, чтобы вы имели представление о структуре базы, я приведу из нее вырезку.
Теперь перейдем к примерам работы базы. Для примера были использованы статьи из интернета, выбранные случайным образом. Пример обработки текста (синим цветом помечены замененные слова). Необходимо отметить то, что это пример автоматической обработки текста, без вмешательства человека. В примере, конечно же, не все замены идеально вписываются в текст, но для программного рерайта это очень и очень хороший результат.
Изменения, касающиеся покупки базы (как приобрести базу синонимов).
Со всеми вопросами и предложениями обращайтесь по Whatsap +79833813211
Смотрите также:
Описание программы Smartrewriter.
Новости RSS

Рубрики:
С вопросами о покупке (или другими организационными), вы можете в любое время обращаться по Телефону +7 983 381 3211 или Телеграм @ContentDownloaderX1 (Сергей Владимирович)
WBApp (дополнение для Content Downloader) - парсинг с выполнением WEB-скриптов, с возможностью имитации кликов по элементам страниц, произведение прокрутки страниц, заполнение текстовых полей и многое другое...