При написании своего синонимайзера предо мной стал один очень серьезный вопрос – где взять базу синонимов. После многократных и неудачных попыток найти качественную базу синонимов в интернете я понял то, что надо браться за это дело самому. После многомесячного труда я, наконец, готов представить вам свою собственную базу синонимов в 58,5 тысяч записей (включая словоформы). Хочу отметить и то, что работы над улучшением и наполнением базы ведутся и по сей день.
Большинство пользователей признали ее одной из лучших баз. Главным достоинством базы синонимов является то, что я собирал ее вручную, тоесть вводил каждую запись с клавиатуры, что делает ее на порядок лучше остальных баз, напарсенных из словарей, при использовании которых на выходе получается нечитаемый текст, с кучей несогласованных словоформ.
При использовании моей базы вы получите максимально читабельный контент. Надо отметить то, что идеального контента вы все равно не получите, ведь это же программная обработка, но добиться хорошего результата сможете без проблем.
В базе почти все синонимы однозначные, то есть применимы во всех контекстах, например вероятность того что у вас на выходе будет предложение – “арбалет рос крепким и зеленым” очень низка (в примере слово “лук” было заменено на “арбалет” – что неприемлемо, чего практически нет в предлагаемой базе синонимов).
Еще одним достоинством базы является то, что практически нет таких записей, которые могут привести к несогласованию словоформ в тексте. Например “Машина ехал по дороге” (в примере слово “автомобиль” было заменено на “машина” – что неприемлемо).
Единственный минус данной базы заключается в том, что на выходе получается не всегда уникальный контент, но если применять базу с другими методами уникализации то проблема разрешается.
Для того, чтобы вы имели представление о структуре базы, я приведу из нее вырезку.
Теперь перейдем к примерам работы базы. Для примера были использованы статьи из интернета, выбранные случайным образом. Пример обработки текста (синим цветом помечены замененные слова). Необходимо отметить то, что это пример автоматической обработки текста, без вмешательства человека. В примере, конечно же, не все замены идеально вписываются в текст, но для программного рерайта это очень и очень хороший результат.
Изменения, касающиеся покупки базы (как приобрести базу синонимов).
Со всеми вопросами и предложениями обращайтесь по Whatsap +79833813211
Смотрите также:
Описание программы Smartrewriter.
Тоже правду говорите.
Сколько не замечал, но какая бы не была общетематическая база, но она никогда не сможет сделать идеального текста или приблеженного к идеалу.
Намного лучше с этим делом справляются узконаправленные базы синонимов, на определенную тематику.
Но я все же вернусь к общей базе. Я просто имел ввиду собирать такую базу не для того, что бы “нажал на кнопку – тебе уникальный и читабельный текст”, а для облегчения жизни рерайтера. Ведь для этого такие программы один из лучших вариантов облегчения их труда. Так вот, в памяти рерайтера может и не быть определенных слов-синонимов или просто их надо долго вспоминать. А тут загрузил текст, нажал кнопку, программа выдала там что-то, а рерайтер уже в дальнейшем будет перерабатывать текст. То есть в вашей программе когда нажимаешь на замененное слово, она выдает еще другие виды замен, которые есть в базе. Вот для этого и нужна такая большая база. Что бы не надо было вспоминать, чем же можно заменить данное слово.
И еще вопрос, чем будет впервую очередь заменять программа слова?
Синонимами или словосочетаниями?
К примеру:
Как выйти замуж?
как,каким образом
выйти замуж,обрести мужа,обвенчаться и т.д.
и вот такой вариант
как выйти замуж,как же стать замужней
Какой из этих вариантов программа будет использовать?
Заменять по синонимам или заменять словосочетаниями?
Заменять будет словосочетаниями, они имеют приоритет, чем больше слов в словосочетании, тем выше приоритет…
Я наверно уже надоел, но будет ли в будущем программа воспринимать базы, имеющие более 1 000 000 строк?
Не надоели ;).
Пока не планируется…, попробуйте может и работает, не тестировалось с таким большим объемом баз.
Здравствуйте.
У меня такой вот вопрос:
в свое время купил у вас синомайзер за 25 бакинских… Сейчас программа бесплатная и для норм работы вы предлагаете еще докупить базу с огромной скидкой в 3$. Итого чтобы получить последнюю версию программы + новую базу, я потрачу 25 + 14 = 39 баксов.
В данный момент, любой человек может купить тоже самое за 17 баксов… Так вот у меня вопрос: Как понимать такую разницу в 22 доллара? Может вы бы разослали бесплатно базу для всех у кого есть лицензия (или хотя бы не всю базу, а только часть)? А то уже попахивает сильной наглостью с вашей стороны… Я один из тех кто купил лицензию на самых первых версиях (так сказать помог в развитии проекта) и было обещано рассылать обновления… Теперь обновлений нет и надо снова платить? Хотя бы скидку сделали бы нормальной для обладателей лицензии…
База для обладателей лицензии является бесплатной, для ее получения стучите в ICQ (номер в сайдбаре справа).
Спасибо за внимание.
Что-то я совсем запутался… у меня НЕТ ни самого смартрирайтера ни баз –ничего –только деньги и желание получить программу с новыми базами— что бы скачать и работать.Что куда и сколько я должен отправить?Спасибо
Петр, отправьте 17 WMZ сюда – Z201847902942 (разовая покупка базы синонимов, то есть получите последнюю версию базы).
Если хотите подписаться на полуторамесячные обновления базы, то оплатите 23 доллара на тот же кошелек. На указанный при оплате мейл каждую неделю будут приходить обновления базы.
Сама программа распространяется бесплатно – http://sbfactory.ru/free/smartrewriterpro.exe
Если хотите оплатить базу рублями, то отправьте нужную сумму на этот кошелек – R343596475065 (510 рублей за разовую покупку или 690 рублей за подписку).
С уважением к вам, Сергей.
Пользуюсь вашой базой для размножения, но честно говоря, довольно скудно…
Если есть какая-то база по-больше, либо доработанная существующая – готов купить.
Нет, активно занимаюсь Content Downloader
admin, а есть в программе отправка своей базы? Ну то есть для того чтобы база быстро и сама развилась? Народ правит, кто сколько может, при сохранении базы предлагаем отправить ее разработчику. При получении новой версии базы, искать новые строки и добавлять в новую версию базы. Правда так понадобится какая-то модерация, а то такого понаписать могут 🙂
Или например, можно сделать поинтересней. Делаем свой миниредактор базы. Пользователь не меняет старую версию, а просто добавляет новые слова и при сохранении отправляет на сервак. А дальше, для модерации (чтобы не просматривать все самому) – рассылаем пользователям по 10 фраз, на модерацию. Кто промодерировал – получает новую версию базы (когда выйдет), а кто отказался – если нужна база, надо насильно заставить..
Ну вот примерно так я это дело вижу… Думаю если еще покумекать, то так проект быстрей разрастется 😉
Нет, делать это тоже пока не планирую. 99% даю, что никто не будет отправлять свои наработки, пройденный этап…
Спасибо,хорошую,русскоязычную базу синонимов давно искал!
Варезнки клепать – самое оно)
За скидку и правку структуры базы отдельная благодарность.
Удачи вам,администратор)
Добрый день, у меня следующий вопрос: при оплате базы синонимов через WMZ как вы будуте знать что деньги кинул именно я, а никто другой?
Заранее спасибо
Укажите в примечании e-mail адрес (на него я вам вышлю базу). База на данный момент стоит 10 WMZ или 300 WMR.
Спасибо!
Здравствуйте. База идет в комплекте с программой Content Downloader или прийдется покупать отдельно?
Здравствуйте, внутри, файл data.txt
Здравствуйте. Сколько на сегодняшний день стоит база ? А программа, я так понял, распространяется бесплатно, да?
10 долларов.
10 wmz проплатил, почт ящик в примечании указал, жду.
Спасибо! Выслал.
Оплатил, жду базу.
Выслал. Спасибо!
добрый день,
а в каком формате база? Мне нужна сама база для другого проекта, юез программы.
И еще, как с Вами связаться помимо ICQ, я ею уже лет 7 не пользуюсь…
опечатка, имел ввиду без самой программы
Здравствуйте!
Skype smartbyte_support
ICQ 571-880-051
Формат базы синонимов: слово,синоним
С уважением к вам, Сергей.
А база синонимов которая в контент доунлоадере та же что и эта база или это отдельные продукты??
Здравствуйте. Это та же база.
Доброго времени суток, скажите в базе синонимы в единственном экземпляре или с окончаниями? я имею ввиду чтобы не получился текст например – Я твой дом труба шатал…
Здравствуйте, со словоформами…
Здравствуйте. В программе контент довнлоад база не обновляется, раз вы говорите, что базы одинаковые. Только что обновил content download и посмотрел там базу и в SmartRewriterPro базу, то вес почти одинаков. Почему?
Здравствуйте.
Базами синонимов уже не занимаемся несколько лет.