Русскоязычная база отборных синонимов – описание, купить

При написании своего синонимайзера предо мной стал один очень серьезный вопрос – где взять базу синонимов. После многократных и неудачных попыток найти качественную базу синонимов в интернете я понял то, что надо браться за это дело самому. После многомесячного труда я, наконец, готов представить вам свою собственную базу синонимов в 58,5 тысяч записей (включая словоформы). Хочу отметить и то, что работы над улучшением и наполнением базы ведутся и по сей день.

Большинство пользователей признали ее одной из лучших баз. Главным достоинством базы синонимов является то, что я собирал ее вручную, тоесть вводил каждую запись с клавиатуры, что делает ее на порядок лучше остальных баз, напарсенных из словарей, при использовании которых на выходе получается нечитаемый текст, с кучей несогласованных словоформ.

При использовании моей базы вы получите максимально читабельный контент. Надо отметить то, что идеального контента вы все равно не получите, ведь это же программная обработка, но добиться хорошего результата сможете без проблем.

В базе почти все синонимы однозначные, то есть применимы во всех контекстах, например вероятность того что у вас на выходе будет предложение – “арбалет рос крепким и зеленым” очень низка (в примере слово “лук” было заменено на “арбалет” – что неприемлемо, чего практически нет в предлагаемой базе синонимов).

Еще одним достоинством базы является то, что практически нет таких записей, которые могут привести к несогласованию словоформ в тексте. Например “Машина ехал по дороге” (в примере слово “автомобиль” было заменено на “машина” – что неприемлемо).

Единственный минус данной базы заключается в том, что на выходе получается не всегда уникальный контент, но если применять базу с другими методами уникализации то проблема разрешается.

Для того, чтобы вы имели представление о структуре базы, я приведу из нее вырезку.

Теперь перейдем к примерам работы базы. Для примера были использованы статьи из интернета, выбранные случайным образом. Пример обработки текста (синим цветом помечены замененные слова). Необходимо отметить то, что это пример автоматической обработки текста, без вмешательства человека. В примере, конечно же, не все замены идеально вписываются в текст, но для программного рерайта это очень и очень хороший результат.

Изменения, касающиеся покупки базы (как приобрести базу синонимов).

Со всеми вопросами и предложениями обращайтесь по:
ICQ 571-880-051
e-mail admin@smartbyte.org

Смотрите также:
Описание программы Smartrewriter.

Вы можете оставить комментарий, или поставить трэкбек со своего сайта.

Есть 29 коммент. к теме: “Русскоязычная база отборных синонимов – описание, купить”

  1. azat пишет:

    купив один раз базу, получаю сейчас базу после каждого апдейта от автора программы. Конечно же и сам не останавливаюсь от наполнения базы, конечно о тематических базах речь пока не идет, но пока мне и этой будет вполне хватать.

  2. Romka пишет:

    Использую пока что прошлые базы автора и очень ими доволен. А щас автор вроде мутотор контента написал, так что не жалеем денег и покупаем, потому что человек работал и трудился долгое время над проектом.

  3. admin пишет:

    Romka, спасибо, вы, как и все кто покупал базу, теперь можете обратиться ко мне за свежими версиями по ICQ 517-880-051.

  4. Олег пишет:

    Делал сайт (контент-синонимайз) использовалась исключительно данная база синонимов, сайт ВЫЛЕТЕЛ из индекса Яндекса после двух Аппов выдачи. Жаль потраченных денег и времени.

  5. admin пишет:

    Олег, никто вам и не обещал что программа создаст вам 100% уникальный контент, это инструмент который облегчает работу, вы должны дорабатывать тексты сами и опираться на свой опыт при публикации статей.

  6. musicnubse пишет:

    С точки зрения креатива все супер, но если копнуть глубже то даааа…

  7. Sky пишет:

    Олег, тут дело не в базе, а в умении ее применять. Нет и не будет кнопки “Сбацать сайт” и “Бабло”. Любой синонимайз надо подправлять, но где-то править надо кучу, а где-то щипотку.

    У меня в индексе уже полтора года висит. А по поводу выпадения – это скорее всего глюк яшки. У меня тоже сайт с уником весь вылетел в новогодние праздники, вчера вернулся полностью.

    musicnubse, а куда копать-то ? У меня программа работает на ура, да и база неплохая + добавил в нее свои наработки, уникальность стала порядка 60%, текст на выходе тоже не плохой получается.

  8. Александр пишет:

    Скажите, а сколько на данный момент весит база. Каков ее размер в мб?

  9. Александр пишет:

    А для тех, кто не приобретал лицензию Smartrewriter перечислять можно только на долларовый кошелек?

  10. admin пишет:

    R343596475065 – 510 рублей

  11. Александр пишет:

    Оплатил.
    С нетерпением жду :)

  12. Александр пишет:

    База супер!!!
    Спасибо.

  13. admin пишет:

    Всегда пожалуйста, обращайтесь

  14. miniats пишет:

    Мое мнение: господа создатели вы не правы.

    1. Ваш синонимайзер был мной приобретен (pro version ) с наборами баз …. лучше бы без них.
    2. Базы должны быть людскими а не то что получается на выходе .
    3. мне кажется что цены на базы немного завышены так как при приобретении оговаривалось что новые версии синонимайзера + бызы будут бесплатно.

  15. veny пишет:

    Скажите, сколько строк в вашей базе?

  16. rustam пишет:

    А какой максимальный размер файла базы синонимов может использовать программа?

  17. dekabrist пишет:

    У меня такой вопрос.
    А если все синонимы прогнать морфологически, будет программа работать?
    Ведь там чем больше синонимов к кадому слову, тем жирнее база становится.
    Вот например, если взять синонимы слова “игры”.
    игры,игрушки,игрушечки – это одна строчка.

    игрушки,игрушечки,игры
    игрушечки,игры,игрушки

    И это с одного вида синонимо выходит три строчки, так как программа не сможет заменить слово игрушечки если оно не будет стоять первым. В этом я вижу огромный плюс вашего синонимайзера, а плюс в том, что можно собирать свою тематическую базу, вот к примеру:
    слова игры, игрушки не всегда будет уместно заменить на синоним игрушечки. Тогда как слово игрушечки можно заменить на игрушки.
    Ну вы поняли о чем я.
    Но минус в том, что, как вы говорите, программа больше миллиона строк не потянет.
    А ведь еще и морфологические виды слов есть к примеру:

    игры,игрушки,игрушечки
    игрушки,игрушечки,игры
    игрушечки,игры,игрушки

    играм,игрушкам,игрушечкам
    игрушкам,игрушечкам,играм
    игрушечкам,играм,игрушкам

    играми,игрушками,игрушечками
    игрушками,игрушечками,играми
    игрушечками,играми,игрушками

    В итоге:
    игрушечки,игры,игрушки
    игрушечек,игрушек,игр
    игрушечкам,игрушкам,играм
    игрушечками,игрушками,играми
    игрушечках,игрушках,играх
    игрушечке,игрушке,игре
    игрушечки,игрушки,игры
    игрушечкой,игрушкой,игрой
    игрушечкою,игрушкою,игрою
    игрушечку,игрушку,игру

    10 строк и у каждой по три варианта написания. 10*3=30
    Из 3-х слов мы получаем 30 строк.
    У некоторых слов поменьше парадигм, у некоторых побольше. Поэтому среднее количество морфологического разнообразия на одно слово возьмем число 10.
    Теперь больше математики.
    В среднем 1 слово будет иметь по два синонима минимум (и это еще не очень качественная база будет), то есть как в примере с “игрушками”.
    Но не будем ломать голову, а возьмем количество парадигм на слово, а их у нас на каждое 10.

    Теперь посчитаем.

    Из примерно скажем 200 000 слов мы получим 2 000 000 строк.
    Итог, программа либо умрет при обработке такой базы, либо пользователь этой программы выщипает себе волосы имея при себе такую базу, но ни чего так и не сможет сделать с ней толкового.

    К чему я клоню, а все к тому, что хоть база синонимов и является сердцем любого синонимайзера, но все же программа тоже должна уметь качественно обработать эту базу. Иначе по отдельности это лишь простые инструменты, которые, кроме как на клепку говносайтов аля САПА, больше не сгодяться и делать на таких инструментах что то стоящее – это бред.

    Другое дело, когда инструменты развиваются синхронно и всегда могут соответсвовать друг другу.

    С уважением, Рустам.

  18. admin пишет:

    Здравствуйте.
    Если вы говорите про базу для белых сайтов, она не как нее достигнет размера в 1 000 000 строк. Слов, на которые можно заменить без потери смысла в разных контекстах довольно мало.
    А так я с вами согласен, надо развиваться…

  19. dekabrist пишет:

    Тоже правду говорите.
    Сколько не замечал, но какая бы не была общетематическая база, но она никогда не сможет сделать идеального текста или приблеженного к идеалу.

    Намного лучше с этим делом справляются узконаправленные базы синонимов, на определенную тематику.

    Но я все же вернусь к общей базе. Я просто имел ввиду собирать такую базу не для того, что бы “нажал на кнопку – тебе уникальный и читабельный текст”, а для облегчения жизни рерайтера. Ведь для этого такие программы один из лучших вариантов облегчения их труда. Так вот, в памяти рерайтера может и не быть определенных слов-синонимов или просто их надо долго вспоминать. А тут загрузил текст, нажал кнопку, программа выдала там что-то, а рерайтер уже в дальнейшем будет перерабатывать текст. То есть в вашей программе когда нажимаешь на замененное слово, она выдает еще другие виды замен, которые есть в базе. Вот для этого и нужна такая большая база. Что бы не надо было вспоминать, чем же можно заменить данное слово.

    И еще вопрос, чем будет впервую очередь заменять программа слова?
    Синонимами или словосочетаниями?

    К примеру:

    Как выйти замуж?

    как,каким образом
    выйти замуж,обрести мужа,обвенчаться и т.д.

    и вот такой вариант
    как выйти замуж,как же стать замужней

    Какой из этих вариантов программа будет использовать?
    Заменять по синонимам или заменять словосочетаниями?

  20. admin пишет:

    Заменять будет словосочетаниями, они имеют приоритет, чем больше слов в словосочетании, тем выше приоритет…

  21. dekabrist пишет:

    Я наверно уже надоел, но будет ли в будущем программа воспринимать базы, имеющие более 1 000 000 строк?

  22. admin пишет:

    Не надоели ;) .
    Пока не планируется…, попробуйте может и работает, не тестировалось с таким большим объемом баз.

  23. website1 пишет:

    Здравствуйте.
    У меня такой вот вопрос:
    в свое время купил у вас синомайзер за 25 бакинских… Сейчас программа бесплатная и для норм работы вы предлагаете еще докупить базу с огромной скидкой в 3$. Итого чтобы получить последнюю версию программы + новую базу, я потрачу 25 + 14 = 39 баксов.
    В данный момент, любой человек может купить тоже самое за 17 баксов… Так вот у меня вопрос: Как понимать такую разницу в 22 доллара? Может вы бы разослали бесплатно базу для всех у кого есть лицензия (или хотя бы не всю базу, а только часть)? А то уже попахивает сильной наглостью с вашей стороны… Я один из тех кто купил лицензию на самых первых версиях (так сказать помог в развитии проекта) и было обещано рассылать обновления… Теперь обновлений нет и надо снова платить? Хотя бы скидку сделали бы нормальной для обладателей лицензии…

  24. admin пишет:

    База для обладателей лицензии является бесплатной, для ее получения стучите в ICQ (номер в сайдбаре справа).
    Спасибо за внимание.

  25. Петр пишет:

    Что-то я совсем запутался… у меня НЕТ ни самого смартрирайтера ни баз –ничего –только деньги и желание получить программу с новыми базами— что бы скачать и работать.Что куда и сколько я должен отправить?Спасибо

  26. admin пишет:

    Петр, отправьте 17 WMZ сюда – Z201847902942 (разовая покупка базы синонимов, то есть получите последнюю версию базы).
    Если хотите подписаться на полуторамесячные обновления базы, то оплатите 23 доллара на тот же кошелек. На указанный при оплате мейл каждую неделю будут приходить обновления базы.
    Сама программа распространяется бесплатно – http://sbfactory.ru/free/smartrewriterpro.exe
    Если хотите оплатить базу рублями, то отправьте нужную сумму на этот кошелек – R343596475065 (510 рублей за разовую покупку или 690 рублей за подписку).
    С уважением к вам, Сергей.

Написать комментарий

XHTML: Вы можете использовать эти теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Comment Spam Protection by WP-SpamFree

Добавить изображение к комментарию

Локализовано: Русскоязычные шаблоны ВордПресс