TextoGEN – новое слово в генерации контента

Здравствуйте, дорогие друзья. Решил представить вам одну интересную программу для генерации контента – TextoGEN. В основе софта лежит наша новая технология, надеюсь, вы ее признаете, да и Яндекс тоже ;).

Суть в том, что программа сама строит совершенно уникальные тексты. Никакого “сырья” в виде статей для этого не требуется. Для построения текста программа использует свои базы. Пока их 11 штук (прилагательные, существительные, глаголы и прочее).

Текст генерируется по базе специальных шаблонов, которые вы сможете спокойно дополнять, редактировать и изменять.

Схема генерации довольна проста.

Программа из базы случайным образом выбирает один шаблон предложения, например: {when1}f1 {who2}f2 {glagol1}f1 {what1}f1..cat1, и на его основе строит предложение (когда, кто, действие, над чем происходит действие) . Выражение {when1}f1 указывает программе на то, что следует выборочно взять слово из базы when.txt соответствующее категории 1 (.cat1) и форме 1 (все записи в базах разбиты на категории, каждая категория может содержать в себе до 9 форм слов и выражений). При построении предложения по этому шаблону мы можем получить огромное количество вариантов:

В прошлую минуту архитекторы заштукатурили фасад здания.
На этой неделе хачики выкрасили офис.
В прошлом часу монтажники выкрасили офис.
На этой неделе плотники отремонтировали зал.
В прошлом месяце прорабы отремонтировали дом.
На этой неделе подсобные рабочие отделали гараж.
В этом часу Равшан и Джамшут выстроили гараж.
В прошлом году монтажники выстроили фасад здания.
На прошлой неделе отделочники отремонтировали склад.

И так далее…

TextoGEN

Прелесть в том, что даже маленькие базы слов и шаблонов предложений (размером, скажем, по 30 записей) могут дать огромное количество уникального контента. Эти базы легко редактируются и пополняются, можно постоянно создавать новые наборы баз с любой тематикой.

То, как Яндекс кушает эти статьи, я пока сказать не могу, мы недавно сделали тестовый сайт на этом контенте, ждем результатов индексации. Думаю, все пройдет успешно. Все предложения имеют правильную структуру и даже немного связаны между собой (категории шаблонов выбираются из базы по порядку: сначала выборочно из первой категории, потом из второй и так далее).

– пример текста из тестовых баз строительной тематики (около 100 000 символов + заголовки);
– базы слов и выражений;
– база шаблонов предложений.

Скорость генерации довольно высокая. За секунду программа может выдавать по одному мегабайту текста.

Продукт еще не поступил в продажу. Ориентировочная дата релиза (если все пройдет успешно и Яндексу понравится тестовый сайт) – 3 июля 2010 года.

Пока все, желаю вам удачи в делах.

Вы можете оставить комментарий, или поставить трэкбек со своего сайта.

Есть 28 коммент. к теме: “TextoGEN – новое слово в генерации контента”

  1. mik says:

    ЖДЕМ результатов!

  2. Yurik says:

    Ага. Интересно, сколько времени продержутся в индексе. Хотя, если влезли все страницы, то думаю держаться будут долго..

  3. mik says:

    не факт что долго , яндекс это реальная жопа . Чистый белый ресурс , страницы то входят то выходят с индекса , причина не понятна , уже более 7 месяцев такое .

  4. Agarin says:

    Когда будут объявлены результаты?

  5. admin says:

    Все саты уже два апа в индексе…

  6. Agarin says:

    Значит можно уже начинать продавать?

  7. admin says:

    Доделать кое-что надо, все никак не могу…

  8. Сергей says:

    Интересно, автор, какая ситуация на данный момент с этим генератором текста?

Написать комментарий

Пожалуйста, ознакомьтесь с правилами комментирования (почему некоторые комментарии могут быть удалены?!)

Добавить изображение к комментарию (jpg)