TextoGEN – новое слово в генерации контента

TextoGEN – новое слово в генерации контента

Здравствуйте, дорогие друзья. Решил представить вам одну интересную программу для генерации контента – TextoGEN. В основе софта лежит наша новая технология, надеюсь, вы ее признаете, да и Яндекс тоже ;).

Суть в том, что программа сама строит совершенно уникальные тексты. Никакого “сырья” в виде статей для этого не требуется. Для построения текста программа использует свои базы. Пока их 11 штук (прилагательные, существительные, глаголы и прочее).

Текст генерируется по базе специальных шаблонов, которые вы сможете спокойно дополнять, редактировать и изменять.

Схема генерации довольна проста.

Программа из базы случайным образом выбирает один шаблон предложения, например: {when1}f1 {who2}f2 {glagol1}f1 {what1}f1..cat1, и на его основе строит предложение (когда, кто, действие, над чем происходит действие) . Выражение {when1}f1 указывает программе на то, что следует выборочно взять слово из базы when.txt соответствующее категории 1 (.cat1) и форме 1 (все записи в базах разбиты на категории, каждая категория может содержать в себе до 9 форм слов и выражений). При построении предложения по этому шаблону мы можем получить огромное количество вариантов:

В прошлую минуту архитекторы заштукатурили фасад здания.
На этой неделе хачики выкрасили офис.
В прошлом часу монтажники выкрасили офис.
На этой неделе плотники отремонтировали зал.
В прошлом месяце прорабы отремонтировали дом.
На этой неделе подсобные рабочие отделали гараж.
В этом часу Равшан и Джамшут выстроили гараж.
В прошлом году монтажники выстроили фасад здания.
На прошлой неделе отделочники отремонтировали склад.

И так далее…

TextoGEN

Прелесть в том, что даже маленькие базы слов и шаблонов предложений (размером, скажем, по 30 записей) могут дать огромное количество уникального контента. Эти базы легко редактируются и пополняются, можно постоянно создавать новые наборы баз с любой тематикой.

То, как Яндекс кушает эти статьи, я пока сказать не могу, мы недавно сделали тестовый сайт на этом контенте, ждем результатов индексации. Думаю, все пройдет успешно. Все предложения имеют правильную структуру и даже немного связаны между собой (категории шаблонов выбираются из базы по порядку: сначала выборочно из первой категории, потом из второй и так далее).

– пример текста из тестовых баз строительной тематики (около 100 000 символов + заголовки);
– базы слов и выражений;
– база шаблонов предложений.

Скорость генерации довольно высокая. За секунду программа может выдавать по одному мегабайту текста.

Продукт еще не поступил в продажу. Ориентировочная дата релиза (если все пройдет успешно и Яндексу понравится тестовый сайт) – 3 июля 2010 года.

Пока все, желаю вам удачи в делах.

Вы можете оставить комментарий, или поставить трэкбек со своего сайта.
Написать комментарий

Пожалуйста, ознакомьтесь с правилами комментирования (причина УДАЛЕНИЯ некоторых комментариев)

Добавить изображение к комментарию (jpg)