28.01.2007, 00:19
общий
это ответ
Здравствуйте, Ling!
Дело в том, что для нахождения всех словоформ Вам надо прежде всего найти основу слова, а потом уже формировать всю парадигму.
Хорошая морфология не бесплатна. Из некоммерческих
проектов довольно широкое распространение получила морфология
на основе словаря Лебедева для UNIX-программы ispell подробнее <a href=http://fmg-www.cs.ucla.edu/geoff/ispell-dictionaries.html>тут</a>
Предназначение программы - проверка орфографии, поэтому,
вообще говоря, морфология на базе этого словаря сильно уступает
морфологическим модулям, специально разрабатываемых для поис-
ковых систем. Но, тем не менее, этого словаря обычно хватает. Словарь состоит из двух частей:
собственно словаря и набора правил словообразования (аффикс-
файл) подробнее <a href=http://scon155.phys.msu.ru/~swan/orthography.html>тут</a>
Ряд идей по организации поиска обсуждались на форумах
PHPClub и xpoint:
http://phpclub.ru/talk/showthread.php?s=&threadid=45100
http://xpoint.ru/archive/threads/97/19558.html
http://xpoint.ru/archive/threads/37/7492.html
http://xpoint.ru/archive/topic7/62/12482.html
Некоторые весьма интересные обсуждения, статьи и ссылки
можно найти на сайте www.searchengines.ru
По этим ссылкам в оновном обсуждается технология поисковой системы, в Вашем же случае надо обратить внимание как ищуться все словоформы.
Если будут проблемы с морфологией то можете обратиться сюда или на прямую ко мне, я однажды составлял словарь для поиска всех словоформ, но из-за нехватки времени работу пока приостановил. Могу отдать свои наработки и базы данных в хорошие руки.