Консультация № 175094
10.12.2009, 02:00
0.00 руб.
0 2 0
Здравствуйте уважаемые эксперты.

Нужна помощь по созданию программы для дешифровки русских текстов.

Задание вот такое:
Дается зашифрованный текст (3-8 предложений). Для шифровки был использован метод подстановки, заключающийся в замене одних букв алфавита на другие, причем исключен простейший частный случай этого метода - циклический сдвиг алфавита.
Нужно создать программу, которая расшифрует текст и найдёт шифр (т.е. набор пар буква - буква, число этих пар может быть несколько меньше количества букв в алфавите - если в расшифрованном тексте был использован не весь алфавит). Указанный метод шифровки сохраняет структуру текста - количество и длину слов, знаки препинания. Расшифровка текста должна быть основана на знаниях закономерностей, свойственных текстам на выбранном языке - знаний о лексических, морфологических и грамматических особенностях этого языка.

Сделал пока программку, которая: производит частотный поиск букв, заменяет их на часто встречаемые в языке, разбивает текст на слова, сортирует их по количеству букв, выбирает слова с указанной(например, самой частой) буквой.
Эталонный словарик подгрузил из 5000 самых употребляемых слов. В общем, пытался идти напролом и впал в кризис. :-)
Сразу скажу что криптологию знаю не очень хорошо.

Может, кто-нибудь уже работал с чем-то подобным и может дать хотя бы словесный алгоритм для такой программы. За что тут можно зацепиться?

Обсуждение

Неизвестный
11.12.2009, 00:33
общий
Нужно подсчитать дополнительно статистику встречаемости последовательностей из двух, трех и четырех букв в языке и тексте.
Неизвестный
17.12.2009, 20:03
общий
Vitaliytemirtau:
Возможно, стоит обратить внимание на повторяющиеся буквы (нн, сс, ее и т.п.), на слова из 1-2-3 букв и на окончания слов.
Форма ответа