Консультация № 72736
26.01.2007, 13:09
0.00 руб.
0 3 3
Добрый день!

Имеется следующая проблема - необходим текстологический анализ (синтаксис, грамматика, первичная классификация объектов) некоторых HTML-страниц в Интернете. Вопрос в следующем, подходит ли для этой цели Perl, и если да, то какую литературу по решению данной проблемы на этом языке вы можете посоветовать.

Заранее благодарен!

Обсуждение

Неизвестный
26.01.2007, 13:45
общий
это ответ
Здравствуйте, Zaec!
PERL - Practical Extraction and Report Language, идеально подходит для обработки текстовой информации(в частности для HTML, не даром это один из самых популярных языков написания CGI сценариев). Одна из самых сильных сторон языка - регулярные выражения. Если нет проблем с английским, то самое лучшее - это хелп, поставляемый с дистрибутивом. На русском, к сожалению, посоветовать ничего не могу, хотя видел толстые книжки в магазинах.
Неизвестный
26.01.2007, 13:52
общий
это ответ
Здравствуйте, Zaec!
вполне подходит.
литература:
1.Programming Perl, Third Edition
By Larry Wall, Tom Christiansen, Jon Orwant

2.Perl Cookbook, Second Edition
By Tom Christiansen, Nathan Torkington

3.Mastering Regular Expressions, Second Edition
By Jeffrey E. F. Friedl

названия на англ, но существуют переведенные.
Неизвестный
26.01.2007, 15:15
общий
это ответ
Здравствуйте, Zaec!

ccылка на книги что перечислил -OC-
http://unix.org.ua/orelly/perl/
Форма ответа