|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Sutovsky Vladimir 2:4624/8.5 30 Apr 2001 14:12:32 To : Alexey Litvinuke Subject : Re: Отодрать текст от тэгов -------------------------------------------------------------------------------- >>> Поделитесь плиз скриптом, который считывал бы *.htm файл и >>> извлекал оттуда значимый текст свободный от тэгов(без сохранения >>> форматирования), другими словами в результате работы, получался бы >>> текст, который видит пользователь в броузере при просмотре этого >>> файла. AL> open(FILE1,"$ARG[1]") || die "Can't open file $ARG[1]!"; AL> open(FILE2,">$ARG[2]") || die "Can't create file $ARG[2]!"; AL> while (getc(FILE1)) AL> { AL> if ($_ eq "<") AL> { AL> while (getc(FILE1) ne ">") {} AL> } AL> print FILE2 $_; # так привык! ;) AL> } AL> Сам таким пользуюсь! У меня CGA! :) гм.... а не проще сделать например прочитав строку в переменную $text такое: open RF, "$filename" || die "can't open"; while (<RF>) { $text=$_; $text =~ s/<([a-zA-Z]|\/[a-zA-Z])[^>]*>//g; print $text; } close RF; ну или в файл писать, смотря что надо Bye! Sutovsky [Team no Future] --- Antares | http://antares.km.ua | antares@km.ua | icq #49232492 * Origin: Улыбайся, завтра будет еще хуже... (2:4624/8.5) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/23033aed5823.html, оценка из 5, голосов 10
|