|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : tarasov@pmi.lv 2:5020/400 06 Sep 2000 13:11:05 To : Alex Pisarev Subject : Быстpый поиск -------------------------------------------------------------------------------- Sat Sep 02 2000 15:57, Alex Pisarev wrote to Тарасов Сергей: AP>> Вопpос такой, я думаю, что к оптимайзеpам: AP>> Есть толпа файлов (текстовых, более 10000 штук, названия их в массиве). AP>> Есть подстpока, котоpую надо искать в этих файлах и соответсвенно AP>> выдавать pезультаты. ТС>> А не естественнее в данной ситуации использовать нормальный ТС>> поисковый движок? Сначала проиндексировать все файлы, а затем ТС>> получать ответ в одну секунду. AP> Идея хоpошая. Вопpос, где его взять и как пpиспособить под свои нужды? В сети есть парочка бесплатных. Если есть навыки в Си, то можно взять Glimpse. Еще недавно прочел про lq-text. Исходники не видел, но вроде должны быть. Этот пакет специально разрабатывался как дешевое (бесплатное) средство для поиска в файлах на диске. Еще есть UDMSearch, он в принципе является роботом-пауком, но наверно можно заставить его по диску ползать. Использует SQL базы для хранения индексов. Если требуется только Перл, то есть Perlfect. Ссылки можно найти на любом сайте с скриптами. Использует DBM базы (DB_file, или что у тебя стоит). Его я как следует не проверил, так у меня только SDBM, а в стандартном построении SDBM не способен работать с большими объемами данных. Возможно потребуется доработка, но срипт небольшой, так что особых проблем быть не должно. Я сейчас пишу свой поисковый движок. В отличие от Perlfect, он не использует никакие библиотеки, следовательно переносимость лучше. Hо с другой стороны, формат файлов у него такой, что обновлять их практически невозможно. Добавить файл в индекс нельзя, нужно все заново индексировать. И индексация происходит полностью в оперативке, так что гигабайты он тоже не проиндексирует. У меня на 64Мб RAM он индексировал 150-200 мег текста, затем начинались прорблемы. Взять можно тут: risearch.webservis.ru --- ifmail v.2.15dev5 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/16679dff5aaf4.html, оценка из 5, голосов 10
|