Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : tarasov@pmi.lv                       2:5020/400     06 Sep 2000  13:11:05
 To : Alex Pisarev
 Subject : Быстpый поиск
 -------------------------------------------------------------------------------- 
 
 Sat Sep 02 2000 15:57, Alex Pisarev wrote to Тарасов Сергей:
 
  AP>> Вопpос такой, я думаю, что к оптимайзеpам:
 
  AP>> Есть толпа файлов (текстовых, более 10000 штук, названия их в массиве).
  AP>> Есть подстpока, котоpую надо искать в этих файлах и соответсвенно
  AP>> выдавать pезультаты.
 
  ТС>> А не естественнее в данной ситуации использовать нормальный
  ТС>> поисковый движок? Сначала проиндексировать все файлы, а затем
  ТС>> получать ответ в одну секунду. 
 
  AP>  Идея хоpошая. Вопpос, где его взять и как пpиспособить под свои нужды?
 
  В сети есть парочка бесплатных.
 Если есть навыки в Си, то можно взять Glimpse. Еще недавно прочел про
 lq-text. Исходники не видел, но вроде должны быть. Этот пакет
 специально разрабатывался как дешевое (бесплатное) средство для поиска
 в файлах на диске. Еще есть UDMSearch, он в принципе является 
 роботом-пауком, но наверно можно заставить его по диску ползать.
 Использует SQL базы для хранения индексов.
 
 Если требуется только Перл, то есть Perlfect. Ссылки можно найти на
 любом сайте с скриптами. Использует DBM базы (DB_file, или что у тебя
 стоит). Его я как следует не проверил, так у меня только SDBM, а в
 стандартном построении SDBM не способен работать с большими объемами
 данных. Возможно потребуется доработка, но срипт небольшой, так что
 особых проблем быть не должно.
 
 Я сейчас пишу свой поисковый движок. В отличие от Perlfect, он не использует
 никакие библиотеки, следовательно переносимость лучше. Hо с другой
 стороны, формат файлов у него такой, что обновлять их практически
 невозможно. Добавить файл в индекс нельзя, нужно все заново
 индексировать. И индексация происходит полностью в оперативке, так что
 гигабайты он тоже не проиндексирует. У меня на 64Мб RAM он индексировал
 150-200 мег текста, затем начинались прорблемы.
 Взять можно тут: risearch.webservis.ru
 
 --- ifmail v.2.15dev5
  * Origin: FidoNet Online - http://www.fido-online.com (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Быстpый поиск   tarasov@pmi.lv   06 Sep 2000 13:11:05 
Архивное /ru.perl/16679dff5aaf4.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional