Главная страница


ru.unix.bsd

 
 - RU.UNIX.BSD ------------------------------------------------------------------
 From : dwl                                  2:5020/400     21 Dec 2006  16:28:56
 To : Ilya Anfimov
 Subject : Re: wget regex url
 -------------------------------------------------------------------------------- 
 
 Ilya Anfimov пишет:
 
 >  Hу, если там в числе начальных нулей не можэт быть -- то
 >  a=0
 >  while true ; do
 >    wget http://www.site.com/script.php?param1=$a
 >  done
 
 не очень понял математическую задумку :)
 или пропущен $a++ ?
 param1 цифровой, но с большим разбросом и с огромными цифрами. так что
 тупо идти перебором - не вариант.
 >> может чем то можно пройтись по всему сайту собрав все урлы сайта?
 >  
 >  wget -r и аналоги
 
 есть недостаток.
 на сайте используется вызов нескольких скриптов, но данные выводятся с
 разной сортировкой, что отражается в урле переменной. wget соответсвенно
 считает это разными страницами и качает одну страницу в 10 вариантах.
 
 > 
 >> а потом просто из него подготовить список для wget.
 > 
 >  А потом удалить всё лишнее.
 
 это самое простое  :)
 
 > 
 >> дайте идею :)
 
 ps: похоже прийдется писать своего паучка...
 --- ifmail v.2.15dev5.3
  * Origin: RTComm.RU (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 wget regex url   dwl   21 Dec 2006 03:58:39 
 wget regex url   Vladimir Kurtukov   21 Dec 2006 10:05:34 
 Re: wget regex url   Ilya Anfimov   21 Dec 2006 10:14:18 
 Re: wget regex url   dwl   21 Dec 2006 16:28:56 
 Re: wget regex url   Ilya Anfimov   21 Dec 2006 20:38:55 
 Re: wget regex url   dwl   21 Dec 2006 22:40:25 
Архивное /ru.unix.bsd/9181fac1ae60.html, оценка 3 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional