|
ru.unix.bsd- RU.UNIX.BSD ------------------------------------------------------------------ From : Valentin Davydov 2:5020/400 01 Dec 2006 10:23:17 To : Aleksey Cheusov Subject : Re: awk vs sql: предварительные результаты -------------------------------------------------------------------------------- > From: Aleksey Cheusov <cheusov@scnsoft.com> > Date: Thu, 30 Nov 2006 14:50:57 +0000 (UTC) > > VD> Затем был выполнен select * from table, и на полученный текстовый файл > VD> (к слову сказать, занимающий примерно вдвое меньше места на диске, нежели > VD> структурированный файл базы данных) натравлен awk '{a[$2]+=$7}; > VD> END{for(c in a) print c, a[c]}' | sort -k1. Поскольку awk вынужден >1) ты уверен, что дело в хеше? Да. > Сколько времени выполняется sort -k1 > и {print $2, $7} Hичтожно мало по сравнению с page faultами. >2) какого отношение количества строчек (всего) к количеству попарно различных > фамилий на входе? Хотя бы порядок. Порядка 30. >3) версия [ngmo]awk? One true. Впрочем, это, по всей видимости, не суть важно. > VD> зависимость количества обработанных данных от времени (а она, скорее > VD> всего, сильно сублинейна, ближе к корневой), >С какой стати корневой? Hаблюдаемый факт. Хотя причина тривиальна: массив растёт примерно линейно с объёмом, данные хоршо перемешаны. Вал. Дав. --- ifmail v.2.15dev5.3 * Origin: Demos online service (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix.bsd/6577fc6748f2.html, оценка из 5, голосов 10
|