Re: SELECT ... WHERE ... IN (SELECT ...) -> SELECT ... WHERE (... OR ... )
От | Alexander M. Pravking |
---|---|
Тема | Re: SELECT ... WHERE ... IN (SELECT ...) -> SELECT ... WHERE (... OR ... ) |
Дата | |
Msg-id | 20061205073407.GA12175@dyatel.antar.bryansk.ru обсуждение исходный текст |
Ответ на | Re: SELECT ... WHERE ... IN (SELECT ...) -> SELECT ... WHERE (... OR ... ) (Anton <anton200@gmail.com>) |
Список | pgsql-ru-general |
On Tue, 2006-12-05 at 11:47 +0500, Anton wrote: > Может с этого надо было начать... Словом, потребность есть ВЫБРАТЬ > ПОСЛЕДНЮЮ ДАТУ (поле collect_time) ИЗ ТАБЛИЦЫ ТРАФИКА (таблица > n_traffic) ДЛЯ ВСЕХ ЛОГИНОВ (поле login_id) ЗАДАННОГО АККАУНТА (поле > account_id). Ммм, если последнюю, тогда уж ORDER BY collect_time DESC :) > То есть из таблицы n_logins выбрать все login_id которые имеют > заданный account_id, а потом из таблицы n_traffic выбрать самую > последнюю дату из всех этих login_id. Только PG делает выборку в другом порядке :) Сначала ищет все записи в n_traffic, а потом отсеивает ненужные, для которых не нашлось требуемой записи в n_logins. > >Здесь явно неразумный план: выборка из большой таблицы всех (видимо) > >записей по условию, которое всегда true. Здесь даже seq scan был бы > >быстрее (ANALYZE давно делали?). > > VACUUM FULL ANALYZE делался буквально перед тем как. collect_time НЕ > ВСЕГДА сравнивается с "1970-01-01 ...", а более чаще с датой начала > текущего месяца. Но в определенных случаях (некоторые данные > неизвестны) берется просто тот самый "1970-01-01 ...". > Однако это дела не меняет, если даже убрать вообще условие с > collect_time (см. планы внизу для nestloop ON и OFF). Всё равно фильтр по дате, судя из условий задачи, не настолько сужает поиск, как фильтр по login_id (одному или нескольким) плюс по дате. У тебя PG почему-то совсем не хочет сначала искать login_id'ы, а потом уже по ним -- записи из n_traffic. > ... > >порядок JOIN'а вручную. Насчёт восьмёрки вроде проскакивало, что > >оптимизатор умничает даже в случае явного JOIN, хотя я не уверен, так > >что можно попробовать и этот вариант. > см. ниже, видимо это как раз то, о чём ты говоришь. Нет, я имел в виду вместо ... FROM n_logins, n_traffic WHERE n_traffic.login_id = n_logins.login_id ... попробовать поменять порядок JOIN'а: SELECT collect_time FROM n_logins l JOIN n_traffic t USING (login_id) WHERE l.account_id = '1655' ORDER BY collect_time LIMIT 1; -- Fduch M. Pravking
В списке pgsql-ru-general по дате отправления: