В чём разница между RANK() и DENSE_RANK() в SQL?

Question

Использую оконные функции для ранжирования и наткнулся на две похожие: RANK() и DENSERANK(). На первый взгляд делают одно и то же. В чём между ними разница, особенно когда есть одинаковые значения (ничьи)? И чем они отличаются от ROWNUMBER()? Пример на SQL приветствуется.

Вероника Морозова · Accepted Answer

Все три функции — ROWNUMBER(), RANK(), DENSERANK() — ранжируют строки внутри окна, но по-разному ведут себя при ничьих (одинаковых значениях в ORDER BY). - ROWNUMBER() — всегда уникальные номера 1, 2, 3, ..., даже при равных значениях. Ничьи разрываются произвольно. - RANK() — при ничьей даёт одинаковый ранг, но затем пропускает номера (есть «дырки»). - DENSERANK() — при ничьей даёт одинаковый ранг и не пропускает следующие (без «дырок»). Лучше всего видно на примере. Пусть есть очки игроков: Результат для очков 100, 100, 90, 80: Обратите внимание на строку Clara (90 очков): - ROWNUMBER = 3 —…

Иван Фролов · Answer

Короткая шпаргалка, которую я держу в голове на собеседованиях:

Значения:   100  100  90  80
ROW_NUMBER:   1    2   3   4   (всегда подряд, уникально)
RANK:         1    1   3   4   (ничья → пропуск)
DENSE_RANK:   1    1   2   3   (ничья → без пропуска)

Хороший практический кейс для DENSE_RANK() — найти N-ю по величине различную зарплату. Например, вторая по величине зарплата:

WITH r AS (
    SELECT salary, DENSE_RANK() OVER (ORDER BY salary DESC) AS dr
    FROM employees
)
SELECT DISTINCT salary
FROM r
WHERE dr = 2;

Если бы здесь стоял RANK(), то при нескольких людях с максимальной зарплатой ранг 2 мог бы вообще не существовать — и запрос вернул бы пусто. Поэтому для «N-го уникального значения» правильнее именно DENSE_RANK().

В чём разница между RANK() и DENSE_RANK() в SQL?

2 ответа

Ваш ответ