Как удалить дубликаты строк в SQL, оставив по одной?

Question

В users есть полные дубли по email (по 2-3 одинаковых записи). Хочу почистить так, чтобы остался ровно один экземпляр каждого. Как удалить лишние, не снеся вообще все повторы?

Владимир Григорьев · Accepted Answer

Идея: оставляем строку с минимальным id в каждой группе, остальные удаляем. На MySQL/PostgreSQL надёжно работает так: Внутренний подзапрос возвращает «победителя» каждой группы (самый ранний id), а DELETE сносит всё, чего нет в этом списке. Обёртка через AS keep нужна, потому что MySQL не даёт читать ту же таблицу, которую удаляешь, напрямую. Обязательно сначала прогони этот SELECT отдельно и проверь, что он возвращает то, что ты ждёшь. И сделай бэкап.

Иван Иванов · Answer

В современном PostgreSQL удобнее через оконную функцию: ROWNUMBER нумерует строки внутри каждого email, и мы валим всё, где номер больше 1.

Иван Соловьёв · Answer

Просто DISTINCT поставь и всё.

Как удалить дубликаты строк в SQL, оставив по одной?

3 ответа

Ваш ответ