Что быстрее: SELECT DISTINCT или отдельная таблица

103

proksey-net

10 июля 2015, 12:32

887

Уважаемые знатоки MySQL!

Допустим, есть таблица комментариев. И в ней поле E-mail, при этом поле, естественно, может повторяться, т.к. один пользователь может оставить несколько комментариев. В админке нужно выводить список всех E-mail. Так вот есть два способа решения:

1) отдельная таблица emails с UNIQUE email, туда добавляется E-mail каждый раз при написании нового комментария, как INSERT IGNORE.

2) SELECT DISTINCT email FROM comments, при этом у email есть индекс INDEX.

Что быстрее? Будет ли MySQL-сервер при запросе SELECT DISTINCT email считывать просто все подряд из индекса или будет перебирать всю таблицу?

Спасибо!

Мой совет помог? Не скупись! Bitcoin 1Lseddet1o1B6odgXQHbGaWGwRkt1Db8Ef Ethereum 0x450f1a17461e25194B7F9226cDEe70173F39e1e1

K

45

kostyanet

10 июля 2015, 12:49

#1

По заповедям тексты не должны повторяться. Зачем инсерт игноре - инсерт и дубликате ки убдате

MYSQL PHP JS HTML CSS SEO TXT США СССР

196

lutskboy

10 июля 2015, 13:21

#2

Зачем отдельная таблица если данные будут выводиться только в админке.

Да и не в админке тоже.

SELECT DISTINCT и все

или GROUP BY

K

45

kostyanet

10 июля 2015, 16:37

#3

Админка тут временно. Позже ТС может захотеть сделать рассылку по этим адресам, или банить по адресу, или продать их кому-нить на спам, или порыться через них в социале и собрать все досье.

Следовательно нужна каноничная таблица users с той лишь разницей что поле passw может быть null. Автоматическое добавление юзера по введенному имейлу делается через тот самый запрос. Прицепить такую таблицу к каментам по user_id еще более каноничная и тривиальная задача.

Ну то есть обычная юзерская схема, только вся гостевая, или не вся, а только тех, у кого пассв - нул.

PHP + MYSQL. Задача Правила раздела. Обсуждение Портал на нескольких движках

PN

103

proksey-net

10 июля 2015, 19:14

#4

если что, это был гипотетический вопрос, никакой таблицы комментариев и емейлов нет:)я мог вместо E-mail придумать любое другое поле. Вопрос именно в скорости работы SELECT DISTINCT и выборки из отдельной таблицы.

Вопрос по выборке с Вопрос по запросу SQL Помогите составить запрос

RS

1

RemontSajtov

11 июля 2015, 22:43

#5

proksey-net:
если что, это был гипотетический вопрос, никакой таблицы комментариев и емейлов нет:)я мог вместо E-mail придумать любое другое поле. Вопрос именно в скорости работы SELECT DISTINCT и выборки из отдельной таблицы.

Если так, то SELECT email FROM быстрее чем SELECT DISTINCT email FROM, при стандартных настройках и архитектуре СУБД.

L

272

livetv

3 августа 2015, 12:20

#6

Конечно же SELECT без DISTINCT быстрее SELECT c DISTINCT :)

K

45

kostyanet

3 августа 2015, 20:04

#7

proksey-net:
Вопрос именно в скорости работы SELECT DISTINCT и выборки из отдельной таблицы.

Нет, вопрос именно в парадигме. Или вы заполняете базу хламом и потом разгребаете его в рабочем порядке как программисты делают, или вы заполняете базу фактами и оперируете их отношениями как делают инженеры БД.

1

775

edogs software

3 августа 2015, 20:09

#8

proksey-net:
Уважаемые знатоки MySQL!
Допустим, есть таблица комментариев. И в ней поле E-mail, при этом поле, естественно, может повторяться, т.к. один пользователь может оставить несколько комментариев. В админке нужно выводить список всех E-mail. Так вот есть два способа решения:
1) отдельная таблица emails с UNIQUE email, туда добавляется E-mail каждый раз при написании нового комментария, как INSERT IGNORE.
2) SELECT DISTINCT email FROM comments, при этом у email есть индекс INDEX.

Что быстрее? Будет ли MySQL-сервер при запросе SELECT DISTINCT email считывать просто все подряд из индекса или будет перебирать всю таблицу?

Спасибо!

Разницы в скорости не будет, будет считывать все из индекса.

---------- Добавлено 03.08.2015 в 23:13 ----------

kostyanet:
Нет, вопрос именно в парадигме. Или вы заполняете базу хламом и потом разгребаете его в рабочем порядке как программисты делают, или вы заполняете базу фактами и оперируете их отношениями как делают инженеры БД.

Нормальный человек делает так, как лучше в конкретной ситуации. Хороший программист отлично знает про нормализацию и когда ее использовать, хороший инженер отлично знает про денормализацию и когда ее использовать.

Разработка крупных и средних проектов. Можно с криптой. Разумные цены. Хорошее качество. Адекватный подход. Продаем lenovo legion в спб, дешевле магазинов, новые, запечатанные. Есть разные. skype: edogssoft

SQL | Много таблиц Сложная выборка SQL Спасите, помогите... checkbox

K

45

kostyanet

4 августа 2015, 02:52

#9

Программист и напишет "использовать нормализацию", как будто бы это надстройка, а не базис.

Что делать, чтобы попасть в ответы Google Bard

Вышел новый Яндекс Браузер с YandexGPT и YandexART