1. Під час співбесіди я зіткнувся з проблемою: написати таблицю з двома полями id і name, запитати всі дані з дублікатними іменами, а тепер перелічити наступне:
2. Після запиту до всіх даних для групування, нижче наведено дані запиту про кількість повторень дублікатних даних:
3. Нижче наведено перегляд результатів інших, і тепер наведено наступне: Повний перелік методів запитів і видалення дублікатів записів
1. Знайдіть дубловані записи в таблиці, і дублікати записів оцінюються за одним полем (peopleId).
2. Видалити дублікатні записи в таблиці, і дублікати оцінюються за одним полем (peopleId), залишаючи лише записи з найменшим rowid
3. Знайдіть резервні дублікати записів (кілька полів) у таблиці
4. Видаліть зайві дублікати записів (кілька полів) у таблиці, залишивши лише записи з найменшим рядковим номером
5. Знайдіть у таблиці надлишкові дублікати записів (кілька полів) і не містять записів з найменшим рядковим значенням
(два)
Наприклад У таблиці A є поле «name», І значення «name» може бути однаковим для різних записів, Тепер потрібно звертатися до предметів із дубльованими значеннями «імені» між записами в таблиці;
Якщо стать також однакова, то це так:
(три)
Метод 1
Метод 2 «Дубльовані записи» мають два значення дублікатних записів: одне — повністю дубльований запис, тобто запис із усіма дубльованими полями, а інше — запис із дубльованими частинами ключових полів, наприклад, дубльоване поле Ім'я, тоді як інші поля не обов'язково дубльовані або всі дублікати можна ігнорувати.
1. Для першого типу повторення його відносно легко розв'язати та використовувати
Ви можете отримати набір результатів без дублікатів записів.
Якщо таблиця потребує видалення дублікатів записів (зберігається 1 дубльований запис),
Ви можете видалити його наступним чином
Це дублювання виникає через погану структуру таблиць і може бути вирішене додаванням унікальних індексних стовпців.
2. Такий тип задачі дублювання зазвичай вимагає збереження першого запису в дублікатному записі, і метод операції виглядає так: Припускаючи, що існують дублікати як Ім'я та Адреса, потрібен унікальний набір результатів цих двох полів
Останній вибір отримує набір результатів Ім'я та Адреса, які не повторюються (але є додаткове поле autoID, яке можна записати у клаузу select під час фактичного запису)
(4)
Запити дублюються
|