Все книги Импринты Бестселлеры Бесплатные Скидки Подборки Книги людям

16+

Бесплатный фрагмент - Безопасность систем баз данных

Name: Безопасность систем баз данных
Author: Антон Лошманов

Для студентов

Антон Лошманов

Объем: 160 бумажных стр.

Формат: epub, fb2, pdfRead, mobi

Подробнее

0.00 Оценить

О книге отзывы Оглавление Читать фрагмент

Введение

Развитие компьютерных технологий, связанных с хранением и обработкой данных, привело к появлению с середины 1960-х гг понятия базы данных и специализированного программного обеспечения, получившего название систем управления базами данных (СУБД) — DataBase Management Systems, (DBMS).

База данных (БД) — это поименованная совокупность структурированных данных, относящихся к определенной предметной области. По технологии обработки данных базы данных подразделяются на централизованные и распределенные (клиент-серверные).

СУБД — это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. СУБД позволяют структурировать, систематизировать и организовывать данные для их компьютерного хранения и обработки. Именно системы управления базами данных являются основой практически любой информационной системы.

В данном пособии рассмотрены основные этапы проектирования реляционных баз данных как наиболее широко используемых в настоящее время. В учебном пособии особенно уделяется внимание вопросам информационной безопасности систем баз данных. Рассмотрены основные модели разграничения доступа.

Для студентов, обучающихся по специальностям группы «информационная безопасность».

1 ПРОЕКТИРОВАНИЕ РЕЛЯЦИОННОЙ БАЗЫ ДАННЫХ

1.1 Теория реляционных баз данных, нормальные формы

Принципы реляционной модели были сформулированы в 1969—1970 годах Э. Ф. Коддом (E. F. Codd). Идеи Кодда были впервые публично изложены в статье «A Relational Model of Data for Large Shared Data Banks», ставшей классической.

Обратимся к википедии для определения реляционной модели данных.

Реляционная модель данных (РМД) — логическая модель данных, прикладная теория построения баз данных, которая является приложением к задачам обработки данных таких разделов математики, как теория множеств и логика первого порядка.

С появлением теории реляционных баз данных на смену хранилищам в файловых системах пришли реляционные системы управления базами данных (РСУБД).

Основа теории реляционной модели данных — это нормальные формы (НФ). Для корректного представления и обработки данных существует шесть нормальных форм.

Основные достоинства данного подхода:

1. Позволяет исключить избыточность.

2. Процесс обновления данных становиться простым.

3. Можно легко расширять и дополнять БД, так как она будет отражать сущности реального мира.

4. Проверка целостности данных будет осуществляться за счет БД.

Работу с РСУБД невозможно представить себе без НФ. Давайте рассмотрим шесть НФ.

1.1.1 Первая нормальная форма

Переменная отношения находится в первой нормальной форме (1НФ), когда в любом допустимом значении отношения каждый его кортеж содержит только одно значение для каждого из атрибутов.

В реляционной модели отношение всегда находится в первой нормальной форме по определению понятия отношение. Что же касается различных таблиц, они могут не быть правильными представлениями отношений и, соответственно, могут не находиться в 1НФ.

Рисунок 1.1.2 — Пример приведения к первой нормальной форме

1.1.2 Вторая нормальная форма

Переменная отношения находится во второй нормальной форме, когда она находится в первой нормальной форме, и каждый неключевой атрибут неприводимо (функционально полно) зависит от её потенциального ключа.

В этой таблице первичные ключи представлены в виде двух столбцов — категория и дата акции. Схема функционально зависит от категории и не зависит от даты — т.е. зависимость идет от первичного ключа частично. Приведем таблицу ко второму нормальному виду.

Рисунок 1.1.4 — Пример приведения ко второй нормальной форме

Рисунок 1.1.5 — Пример приведения ко второй нормальной форме

1.1.3 Третья нормальная форма

Переменная отношения находится в третьей нормальной форме тогда и только тогда, когда она находится во второй нормальной форме, и отсутствуют транзитивные функциональные зависимости неключевых атрибутов от ключевых. Привести к третьей нормальной форме — это значит выделить из таблицы первичный ключ, который будет уникально идентифицировать запись в таблице.

Рисунок 1.1.6 — Пример приведения к третьей нормальной форме

Рисунок 1.1.7 — Пример приведения к третьей нормальной форме

Рисунок 1.1.8 — Пример приведения к третьей нормальной форме

1.1.4 Нормальная форма Бойса-Кодда

Переменная отношения находится в нормальной форме Бойса-Кодда (иначе — в усиленной третьей нормальной форме), когда каждая её нетривиальная и неприводимая слева функциональная зависимость имеет в качестве своего детерминанта некоторый потенциальный ключ.

Другими словами, в таблице должен быть только один первичный ключ.

1.1.5 Четвёртая нормальная форма

Переменная отношения находится в четвертой нормальной форме, если она находится в нормальной форме Бойса-Кодда и не содержит нетривиальных многозначных зависимостей. Предположим, что рестораны производят разные виды пиццы, а службы доставки ресторанов работают только в определенных районах города. Составной первичный ключ соответствующей переменной отношения включает три атрибута: {Ресторан, Вид пиццы, Район доставки}.

Такая переменная отношения не соответствует 4НФ, так как существует следующая многозначная зависимость: {Ресторан} — {Вид пиццы}, {Ресторан} — {Район доставки}.

То есть, например, при добавлении нового вида пиццы придется внести по одному новому кортежу для каждого района доставки. Возможна логическая аномалия, при которой определенному виду пиццы будут соответствовать лишь некоторые районы доставки из обслуживаемых рестораном районов.

Для предотвращения аномалии нужно декомпозировать отношение, разместив независимые факты в разных отношениях. В данном примере следует выполнить декомпозицию на {Ресторан, Вид пиццы} и {Ресторан, Район доставки}.

Однако, если к исходной переменной отношения добавить атрибут, функционально зависящий от потенциального ключа, например, цену с учётом стоимости доставки ({Ресторан, Вид пиццы, Район доставки} — Цена), полученное отношение будет находиться в 4НФ и его уже нельзя подвергнуть декомпозиции без потерь.

1.1.6 Пятая нормальная форма

Переменная отношения находится в пятой нормальной форме (иначе — в проекционно-соединительной нормальной форме), когда каждая нетривиальная зависимость соединения в ней определяется потенциальным ключом (ключами) этого отношения.

Другими словами, если есть сложная связь между зависимыми атрибутами, она должна выноситься в отдельную таблицу. Не нужно делать зависимость трех и более атрибутов. На практике такое встречается очень редко, но придерживаться данного правила необходимо.

1.1.7 Доменно-ключевая нормальная форма

Переменная отношения находится в ДКНФ, когда каждое наложенное на неё ограничение является логическим следствием ограничений доменов и ограничений ключей, наложенных на данную переменную отношения.

1.1.8 Шестая нормальная форма

Переменная отношения находится в шестой нормальной форме, когда она удовлетворяет всем нетривиальным зависимостям соединения. Из определения следует, что переменная находится в 6НФ, когда она неприводима, то есть не может быть подвергнута дальнейшей декомпозиции без потерь. Каждая переменная отношения, которая находится в 6НФ, также находится и в 5НФ.

Введена К. Дейтом в его книге как обобщение пятой нормальной формы для хронологической базы данных.

Практическое применение

Из всех представленных форм практическое применение обычно имеют первые четыре НФ. Наши схемы мы будем создавать на основе четырех НФ.

1.2 Типы данных в MySQL

Для успешного проектирования РСУБД недостаточно понимания нормальных форм. Как известно, объем данных, которые необходимо сохранить, практически не ограничен (пример — математические числа), но память компьютера имеет предел. Поэтому мы ограничены набором типов данных, каждый из них ограничен своим набором байт.

Также практическое понимание типов данных необходимо для построения быстрого и эффективного поиска по БД.

Разберемся, какие есть типы данных в MySQL. Типы данных соответствуют стандартам ANSI SQL.

TINYINT [(M)] [UNSIGNED] [ZEROFILL]

Очень малое целое число. Диапазон со знаком от -128 до 127. Диапазон без знака от 0 до 255.

BIT, BOOL

Являются синонимами для TINYINT (1).

SMALLINT [(M)] [UNSIGNED] [ZEROFILL]

Малое целое число. Диапазон со знаком от -32768 до 32767. Диапазон без знака от 0 до 65535.

MEDIUMINT [(M)] [UNSIGNED] [ZEROFILL]

Целое число среднего размера. Диапазон со знаком от -8388608 до 8388607. Диапазон без знака от 0 до 16777215.

INT [(M)] [UNSIGNED] [ZEROFILL]

Целое число нормального размера. Диапазон со знаком от -2147483648 до 2147483647. Диапазон без знака от 0 до 4294967295.

INTEGER [(M)] [UNSIGNED] [ZEROFILL]

Синоним для INT.

BIGINT [(M)] [UNSIGNED] [ZEROFILL]

Большое целое число. Диапазон со знаком от -9223372036854775808 до 9223372036854775807. Диапазон без знака от 0 до 18446744073709551615. Для столбцов типа BIGINT необходимо учитывать некоторые особенности:

Все арифметические операции выполняются с использованием значений BIGINT или DOUBLE со знаком, так что не следует использовать беззнаковые целые числа больше чем 9223372036854775807 (63 бита), кроме операций, выполняемых логическими функциями. В противном случае несколько последних разрядов результата могут оказаться неверными из-за ошибок округления при преобразовании BIGINT в DOUBLE. MySQL 4.0 может обрабатывать данные типа BIGINT в следующих случаях:

• Использование целых чисел для хранения больших беззнаковых величин в столбце с типом BIGINT.

• В случаях MIN (big_int_column) и MAX (big_int_column).

• При использовании операторов (»+», «-», «*» и т.д.), когда оба операнда являются целыми числами.

Точное значение целого числа всегда можно хранить в столбце с типом BIGINT в виде строки. В этом случае MySQL выполнит преобразование строки в число без промежуточного преобразования.

Если оба аргумента являются целочисленными величинами, при выполнении над ними операций «+», «-» и «*» будут использоваться правила BIGINT-арифметики. Это означает, что при умножении двух больших целых чисел (или результатов вычислений функций, возвращающих целые числа) результат операции может оказаться непредсказуемым, если он превосходит значение 9223372036854775807.

FLOAT (точность) [UNSIGNED] [ZEROFILL]

Число с плавающей точкой. Атрибут точности может иметь значение <=24 для числа с плавающей точкой обычной (одинарной) точности и между 25 и 53 — для числа с плавающей точкой удвоенной точности. Эти типы данных сходны с типами FLOAT и DOUBLE, описанными ниже. FLOAT (X) относится к тому же интервалу, что и соответствующие типы FLOAT и DOUBLE, но диапазон значений и количество десятичных знаков не определены.

Следует отметить, что использование типа данных FLOAT может привести к неожиданным проблемам, так как все вычисления в MySQL выполняются с удвоенной точностью.

FLOAT [(M,D)] [UNSIGNED] [ZEROFILL]

Малое число с плавающей точкой обычной точности. Допустимые значения: от -3,402823466E+38 до -1,175494351E-38, 0, и от 1,175494351E-38 до 3,402823466E+38. Если указан атрибут UNSIGNED, отрицательные значения недопустимы. Атрибут M указывает количество выводимых пользователю знаков, а атрибут D — количество разрядов, следующих за десятичной точкой. Обозначение FLOAT без указания аргументов или запись вида FLOAT (X), где X <=24 справедливы для числа с плавающей точкой обычной точности.

DOUBLE [(M,D)] [UNSIGNED] [ZEROFILL]

Число с плавающей точкой удвоенной точности нормального размера. Допустимые значения: от -1,7976931348623157E+308 до -2,2250738585072014E-308, 0, и от 2,2250738585072014E-308 до 1,7976931348623157E+308. Если указан атрибут UNSIGNED, отрицательные значения недопустимы. Атрибут M указывает количество выводимых пользователю знаков, а атрибут D — количество разрядов, следующих за десятичной точкой. Обозначение DOUBLE без указания аргументов или запись вида FLOAT (X), где 25 <= X <= 53 справедливы для числа с плавающей точкой двойной точности.

DOUBLE PRECISION [(M,D)] [UNSIGNED] [ZEROFILL], REAL [(M,D)] [UNSIGNED] [ZEROFILL]

Данные обозначения являются синонимами для DOUBLE.

DECIMAL [(M [,D])] [UNSIGNED] [ZEROFILL]

«Неупакованное» число с плавающей точкой. Ведет себя подобно столбцу CHAR, содержащему цифровое значение. Термин «неупакованное» означает, что число хранится в виде строки, и при этом для каждого десятичного знака используется один символ. Разделительный знак десятичных разрядов, а также знак «-» для отрицательных чисел, не учитываются в M (но место для них зарезервировано). Если атрибут D равен 0, величины будут представлены без десятичного знака, т. е. без дробной части. Максимальный интервал значений типа DECIMAL тот же, что и для типа DOUBLE, но действительный интервал для конкретного столбца DECIMAL может быть ограничен выбором значений атрибутов M и D. Если указан атрибут UNSIGNED, отрицательные значения недопустимы. Если атрибут D не указан, его значение по умолчанию равно 0. Если не указан M, его значение по умолчанию равно 10. В более ранних, чем MySQL 3.23, версиях аргумент M должен содержать в себе место для знака числа и десятичного знака.

DEC [(M [,D])] [UNSIGNED] [ZEROFILL], NUMERIC [(M [,D])] [UNSIGNED] [ZEROFILL]

Данные обозначения являются синонимами для DECIMAL.

DATE

Дата. Поддерживается интервал от «1000-01-01» до «9999-12-31». MySQL выводит значения DATE в формате «YYYY-MM-DD», но можно установить значения в столбец DATE, используя как строки, так и числа.

DATETIME

Комбинация даты и времени. Поддерживается интервал от «1000-01-01 00:00:00» до «9999-12-31 23:59:59». MySQL выводит значения DATETIME в формате «YYYY-MM-DD HH: MM: SS», но можно устанавливать значения в столбце DATETIME, используя как строки, так и числа.

TIMESTAMP [(M)]

Временная метка. Интервал от «1970-01-01 00:00:00» до некоторого значения времени в 2037 году. MySQL выводит значения TIMESTAMP в форматах YYYYMMDDHHMMSS, YYMMDDHHMMSS, YYYYMMDD или YYMMDD в зависимости от значений M: 14 (или отсутствующее), 12, 8, или 6; но можно также устанавливать значения в столбце TIMESTAMP, используя как строки, так и числа. Столбец TIMESTAMP полезен для записи даты и времени при выполнении операций INSERT или UPDATE, так как при этом автоматически вносятся значения даты и времени самой последней операции, если эти величины не введены программой. Можно также устанавливать текущее значение даты и времени, задавая значение NULL. Аргумент M влияет только на способ вывода столбца TIMESTAMP; для хранения его значений всегда используется 4 байта. Следует учитывать, что столбцы TIMESTAMP (M), где M равно 8 или 14, представляют собой числа, в то время, как столбцы TIMESTAMP (M) с иным значением аргумента M являются строками. Это убеждает, что можно надежно сделать дамп и восстановить таблицу с этими типами столбцов!

TIME

Время. Интервал от '-838:59:59» до «838:59:59». MySQL выводит значения TIME в формате «HH: MM: SS», но можно устанавливать значения в столбце TIME, используя как строки, так и числа.

YEAR [(2|4)]

Год в двухзначном или четырехзначном форматах (по умолчанию формат четырехзначный). Допустимы следующие значения: с 1901 по 2155, 0000 для четырехзначного формата года и 1970—2069 при использовании двухзначного формата (70—69). MySQL выводит значения YEAR в формате YYYY, но можно задавать значения в столбце YEAR, используя как строки, так и числа (тип данных YEAR недоступен в версиях, предшествующих MySQL 3.22).

[NATIONAL] CHAR (M) [BINARY]

Строка фиксированной длины, при хранении всегда дополняется пробелами в конце строки до заданного размера. Диапазон аргумента M составляет от 0 до 255 символов (от 1 до 255 в версиях, предшествующих MySQL 3.23). Концевые пробелы удаляются при выводе значения. Если не задан атрибут чувствительности к регистру BINARY, величины CHAR сортируются и сравниваются как независимые от регистра в соответствии с установленным по умолчанию алфавитом.

Атрибут NATIONAL CHAR (или его эквивалентная краткая форма NCHAR) представляет собой принятый в ANSI SQL способ указания, что в столбце CHAR должен использоваться установленный по умолчанию набор символов (CHARACTER). В MySQL это принято по умолчанию. CHAR является сокращением от CHARACTER. MySQL позволяет создавать столбец типа CHAR (0).

В основном это полезно, если необходимо обеспечить совместимость с некоторыми старыми приложениями, которые зависят от наличия столбца, но реально эту величину не используют. Кроме того, такая возможность может очень пригодиться в случае, если необходим столбец, который может содержать только 2 значения, а именно CHAR (0) (т.е. столбец, который не определен как NOT NULL, занимает только один бит и принимает только 2 значения: NULL или «»).

CHAR

Это синоним для CHAR (1).

[NATIONAL] VARCHAR (M) [BINARY]

Строка переменной длины. Примечание: концевые пробелы удаляются при сохранении значения (в этом заключается отличие от спецификации ANSI SQL). Диапазон аргумента M составляет от 0 до 255 символов (от 1 до 255 в версиях, предшествующих MySQL Version 4.0.2). Если не задан атрибут чувствительности к регистру BINARY, величины VARCHAR сортируются и сравниваются как независимые от регистра.

TINYBLOB, TINYTEXT

Столбец типа BLOB или TEXT с максимальной длиной 255 (280254 — 1) символов.

BLOB, TEXT

Столбец типа BLOB или TEXT с максимальной длиной 65535 (216—1).

MEDIUMBLOB, MEDIUMTEXT

Столбец типа BLOB или TEXT с максимальной длиной 16777215 (224—1).

LONGBLOB, LONGTEXT

Столбец типа BLOB или TEXT с максимальной длиной 4294967295 (232—1) символов. Следует учитывать, что в настоящее время протокол передачи данных сервер/клиент и таблицы MyISAM имеют ограничение 16 Мб на передаваемый пакет/строку таблицы, поэтому пока нельзя использовать этот тип данных в его полном диапазоне.

ENUM («значение1», «значение2», …)

Перечисление. Перечисляемый тип данных. Объект строки может иметь только одно значение, выбранное из заданного списка величин «значение1», «значение2», …, NULL или специальная величина ошибки «». Список ENUM может содержать максимум 65535 различных величин.

SET («значение1», «значение2», …)

Набор. Объект строки может иметь ноль или более значений, каждое из которых должно быть выбрано из заданного списка величин «значение1», «значение2», … Список SET может содержать максимум 64 элемента.

Практическое применение

На практике чаще всего используются INT, FLOAT, VARCHAR, TEXT, DATETIME, TIMESTAMP. Этими типами данных можно описать любую таблицу. Но знание и понимание типов данных необходимо, потому что встречаются задачи, где их использование необходимо.

1.3 Ключи

Первичный ключ

В РСУБД существует несколько видов ключей. Самый главный — первичный. Он уникально идентифицирует строку данных, без него приведение к 4НФ было бы невозможно.

Первичный ключи обладает следующими свойствами:

1. Уникальность.

2. Долговечность.

3. Минимальность

Первичный ключ может быть простым или составным. Если первичный ключ состоит из нескольких атрибутов, он является составным.

Уникальный ключ

Уникальный ключ обладает всеми свойствами первичного, но первичным не является. Используется для уникальных атрибутов (например номер банковского счета, email-адрес).

Внешний ключ

Внешний ключ является ключом — ссылкой, связью между таблицами. Внешние ключи используются для проверки РСУБД на целостность. Если атрибут, на который указывает внешний ключ, не будет присутствовать в таблице, на которую он указывает, это приведет к ошибке.

1.4 Индексы и алгоритмы поиска

Давайте представим себе ситуацию: перед нами стоит задача найти в упорядоченном списке число. Допустим, у нас есть список из 1000 элементов, нас интересует элемент под номером 521.

Рисунок 1.4.1 — Список элементов (временный)

Первый алгоритм, который может прийти нам в голову, это простой перебор через цикл со сравнением с заданным числом. Для того, чтобы найти в этом списке интересующий нас элемент, нам необходимо сделать 521 шаг цикла. Потенциально, это может быть очень медленно и проблематично.

Рисунок 1.4.2 — Алгоритм перебора (временный)

Данную проблему может решить алгоритм быстрого поиска по упорядоченному списку — метод деления пополам. Допустим, нам необходимо найти все то же число 521. Давайте разделим наш числовой ряд пополам и проверим, в какой части осталось число 521.

Рисунок 1.4.3 — Метод деления пополам (временный)

Результат будет 500 <521. Значит интересующее нас число больше. Делим пополам правую часть и сравниваем снова. Продолжаем выполнять эту операцию до тех пор, пока не находим исходное число.

Рисунок 1.4.4 — Деление пополам правой части

При применении данного метода мы можем за 4–5 шагов найти любое интересующее нас значение. Насколько мы видим, данный метод очень эффективен.

Это был простейший пример поиска в отсортированном списке. В современных СУБД реализовано много алгоритмов поиска, по разным типам данных и структурам. Механизм, обеспечивающий возможности ускоренного поиска, называется индексом.

В MySQL есть несколько видов индексов — binary tree (B-Tree) и hash table.

Hash-индекс применяется для сравнения/построения индексов строчных и/или двоичных данных. Каждому значению индексируемого выражения сопоставляется значение определенной хэш-функции, отображающей исходное значение на целое число (иногда на строку).

B-Tree индекс дает скорость выборки порядка log (N), hash дает линейную. В реальной жизни hash и B-Tree применяются совместно, то есть для вычисления значений B-Tree индекса все равно применяются хэши.

Если мы объявляем ключи, индексы на эти поля создаются автоматически, так как ключи проверяют структуру данных на целостность, что является очень трудозатратной вычислительной операцией. Для их оптимизации индексы проставляются механизмом MySQL. Но если нам нужен индекс на неключевом поле, значит нам нужно будет создать его вручную.

Также есть специальный тип индексов — full text. Он используется для построения индекса по текстовым полям с большим объемом символов.

1.5 Практическая работа

Учимся вместе проектировать базу данных в MySQL Workbench — строить таблицы, выбирать тип данных — на примере интернет-магазина.

Для начала надо установить Workbench. Скачать его можно по ссылке:

https://dev.mysql.com/downloads/workbench/

Наша задача состоит в построении простой схемы карточки товаров и корзины в интернет-магазине. Схема должна состоять из следующих таблиц:

2 SQL — команды DDL

2.1 Data Definition Language (DDL)

Data Definition Language (DDL) — это язык, с помощью которого можно описать структуру данных в БД. Пользуясь DDL, можно создать и удалить БД, добавить таблицу с любой структурой и связями, изменить и удалить таблицу.

Команды делятся на три вида: create, alter, drop. С помощью этих команд можно провести любые операции с БД и её составляющими.

Далее мы обзорно рассмотрим синтаксис всех трех команд.

2.2 Создание базы данных

Для создания БД используется следующая команда:

Команда создает базу данных с именем «db_name».

Ключ [IF NOT EXISTS] используется для проверки на существование базы данных. Если ключ не указан и база данных существует, это приведет к возникновению ошибки.

2.3 Создание таблицы

Команда позволяет создать таблицу с именем «tbl_name». Также как и в случае создания БД, есть флаг проверки [IF NOT EXISTS], который позволяет проверить на существование в БД таблицы с аналогичным именем.

[TEMPORARY] позволяет создать таблицу только на текущую сессию. Сразу после завершения сессии таблица будет удалена.

2.4 Объявление полей в БД

При объявлении столбца объявляется тип данных, а также ряд дополнительных опций data_type [NOT NULL | NULL] [DEFAULT default_value].

[NOT NULL | NULL] используется для проверки в колонке нулевого/ненулевого значения. При добавлении данных поле может быть обязательным, для этого мы должны использовать флаг [NOT NULL].

[DEFAULT default_value] используется для задания полю значения по умолчанию.

При объявлении полей в БД мы можем сразу присвоить значение ключевым полям — [UNIQUE [KEY] | [PRIMARY] KEY, также поле можно создать с опцией [AUTO_INCREMENT], что позволит каждый раз при добавлении новых данных увеличивать значение поля на единицу. Используется для отслеживания уникальности первичного ключа.

[COMMENT ’string’] позволяет написать комментарий к полю в БД. Очень удобно просматривать комментарии при работе с БД. Комментировать необходимо действительно важные значения.

[STORAGE {DISK|MEMORY|DEFAULT}] определяет носитель, куда будут записываться данные, — на диск или в оперативную память.

2.5 Объявление ключей и индексов

Рисунок 2.5.1 — Объявление ключей и индексов

При объявлении ключа мы должны задать его имя [CONSTRAINT [symbol]], далее объявляется тип ключа — PRIMARY KEY | UNIQUE [INDEX|KEY] | FOREIGN KEY.

Так же можно объявить индекс. Индексы используются для быстрого поиска.

2.6 Внешний ключ

Рисунок 2.6.1 — Объявление внешнего ключа

Чтобы внешний ключ был создан корректно, необходимо, чтобы тип данных колонки в таблице совпадал с типом данных колонки, на которую этот ключ указывает.

Объявление самого внешнего ключа не отличается от объявления других ключей, только в дополнение к ним имеется ряд опций.

REFERENCES tbl_name (index_col_name, …) — указывает, на какую таблицу ссылается внешний ключ.

ON DELETE, ON UPDATE — операции, которые выполняются при удалении или изменении связанной записи — для этого существуют опции RESTRICT | CASCADE | SET NULL | NO ACTION — выбросить ошибку, удалить связанные данные, установить данные в значение NULL, не выполнять никаких действий.

Благодаря внешнему ключу контролируется целостность связанных данных.

2.7 Alter table

Данная команда позволяет изменить структуру таблицы — добавить, изменить и удалить колонку в таблице.

Как видно из спецификации команды, мы можем осуществить любые операции по изменению таблицы, пользуясь данной командой.

Команда может выступать в нескольких ипостасях в зависимости от опций:

• ADD — добавить в таблицу колонку, ключ, индекс.

• CHANGE — изменить имя колонки.

• DROP — удалить колонку, ключ, индекс.

• RENAME — сменить имя таблице.

• CONVERT TO CHARACTER SET — сменить кодировку.

2.8 Drop

Синтаксис для удаления БД:

Синтаксис для удаления таблицы:

Оператор DROP используется для удаления БД или таблицы. Синтаксис очень простой.

[IF EXISTS] перед удалением проверяет наличие данной БД или таблицы.

[RESTRICT | CASCADE] удалит связанные таблицы или выдаст ошибку.

2.9 Практическая работа

Создадим БД «Страны и города мира» с помощью готовых скриптов, приложенных к уроку. Научимся делать импорт SQL-файлов.

• Подключаемся к MySQL с помощью команды:

• Можно использовать пользователя root, которого мы создали при установке MySQL:

Рисунок 2.9.2 — Подключение от имени пользователя root

• Для того, чтобы создать базу данных используется команда:

Рисунок 2.9.3 — создание базы данных geodata

• Выходим из MySQL Shell, введя команду «exit».

Рассмотрим подробнее файлы для создания БД:

• Tables. sql — файл, который содержит в себе структуру БД, команды DDL для создания схемы.

• _cities. sql, _countries. sql, _regions. sql — файлы необходимые для импорта данных.

В этой практической работе мы импортируем схему и данные. Для этого используется команда:

Рисунок 2.9.4 — Импортирование данных в БД

3 SQL-команды DML

3.1 Типы команд DML

Data Manipulation Language (DML) (язык управления или манипулирования данными) — это семейство компьютерных языков, используемых в компьютерных программах или пользователями баз данных для получения, вставки, удаления или изменения данных в базах данных.

Функции языков DML определяются первым словом в предложении (часто называемом запросом), которое почти всегда является глаголом. В случае с SQL эти глаголы — «select» («выбрать»), «insert» («вставить»), «update» («обновить»), и «delete» («удалить»). Это превращает код на языке в последовательность обязательных утверждений (команд) относительно базы данных.

Рассмотрим каждую из команд подробно.

3.2 SELECT

Одна из самых сложных по структуре команд в MySQL. Позволяет выбрать любой срез данных из БД. Таблицы можно объединять, данные можно сортировать, объединять, группировать.

Рисунок 3.2.1 — Синтаксис команды SELECT

Рассмотрим теперь отдельно все возможности выборки. Мы можем проводить вычисления, не используя вообще никаких таблиц.

Рисунок 3.2.2 — Вычисления при помощи команды SELECT

Также можно сделать запрос в несуществующую таблицу:

3.2.1 Простые запросы

Рассмотрим типовые запросы при выборке данных:

Рисунок 3.2.4 — Запрос всех данных из таблицы

В данном контексте мы выбираем все поля (*) из таблицы tbl_name. Если мы хотим сделать выборку определенных полей, нам нужно указать их после оператора SELECT.

Рисунок 3.2.5 — Выборка определённых полей из таблицы

Поля можно объединять:

Пользуясь оператором CONCAT, можно сцепить значения колонок в одну. Используя оператор AS, можно задать результирующей колонке специфическое имя full_name.

Рисунок 3.2.7 — Использование оператора CONCAT

3.2.2 DISTINCT

Если нам нужно выбрать только уникальные записи в поле, нужно использовать DISTINCT.

Рисунок 3.2.8 — Использование оператора DISTINCT

3.2.3 WHERE

Теперь рассмотрим условия выборки, для этого у нас есть клауза WHERE:

Рисунок 3.2.9 — Использование условия WHERE

Мы выбираем из таблицы tbl_name поля field1, field2 и указываем дополнительно условие, что поле field1 должно быть равно 20.

В WHERE можно указывать любые условия из булевой алгебры, пользуясь следующим синтаксисом выражений.

3.2.4 Операторы сравнения

Бесплатный фрагмент закончился.

Купите книгу, чтобы продолжить чтение.