Целостность данных
Среди многих опасностей, с которыми может столкнуться вычислительная система, к наиболее серьезным относятся ошибки в данных. Каким образом данные становятся ошибочными? Наиболее общими причинами являются, вторжение со стороны других пользователей и неправильное функционирование системы.
Преднамеренное или нечаянное вторжение одного пользователя в информационный ресурс другого может привести к порче данных. В данном случае система может предоставить средства защиты способами, рассмотренными ранее.
Неправильное функционирование может быть вызвано различными причинами. Например, из-за ошибок при проектировании программа пользователя может быть не в состоянии обрабатывать все вхождения некоторого элемента в многофайловой базе данных. Неправильная синхронизация, может свести всю работу на нет. Некорректные действия может выполнять новая версия программы. Неправильно работать может даже операционная система. Свои ошибки вносит и неправильная работа технических средств. Хотя и редко, но сбивается процессор. Чаще ошибки возникают в подсистеме ввода/вывода: отключаются терминалы; пыль, налипшая на магнитное покрытие, вызывает ошибки чтения; касание головки поверхности диска приводит к потере информация.
Каким образом можно смягчить последствия утраты данных? Лучше всего предвидеть, что утрата данных может произойти. Пользователь может периодически запоминать состояние памяти, выполнять проверку данных и, в случае обнаружения ошибки, осуществлять повторноеисполнение начиная с последней контрольной точки. Как именно выполнять выше сказанное, конечно, во многом зависит от области применения.
Для предотвращения потери информации операционная система может периодически копировать ее с дисков и других устройств, имеющих большую вероятность сбоя, на магнитные ленты, хранимые отдельно от вычислительной системы. Различаются два типа такого копирования: полный дамп и наращиваемый дамп. Полный дамп (иногда называемый “периодическим”) целиком определяется своим названием. Переписывается вся информация, находящаяся на диске. В дальнейшем любой файл может быть воссоздан в том состоянии, которое он имел в момент выполнения дампа. Полный дамп имеет три недостатка:
1. Во время выполнения дампа файловая система должна быть изъята из обслуживания. В противном случае дамп должен будет пропускать те файлы, которые открыты для любой формы записи.
2. Выполнение дампа может занимать несколько часов и представлять значительную нагрузку для системы.
3. Так как время выполнения дампа велико, он может осуществляться редко, например несколько раз в месяц. В таком случае после восстановления информации она может оказаться сильно устаревшей.
При наращиваемом дампе осуществляется копирование только тех файлов и справочников, которые претерпели изменения со времени последнего дампа. Чтобы определить, какие файлы подлежат дублированию, в элементах справочников для каждого файла вводится специальный признак, который устанавливается при изменении файла и сбрасывается при выполнении дампа. Восстановление происходит в порядке, обратном порядке выполнения дампов. С ленты считываются только те файлы, которые не были еще восстановлены. Последней лентой является лента, хранящая самый последний полный дамп. Наращиваемые дампы могут использоваться либо для увеличения интервала между полными дампами, либо для уменьшения интервала между копированиями измененных файлов. Достоинство наращиваемого дампа состоит в том, что он может выполняться параллельно с использованием файловой системы. Его принципиальный недостаток-это сложность процедуры восстановления.
Третьим средством повышения целостности данных, которое в одних системах поддерживается системой, а в других выполняется пользователем это запоминание поколений файла, являющихся версиями одного и того же файла в хронологическом порядке. По крайней мере поддерживаются три поколения: текущий, отцовский и дедовский файлы, чтобы иметь хотя бы одну доступную копию, если две остальные испорчены.