Терминология резервного копирования: что означает "инкрементальный" и "дифференциальный", и зачем они нужны?

Терминология резервного копирования: что означает "инкрементальный" и "дифференциальный", и зачем они нужны?

Терминология резервного копирования

На протяжении многих лет разрабатывались различные технологии резервного копирования в попытке свести к минимуму объем пространства на диске, необходимого для хранения резервных копий файлов, и уменьшить объем проходящего трафика, необходимого для копирования файлов на удаленные ресурсы (компьютеры, сетевые диски и прочие). В разнообразии методов резервного копирования, предлагаемых программами, можно легко запутаться, так как используемая терминология часто не понятна с первого взгляда и не описывает особенности методов. Кроме того, иногда, с первого взгляда трудно понять преимущества и недостатки какой-либо технологии. Эта статья представляет собой руководство, которое позволит вам разобраться в некоторых используемых терминах, а так же в их различиях, преимуществах и недостатках.

Примечание: В данном руководстве приводится большинство основных используемых методов на сегодняшний день. Понимание их области применения, ограничений, особенностей, преимуществ и недостатков будет более, чем достаточно, чтобы упростить выбор подходящего для вас решения для организации резервного копирования на компьютере.

 

Оглавление

Терминология резервного копирования: что означает "инкрементальный" и "дифференциальный", и зачем они нужны?Общие методы резервного копирования

  1. Полная резервная копия
  2. Дифференциальное резервное копирование
  3. Инкрементальное резервное копирование
  4. Дельта блочное резервное копирование
  5. Бинарные патчи резервных копий


Другие методы и техники резервного копирования

  1. Зеркальные резервные копии
  2. Синтетические полные резервные копии
  3. Резервное копирование с использованием жестких ссылок

Заключительные слова о резервировании

 

1. Полная резервная копия

Это именно то, как это звучит. Это полная копия всех данных, которые пользователь выбирает при настройке задания резервного копирования. Обычно, скопированные файлы помещаются в один архивный файл и сжимаются, чтобы уменьшить размер итоговой резервной копии. Каждый раз, когда создается полная резервная копия, абсолютно все файлы копируются из источника в архив. В этом подходе есть одна существенная проблема. Несмотря на то, что вы изменили или добавили всего несколько файлов, каждый запуск задания резервного копирования будет приводить к полному копированию файлов, что в конечном итоге будет сказываться не только на длительности выполнения операции, но и на занимаемом дисковом пространстве, ведь каждая копия будет содержать массу дублирующихся файлов, которые не отличаются от копии к копии. Вы, конечно, можете удалять старые копии для освобождения места, но времени все равно будет потрачено масса. Кроме того, если речь идет о хранении бэкапов на удаленных ресурсах, то, кроме времени, так же полная копия отразится на протекающем трафике.

Гораздо более лучшей идеей было бы сделать полную копию данных один раз, а затем лишь добавлять или изменять отдельные файлы на более регулярной основе. Существует несколько методов, которые реализуют эту идею, и они описаны ниже.

Преимущества и недостатки создания полных резервных копий

  • Быстрое восстановление всех файлов - Когда необходимо восстановить полную копию файлов, то легче всего это сделать с одним архивным файлом
  • Полные резервные копии занимают много места и отнимают много времени - Полные копии не очень хорошо подходят для регулярного резервного копирования, такого как ежечасное или ежедневное копирование.

 

2. Дифференциальное резервное копирование

После создания архива с полной резервной копией, использование дифференциального резервного копирования помогает уменьшить размер последующих копий, делая их на основе дифференциального сравнения исходных файлов с файлами из последней резервной копии. Все добавленные или измененные файлы копируются в отдельный архив, рядом с полной копией. Важно понимать, что дифференциальные резервные копии являются накопительными. Каждое дифференциальное резервное копирование сохраняет в бэкап все, что отличается с момента последнего полного копирования, даже если эти файлы уже были включены в предыдущей дифференциальной копии. Тем не менее, даже с этим ограничением, дифференциальные бэкапы создаются гораздо быстрее и занимают меньше места, чем при использовании метода полного резервного копирования. Поэтому данный метод хорошо подходит для ежедневных или более частых регулярных заданий резервного копирования.

Дифференциальное резервное копирование

Преимущества и недостатки дифференциального резервного копирования

  • Быстрое восстановление, по сравнению с другими методами - Для полного восстановления всех файлов из резервной копии, вам нужны только два архива: архив с полной копией и последний дифференциальный бэкап.
  • Дифференциальные бэкапы занимают больше места, по сравнению с аналогами - Используемый подход позволяет более эффективно использовать место на диске и создавать резервные копии быстрее, чем при создании полной резервной копии, но все же данный метод все еще содержит избыточные данные.
  • Каждый последующий дифференциальный бэкап значительно возрастает - Так как файлы сравниваются только с полной резервной копией, то рано или поздно дифференциальный бэкап будет сравним с полной копией. В такой случае необходимо делать заново полную копию файлов и начинать процесс заново (обычно, выполняется в автоматическом режиме). 

 

3. Инкрементальное резервное копирование

Метод инкрементального резервного копирования очень похож на дифференциальное резервное копирование, но имеет одно принципиальное отличие - хранит меньше избыточных данных в бэкапах. Каждый инкрементальный бэкап содержит только те файлы, которые были созданы или изменены с момента последнего создания полной копии или последнего инкрементального бэкапа. Такие резервные копии хранят намного меньше избыточных данных, по сравнению с дифференциальными бэкапами, но все же эффект нарастающего итога все еще присутствует, так что инкрементальные копии могут содержать файлы, которые уже были в одной из инкрементальных копий, но в последствии были изменены. Инкрементальные резервные копии особенно хорошо применять для частого создания резервных копий, как например, ежечасно.

Инкрементальное резервное копирование

Преимущества и недостатки инкрементных резервных копий

  • Инкрементальные резервные копии создаются быстрее, чем дифференциальные - За счет учета предыдущих внесенных изменений, такие бэкапы хранят меньше избыточной информации и поэтому создаются намного быстрее.
  • Инкрементальные бэкапы меньше дифференциальных - За счет учета тех же предыдущих изменений, такие бэкапы хранят меньше информации
  • Инкрементальных бэкапов можно создать больше, чем дифференциальных - Так как бэкапы хранят меньше избыточной информации, то их может быть гораздо больше между полными копиями нежели, чем в случае с дифференциальными копиями.
  • Восстановление инкрементальные копий происходит дольше, чем в случае дифференциальных - Для того чтобы восстановить файлы необходимо извлечь их из полной копии, а затем последовательно применить все последующие инкрементальные бэкпапы.
  • Повышенный риск потери информации - Если одна из инкрементальных копий была повреждена или удалена, то восстановление файлов из этой копии будет невозможным, в следствии чего будут безвозвратно утеряны изменения в файлах и добавленные файлы. Тем не менее, восстановить данные из других инкрементальных копий все еще возможно.

 

4. Дельта блочное резервное копирование

Понятие "дельта" часто относят к методу дифференциального резервного копирования, но иногда его так же называют "дельта резервное копирование", "дельта блочное копирование" и "дельта стилевое резервное копирование". И в основном, все эти понятия относятся к одной и той же технологии создания резервной копии. Метод дельты корректнее всего называть дельта блочное резервное копирование, которое применяется в связке с инкрементальным и дифференциальным подходами. Важно отметить, что метод дельта блочного резервного копирования применяется только для измененных файлов, а не созданных. Добавленные файлы, конечно, так же сохраняются в копиях, но в обычном режиме.

Ранее описанные методы резервного копирования создают полную копию измененного файла, даже если в нем изменился всего один символ. Конечно, такой подход не будет составлять особой проблемы, если речь идет о маленьких текстовых документах, но в случае с очень большими файлами, такими как базы данных, такой подход будет весьма проблематичным. К примеру, почтовые клиенты, такие как Outlook, чаще всего хранят всю информацию в одном большом файле (письма, контакты и прочее). В этом случае получается, что даже получив одно письмо, все предыдущие методы будут вынуждены создавать копию всего файла. А поскольку такого рода файлы могут часто меняться, то какой бы подход вы не применяли, ваши бэкапы будут разрастаться непомерными шагами и приводить к хранению огромного числа избыточной информации.

Дельта блочные резервные копии позволяют справиться с этой проблем, создавая резервные копии только тех частей файлов, которые были изменены, а не всего файла. Суть метода достаточно проста. Каждый файл разбивается на блоки определенных размеров, а затем при резервном копировании блоки измененного файла сравниваются с блоками файла в полной резервной копии. И в итоге, в резервную копию попадут только те блоки, которые были изменены или добавлены в файл. Термин дельта может ввести вас в заблуждение, так как в зависимости от применяемых способов, содержание в созданных бэкапах может быть разным. В случае дифференциального метода, в архиве будет содержаться отличие от полной копии, а в случае инкрементального метода, в архиве будет содержаться разница от последнего архива с измененным файлом. Соответственно, преимущества и недостатки будут такими же, как и у методов, в связке с которыми применяется дельта. Однако, в случае инкрементального копирования риск потери информации будет выше, так как потеря инкрементального бэкапа будет означать невозможность применить изменения из всех последующих инкрементальных бэкапов (так как нельзя гарантировать, что последующие изменения будут корректно применены).

Примечание: Размер блока будет зависеть от программ или выбранного пользователем размера, если такое поддерживает программа. Обычно, размер блоков находится в диапазоне от 1 до 32 килобайт. 

Дельта блочное резервное копирование

Дельту особенно хорошо применять в технологиях, где файлы резервируются сразу после их создания или изменения. Этот подход так же известен как резервирование в режиме реального времени или непрерывной защиты данных. Дельту так же полезно применять, когда резервные копии сохраняются на удаленных ресурсах (сервера, хранилища) в условиях ограниченной пропускной способности.

Преимущества и недостатки дельта блочного резервного копирования

  • Дельта резервные копии занимают очень мало места и создаются намного быстрее 
  • Дельта бэкапы позволяют хранить намного меньше избыточной информации - Методы инкрементального и дифференциального резервного копирования, из-за необходимости копировать файлы, при их минимальном изменении, могут хранить значительное количество избыточной информации. Метод дельта блочного копирования позволяет снизить этот уровень.
  • Так как дельта блоки создаются программами по специфическим алгоритмам, то восстановить их можно только этими же программами. В этом смысле такие бэкапы будут ограничивать тех пользователей, у которых может возникать необходимость ручного восстановления данных.
  • Дельта блочное резервирование медленнее, так как необходимо восстанавливать файлы из различных частей.

 

5. Бинарные патчи резервных копий

Технология бинарных патчей изначально была разработана как способ для разработчиков программного обеспечения легко обновлять свои программы у клиентов через интернет. Такие "заплатки" заменяли модифицированные части в файлах. Именно части файлов, а не целиком файлы. Такие патчи занимают гораздо меньший размер, чем занимали бы простые патчи, полностью заменяющие файлы. Со временем, данная технология была адаптирована к задачам резервного копирования. 

Примечание: Примером применения такого метода резервного копирования является FastBittm, который используют крупные компании, такие как Microsoft, IBM и Compaq.

Метод бинарных патчей резервных копий очень похож на дельта блочное резервное копированием, но с той разницей, что дельта использует блоки, как единицу сравнения, а бинарные патчи, как и следует из названия, используют биты, как единицу сравнения. Другими словами, дельта копирует в резервный архив любой изменившийся блок данных, пусть даже изменилось всего пара символов (например, если блок 32 Кб, то даже при изменении 1 символа будет копироваться весь блок 32 Кб), а при методе бинарных патчей копируются только изменившиеся биты данных. Это различие позволяет сэкономить на размерах и как следствие на передаваемом трафике.

Бинарные патчи резервных копий

Преимущества и недостатки бинарных патчей резервных копий

Примечание: В настоящее время существует очень-очень мало приложений резервного копирования, которые бы поддерживали данную технологию. Кроме того, по данной технологии существует очень мало информации, поэтому недостатки и преимущества стоит рассматривать с теоретической стороны.

  • Практически полностью устраняет избыточность данных, в следствие чего получаются самые маленькие бэкапы.
  • Минимальный размер позволяет существенно снизить нагрузку на полосу пропускания сети.
  • Данный метод более требователен к системным ресурсам и времени, чем дельта. Однако, такой подход может компенсироваться существенным снижением нагрузки в сети.
  • Практически нет информации о том, как файл восстанавливается и насколько метод эффективен. Хоть, теоретически метод должен быть не существенно сложнее, чем дельта, все же практика от теории может серьезно отличаться.

 

6. Зеркальные резервные копии

Большинство программ резервного копирования поддерживают зеркальное резервное копирование в качестве альтернативы полному копированию, дифференциальному и прочим. Некоторые программы используют альтернативную терминологию для понятия зеркала, как например, "простое копирование". Отчасти это происходит от того, что зеркальные копии в основном представляют собой простой тип создания бэкапа. В данном методе не применяется каких-либо специальных резервных технологий, только простая операция копирования. Как пример, если вы копируете и вставляете каталог с одного диска на другой, то можете считать, что вы создали зеркальную резервную копию этой папки. Файлы в зеркальных копиях обычно представляют собой те же файлы, что и в источнике. Они не сжимаются в архивы, как при полном резервном копировании (хотя некоторые программы поддерживают сжатие отдельных файлов и шифрование).

Когда используются зеркальные резервные копии

Зеркальные копии без сжатия хорошо подходят в тех случаях, когда большинство копируемых файлов уже сжато в архивы. Например, музыкальные файлы в формате mp3 или wma, изображения в формате jpg или png, видео в DivX, mov или flv формате. Кроме того, большинство инсталляторов так же сжаты. Если включить эти файлы в обычную процедуру полного резервного копирования, которая применяет сжатие, то вы заметите, что кроме того, что такое копирование будет выполняться долго, итоговый архив будет мало отличаться в размере (очень мало данных будет сжато). В этом смысле, лучше всего создавать отдельные задания для резервного копирования для сжатых и не сжатых файлов. Если ваши программы резервного копирования поддерживают фильтры, то вы можете их использовать для автоматического выбора подходящих файлов для каждого из заданий.

Преимущества и недостатки зеркальных резервных копий

  • Зеркальные копии выгодно использовать на сжатых файлах.
  • Из-за того, что зеркальная копия не хранится в едином архивном файле, вам можно меньше беспокоиться о повреждении файлов.
  • Зеркальные копии, как правило, не используют сжатие и поэтому требуют большого количество места для хранения, если не применяются другие методы, как например, жесткие ссылки (подробнее о них будет рассказано далее)

 

7. Синтетические полные резервные копии

Синтетическое полное резервное копирование встречается время от времени в описаниях, но следует понимать, что это не резервный метод, а технология организации резервного копирования, которая может быть применена к одному из выше указанных способов, чтобы эффективнее восстанавливать и создавать резервные копии. 

Синтетические копии, как правило применяются только в клиент-серверных системах резервного копирования. Смысл метода достаточно прост. Клиентский компьютер может выполнять резервное копирование с помощью любого способа (инкрементальный, дифференциальный и т.д.) и передавать эту резервную копию на сервер. Сервер же в определенный момент самостоятельно объединит несколько отдельных архивов для формирования синтетической полной копии. Такой способ организации позволяет, после создания первой полной резервной копии, клиентскому компьютеру не создавать повторно полные резервные копии, так как это процесс автоматически выполняется на сервере.

Преимущество такого подхода заключается в двух важных моментах. Во-первых, скорость резервного копирования, при использовании дифференциальных копий не будет снижаться с течением времени из-за совокупности изменений, так как синтетические полные архивы будут создаваться на сервере на регулярной основе. Во-вторых, полное восстановление файлов на клиентской машине не потребует процесса реконструкции файлов из частей. Причиной тому то, что реконструкция уже производится на сервере, позволяя клиентской машине восстанавливать архивы за минимально возможное время.

 

8. Резервное копирование с использованием жестких ссылок

Некоторые программы резервного копирования поддерживают создание жестких ссылок, которые позволяют сохранить дисковое пространство, при создании нескольких полных зеркальных резервных копий одного и того же набора файлов. 

Чтобы понять, что представляет из себя жесткая ссылка, нужно понимать, как хранятся файлы на жестком диске. При сохранении файла, физически данные могут быть записаны в любом месте на диске. В этом случае файловая система создает жесткую ссылку на физическое расположение данных с именем файла, который вы использовали. Некоторые файловые системы позволяют создавать более одной жесткой ссылки на реальные данные. Использование жестких ссылок позволяет использовать любое количество файлов в разных каталогах, которые будут ссылаться на одни и те же физические данные.

При использовании программ резервного копирования, которые поддерживают жесткие ссылки для создания нескольких копий одинаковых файлов, программа будет создавать жесткие ссылки для всех файлов, которые не изменились. Например, если вы создаете две копии каталога, который содержит 100 Мб данных, то, в обычных условиях, эти копии занимали бы 200 Мб на жестком диске. С помощью жестких ссылок такие копии будут занимать все те же 100 Мб дискового пространства. Изменение любого из файлов в таких каталогах будет в действительности изменять только одни физические данные, при этом эти данные будут доступны в обоих каталогах. К примеру, если после создания каталогов с жесткими ссылками, вы в первом каталоге увеличите файл на 2 Мб, то их общий размер будет 102 Мб, и при этом в обоих каталогах данные в файле будут одни и те же.

Следует отметить, что если вы захотите удалить одну из резервных копий, содержащих жесткие ссылки, то это не будет проблемой, та как при этом не затрагиваются остальные ссылки. Физические данные файла на диске удаляются только тогда, когда все жесткие ссылки на него были удалены. Так же необходимо понимать, что жесткие ссылки можно создавать только в приделах одного тома (логического диска). Например, между разными разделами или дисками нельзя создавать жесткие ссылки. В Windows файловых системах, NTFS поддерживает жесткие ссылки, в то время как FAT не поддерживает.

Примечание: Проводник Windows, при подсчете размера, не учитывает использование жестких ссылок. Это означает, что если файл занимает 100 Мб и имеет две жесткие ссылки, то в реальности будет потребляться всего 100 Мб диска, в то время как проводник Windows будет показывать использование 200 Мб диска. Этот момент необходимо учитывать, при использовании резервного копирования с использованием жестких ссылок.

Тем не менее, каким бы привлекательным не показался вам данный метод, его необходимо использовать с осторожностью. Так как привычная логика "изменения файлов в разных каталогах - будет означать изменение разных данных" в случае данного метода не применима. Это означает, что случайное изменение одного файла в одной из копий будет обозначать изменение того же файла во всех копиях. Поэтому, если вы используете программу резервного копирования, поддерживающую жесткие ссылки, то рекомендуется вносить все изменения только через программу и воздержаться от ручного изменения.

 

Заключительные слова о резервировании

Несмотря на многообразие приводимых методов, резервное копирование это одна их тех областей, где выбор используемых технологий должен оправдываться, с точки зрения решаемых задач. Не стоит использовать методы только из-за отдельных характеристик, таких как скорость и занимаемое дисковое пространство. Так, к примеру, если вы храните резервные копии на переносном жестком диске, то использование такой технологии, как дельта блочное копирование, возможно, позволит сэкономить вам место, но может сделать такие копии абсолютно бесполезными в ситуациях, когда программа резервного копирования будет не доступна (например, вам нужно подкорректировать документ на другом компьютере или же по каким-то причинам сломалась программа, а доступа в интернет для скачивания инсталлятора нет). В таком случае использование обычного инкрементального копирования (без дельты) будет более оправдано, так как вы всегда можете в ручном режиме восстановить нужные документы. Поэтому, старайтесь выбирать технологии со здравым смыслом.

Теперь, вы знаете некоторые термины резервного копирования, а так же понимаете, что обозначают методы в теории и на практике.

Социальные сети

☕ Понравился обзор? Поделитесь с друзьями!

Комментарии / отзывы  

+1 # максим 27.04.2016 09:06
Отличная статья! очень нужный и полезный материал спасибо.
Ответить | Ответить с цитатой | Цитировать | Сообщить модератору
Добавить комментарий / отзыв
Комментарий - это вежливое и наполненное смыслом сообщение (правила).



* Нажимая на кнопку "Отправить", Вы соглашаетесь с политикой конфиденциальности.
Социальные сети
Программы (Freeware, OpenSource...)