Понятие о файле.

Одним из основных понятий операционной системы является понятие файла (от англ. File – папка для хранения документов). Файл предназначен для хранения информации. В самом общем смысле файл – это все то, что может содержать информацию и откуда она может извлекаться для использования.

В компьютерах информация хранится на накопителях, откуда она считывается при необходимости.

Файл – это область на носителе какого-либо накопителя, содержащая логически объединенную информацию и названная конкретным именем.

Вся информация, хранимая на носителях, находится в файлах.

В файлах содержатся:

–  программы самой операционной системы и драйвера устройств;

–  тексты программ на языках программирования;

–  программы в машинных кодах;

–  текстовые документы;

–  графические изображения;

–  таблицы;

–  мелодии;

конечно, все в закодированном виде. Вся информация, хранимая на носителях, содержится в файлах в двоичном виде.

Все файлы можно разделить на две основные группы: файлы данных (различных: музыкальных, текстовых, графических, числовых и т. д.) и исполняемые файлы, т. е. файлы содержащие программы в машинных кодах.

Для работы с файлами созданы системы управления файлами и файловые системы.

Файловая система определяет, прежде всего, принцип доступа к данным, организованным в файлы. Система управления файлами – это комплект программных модулей, обеспечивающих работу с файлами в конкретной операционной системе. В некоторых ОС может быть несколько систем управления файлами, что обеспечивает им возможность работать с несколькими файловыми системами.

НЕ нашли? Не то? Что вы ищете?

Благодаря системам управления файлами пользователям предоставляются следующие возможности:

–  создание, удаление, переименование, копирование, перемещение файлов (и другие операции);

–  работать с периферийными устройствами как с файлами;

–  обмен данными между файлами, между устройствами, между файлом и устройством (и наоборот);

–  защита файлов от несанкционированного доступа и т. д.

Различными типами файловых систем являются системы NTFS, FAT и FAT32.

Файловая система FAT

Файловая система, используемая MS-DOS и операционными системами семейства Windows для упорядочения файлов и управления ими. FAT (file allocation table — таблица размещения файлов) представляет собой структуру данных, создаваемую Windows при форматировании тома для файловых систем FAT или FAT32. Windows хранит в таблице размещения файлов сведения о каждом файле, чтобы при необходимости можно было извлечь нужный файл.

Файловая система FAT32

Файловая система, производная системы FAT. FAT32 поддерживает меньшие размеры кластеров, что позволяет более эффективно использовать дисковое пространство.

Файловая система NTFS

Улучшенная файловая система, обеспечивающая уровень быстродействия и безопасности, а также дополнительные возможности, недоступные ни в одной версии файловой системы FAT. Например, для обеспечения целостности данных тома в файловой системе NTFS используются стандартные технологии записи и восстановления транзакций. В случае сбоя компьютера целостность файловой системы восстанавливается с помощью файла журнала NTFS и данных о контрольных точках. В операционных системах Windows 2000 и Windows XP файловая система NTFS также обеспечивает такие дополнительные возможности, как разрешения для файлов и папок, шифрование, дисковые квоты и сжатие.

РАЗМЕР ФАЙЛА

это количество содержащейся в нем информации, измеренное в байтах.

Информация на магнитных дисках (дискетах) размещается и передается блоками. Каждый такой блок называется сектором. Сектора расположены на концентрических дорожках поверхности диска. Размер сектора (точнее – емкость поля данных) устанавливается контроллером или драйвером. Для дискеты размер сектора установлен в 512 байт.

ГИБКИЙ ДИСК

Минимальный элемент информации на гибком диске – сектор, информационная емкость которого 512 байтов.

объем гибких дисков:

V = p*d*k*l

р – количество поверхностей диска (p = 2)

d – количество дорожек на поверхности (d = 80)

k – количество секторов на дорожке (k = 18 )

l – емкость сектора (l = 512 байт).

V = 2 * 80 * 18 * 512 = 1 474 560 байт (1,44 Мбайт)

Логическая структура гибких дисков – это совокупность секторов (емкостью 512 байтов), каждый из которых имеет свой порядковый номер (например, 100).

Минимальный элемент информации на гибком диске – сектор. Минимальный размер файла составляет один сектор, а максимальный – общее количество секторов на диске. При размещении на диске файл записывается в произвольные свободные сектора.

1-й сектор – загрузочная запись ОС;

со 2 по 33 сектора – каталог и таблица FAT;

с 34 по 2880 сектора – файлы.

ЖЕСТКИЙ ДИСК

Минимальный элемент информации на жестком диске – кластер, который содержит один или несколько смежных секторов.

Все файловые системы, используемые Windows для работы с жесткими дисками, основаны на этом размере. Чем меньше размер кластера, тем более эффективно используется дисковая память. Если при форматировании диска размер кластера не указан в явном виде, Windows выбирает одно из стандартных значений, исходя из размера тома (диска). Стандартные значения подобраны таким образом, чтобы снизить потерю дискового пространства и степень возможной фрагментации тома. Размер кластера называется также единицей выделения памяти.

Размер кластера зависит от типа используемой FAT-таблицы и емкости жесткого диска и определяется по формуле:

Vкластера=Vдиска / N,

где N – число кластеров, которое может располагаться в FAT-таблице.

Для указания номера кластера в системе управления файлами FAT-16 используется 16-битовое слово, следовательно, можно иметь до 216 – 65536 кластеров (с номерами от 0 до 65535).

Пример: Объем жесткого диска 2 Гбайта. На нем используется FAT16 (адреса записываются двухбайтовым числом). Определить объем кластера.

Решение: FAT16 может адресовать 216 = 65536 кластеров.

Объем диска 2 Гбайт = 2048 Кбайт.

Минимальный размер адресуемого пространства (размер кластера) равен

Vкластера = 2048 Кбайт / 216 = 32 Кбайт

Файлам всегда выделяется целое число кластеров. Последний кластер при этом может быть задействован не полностью, что приведет к заметной потере дискового пространства при большом размере кластера.

Каким бы маленьким не был файл, он всегда займет целый кластер. Например, файл, содержащий слово «информатика», составляет 11 байт, но на диске будет занимать целый кластер. Это приводит к большим потерям дискового пространства.

Поэтому в современных файловых системах размеры кластеров ограничиваются (обычно – от 512 байт до 4 Кбайт). В FAT-32 проблема решается за счет того, что собственно сама FAT в этой файловой системе может содержать до 228 кластеров (в файловой системе FAT-32 в 32-битовом слове, используемом для представления номера кластера, фактически учитываются только 28 разрядов, что приводит к тому, что длина FAT в этой системе не может превышать 228 элементов).

В следующей таблице приведены сравнительные данные по размерам дисков и файлов, допустимых для каждой файловой системы.

NTFS

FAT

FAT32

Рекомендуемый минимальный размер тома равен примерно 10 МБ.

Допускаются размеры томов свыше 2 ТБ (теоретически до 16 ЭБ).

Не может использоваться для гибких дисков.

Тома объемом от гибкого диска до 4 ГБ.

Домены не поддерживаются.

Тома объемом от 512 МБ до 2 ТБ.

Windows XP позволяет отформатировать в FAT32 тома объемом до 32 ГБ.

Домены не поддерживаются.

Максимальный размер файла ограничен только размером тома.

Максимальный размер файла равен 2 ГБ.

Максимальный размер файла равен 4 ГБ.

1 ТБ (ТераБайт) = 1012 байт

1 ЭБ (ЭкоБайт) = 1015 байт

ТОМ

– область памяти на жестком диске. Том (логический диск) форматируется для определенной файловой системы, такой как FAT или NTFS, и обозначается буквой. Содержимое тома можно просмотреть, щелкнув его значок в проводнике Windows или в окне «Мой компьютер». Один жесткий диск может содержать несколько томов; тома также могут занимать несколько дисков.

ДОМЕН

– группа компьютеров, образующих часть сети и использующих общую базу данных каталога. Домен администрируется как единый объект с определенными правилами и процедурами. Каждый домен имеет уникальное имя.

Домен Active Directory — это группа компьютеров, определенная администратором сети Windows. Эти компьютеры используют общие базу данных каталогов, политики безопасности и доверительные отношения с другими доменами. Домен Active Directory обеспечивает доступ к централизованному набору учетных записей пользователей и групп, который поддерживается администратором домена. Лес Active Directory состоит из одного или нескольких доменов, каждый из которых может включать несколько физических мест.

Имя и расширение имени файла.

Чтобы операционная система и другие программы могли обращаться к файлам, файлы должны иметь обозначения. Это обозначение обычно называют именем файла. Имя файла состоит из двух частей – названия (от англ. name) и расширения (от англ. extension – удлинение, растягивание, вытягивание, расширение, распространение). Символ точки является разделителем частей в имени файла.

В DOS и Windows 3.1 название файла может содержать от одного до восьми символов. В качестве символом в имени файла можно использовать малые и большие буквы латинского алфавита, цифры и некоторые специальные знаки. Для названия файла пользователь может выбирать любое сочетание разрешенных символов. Некоторые «русифицированные» версии DOS позволяют употреблять в названиях русские буквы. Однако эту возможность надо использовать с осторожностью: многие программы из DOS не «понимают» имен с русским буквами. Начиная с Windows 95 можно использовать длинные названия файлов (до 254 символов) и кириллицу.

Расширение может содержать не более трех символов. Им пользуются для того, чтобы указать характер хранимой в файле информации или какой программой создан файл. Кроме того, ОС и многие программы позволяют по расширению имени вызвать соответствующую программу и сразу загрузить в нее данный файл. Обычно ОС Windows по умолчанию скрывает расширения файлов.

Примеры расширений:

–  .com, .exe – исполняемые файлы;

–  .bat – командные файлы;

–  .pas – файлы созданные на языке Паскаль;

–  .bak – копия файла, создаваемая перед его изменением;

–  .c – файлы созданные на языке Си;

–  .asm – файлы созданные на языке Ассемблер;

–  .sys – системные файлы;

–  .bas – файлы созданные на языке Бейсик;

–  .rar, .zip, arj, .ice – архивные файлы;

–  .dat – файлы данных;

–  .doc, .txt – текстовые файлы.

Некоторые сочетания символов нельзя использовать в качестве имен файлов (особенно в DOS), так как ОС использует их для обозначения устройств и портов. Например:

–  PRN – принтер,

–  LPT1-LPT4 – устройства, присоединяемые к параллельным портам,

–  COM1-COM4 – устройства, присоединяемые к последовательным портам,

–  CON – консоль (при вводе – клавиатура, при выводе – экран).

Каталоги (папки) и подкаталоги файлов

Файлы на диске объединены в каталоги (директории, папки; названия одного и того же понятия в разных ОС). Каждый каталог может включать в себя как файлы, так и другие каталоги. Каждый диск имеет один главный каталог, который называется корневым. Все остальные каталоги являются его подкаталогами разных уровней.

Имена каталогов имеют такую же структуру, как и имена файлов, однако обычно они состоят из одного слова без расширения, хотя делать расширения для них никто не запрещает.

Структура размещения файлов одинакова для всех дисков. Каждый из них имеет корневой каталог, в котором могут находится файлы и другие каталоги, которые называются подкаталогами корневого каталога или каталогами первого уровня. В каталогах первого уровня могут также находится как файлы, так и подкаталоги, которые называются каталогами второго уровня. Процесс дробления вложенных каталогов на подкаталоги следующих уровней продолжается до тех пор, пока все подкаталоги не будут состоять из обычных файлов. Такая сложная структура размещения каталогов и файлов похожа на дерево и поэтому она называется древовидной.

В каждом каталоге может быть много файлов, но зарегистрировать два файла одного типа под одним именем в данном каталоге нельзя (можно зарегистрировать второй файл только как копию, а копий может быть много: «копия1 …», «копия2 …» и т. д.).

Путь к файлу

Каталог, с файлами которого работают в данный момент, называют активным или текущим (он указывается в заголовке окна ОС Windows). Чтобы обратится к файлу, находящемуся в активном каталоге, достаточно указать его имя. Последовательно переходя из каталога в каталог, получают доступ к файлам, которые находятся на разных уровнях.

К файлу, расположенному в любом месте древовидной структуры, можно также обратиться, указав путь к нему (или то же самое, полное имя файла). Для DOS и ОС Windows путь состоит из имени диска (буква с двоеточием), последовательного списка каталогов, разделенных обратной косой чертой (англ. back slash), и имени файла. Обратная косая черта перед именем первого каталога указывает на то, что путь начинается от корневого каталога диска. Путь к файлу в ОС Windows показывается в адресной строке окна. Его иногда называют маршрутом.