Читать Linux API. Исчерпывающее руководство Онлайн и Бесплатно. Библиотека Читка

• Столбцы затрачиваемого времени и общего времени задействования центрального процессора в пояснениях не нуждаются. Столбцы времени задействования центрального процессора пользователем и системой показывают, как общее время разбивается соответственно на время, затраченное на выполнение кода в пользовательском режиме, и время на выполнение кода ядра (то есть системных вызовов).

• Тест, по которому была сформирована табл. 13.1, выполнялся с использованием «ванильного» ядра версии 2.6.30 в файловой системе ext2 с размером блока 4096 байт.

Когда говорится о том, что ядро «ванильное», это означает, что оно не подвергалось исправлениям. Оно отличается от ядер, предоставляемых большинством поставщиков, которые нередко включают различные исправления для устранения недостатков или добавления возможностей.

• В каждой строке показано усредненное значение для заданного размера буфера после 20 запусков. В этих тестах, а также в других, показанных далее в этой главе, перед каждым выполнением программы файловая система была размонтирована и снова смонтирована, чтобы гарантировать чистую буферную кэш-память, используемую для файловой системы. Замеры времени были выполнены с помощью команды оболочки time.

Таблица 13.1. Время, необходимое для дублирования файла длиной 100 миллионов байт

_{Размер BUF_SIZE}

_{Время (в секундах)}

_{Затрачиваемое}

_{Задействования центрального процессора}

_Общее

_{Пользователем}

_{Системой}

₁

₂

₄

₈

₁₆

₃₂

₆₄

₁₂₈

₂₅₆

₅₁₂

₁₀₂₄

_107,43

_54,16

_31,72

_15,59

_7,50

_3,76

_2,19

_2,16

_2,06

_2,05

_107,32

_53,89

_30,96

_14,34

_7,14

_3,68

_2,04

_1,59

_1,75

_1,03

_0,65

_8,20

_4,13

_2,30

_1,08

_0,51

_0,26

_0,13

_0,11

_0,10

_0,05

_0,02

_99,12

_49,76

_28,66

_13,26

_6,63

_3,41

_1,91

_1,48

_1,65

_0,98

_0,63

₄₀₉₆

_16 384

_65 536

_2,05

_2,06

_0,38

_0,34

_0,32

_0,01

_0,00

_0,38

_0,33

_0,32

Поскольку для различных размеров буферной памяти общий объем переносимых данных один и тот же (а стало быть, и одинаковое количество дисковых операций), информация в табл. 13.1 показывает наличие издержек на совершение вызовов read() и write(). При размере буферной памяти, равном 1 байту, для read() и write() совершается 100 миллионов вызовов. При размере буферной памяти, равном 4096 байт, количество обращений к каждому системному вызову снижается примерно до 24 000 и достигается производительность, близкая к оптимальной. После этого значения производительность существенно не улучшается, поскольку затраты на совершение системных вызовов read() и write() становятся несущественными по сравнению с временем, требуемым для копирования данных между пространством пользователя и пространством ядра и для выполнения фактического дискового ввода-вывода.

Последние строки табл. 13.1 позволяют приблизительно оценить время, необходимое для переноса данных между пользовательским пространством памяти и пространством ядра, а также для осуществления файлового ввода-вывода. Поскольку количество системных вызовов в этих случаях относительно невелико, можно пренебречь их составляющей в затрачиваемом времени и времени задействования ЦП. Таким образом, можно сказать, что время задействования ЦП со стороны системы фактически является замером времени переноса данных между пользовательским пространством и пространством ядра. Значение затрачиваемого времени дает нам приблизительную оценку времени, необходимого для переноса данных на диск и с диска. (Как вскоре станет понятно, это в основном время, требуемое для считывания данных с диска.)

Таким образом, если переносится большой объем данных в файл или из файла, то буферизация данных в больших блоках и, в силу этого, выполнение меньшего количества системных вызовов позволяют нам существенно повысить производительность ввода-вывода.

Перейти на страницу:

Linux API. Исчерпывающее руководство полностью

Поиск

Книга жанров

Похожие книги