• Столбцы затрачиваемого времени и общего времени задействования центрального процессора в пояснениях не нуждаются. Столбцы времени задействования центрального процессора пользователем и системой показывают, как общее время разбивается соответственно на время, затраченное на выполнение кода в пользовательском режиме, и время на выполнение кода ядра (то есть системных вызовов).

• Тест, по которому была сформирована табл. 13.1, выполнялся с использованием «ванильного» ядра версии 2.6.30 в файловой системе ext2 с размером блока 4096 байт.

Когда говорится о том, что ядро «ванильное», это означает, что оно не подвергалось исправлениям. Оно отличается от ядер, предоставляемых большинством поставщиков, которые нередко включают различные исправления для устранения недостатков или добавления возможностей.

• В каждой строке показано усредненное значение для заданного размера буфера после 20 запусков. В этих тестах, а также в других, показанных далее в этой главе, перед каждым выполнением программы файловая система была размонтирована и снова смонтирована, чтобы гарантировать чистую буферную кэш-память, используемую для файловой системы. Замеры времени были выполнены с помощью команды оболочки time.

Таблица 13.1. Время, необходимое для дублирования файла длиной 100 миллионов байт

Размер BUF_SIZE

Время (в секундах)

Затрачиваемое

Задействования центрального процессора

Общее

Пользователем

Системой

1

2

4

8

16

32

64

128

256

512

1024

107,43

54,16

31,72

15,59

7,50

3,76

2,19

2,16

2,06

2,06

2,05

107,32

53,89

30,96

14,34

7,14

3,68

2,04

1,59

1,75

1,03

0,65

8,20

4,13

2,30

1,08

0,51

0,26

0,13

0,11

0,10

0,05

0,02

99,12

49,76

28,66

13,26

6,63

3,41

1,91

1,48

1,65

0,98

0,63

4096

16 384

65 536

2,05

2,05

2,06

0,38

0,34

0,32

0,01

0,00

0,00

0,38

0,33

0,32

Поскольку для различных размеров буферной памяти общий объем переносимых данных один и тот же (а стало быть, и одинаковое количество дисковых операций), информация в табл. 13.1 показывает наличие издержек на совершение вызовов read() и write(). При размере буферной памяти, равном 1 байту, для read() и write() совершается 100 миллионов вызовов. При размере буферной памяти, равном 4096 байт, количество обращений к каждому системному вызову снижается примерно до 24 000 и достигается производительность, близкая к оптимальной. После этого значения производительность существенно не улучшается, поскольку затраты на совершение системных вызовов read() и write() становятся несущественными по сравнению с временем, требуемым для копирования данных между пространством пользователя и пространством ядра и для выполнения фактического дискового ввода-вывода.

Последние строки табл. 13.1 позволяют приблизительно оценить время, необходимое для переноса данных между пользовательским пространством памяти и пространством ядра, а также для осуществления файлового ввода-вывода. Поскольку количество системных вызовов в этих случаях относительно невелико, можно пренебречь их составляющей в затрачиваемом времени и времени задействования ЦП. Таким образом, можно сказать, что время задействования ЦП со стороны системы фактически является замером времени переноса данных между пользовательским пространством и пространством ядра. Значение затрачиваемого времени дает нам приблизительную оценку времени, необходимого для переноса данных на диск и с диска. (Как вскоре станет понятно, это в основном время, требуемое для считывания данных с диска.)

Таким образом, если переносится большой объем данных в файл или из файла, то буферизация данных в больших блоках и, в силу этого, выполнение меньшего количества системных вызовов позволяют нам существенно повысить производительность ввода-вывода.

Перейти на страницу:

Похожие книги