Для ожидания потомков, созданных с помощью вызова clone(), в аргумент options вызовов waitpid(), wait3() или wait4() (который является битовой маской) можно передавать следующие значения (актуальные только для Linux).

• __WCLONE — в зависимости от того, установлен этот флаг или нет, родитель ожидает только клонированных или соответственно только неклонированных потомков. В данном контексте клонированным является потомок, который при завершении работы отправляет родителю сигнал, отличающийся от SIGCHLD. Этот бит игнорируется, если использовать его в сочетании с __WALL.

• __WALL (начиная с Linux 2.4) — приводит к ожиданию любых потомков, независимо от того, клонированные они или нет.

• __WNOTHREAD (начиная с Linux 2.4) — по умолчанию вызовы wait() позволяют ждать потомков не только вызывающего, но и любого другого процесса в одной с ним группе. Флаг __WNOTHREAD ограничивает процедуру ожидания потомками вызывающего процесса.

Эти флаги нельзя использовать в вызове waitid().

28.3. Скорость создания процессов

В табл. 28.3 приводится сравнение производительности разных методов создания процессов. Результаты были собраны с помощью тестовой программы, которая создает в цикле дочерние процессы и ждет, когда те завершатся. В сравнении используются три разных объема памяти, выделяемой для процесса (столбец «Общая виртуальная память»). Это было достигнуто путем выделения дополнительного места в куче с помощью вызова malloc() до начала замеров.

Значения размеров процессов («Общая виртуальная память») в табл. 28.3 взяты из столбца VSZ при выводе команды ps — o "pid vsz cmd".

Таблица 28.3. Время, необходимое для создания 100 000 процессов с помощью вызовов fork(), vfork() и clone()

Метод создания процесса

Общая виртуальная память

1,70 Мбайт

2,70 Мбайт

11,70 Мбайт

Время (с)

Количество

Время (с)

Количество

Время (с)

Количество

fork()

22,27 (7,99)

4544

26,38 (8,98)

4135

126,93 (52,55)

1276

vfork()

3,52 (2,49)

28 955

3,55 (2,50)

28621

3,53 (2,51)

28 810

clone()

2,97 (2,14)

34 333

2,98 (2,13)

34217

2,93 (2,10)

34 688

fork() + + exec()

135,72 (12,39)

764

146,15 (16,69)

719

260,34 (61,86)

435

vfork() + + exec()

107,36 (6,27)

969

107,81 (6,35)

964

107,97 (6,38)

960

Для каждого размера в табл. 28.3 представлено два вида статистики.

• Первый вид состоит из двух временных измерений. Первое (то, что больше) представляет общее (реальное) время, затраченное на создание 100 000 процессов. Второе, заключенное в скобки, является процессорным временем, потребленным родительским процессом. Поскольку эти тесты выполнялись на свободном от других задач компьютере, разница между этими двумя значениями представляет собой общее время существования дочерних процессов.

• Второй вид статистики в каждом из тестов показывает количество создаваемых процессов за одну (реальную) секунду. Для каждого случая выполнялось 20 тестовых прогонов; статистика была получена в системе с архитектурой x86-32 и ядром 2.6.27.

Первые три строки с данными содержат время, уходящее на простое создание процесса (без выполнения новой программы внутри потомка). В каждом из случаев дочерний процесс завершает свою работу сразу же после создания, а родитель ожидает этого момента, чтобы создать следующий процесс.

В первом столбце находятся значения для системного вызова fork(). По этим данным видно, что чем больше процесс, тем дольше он создается. Разница в значениях отражает дополнительное время, необходимое для копирования все более объемных страниц памяти родителя и перевод всех страничных записей (данных, кучи и стека) в режим только для чтения (сами страницы не копируются, так как потомок не изменяет свои сегменты с данными и стеком).

Второй столбец предоставляет такую же статистику для vfork(). Мы видим, что, несмотря на увеличение размера процесса, время остается неизменным. Дело в том, что вызов vfork() не копирует таблицы со страницами памяти или сами страницы, поэтому размер виртуальной памяти вызывающего процесса не играет никакой роли. Разница между статистикой для вызовов fork() и vfork() представляет общее время, необходимое в каждом из случаев для копирования таблицы со страницами.

Небольшая разница между значениями для vfork() и clone(), показанными в табл. 28.3, связана с выборкой ошибок и отклонениями в планировщике. Даже если увеличить размер создаваемых процессов до 300 Мбайт, временные показатели этих двух вызовов не изменятся.

Третий столбец показывает статистику создания процессов с помощью вызова clone() и следующего сочетания флагов:

CLONE_VM | CLONE_VFORK | CLONE_FS | CLONE_SIGHAND | CLONE_FILES

Перейти на страницу:

Похожие книги