Сегмент инициализированных данных — хранит глобальные и статические переменные, инициализированные явным образом. Значения этих переменных считываются из исполняемого файла при загрузке программы в память.

Сегмент неинициализированных данных — содержит глобальные и статические переменные, не инициализированные явным образом. Перед запуском программы система инициализирует всю память в этом сегменте значением 0. По историческим причинам этот сегмент часто называют bss. Его имя произошло из старого ассемблерного мнемонического термина block started by symbol («блок, начинающийся с символа»). Основная причина помещения прошедших инициализацию глобальных и статических переменных в отдельный от неинициализированных переменных сегмент заключается в том, что, когда программа сохраняется на диске, нет никакого смысла выделять пространство под неинициализированные данные. Вместо этого исполняемой программе просто нужно записать местоположение и размер, требуемый для сегмента неинициализированных данных, и это пространство выделяется загрузчиком программы в ходе ее выполнения.

• Динамически увеличивающийся и уменьшающийся сегмент стека — содержит стековые фреймы. Для каждой вызванной на данный момент функции выделяется один стековый фрейм. Во фрейме хранятся локальные переменные функции (так называемые автоматические переменные), аргументы и возвращаемое значение. Более подробно стековые фреймы рассматриваются в разделе 6.5.

• Динамическая память, или куча, — область, из которой память (для переменных) может динамически выделяться в ходе выполнения программы. Верхний конец кучи называют крайней точкой программы (program break).

Не такими популярными, но более наглядными маркировками для сегментов инициализированных и неинициализированных данных являются сегмент данных, инициализированных пользователем (user-initialized data segment), и сегмент данных с нулевой инициализацией (zero-initialized data segment).

Команда size(1) выводит размеры текстового сегмента, сегментов инициализированных и неинициализированных (bss) данных двоичной исполняемой программы.

Термин «сегмент», который употребляется в основном тексте, не нужно путать с аппаратной сегментацией, используемой в некоторой аппаратной архитектуре, например в x86-32. В нашем случае сегменты представляют собой логические разделения виртуальной памяти процесса в системах UNIX. Иногда вместо сегмента употребляется термин «раздел» (section), поскольку он более соответствует терминологии, используемой в настоящее время повсеместно согласно ELF-спецификации для форматов исполняемого файла.

В этой книге часто встречаются места, где говорится, что библиотечная функция возвращает указатель на статически выделяемую память. Под этим понимается, что память выделена либо под сегмент инициализированных данных, либо под сегмент неинициализированных данных. (В некоторых случаях библиотечные функции могут вместо этого выполнять однократное динамическое выделение памяти в куче, но эта деталь реализации не имеет отношения к рассматриваемому здесь смысловому значению слова «указатель».) О случаях, когда библиотечная функция возвращает информацию посредством статически выделяемой памяти, важно знать, поскольку эта память существует независимо от привлечения функции и может быть переписана последующими вызовами той же самой функции (или же, в некоторых случаях, путем последующих вызовов родственных функций). При использовании статической памяти функция становится нереентерабельной (не допускается повторный вызов функции до завершения ее работы). Дополнительные сведения о реентерабельности даются в подразделе 21.1.2 и разделе 31.1.

В листинге 6.1 продемонстрированы различные типы переменных в коде на языке C, а также комментарии, показывающие, в каких сегментах каждая переменная размещается. Эти комментарии предполагают применение неоптимизирующего компилятора и такого двоичного интерфейса приложения, в котором все аргументы передаются в стек. На практике оптимизирующий компилятор может поместить часто используемые переменные в регистры или провести оптимизацию, вообще исключая существование переменной. Кроме того, некоторые ABI требуют, чтобы аргументы функций и результаты их выполнения передавались через регистры, а не через стек. Как бы то ни было, этот пример предназначен для демонстрации отображения переменных кода на языке C на сегменты процесса.

Листинг 6.1. Размещение переменных программы в сегментах памяти процесса

proc/mem_segments.c

#include

#include

char globBuf[65536]; /* Сегмент неинициализированных данных */

int primes[] = { 2, 3, 5, 7 }; /* Сегмент инициализированных данных */

static int

square(int x) /* Размещается в фрейме для square() */

{

Перейти на страницу:

Похожие книги