Опциональный аргумент в первой строчке интерпретируемого скрипта не должен содержать пробельных символов, потому что в противном случае поведение будет сильно зависеть от конкретной реализации. В Linux пробельный символ в опциональном аргументе не означает ничего особенного — весь текст от начала аргумента и до конца строки воспринимается как единое слово (которое передается интерпретатору в качестве параметра, как будет описано ниже). Стоит отметить, что такое обращение с пробельными символами контрастирует с командной оболочкой, в которой их используют для разделения строк на отдельные слова.

Одни реализации UNIX воспринимают пробельные символы в опциональном аргументе так же, как Linux, другие — иначе. Раньше в системе FreeBSD после пути к интерпретатору можно было указывать несколько аргументов, разделенных пробелами (после чего те передавались интерпретатору в виде отдельных слов); но, начиная с версии 6.0, FreeBSD ведет себя так же, как Linux. В Solaris 8 пробельные символы завершают опциальный аргумент; любой текст, следующий после них в начальной строке, игнорируется.

В ядре Linux существует ограничение на длину начальной строки скрипта — 127 символов (не считая символа перехода на новую строку в конце). Все, что выходит за его пределы, игнорируется.

Способ определения интепретатора скрипта с помощью #! не описан в стандарте SUSv3, но доступен в большинстве реализаций UNIX.

Ограничение, накладываемое на длину начальной строки, варьируется в зависимости от конкретной системы. Например, OpenBSD 3.1 имеет ограничение 64 символа, а Tru64 5.1 — 1024. В некоторых старых реализациях (таких как SunOS 4) ограничение составляло 32 символа.

Выполнение интерпретируемых скриптов

Поскольку скрипт не содержит двоичного машинного кода, очевидно, что при его запуске с помощью вызова execve() должно происходить что-то необычное. Если execve() обнаруживает в начале скриптового файла двухбайтную последовательность #! он извлекает оставшуюся часть строки (путь и аргументы) и выполняет файл интерпретатора со следующим списком аргументов:

путь-к-интерпретатору [опциональные-аргументы] путь-к-скрипту аргументы

Путь к интерпретатору и опциональные аргументы берутся из начальной строки файла, путь к скрипту передается вызову execve(), а все дальнейшие аргументы указываются через параметр argv в том же вызове (при этом элемент argv[0] игнорируется). Происхождение каждого аргумента в скрипте показано на рис. 27.1.

Рис. 27.1. Список аргументов, который передается выполняемому скрипту

Происхождение аргументов интерпретатора можно продемонстрировать на примере скрипта, который использует программу из листинга 6.2 (necho.c). Эта программа просто выводит все аргументы командной строки, которые ей переданы. Воспользовавшись программой из листинга 27.1, чтобы запустить наш скрипт, мы увидим следующее:

$ cat > necho.script Создаем скрипт

#!/home/mtk/bin/necho some argument

Some junk

Нажмите Ctrl-D

$ chmod +x necho.script Делаем скрипт исполняемым

$ ./t_execve necho.script И выполняем скрипт

argv[0] = /home/mtk/bin/necho Первых три аргумента сгенерированы ядром

argv[1] = some argument Аргумент скрипта воспринимается как единое слово

argv[2] = necho.script Это путь к скрипту

argv[3] = hello world Это был элемент argVec[1], переданный в execve()

argv[4] = goodbye А это был элемент argVec[2]

В этом примере наш «интерпретатор» (necho) игнорирует содержимое скрипта (necho.script), поэтому вторая его строка (Some junk) никак не влияет на его выполнение.

Большинство командных оболочек и интерпретаторов в UNIX воспринимают символ # как начало комментария, поэтому при интерпретации скриптов они игнорируют начальную строку #!.

Использование необязательных аргументов скрипта

С помощью необязательных аргументов в начальной строке скрипта можно указать параметры командной строки для интерпретатора. Это бывает полезно при работе с такими интерпретаторами, как awk.

Интерпретатор awk стал частью системы UNIX в конце 1970-х годов. Язык awk описан во множестве книг, одна из которых написана его непосредственными создателями [Aho et al., 1988]. Из их инициалов, к слову, состоит название языка. Его сильной стороной является быстрое создание прототипов приложений, предназначенных для обработки текста. По своей архитектуре (слабая типизация, богатый набор инструкций для работы с текстом, синтаксис, основанный на С) awk является предком таких широко используемых на сегодня языков, как JavaScript и PHP.

Перейти на страницу:

Похожие книги