• Некоторые версии команды ps(1) показывают все потоки процесса (включая управляющий поток) в виде отдельных элементов со своими собственными идентификаторами.
• Потоки не разделяют атрибут nice, устанавливаемый вызовом setpriority().
• Интервальные таймеры, создаваемые вызовом setitimer(), не разделяются между потоками.
• Потоки не разделяют значения отмены семафоров (semadj) в System V.
Другие проблемы, присущие библиотеке LinuxThreads
Помимо расхождений со стандартом SUSv3, перечисленных выше, библиотека LinuxThreads имеет следующие недостатки.
• Если управляющий поток завершился, оставшиеся потоки придется утилизировать вручную.
• Дамп памяти многопоточной программы может содержать не все потоки процесса (или всего один поток, который спровоцировал создание дампа памяти).
• Нестандартная операция ioctl() TIOCNOTTY может убрать привязку процесса к управляющему терминалу, только если она вызвана из главного потока.
33.5.2. Библиотека NPTL
Библиотека NPTL была создана с целью устранения большинства недостатков, присущих LinuxThreads. В частности, тех, которые перечислены ниже.
• NPTL более строго следует спецификации Pthreads из стандарта SUSv3.
• По сравнению с LinuxThreads NPTL обеспечивает лучшее масштабирование приложений, использующих большое количество потоков.
Библиотека NPTL позволяет приложениям создавать большое число потоков, которое может достигать 100 000. В LinuxThreads ограничение на количество потоков обычно составляет несколько тысяч (следует признать, что столько потоков требуется очень немногим программам).
Работа над реализацией библиотеки NPTL началась в 2002 году и продолжалась около года. Параллельно с этим в ядро Linux вносились различные изменения, чтобы удовлетворить требования NPTL. Среди этих изменений, появившихся в Linux 2.6, можно выделить следующие:
• улучшения в реализации групп потоков (см. раздел 28.2.1);
• добавление фьютексов в качестве средства синхронизации (это универсальный механизм, который разрабатывался не только для NPTL);
• добавление новых системных вызовов (get_thread_area() и set_thread_area()) для поддержки локального хранилища на уровне потока;
• поддержку множественных потоков в дампе памяти и отладку многопоточных процессов;
• изменения для поддержки управления сигналами в соответствии с моделью Pthreads;
• добавление нового системного вызова exit_group() для завершения всех потоков в процессе (начиная с glibc 2.3, вызов _exit(), а значит, и библиотечная функция exit() превратились в обертку вокруг exit_group(), в то время как функция pthread_exit() на самом деле выполняет в ядре системный вызов _exit(), что приводит к завершению только вызывающего потока);
• для эффективного планирования большого количества (то есть тысяч) экземпляров KSE переписан планировщик ядра;
• улучшена производительность кода ядра, который отвечает за завершение процессов;
• расширен системный вызов clone() (см. раздел 28.2).
Основные особенности внутреннего устройства библиотеки NPTL таковы.
• Потоки создаются с помощью вызова clone(), для которого указаны следующие флаги:
CLONE_VM | CLONE_FILES | CLONE_FS | CLONE_SIGHAND | CLONE_THREAD | CLONE_SETTLS | CLONE_PARENT_SETTID | CLONE_CHILD_CLEARTID | CLONE_SYSVSEM
NPTL-потоки разделяют всю ту же информацию, что и потоки в LinuxThreads, и не только. Флаг CLONE_THREAD означает, что поток помещается в ту же группу, что и его создатель, и имеет с ним общие идентификаторы текущего и родительского процессов. Благодаря флагу CLONE_SYSVSEM поток разделяет со своим создателем значения отмены семафоров в System V.
Если воспользоваться командой ps(1) для вывода многопоточного процесса, основанного на NPTL, результатом будет всего одна строчка. Чтобы увидеть информацию о потоках внутри процесса, можно указать параметр ps — L.
• Внутри библиотеки используются первые два сигнала реального времени, недоступные обычным приложениям.
Один из этих сигналов отвечает за отмену потоков. Другой применяется в механизме, который гарантирует наличие одних и тех же идентификаторов пользователя и группы у всех потоков внутри одного процесса. Необходимость в этом механизме возникает из-за того, что на уровне ядра потоки имеют разные учетные данные. Следовательно, библиотека NPTL проделывает некоторую работу в функции-обертке для каждого системного вызова, который изменяет идентификаторы пользователя и группы (setuid(), setresuid() и аналогичные вызовы для группы), что приводит к изменению идентификаторов для всех потоков в процессе.
• В отличие от LinuxThreads библиотека NPTL не применяет управляющие потоки.
Благодаря этим изменениям библиотека NPTL намного строже следует стандарту SUSv3, чем LinuxThreads. На момент написания данной книги все еще остается следующее расхождение.
• Потоки не разделяют значение nice.
Дополнительные расхождения имелись в ядрах, предшествовавших версии 2.6.