Главная » Ядро Linux » Дескриптор памяти

0

Ядро представляет адресное пространство процесса в виде структуры данных, которая называется  дескриптором памяти. Эта  структура содержит всю  информацию, которая относится к  адресному пространству процесса. представляется с  помощью  структуры  struc t   mm_struct,  которая определена в  файле

<1inux/sched.h> 3 .

Рассмотрим эту  структуру с  комментариями, поясняющими назначение каждого поля.

struct mm_struct {

struct vm_area_struct *mmap;    /* список областей памяти */

struct rb_root     mm_rb;     /* красно-черное дерево областей памяти*/ struct vm_area_struct *mmap_cache; /*последняя использованная область памяти*/ unsigned long       free_area_cache; /* первый незанятый участок

spinlock_t         page_table_lock; /* спин-блокировка таблиц страниц*/ struct list_head     mmlist;   /* список всех структур mm_struct */ unsigned long       start_code; /* начальный адрес сегмента кода */ unsigned long       end code;  /* конечный адрес сегмента кода */ unsigned long       start_data; /* начальный адрес сегмента данных */ unsigned long    end_data;    /* конечный адрес сегмента данных */ unsigned long       start_brk; /* начальный адрес сегмента "кучи" */ unsigned long       brk;      /* конечный адрес сегмента "кучи" */ unsigned long       start_stack;  /* начало стека процесса */

unsigned long       arg_start; /* начальный адрес области аргументов */ unsigned long       arg_end;   /* конечный адрес области аргументов */ unsigned long env_start; /*начальный адрес области переменных среды */ unsigned long       env_end;   /*конечный адрес области переменных среды*/ unsigned long        rss;      /* количество физических страниц памяти*/ unsigned long    total_vm;    /* общее количество страниц памяти */ unsigned long       locked_vm; /* количество заблокированных страниц

памяти */

unsigned long       def_flags; /* флаги доступа, используемые по умолчанию */

unsigned long      cpu_vm_mask; /*MacKa отложенного переключения буфера TLB*/ unsigned long       swap_address; /* последний сканированный адрес */ unsigned           dumpable:l;  /* можно ли создавать файл core? */ int                used_hugetlb; /* используются ли гигантские

страницы памяти (hugetlb)? */

3    Между дескриптором   процесса,  дескриптором   памяти  и  соответствующими  функциями   существует тесна я  связь.   Поэтому   структура  struc t   mm_struc t   и  определена  в  заголовочном   файл е  sched.h.

mm_context_t       context;  /* данные, специфичные для аппаратной платформы */

int               core_waiters; /* количество потоков, ожидающих на создание файла core */

struct completion   *core_startup_donc; /* условная переменная начала создания файла core */

struct completion   core_done; /* условная переменная завершения создания файла core */

rwlock_t          ioctx_l.ist_lock; /* блокировка списка асинхронного ввода-вывода (AIO) */

struct kioctx      *ioctx_list; /* список асинхронного ввода-вывода (AIO) V

struct kioctx      default kioctx; /* контекст асинхронного вводавывода, используемый по умолчанию */

};

Поле  mm_users — это  количество процессов,  которые  используют данное  адресное  пространство. Например,  если  одно  и  то  же  адресное пространство  совместно  используется  двумя  потоками,  то  значение  поля   mm_user s  равно   двум.  Поле ram_count — это  основной счетчик использования  структуры   mm_struct .  Наличие пользователей  структуры,  которым  соответствует поле   mm_users ,  приводит к  увеличению  счетчика mm_coun t  на  единицу.  В  предыдущем примере  значение  поля mm_count равно  единице. Когда  значение поля  mm_user s становится равным нулю (т.е.  когда  два  потока   завершатся), только  тогда  значение поля  mm_count уменьшается  на  единицу.  Когда  значение поля  mm_coun t  становится  равным  нулю,  то  на соответствующую  структуру   mm_struc t   больше   нет  ссылок,  и  она  освобождается, Поддержка двух  счетчиков  позволяет  ядру  отличать   главный  счетчик  использования   (mm_count)  от  количества  процессов,  которые  используют данную   структуру (mm_users).

Поля  mmap  и mm_r b — это  два  различных контейнера данных, которые содержат одну  и  ту же  информацию:  информацию  обо  всех  областях   памяти  в  соответствующем   адресном  пространстве.  В  первом   контейнере  эта  информация  хранится в виде  связанного списка,  а  во  втором—    в  виде  красно-черного  бинарного дерева. Поскольку красно-черное дерево  — это  разновидность бинарного дерева, то,  как  и для  всех  типов  бинарного  дерева,  количество операций  поиска  заданного элемента в  нем  равно  О(lo g (n)  ).  Более  детальное рассмотрение красно-черных деревьев  найдете  в  разделе  "Списки и деревья  областей  памяти".

Хотя  обычно   в  ядре  избегают   избыточности,  связанной  с  введением  нескольких структур  для  хранения  одних  и  тех  же  данных,  тем  не  менее   в  данном  случае  эта избыточность очень  кстати.  Контейнер mmap — это  связанный список, который позволяет  очень  быстро  проходить по  всем  элементам.  С  другой  стороны,  контейнер mm_rb  — это  красно-черное  дерево,  которое очень  хорошо   подходит  для  поиска заданного элемента.  Области   памяти будут рассмотрены в этой  главе  несколько ниже, Все  структуры   mm_struc t  объединены в  двухсвязный список  с  помощью  нолей mmlist .  Первым элементом этого  списка  является дескриптор памяти  init_mm , который  является дескриптором памяти процесса ink .  Этот  список защищен от  конкурентного доступа  с  помощью  блокировки  mmlist_lock ,  которая  определена  в  файле   kernel/fork.с .   Общее  количество дескрипторов памяти  хранится в глобальной

целочисленной  переменной mmlist_nr ,  которая определена в том  же  файле.

Выделение дескриптора памяти

Указатель на дескриптор памяти,  выделенный для  какой-либо  задачи, хранится в поле  mm дескриптора процесса этой  задачи.  Следовательно, выражение current->rnm позволяет получить дескриптор памяти текущего   процесса. Функция  copy_mm()  используется для  копирования  дескриптора  родительского процесса в  дескриптор порожденного процесса во  время  выполнения вызова   fоrk  () .  Структура mm_struc t выделяется из  слябового кэша  mm_cachep с  помощью макроса allocate_m m () .  Это реализовано  в  файле    kernel/fork.с .   Обычно  каждый   процесс получает  уникальный  экземпляр  структуры   mm_struc t  и  соответственно уникальное  адресное пространство.

Процесс может  использовать одно  и  то  же  адресное пространство  совместно со своими порожденными процессами,  путем  указания флага  CLONE_VM при  выполнении  вызова  clon e () .  Такие  процессы называются потоками.  Вспомните из  материала  главы  3,  "Управление процессами",  что  в операционной системе   Linux  в этом  и состоит   единственное  существенное  отличие между  обычными  процессами  и  потоками.  Ядро  Linux  больше   никаким другим  образом их  не  различает. Потоки с  точки зрения ядра—  это  обычные процессы,  которые просто  совместно  используют некоторые  общие   ресурсы.

В случае,  когда  указан   флаг  CLONE_VM, макрос   allocate_mm( )   не  вызывается,  а в поле mm дескриптора порожденного процесса записывается значение указателя на дескриптор памяти родительского процесса.  Это  реализовано с.  помощью следующего оператора ветвления в функции сору_m m () .

if   (clone_flag s  &  CLONE_VM)   {

/*

*  curren t  — это  родительский  процесс

*  ts k  — это   процесс,  порожденный  в  вызове   fork( )

*/

atomic_inc(&current->mm->mm_users);

tsk->mm = current->mm;

}

Удаление дескриптора памяти

Когда  процесс,  связанный с  определенным  адресным пространством,  завершается, то  вызывается функция  exit_mm( ) .  Эта  функция  выполняет некоторые служебные  действия и  обновляет некоторую  статистическую информацию.  Далее  вызывается  функция input() , которая уменьшает на  единицу значение счетчика количества пользователей  mm_user s  для  дескриптора памяти.  Когда  значение  счетчика количества  пользователей становится  равным  нулю,  то  вызывается функция mmdrop( ) , которая уменьшает значение основного счетчика использования mm_count.  Когда  и этот  счетчик использования  наконец  достигает   нулевого   значения,  то  вызывается функция  free_mm() ,  которая возвращает экземпляр структуры  mm_struc t  в  слябовый  кэш mm_cachep с помощью вызова  функции  kmem_cache_fгее() , поскольку де-. скриптор памяти больше  не  используется.

Структура mm_struc t и потоки пространства ядра

Потоки пространства ядра  не  имеют  своего  адресного пространства процесса и, следовательно, связанного с ним  дескриптора памяти. Значение поля  mm для потока пространства ядра  равно  NULL. Еще  одно  определение потока ядра — это  процесс, который  не  имеет  пользовательского контекста.

Отсутствие адресного пространства— хорошее свойство,  поскольку потоки  ядра вообще не  обращаются к памяти в пространстве пользователя (действительно,  к какому  адресному пространству им  обращаться?). Поскольку потоки ядра  не  обращаются  к страницам памяти в пространстве пользователя,  им  вообще не  нужен  дескриптор  памяти и таблицы страниц (таблицы страниц обсуждаются дальше  в этой  главе). Несмотря на  это,  потокам пространства ядра  все  же  нужны   некоторые структуры данных, такие  как  таблицы страниц,  чтобы  обращаться к  памяти ядра.   Чтобы  обеспечить потоки ядра  всеми  данными без  необходимости тратить  память на дескриптор  памяти и  таблицы страниц,  а также  процессорное время  на  переключение на новое   адресное пространство и  так  далее,  каждый  поток  ядра  использует дескриптор  памяти задания, которое выполнялось перед  ним.

Когда  процесс запланирован на  выполнение,  то  загружается адресное пространство, на  которое указывает поле  mm  этого  процесса. Поле active_m m дескриптора процесса обновляется таким  образом, чтобы  указывать на новое  адресное пространство.  Потоки ядра  не  имеют  своего  адресного пространства,  поэтому значение поля mm для них равно  NULL. Поэтому, когда  поток  ядра планируется на выполнение, ядро определяет, что значение ноля  mm равно  NULL, и оставляет загруженным предыдущее адресное пространство. После этого  ядро  обновляет поле  active_m m  дескриптора процесса для  потока ядра,  чтобы  он  указывал на  дескриптор памяти предыдущего процесса.  Пр и  необходимости  поток  ядра  может  использовать таблицы  страниц предыдущего процесса. Так  как  потоки ядра  не  обращаются к памяти в пространстве пользователя, то  они  используют только  ту информацию об  адресном пространстве ядра, которая связана с памятью ядра  и является общей  для  всех  процессов.

Источник: Лав,  Роберт. Разработка ядра  Linux, 2-е  издание. : Пер.  с англ.  — М.  : ООО  «И.Д.  Вильяме» 2006. — 448 с. : ил. — Парал. тит. англ.

По теме:

  • Комментарии