<返回更多

linux进程间通信——深入理解linux信号量

2020-08-05    
加入收藏

信号灯

信号灯与其他进程间通信方式不大相同,它主要提供对进程间共享资源访问控制机制。相当于内存中的标志,进程可以根据它判定是否能够访问某些共享资源(临界区,类似于互斥锁),同时,进程也可以修改该标志。除了用于访问控制外,还可用于进程同步。

1. 信号灯概述

信号灯与其他进程间通信方式不大相同,它主要提供对进程间共享资源访问控制机制。相当于内存中的标志,进程可以根据它判定是否能够访问某些共享资源(临界区,类似于互斥锁),同时,进程也可以修改该标志。除了用于访问控制外,还可用于进程同步。信号灯有以下两种类型:

2. linux信号灯

linux对信号灯的支持状况与消息队列一样,在red had 8.0发行版本中支持的是系统V的信号灯。因此,本文将主要介绍系统V信号灯及其相应API。在没有声明的情况下,以下讨论中指的都是系统V信号灯。

注意,通常所说的系统V信号灯指的是计数信号灯集。

3. 信号灯与内核

1、系统V信号灯是随内核持续的,只有在内核重起或者显示删除一个信号灯集时,该信号灯集才会真正被删除。因此系统中记录信号灯的数据结构(struct ipc_ids sem_ids)位于内核中,系统中的所有信号灯都可以在结构sem_ids中找到访问入口。

2、下图说明了内核与信号灯是怎样建立起联系的:

linux进程间通信——深入理解linux信号量

 

其中:structipc_ids sem_ids是内核中记录信号灯的全局数据结构;描述一个具体的信号灯及其相关信息。

其中,struct sem结构如下:

struct sem
{    
  int semval; // current value    
  int sempid; // pid of last operation
}

从上图可以看出,全局数据结构struct ipc_ids sem_ids可以访问到struct ipc_id ipcid的一个成员:struct kern_ipc_perm;而每个struct kern_ipc_perm能够与具体的信号灯集对应起来是因为在该结构中,有一个key_t类型成员key,而key则唯一确定一个信号灯集struct sem_array;同时,结构struct sem_array的最后一个成员sem_nsems确定了该信号灯在信号灯集中的顺序,这样内核就能够记录每个信号灯的信息了。

kern_ipc_perm结构如下:

//内核中全局数据结构sem_ids能够访问到该结构;
struct kern_ipc_perm
{
    key_t   key;    //该键值则唯一对应一个信号灯集
    uid_t   uid;
    gid_t   gid;
    uid_t   cuid;
    gid_t   cgid;
    mode_t  mode;
    unsigned long seq;
}
/*系统中的每个信号灯集对应一个sem_array 结构 */
struct sem_array 
{
    struct kern_ipc_perm sem_perm; /* permissions .. see ipc.h */
    time_t sem_otime; /* last semop time */
    time_t sem_ctime; /* last change time */
    struct sem *sem_base; /* ptr to first semaphore in array */
    struct sem_queue *sem_pending; /* pending operations to be processed */
    struct sem_queue **sem_pending_last; /* last pending operation */
    struct sem_undo *undo; /* undo requests on this array */
    unsigned long sem_nsems; /* no. of semaphores in array */
};

其中,sem_queue结构如下:

/* 系统中每个因为信号灯而睡眠的进程,都对应一个sem_queue结构*/
struct sem_queue 
{
    struct sem_queue * next; /* next entry in the queue */
    struct sem_queue ** prev; /* previous entry in the queue, *(q->prev) == q */
    struct task_struct* sleeper; /* this process */
    struct sem_undo * undo; /* undo structure */
    int pid; /* process id of requesting process */
    int status; /* completion status of operation */
    struct sem_array * sma; /* semaphore array for operations */
    int id; /* internal sem id */
    struct sembuf * sops; /* array of pending operations */
    int nsops; /* number of operations */
    int alter; /* operation will alter semaphore */
};

需要C/C++ Linux服务器架构师学习资料私信“资料”(资料包括C/C++,Linux,golang技术,Nginx,ZeroMQ,MySQLredis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享

linux进程间通信——深入理解linux信号量

 

4. 操作信号灯

对信号灯的操作无非有下面三种类型:

1、打开或创建信号灯 与消息队列的创建及打开基本相同,不再详述。

2、信号灯值操作 linux可以增加或减小信号灯的值,相应于对共享资源的释放和占有。具体参见后面的semop系统调用。

3、获得或设置信号灯属性: 系统中的每一个信号灯集都对应一个struct sem_array结构,该结构记录了信号灯集的各种信息,存在于系统空间。为了设置、获得该信号灯集的各种信息及属性,在用户空间有一个重要的联合结构与之对应,即union semun。

linux进程间通信——深入理解linux信号量

 

联合semun数据结构:

union semun   
{  
    int val; /* value for SETVAL */  
    struct semid_ds *buf; /* buffer for IPC_STAT & IPC_SET */  
    unsigned short *array; /* array for GETALL & SETALL */  
    struct seminfo *__buf; /* buffer for IPC_INFO */ //test!!  
    void *__pad;  
};  
 
The semid_ds data structure is defined in <sys/sem.h> as follows:
 
struct semid_ds {
    struct ipc_perm sem_perm;  /* Ownership and permissions */
    time_t          sem_otime; /* Last semop time */
    time_t          sem_ctime; /* Last change time */
    unsigned short  sem_nsems; /* No. of semaphores in set */
};
 
The ipc_perm structure is defined in <sys/ipc.h> as follows (the highlighted fields are settable using IPC_SET):
struct ipc_perm {
    key_t key;            /* Key supplied to semget() */
    uid_t uid;            /* Effective UID of owner */
    gid_t gid;            /* Effective GID of owner */
    uid_t cuid;           /* Effective UID of creator */
    gid_t cgid;           /* Effective GID of creator */
    unsigned short mode;  /* Permissions */
    unsigned short seq;   /* Sequence number */
};
 
seminfo, defined in <sys/sem.h> if the _GNU_SOURCE feature test macro is defined:
 
struct  seminfo {
    int semmap;  /* #(number?) of entries in semaphore map;
                                unused */
    int semmni;  /* Max. # of semaphore sets */
    int semmns;  /* Max. # of semaphores in all
                                semaphore sets */
    int semmnu;  /* System-wide max. # of undo
                                structures; unused */
    int semmsl;  /* Max. # of semaphores in a set */
    int semopm;  /* Max. # of operations for semop() */
    int semume;  /* Max. # of undo entries per
                                process; unused */
    int semusz;  /* size of struct sem_undo */
    int semvmx;  /* Maximum semaphore value */
    int semaem;  /* Max. value that can be recorded for
                                semaphore adjustment (SEM_UNDO) */
};
The semmsl, semmns, semopm, and semmni settings can be changed via /proc/sys/kernel/sem; see proc(5) for details.


信号灯API

1、文件名到键值

#include <sys/types.h>
#include <sys/ipc.h>
key_t ftok (char*pathname, char proj);

它返回与路径pathname相对应的一个键值,具体用法请参考《Linux环境进程间通信(三):消息队列》。

2、 linux特有的ipc()调用:

int ipc(unsigned int call, int first, intsecond, int third, void *ptr, long fifth);

参数call取不同值时,对应信号灯的三个系统调用: 当call为SEMOP时,对应int semop(int semid, struct sembuf *sops, unsigned nsops)调用; 当call为SEMGET时,对应int semget(key_t key, int nsems,int semflg)调用; 当call为SEMCTL时,对应int semctl(int semid,int semnum,int cmd,union semun arg)调用; 这些调用将在后面阐述。

注:本人不主张采用系统调用ipc(),而更倾向于采用系统V或者POSIX进程间通信API。原因已在Linux环境进程间通信(三):消息队列中给出。

3、系统V信号灯API

系统V消息队列API只有三个,使用时需要包括几个头文件:

#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>

1)int semget(key_t key, int nsems, int semflg) 参数key是一个键值,由ftok获得,唯一标识一个信号灯集,用法与msgget()中的key相同;参数nsems指定打开或者新创建的信号灯集中将包含信号灯的数目;semflg参数是一些标志位。参数key和semflg的取值,以及何时打开已有信号灯集或者创建一个新的信号灯集与msgget()中的对应部分相同。该调用返回与健值key相对应的信号灯集描述字。 调用返回:成功返回信号灯集描述字,否则返回-1。 注:如果key所代表的信号灯已经存在,且semflg指定了IPC_CREAT|IPC_EXCL标志,那么即使参数nsems与原来信号灯的数目不等,返回的也是EEXIST错误;如果semflg只指定了IPC_CREAT标志,那么参数nsems必须与原来的值一致,在后面程序实例中还要进一步说明。

Upon creation, the least significant 9 bits of the argument semflg define the permissions (for owner, group and others) for the semaphore set. These bits have the same format, and the same meaning, as the mode argument of open(2) (though the execute permissions are not meaningful for semaphores, and write permissions mean permission to alter semaphore values)

例如:IPC_CREAT | 权限标识

2)int semop(int semid, struct sembuf *sops, unsigned nsops); semid是信号灯集ID,sops指向数组的每一个sembuf结构都刻画一个在特定信号灯上的操作。nsops为sops指向数组的大小。 sembuf结构如下:

struct sembuf
{    
  unsigned short sem_num; /* semaphore index in array */    
  short sem_op; /* semaphore operation */    
  short sem_flg; /* operation flags */
};


sem_num对应信号集中的信号灯,其值是一个从0到相应的信号量集的资源总数(ipc_perm.sem_nsems)之间的整数,0对应第一个信号灯。

sem_flg可取IPC_NOWAIT以及SEM_UNDO两个标志。如果设置了SEM_UNDO标志,那么在进程结束时,相应的操作将被取消,这是比较重要的一个标志位。如果设置了该标志位,那么在进程没有释放共享资源就退出时,内核将代为释放。如果为一个信号灯设置了该标志,内核都要分配一个sem_undo结构来记录它,为的是确保以后资源能够安全释放。事实上,如果进程退出了,那么它所占用的资源就释放了,但信号灯值却没有改变,此时,信号灯值反映的已经不是资源占有的实际情况,在这种情况下,问题的解决就靠内核来完成。这有点像僵尸进程,进程虽然退出了,资源也都释放了,但内核进程表中仍然有它的记录,此时就需要父进程调用waitpid来解决问题了。

sem_op的值大于0,等于0以及小于0确定了对sem_num指定的信号灯进行的三种操作。具体请参考linux相应手册页。 (是信号量在一次操作中需要改变的数值(可以是非1的数值)。通常只会用到两个值:-1----P操作,申请资源,如果已经没有资源可申请,则阻塞。为阻塞原语;1---V操作,释放资源,为唤醒原语。)

也许从实际含义上更好理解这些操作:信号灯的当前值记录相应资源目前可用数目;sem_op>0对应相应进程要释放sem_op数目的共享资源;sem_op=0可以用于对共享资源是否已用完的测试;sem_op<0相当于进程要申请-sem_op个共享资源。再联想操作的原子性,更不难理解该系统调用何时正常返回,何时睡眠等待。调用返回:成功返回0,否则返回-1。

若sem_op 是正数,其值就加到semval上,即释放信号量控制的资源若sem_op 是0,那么调用者希望等到semval变为0,如果semval是0就返回;若sem_op 是负数,那么调用者希望等待到semval变为大于或等于sem_op的绝对值。如果当前semval大于或等于sem_op的绝对值,则立即返回。

这里需要强调的是semop同时操作多个信号灯,在实际应用中,对应多种资源的申请或释放。semop保证操作的原子性,这一点尤为重要。尤其对于多种资源的申请来说,要么一次性获得所有资源,要么放弃申请,要么在不占有任何资源情况下继续等待,这样,一方面避免了资源的浪费;另一方面,避免了进程之间由于申请共享资源造成死锁。

3) int semctl(int semid,int semnum,int cmd,union semun arg) 该系统调用实现对信号灯的各种控制操作,参数semid指定信号灯集,参数cmd指定具体的操作类型;参数semnum指定对哪个信号灯操作,只对几个特殊的cmd操作有意义;arg用于设置或返回信号灯信息。该系统调用详细信息请参见其手册页,这里只给出参数cmd所能指定的操作。

linux进程间通信——深入理解linux信号量

 

IPC_RMID Immediately remove the semaphore set, awakening all processes blocked in semop()

calls on the set (with an error return and errno set to EIDRM). The effective user ID

of the calling process must match the creator or owner of the semaphore set, or the

caller must be privileged. The argument semnum is ignored.

调用返回:调用失败返回-1,成功返回与cmd相关:

linux进程间通信——深入理解linux信号量

 

5. 信号灯的限制

1、一次系统调用semop可同时操作的信号灯数目SEMOPM,semop中的参数nsops如果超过了这个数目,将返回E2BIG错误。SEMOPM的大小特定与系统,redhat 8.0为32。

2、信号灯的最大值:SEMVMX,当设置信号灯值超过这个限制时,会返回ERANGE错误。在redhat 8.0中该值为32767。

3、系统范围内信号灯集的最大数目SEMMNI以及系统范围内信号灯的最大数目SEMMNS。超过这两个限制将返回ENOSPC错误。redhat 8.0中该值为32000。

4、每个信号灯集中的最大信号灯数目SEMMSL,redhat 8.0中为250。 SEMOPM以及SEMVMX是使用semop调用时应该注意的;SEMMNI以及SEMMNS是调用semget时应该注意的。SEMVMX同时也是semctl调用应该注意的。

6. 竞争问题

第一个创建信号灯的进程同时也初始化信号灯,这样,系统调用semget包含了两个步骤:创建信号灯;初始化信号灯。由此可能导致一种竞争状态:第一个创建信号灯的进程在初始化信号灯时,第二个进程又调用semget,并且发现信号灯已经存在,此时,第二个进程必须具有判断是否有进程正在对信号灯进行初始化的能力。在参考文献[1]中,给出了绕过这种竞争状态的方法:当semget创建一个新的信号灯时,信号灯结构semid_ds的sem_otime成员初始化后的值为0。因此,第二个进程在成功调用semget后,可再次以IPC_STAT命令调用semctl,等待sem_otime变为非0值,此时可判断该信号灯已经初始化完毕。下图描述了竞争状态产生及解决方法:

linux进程间通信——深入理解linux信号量

 

实际上,这种解决方法也是基于这样一个假定:第一个创建信号灯的进程必须调用semop,这样sem_otime才能变为非零值。另外,因为第一个进程可能不调用semop,或者semop操作需要很长时间,第二个进程可能无限期等待下去,或者等待很长时间。

7. 信号灯应用实例

本实例有两个目的:1、获取各种信号灯信息;2、利用信号灯实现共享资源的申请和释放。并在程序中给出了详细注释。

#include <stdio.h>
#include <sys/sem.h>
#include <errno.h>
#include <unistd.h>
#include <stdlib.h>
 
 
#define SEM_PATH "/unix/my_sem"
#define max_tries 10
 
#ifndef IPC_INFO
#define IPC_INFO 3     /* see ipcs */
#endif
 
int gi_semid;
const int gi_semcnt = 1;
 
union semun     
{    
    int val;                /* value for SETVAL */    
    struct semid_ds *buf;   /* buffer for IPC_STAT & IPC_SET */    
    unsigned short *array;  /* array for GETALL & SETALL */    
    struct seminfo *__buf;  /* buffer for IPC_INFO */ //test!!    
    void *__pad;    
};
 
 
int main()
{
    int i_flag_create, i_flag_get, i_key, i, i_init_ok, i_tmperrno;
    struct semid_ds semid_ds_var;
    struct seminfo seminfo_var;
    union semun semun_arg;
    struct sembuf sembuf_ask, sembuf_free;
 
    i_flag_create = IPC_CREAT | IPC_EXCL | 00666;
    i_flag_get = IPC_CREAT | 00666;
    i_key = ftok( SEM_PATH, 'a' );
 
    //error handling for ftok here;
    i_init_ok = 0;
    gi_semid = semget( i_key, gi_semcnt, i_flag_create );
 
    //create a semaphore set that only includes one semaphore.
    if( gi_semid < 0 )
    {
        i_tmperrno = errno;
 
        perror( "semget" );
 
        if( i_tmperrno == EEXIST )
        //errno is undefined after a successful library call( including perror call)
        //so it is saved in i_tmperrno.
        {
            gi_semid = semget( i_key, gi_semcnt, i_flag_get );
            // i_flag_get 只包含了IPC_CREAT标志, 参数nsems(这里为1)
            // 必须与原来的信号灯数目一致
 
            semun_arg.buf = &semid_ds_var;
            for ( i = 0; i < max_tries; i++ )
            {
                printf( "semctl IPC_STAT, to solve compete: %d n", i );
                if ( semctl( gi_semid, 0, IPC_STAT, semun_arg ) == -1 )
                {
                    perror( "semctl error" );
                    i = max_tries;
                }
                else
                {
                    if( semun_arg.buf->sem_otime != 0 )
                    // the create process already initialized the semaphore
                    {
                        i = max_tries; 
                        i_init_ok = 1;
                    }
                    else 
                        sleep(1);
                }
            } // for(i=0; i<max_tries; i++)
 
            if( !i_init_ok )
            // do some initializing, here we assume that the first process that creates the sem
            // will finish initialize the sem and run semop in max_tries*1 seconds. else it will
            // not run semop any more.
            {
                printf( "semctl SETVALn" );
                semun_arg.val = 1;
                if ( semctl( gi_semid, 0, SETVAL, semun_arg ) == -1 ) 
                    perror( "semctl SETVAL error" );
            } // if(!i_init_ok)
 
        } // if(i_tmperrno==EEXIST)
        else
        {
            perror("semget error, process exit"); 
            exit( 1 ); 
        }
 
    }
    else //gi_semid>=0; do some initializing
    {        
        printf( "create semaphore success, initialize itn" );
        semun_arg.val = 1;
        if ( semctl( gi_semid, 0, SETVAL, semun_arg ) == -1 )
            perror( "semctl SETVAL error" );
    }
 
    //get some information about the semaphore and the limit of semaphore in redhat8.0
    semun_arg.buf=&semid_ds_var;
    if( semctl( gi_semid, 0, IPC_STAT, semun_arg ) == -1 )
        perror("semctl IPC STAT");
 
    printf( "owner's uid is %dn", semun_arg.buf->sem_perm.uid );
    printf( "owner's gid is %dn", semun_arg.buf->sem_perm.gid );
    printf( "creater's uid is %dn", semun_arg.buf->sem_perm.cuid );
    printf( "creater's gid is %dn", semun_arg.buf->sem_perm.cgid );
    
    semun_arg.__buf = &seminfo_var;
    if( semctl( gi_semid, 0, IPC_INFO, semun_arg ) == -1 )
        perror( "semctl IPC_INFO" );
 
    printf( "the number of entries in semaphore map is %d n", semun_arg.__buf->semmap );
    printf( "max number of semaphore identifiers is %d n", semun_arg.__buf->semmni );
    printf( "mas number of semaphores in system is %d n", semun_arg.__buf->semmns );
    printf( "the number of undo structures system wide is %d n", semun_arg.__buf->semmnu );
    printf( "max number of semaphores per gi_semid is %d n", semun_arg.__buf->semmsl );
    printf( "max number of ops per semop call is %d n", semun_arg.__buf->semopm );
    printf( "max number of undo entries per process is %d n", semun_arg.__buf->semume );
    printf( "the sizeof of struct sem_undo is %d n", semun_arg.__buf->semusz );
    printf( "the maximum semaphore value is %d n", semun_arg.__buf->semvmx );
 
    // print sem_otime
    semun_arg.buf = &semid_ds_var;
    if ( semctl( gi_semid, 0, IPC_STAT, semun_arg ) == -1 )
    {
        perror( "semctl error" );
        i = max_tries;
    }
    else
    {
        printf( "before semop, semun_arg.buf->sem_otime: %lun", semun_arg.buf->sem_otime );
    }
    
    //now ask for available resource:
    printf( "now ask the resourcen" );
    sembuf_ask.sem_num = 0;
    sembuf_ask.sem_op = -1;
    sembuf_ask.sem_flg = SEM_UNDO;
    if( semop( gi_semid, &sembuf_ask, 1 ) == -1 )   //ask for resource
        perror("semop error");
    printf( "ask the resource successn" );
 
    // print sem_otime
    semun_arg.buf = &semid_ds_var;
    if ( semctl( gi_semid, 0, IPC_STAT, semun_arg ) == -1 )
    {
        perror( "semctl error" );
        i = max_tries;
    }
    else
    {
        printf( "after semop, semun_arg.buf->sem_otime: %lun", semun_arg.buf->sem_otime );
    }
    
    sleep(5);
 
    //do some handling on the sharing resource here, just sleep on it 3 seconds
    printf( "now free the resourcen" );
 
    //now free resource
    sembuf_free.sem_num = 0;
    sembuf_free.sem_op = 1;
    sembuf_free.sem_flg = SEM_UNDO;
 
    if ( semop( gi_semid, &sembuf_free, 1 ) == -1 )     //free the resource.
        if( errno == EIDRM )
            printf( "the semaphore set has been removedn" );
    
    //you can comment out the codes below to compile a different version:
    if( semctl( gi_semid, 0, IPC_RMID ) == -1 )
        perror( "semctl IPC_RMID" );
    else 
        printf("remove sem okn");
 
    return 0;
}

注:读者可以尝试一下注释掉初始化步骤,进程在运行时会出现何种情况(进程在申请资源时会睡眠),同时可以像程序结尾给出的注释那样,把该程序编译成两个不同版本。下面是本程序的运行结果(操作系统gentoo):

create semaphore success, initialize it
owner's uid is 1007
owner's gid is 1007
creater's uid is 1007
creater's gid is 1007
the number of entries in semaphore map is 32000 
max number of semaphore identifiers is 128 
mas number of semaphores in system is 32000 
the number of undo structures system wide is 32000 
max number of semaphores per gi_semid is 250 
max number of ops per semop call is 32 
max number of undo entries per process is 32 
the sizeof of struct sem_undo is 20 
the maximum semaphore value is 32767 
before semop, semun_arg.buf->sem_otime: 0
now ask the resource
ask the resource success
after semop, semun_arg.buf->sem_otime: 1398501342
now free the resource
remove sem ok

Summary:信号灯与其它进程间通信方式有所不同,它主要用于进程间同步。通常所说的系统V信号灯实际上是一个信号灯的集合,可用于多种共享资源的进程间同步。每个信号灯都有一个值,可以用来表示当前该信号灯代表的共享资源可用(available)数量,如果一个进程要申请共享资源,那么就从信号灯值中减去要申请的数目,如果当前没有足够的可用资源,进程可以睡眠等待,也可以立即返回。当进程要申请多种共享资源时,linux可以保证操作的原子性,即要么申请到所有的共享资源,要么放弃所有资源,这样能够保证多个进程不会造成互锁。Linux对信号灯有各种各样的限制,程序中给出了输出结果。另外,如果读者想对信号灯作进一步的理解,建议阅读sem.h源代码,该文件不长,但给出了信号灯相关的重要数据结构。

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>