kejingfan/Operating_Systems

Fork 0

kejingfan 5f1b6a7b06 first commit

2024-09-05 13:31:02 +08:00

12 KiB

Raw Blame History

北京交通大学实验报告

课程名称:操作系统

实验题目:Linux进程控制的实现机制

学号:21281280

姓名:柯劲帆

班级:物联网2101班

指导老师:何永忠

报告日期:2023年11月6日

1. 开发运行环境和工具

代码阅读环境：Windows11 + VS Code
开发测试环境：Bochs

2. 实验过程、分析和结论

2.1. fork系统调用和内核函数

首先在init/main.c-->main()中看到了fork()函数

if (!fork()) {		/* we count on this going ok */
    init();
}

即为如果fork()没有发现父进程（后面会讲到），则初始化系统，创建系统初始进程。

追踪fork()，发现在main.c开头有一行：

static inline _syscall0(int,fork)

即调用fork()时，编译器会将fork()内嵌为_syscall0(int,fork)，即在编译时直接替换为_syscall0(int,fork)的函数代码，以免调用堆栈。

追踪_syscall0()，在include/unistd.h中：

#define _syscall0(type,name) \
type name(void) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
	: "=a" (__res) \
	: "0" (__NR_##name)); \
if (__res >= 0) \
	return (type) __res; \
errno = -__res; \
return -1; \
}

即，调用fork()就是在调用

"int $0x80" : "=a" (__res) : "0" (__NR_fork)

"int $0x80"：表示触发软中断。在x86体系结构中，软中断0x80用于进入内核态进行系统调用。
: "=a" (__res)：对输出操作数的约束。=a 表示将寄存器 eax 的值分配给 __res，并且这个值会在系统调用结束后存储系统调用的返回值。
: "0" (__NR_fork)：对输入操作数的约束。0 表示使用与前面输出操作数相同的寄存器，这里是 eax。__NR_fork 是系统调用号的宏，被定义为2，用于标识调用的具体系统调用。

那么调用fork()时，就是调用了2号系统软中断。

接下来到kernel/system_call.s中查看软中断函数_system_call代码是如何执行的：首先进行了一系列参数的检查和原寄存器入栈保存操作，这里不予赘述。然后执行了

call _sys_call_table(,%eax,4)

按照传进来的参数，实际上调用了_sys_call_table(,2,4)

由于这是汇编文件，调用_sys_call_table()实际上就是在调用C语言代码中的sys_call_table()函数，因为在编译时，编译器会在C代码函数前加上_作为其在汇编代码中的命名（实验证明见附录）。

那么追踪sys_call_table()，在include/linux/sys.h中发现了系统调用表：

fn_ptr sys_call_table[] = { sys_setup, sys_exit, sys_fork, sys_read,
sys_write, sys_open, sys_close, sys_waitpid, sys_creat, sys_link,
sys_unlink, sys_execve, sys_chdir, sys_time, sys_mknod, sys_chmod,
sys_chown, sys_break, sys_stat, sys_lseek, sys_getpid, sys_mount,
sys_umount, sys_setuid, sys_getuid, sys_stime, sys_ptrace, sys_alarm,
sys_fstat, sys_pause, sys_utime, sys_stty, sys_gtty, sys_access,
sys_nice, sys_ftime, sys_sync, sys_kill, sys_rename, sys_mkdir,
sys_rmdir, sys_dup, sys_pipe, sys_times, sys_prof, sys_brk, sys_setgid,
sys_getgid, sys_signal, sys_geteuid, sys_getegid, sys_acct, sys_phys,
sys_lock, sys_ioctl, sys_fcntl, sys_mpx, sys_setpgid, sys_ulimit,
sys_uname, sys_umask, sys_chroot, sys_ustat, sys_dup2, sys_getppid,
sys_getpgrp, sys_setsid, sys_sigaction, sys_sgetmask, sys_ssetmask,
sys_setreuid,sys_setregid };

其中变量类型fn_ptr是函数指针。所以实际上_sys_call_table(,2,4)调用了第3个sys_fork函数。sys_fork函数在汇编后会被命名成_sys_fork。

我在kernel/system_call.s中找到了对其汇编后的调用_sys_fork，即系统调用fork的函数原型就是：

_sys_fork:
	call _find_empty_process
	testl %eax,%eax
	js 1f
	push %gs
	pushl %esi
	pushl %edi
	pushl %ebp
	pushl %eax
	call _copy_process
	addl $20,%esp
1:	ret

其中依次调用了_find_empty_process和_copy_process函数。这两个函数的C代码find_empty_process()和copy_process()在kernel/fork.c中：

find_empty_process()：寻找一个空闲的pid，并为其在任务数组中为新任务寻找一个空闲项，并返回项号。
copy_process()：复制父进程的各项值并初始化（这么做是因为复制比新建快）。

在这之中，代码为新进程创建了进程控制块struct task_struct *p，到include/linux/sched.h中跟踪其定义：

struct task_struct {
/* these are hardcoded - don't touch */
	long state;	/* -1 unrunnable, 0 runnable, >0 stopped */
    // 表示进程的状态，-1 表示不可运行，0 表示可运行，大于0 表示已停止。
	long counter;	// 计时器，用于调度，当计时器减至0时，进程可能被调度出去。
	long priority;	// 进程的优先级。
	long signal;	// 当前进程正在处理的信号。
	struct sigaction sigaction[32];	// 存储信号处理程序的数组。
	long blocked;	/* bitmap of masked signals */
    // 用于表示被阻塞的信号的位图。
/* various fields */
	int exit_code;
	unsigned long start_code,end_code,end_data,brk,start_stack;
	long pid,father,pgrp,session,leader;
    // pid 进程ID
    // father 父进程ID
    // pgrp 进程组ID
    // session 会话ID
    // leader 会话的领导者ID
	unsigned short uid,euid,suid;	// 用户ID、有效用户ID、保存的用户ID
	unsigned short gid,egid,sgid;	// 组ID、有效组ID、保存的组ID
	long alarm;	// 进程的闹钟定时器
	long utime,stime,cutime,cstime,start_time;
    // utime 用户态运行时间
    // stime 系统态运行时间
    // cutime 子进程的用户态运行时间
    // cstime 子进程的系统态运行时间
    // start_time 进程开始运行的时间
	unsigned short used_math;	// 表示是否使用了数学协处理器
/* file system info */
	int tty;	// 表示进程是否有终端
    /* -1 if no tty, so it must be signed */
	unsigned short umask;	// 文件创建的权限屏蔽掩码
	struct m_inode * pwd;	// 当前工作目录
	struct m_inode * root;	// 当前根目录
	struct m_inode * executable;	// 执行文件的指针
	unsigned long close_on_exec;	// 用于在执行新程序时关闭文件的标志位
	struct file * filp[NR_OPEN];	// 文件指针数组，用于表示打开的文件
/* ldt for this task 0 - zero 1 - cs 2 - ds&ss */
	struct desc_struct ldt[3];	// 进程的局部描述符表，包含代码段、数据段、堆栈段的描述符
/* tss for this task */
	struct tss_struct tss;	// 任务状态段，包含了一些处理器的状态信息
};

最后，返回新建进程的pid。

于是，fork调用就成功创建了新的进程和pid，并把pid返回给了调用fork的进程。

2.2. exit系统调用和内核函数

首先在init/main.c-->main()中看到了_exit()函数：

if (!(pid=fork())) {
    close(0);
    if (open("/etc/rc",O_RDONLY,0))
        _exit(1);
    execve("/bin/sh",argv_rc,envp_rc);
    _exit(2);
}

追踪_exit()，到lib/_exit.c中看到定义：

volatile void _exit(int exit_code)
{
	__asm__("int $0x80"::"a" (__NR_exit),"b" (exit_code));
}

和fork()一样，_exit()也是使用了系统中断来执行。

__NR_exit的宏定义为系统调用号1，所以实际上：__NR_exit 的值被加载到 %eax 寄存器；exit_code 的值被加载到 %ebx 寄存器，作为 exit 系统调用的参数，即退出码。

于是在kernel/system_call.s中，软中断函数_system_call代码执行了call _sys_call_table(,1,4)，即调用了系统调用表中的sys_exit。

sys_exit的定义在kernel/exit.c中：

int sys_exit(int error_code)
{
	return do_exit((error_code&0xff)<<8);
}

再追踪do_exit()的代码，主要执行以下任务：

释放当前进程的页表
处理与当前进程相关的其他进程
关闭当前进程打开的文件
释放当前进程的pwd、root和executable相关资源
处理当前进程是会话领导者等情况
通知父进程
调度下一个进程

至此，本进程结束退出，exit系统调用完毕。

2.3. 原子性实现

纵观代码，进程间的切换主要有两种方式，一种是主动切换，如pause()，其作用就是主动将当前进程挂起，切换到下一个进程任务执行，需要调用schedule()。在schedule()中会判断要操作的进程的状态是否是可中断的。

另一种是通过开关中断，主动允许/不允许中断打断当前进程。在include/asm/system.h中：

#define sti() __asm__ ("sti"::)
#define cli() __asm__ ("cli"::)

因此，在代码中使用sti()和cli()就能实现开/关中断。

在fork和exit系统调用代码中，并没有调用pause()主动切换，也不会因为硬件中断而导致共享资源出错（对栈的使用得当），因此实现了原子性。

2.4. 修改fork系统调用

修改kernel/fork.c文件中copy_process()函数定义，在return前打印出新进程的pid和状态：

p->state = TASK_RUNNING;	/* do this last, just in case */
printk("pid=%d, state=%d", last_pid, p->state);
return last_pid;

运行结果如下：

state为0表示当前进程（在刚刚创建时）是就绪态和运行态。

2.5. Makefile文件

首先，文件定义了编译必要的工具和选项，以及根设备、目标文件等；

接下来定义了编译规则，如从.c文件编译出.s文件等；

然后定义最后生成Image镜像文件；

规定Image文件的构建规则、写入磁盘规则；

定义构建工具的规则；

定义编译完后要清理的文件；

创建备份；

规定项目源码文件之间构建的依赖关系。

附录

编译kernel/fork.c：

[usr/src/linux/kernel]# gcc -E fork.c -fork.i
[usr/src/linux/kernel]# gcc -S fork.i -fork.s
[usr/src/linux/kernel]# vi fork.s

则可以看到，函数verify_area()变成了_verify_area，函数copy_mem()变成了_copy_mem。

12 KiB Raw Blame History Unescape Escape