备案控制台

开发者社区

开发者社区开发与运维文章正文

linux的内核日志系统

2017-11-12 1208

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

今天有同事问我在应用程序中怎么打印信息，在内核中有printk，用户空间用什么？我感到这个问题很奇怪，用printf不就可以了吗？他说他的代码在一个so中，我都无语了！他原来是做windows的，在windows中很多都是win32程序，带界面的，不是控制台程序，他大多数通过单步跟踪和断点来了解程序运行时的信息，其实吧，我倒是挺不喜欢单步或者断点的，除了特殊的调试需要，一般我都是通过打印日志来获取信息，linux有强大的日志记录系统，可以给程序一个安心的多的执行环境，日志仅仅是一个旁路的作用，起到记录个审计的作用而不会影响程序的执行，单步和断点就不同了，很多的问题你仅仅通过单步是无法发现的，特别是并发问题，不过在windows上写代码的哥们总是喜欢单步，就像他们总喜欢反汇编一样，这里面的原因就是，第一，windows程序大多数不是控制台，它实际上没有地方打印信息，第二，windows拥有强大的可视化IDE，这就给单步和断点提供了方便。

在linux中，syslogd是用户空间的一个守护进程，所有的需要记录日志的别的进程可以和这个守护进程通信，可以委托这个守护进程帮助记录日志，为何不自己记录呢，那是因为syslogd非常的专业，可以将日志记录到很细的地步，可以看etc/下面的配置文件，既然所有的进程都可以委托syslogd记录日志，那么就涉及到了进程间通信，这就是linux中另外一大块的内容了，这里就不谈了，linux善于使用小的程序组合成大的机制，linux善于分布式的思想而不是集中的，但是为何将日志都委托给一个守护进程呢，这不就集中了吗？其实这难道不是各司其职吗？因此这还是一个边界的问题。syslogd之外还有一个klogd，这两个其实不是一个层次的，syslogd是个总的日志记录器，而klogd仅仅是一个syslogd的客户端罢了，和很多需要记录日志的进程的级别一样，在需要记录日志的进程里，可以调用syslog函数将日志发送给syslogd守护进程，可是内核并不是一个进程，那么它的日志就有必要专门设置一个用户进程负责传给syslogd，这个进程就是klogd，至于klogd如何从内核得到内核日志信息，这就是它自己的事情了，其实内核专门留下了两个日志接口，一个是sys_syslog系统调用（注意不要和syslog函数混淆，syslog系统调用是和内核通信的，而syslog函数是和syslogd通信的），另一个是/proc/kmsg文件，klogd使用的是后者，当然也可以直接使用ksyslog系统调用。这里首先看一下内核日志的一些结构，首先内核日志大多数由printk产生，你也可以认为完全由printk产生，但是我们知道，printk将信息打印到了屏幕，并没有别的什么副作用，实际上并不是仅仅发生了我们看到的事情，实际上printk并不是将信息直接写入了标准输出文件，而仅仅将信息塞入了一个环形缓冲区，，然后至于这个缓冲区的内容什么时候显示到标准输出，那就是另外一个事情了，而内核日志就是存在于这个环形缓冲区，打印到屏幕的仅仅是一个缓冲区副本，真正的数据还在缓冲区保留，只有到了klogd或者别的什么调用syslog系统调用将信息读出时或者缓冲区满了（环形缓冲区首尾相接）的时候才会清除部分数据或者全部数据，刚才说了有两种方式来得到内核日志，一个是/proc/kmsg。一个是系统调用，幸运的是，这两个都是调用了do_syslog内核函数：

int do_syslog(int type, char __user * buf, int len)

unsigned long i, j, limit, count;

int do_clear = 0;

error = security_syslog(type);

switch (type) {

error = wait_event_interruptible(log_wait, (log_start - log_end)); //如果没有数据，那么就睡眠等待。

spin_lock_irq(&logbuf_lock); //如果要往外读数据，不希望在读的过程中数据发生变化，因此必须锁住环形数据缓冲区

while (!error && (log_start != log_end) && i < len) { //这里才是内核环形缓冲区真正消耗的地方。

c = LOG_BUF(log_start); //得到一个字符

log_start++; //只有在这里才逻辑上清除环形缓冲区的数据

spin_unlock_irq(&logbuf_lock);

error = __put_user(c,buf);

spin_lock_irq(&logbuf_lock);

spin_unlock_irq(&logbuf_lock);

我们看一下printk调用的vprintk内核函数：

asmlinkage int vprintk(const char *fmt, va_list args)

unsigned long flags;

int printed_len;

static char printk_buf[1024];

static int log_level_unknown = 1;

spin_lock_irqsave(&logbuf_lock, flags); //这个logbuf_lock自旋锁其实很重要，确保一次内核信息写的过程不会有别的写过程来捣乱，否则很多信息会揉在一起，比如hello和 world会变为hwellorold。

printed_len = vscnprintf(printk_buf, sizeof(printk_buf), fmt, args);

for (p = printk_buf; *p; p++) {

if (log_level_unknown) {

if (p[0] != '<' || p[1] < '' || p[1] > '7' || p[2] != '>') {

emit_log_char('<');

emit_log_char(default_message_loglevel + '');

emit_log_char('>');

log_level_unknown = 0;

emit_log_char(*p);

if (*p == '/n')

log_level_unknown = 1;

if (!cpu_online(smp_processor_id()) && system_state != SYSTEM_RUNNING) {

spin_unlock_irqrestore(&logbuf_lock, flags);

if (!down_trylock(&console_sem)) { //如果现在可以得到设备的信号量，那么马上将数据显示到终端

console_locked = 1;

spin_unlock_irqrestore(&logbuf_lock, flags);

console_may_schedule = 0;

release_console_sem(); //该函数具体显示数据

spin_unlock_irqrestore(&logbuf_lock, flags);//本次的内核信息已经写入了内核环形缓冲，为了不阻碍别人写，释放掉自旋锁

return printed_len;

内核的环形缓冲有两个用途，一个是直接打印在屏幕上，还有一个就是可能用户空间的内核日志程序正在运行，因此这个函数完成了两个作用：

void release_console_sem(void)

unsigned long flags;

unsigned long _con_start, _log_end;

unsigned long wake_klogd = 0;

for ( ; ; ) { //打印向屏幕，注意，打印的时候也要确保logbuf_lock被拥有，因为不想在打印过程中发生缓冲区变化的事情

spin_lock_irqsave(&logbuf_lock, flags);

wake_klogd |= log_start - log_end; //确保有数据，这个变量还作为是否唤醒do_syslog的睡眠队列的依据。

if (con_start == log_end)

break; /* Nothing to print */

_con_start = con_start;

_log_end = log_end;

con_start = log_end; //注意，log_end和log_start并没有变化，而是副本变化了，这是因为下面还要用到内核缓冲，不能因为写到了屏幕，信息就消耗了。

spin_unlock_irqrestore(&logbuf_lock, flags);

call_console_drivers(_con_start, _log_end);

console_locked = 0;

console_may_schedule = 0;

up(&console_sem);

spin_unlock_irqrestore(&logbuf_lock, flags);

if (wake_klogd && !oops_in_progress && waitqueue_active(&log_wait)) //如果内核唤醒缓冲中有数据，那么就唤醒睡眠队列

wake_up_interruptible(&log_wait);

最后我们看一下procfs导出的kmsg接口的read函数，其实也是调用了do_syslog函数：

static ssize_t kmsg_read(struct file *file, char __user *buf, size_t count, loff_t *ppos)

if ((file->f_flags & O_NONBLOCK) && !do_syslog(9, NULL, 0))

return -EAGAIN;

return do_syslog(2, buf, count);

这里我觉得有一个问题，就是在printk的时候，如果我们恰好可以得到设备的信号量，那么就必须等到信息完全显示到设备上时调用栈才可以返回，也就是说，最好不要在内核大量调用printk函数，另外，在多处理器上这也是很不利的，以前的处理器少，因此问题不大，现在都是多处理器了，性能就可能受printk的影响了，我觉得可以为每一个cpu准备一个环形缓冲区，然后在拼接这些缓冲区的时候进行控制，比如在用户空间读每个cpu的缓冲区，只不过将它们作为一个整体去理解，这个我感觉可以用文件系统实现。在任何程序中频繁调用打印都是不妙的，因为打印涉及设备操作，想想看，外设相比cpu多么慢，而且对于机器中的唯一设备，而且是每个进程几乎都在用的设备，我们花在打架上的时间又是何等的长。

回归同事问我的那个问题，在linux上怎么打印信息，其实，只要你不关闭，每个程序都会默认打开0，1，2三个文件描述符，这三个描述符在start_kernel中调用的kernel_init进程（最终成为/sbin/init）中被初始化，也就是在下面的代码：

if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0)

printk(KERN_WARNING "Warning: unable to open an initial console./n");

(void) sys_dup(0);

(void) sys_dup(0);

在这里，sys_open打开了/dev/console，将其作为标准输出，其实也就是我们的终端，当前终端，在sys_open中会自动将文件描述符0分配给这个终端文件，然后紧接着的sys_dup相当于复制了这个终端文件描述符代表的文件给了新的描述符1和2，这样的话实际上0，1，2代表的是同一个东西，都是指当前的终端，这也就是为什么你往标准错误里面写东西也不会错的道理，实际上标准输入，输出，错误都是给用户进程用的，对于内核，它们是一个东西。因为linux进程都是fork出来的，根源就是这个kernel_init进程，于是每个进程都会默认复制父进程的0，1，2文件描述符（如果父进程没有关闭它们的话）。

本文转自 dog250 51CTO博客，原文链接:http://blog.51cto.com/dog250/1274024

文章标签：

日志服务

Linux

Windows

开发工具

数据可视化

IDE

关键词：

Linux内核

Linux日志

内核日志服务

Linux日志系统

相关实践学习

日志服务之使用Nginx模式采集日志

本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。

科技小能手

目录

相关文章

暴风雨中的白杨

|

9天前

|

Linux C语言

Linux内核队列queue.h

Linux内核队列queue.h

暴风雨中的白杨

23 0 0

风水道人

|

19天前

|

Linux Shell

Linux手动清理Linux脚本日志定时清理日志和log文件执行表达式

Linux手动清理Linux脚本日志定时清理日志和log文件执行表达式

风水道人

72 1 1

泡沫o0

|

28天前

|

存储 Shell Linux

【Shell 命令集合系统设置】Linux 生成并更新内核模块的依赖 depmod命令使用指南

【Shell 命令集合系统设置】Linux 生成并更新内核模块的依赖 depmod命令使用指南

泡沫o0

30 0 0

泡沫o0

|

28天前

|

Shell Linux C语言

【Shell 命令集合网络通讯】Linux 查看系统中的UUCP日志文件 uulog命令使用指南

【Shell 命令集合网络通讯】Linux 查看系统中的UUCP日志文件 uulog命令使用指南

泡沫o0

29 0 0

泡沫o0

|

28天前

|

监控 Shell Linux

【Shell 命令集合系统管理】Linux 自动轮转(log rotation)日志文件 logrotate命令使用指南

【Shell 命令集合系统管理】Linux 自动轮转(log rotation)日志文件 logrotate命令使用指南

泡沫o0

48 0 0

泡沫o0

|

28天前

|

Shell Linux C语言

【Shell 命令集合系统设置】⭐Linux 卸载已加载的内核模块rmmod命令使用指南

【Shell 命令集合系统设置】⭐Linux 卸载已加载的内核模块rmmod命令使用指南

泡沫o0

29 1 1

听风de歌

|

12天前

|

存储监控安全

Linux系统日志

【4月更文挑战第6天】Linux系统日志，关键用于记录系统状态和事件，包括内核、系统、安全和应用日志，助力管理员诊断问题、确保系统正常运行。日志管理涉及收集、分析、备份等，常用工具如rsyslog、systemd-journal和logrotate（用于日志轮转）。重视日志文件的存储管理，防止空间占用过多。

听风de歌

16 1 1

历年考试不作弊

|

2天前

|

算法 Linux 调度

深入理解Linux内核的进程调度机制

【4月更文挑战第17天】在多任务操作系统中，进程调度是核心功能之一，它决定了处理机资源的分配。本文旨在剖析Linux操作系统内核的进程调度机制，详细讨论其调度策略、调度算法及实现原理，并探讨了其对系统性能的影响。通过分析CFS（完全公平调度器）和实时调度策略，揭示了Linux如何在保证响应速度与公平性之间取得平衡。文章还将评估最新的调度技术趋势，如容器化和云计算环境下的调度优化。

历年考试不作弊

7 0 0

Hugo_McQueen

|

4天前

|

SQL 监控安全

Linux&Windows 日志分析陇剑杯 CTF

Linux&Windows 日志分析陇剑杯 CTF

Hugo_McQueen

29 0 0

游客799

|

8天前

|

算法 Linux 调度

深度解析：Linux内核的进程调度机制

【4月更文挑战第12天】在多任务操作系统如Linux中，进程调度机制是系统的核心组成部分之一，它决定了处理器资源如何分配给多个竞争的进程。本文深入探讨了Linux内核中的进程调度策略和相关算法，包括其设计哲学、实现原理及对系统性能的影响。通过分析进程调度器的工作原理，我们能够理解操作系统如何平衡效率、公平性和响应性，进而优化系统表现和用户体验。

游客799

18 3 3

热门文章

最新文章

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

Seata常见问题之服务端 error日志没有输出,客户端执行sql报错如何解决

MySQL数据库，可以使用二进制日志（binary log）进行时间点恢复

C++系统日志库精选：深入剖析glog与log4cplus，轻松搭建高效日志系统

使用Java代码打印log日志

【深入探究 C++ 日志库清理策略】glog、log4cplus 和 spdlog 的日志文件管理策略

【Shell 命令集合系统管理】Linux 自动轮转(log rotation)日志文件 logrotate命令使用指南

ALTER MATERIALIZED VIEW LOG :语句来更改现有物化视图日志的存储特征或类型。

Kubernetes 集群监控与日志管理实践

使用logback异步打印日志

linux实验参考1

Linux中认识路径的概念

Linux创建空白文件

通过Linux挂载Windows端NFS服务实现板端Linux传输文件到PC

Linux实现socket网络通信

Linux 常用命令汇总（五）：网络操作命令

Linux安装HBase的详细教程及常用方法

Linux系统之rename命令的基本使用

Linux系统之file命令的基本使用

Linux 常用命令汇总（四）：信息显示 & 用户管理

相关课程

更多

Linux Web服务器Nginx搭建与配置

Linux用户和组管理

Linux服务器运维基本操作

Linux基本命令

Linux企业运维实战 - 入门及常用命令

Linux Shell 编程入门与实战

相关电子书

更多

Alibaba Cloud Linux 3 发布

ECS系统指南之Linux系统诊断

ECS运维指南之 Linux系统诊断

相关实验场景

更多

Alibaba Cloud Linux操作系统的安装及使用

Alibaba Cloud Linux操作系统Shell程序

推荐镜像

更多

mxlinux-iso

archlinuxarm

archlinuxcn

下一篇

阿里云oss简介和使用流程