11月 | 2021 | 呆鸥

原文地址：http://btorpey.github.io/blog/2014/02/18/clock-sources-in-linux/

他山之石，可以攻玉，该文章将详细地介绍了在Linux 系统中使用TSC 时钟精确地计算一段代码过程（中断和函数等）执行时间需要注意的内容，可以配置Intel 官方文档《How to Benchmark Code Execution Times on Intel® IA-32 and IA-64 Instruction Set Architectures》一起阅读。下面是译文。

为了在现代（操作）系统中的测量（一段过程的）延迟，我们需要（测量时间间隔的时钟）至少能够以微秒为单位，最好以纳秒为单位。好消息是，使用相对现代的硬件和软件，可以准确地测量小到几个纳秒的时间间隔。

但是，为确保您的（测量）结果是准确的，更重要的是要了解您要测量什么，以及不同情况下测量过程的边界是什么。

概要

为了（在Linux 中测量延迟）获得最佳效果，您应该使用：

（使用）Linux 内核 2.6.18 或更高版本 —— 这是第一个包含 hrtimers （高精度时钟）包的版本。最好的是 2.6.32 或更高版本，包括了对大多数不同时钟源的支持。
具有恒定不变的 TSC（constant, invariant TSC (time-stamp counter)）的 CPU。这意味着 TSC 在所有插槽和CPU核心上都以恒定速率运行，而不管电源管理（代码）对 CPU 的频率进行如何更改。如果 CPU 支持 RDTSCP 指令那就更好了（RDTSCP 会使得读取的时间更准确和稳定）。
TSC 应配置为Linux 内核的时钟源。
您应该测量发生在同一台机器上的两个事件之间的间隔（机器内计时，即intra-machine timing）。
对于机器内计时，您最好的选择使用汇编语言直接读取 TSC。在我的测试机器上，软件读取 TSC 大约需要 100ns，这是该方法准确性的（边界）限制（要测量100ns 以内的时间间隔是不实际的）。但不同机器读取TSC 开销不尽相同，这就是为什么我提供了源代码，您可以用来进行测量自己的机器。
- 请注意，上面提到的100ns 主要是因为我的Linux 机器不支持RDTSCP 指令。所以为了获取合理准确的计时，在RDTSC 之前还执行了CPUID 指令以序列化指令执行过程。而在另一台支持RDTSCP 指令的机器（新 MacBook Air）上，开销下降了大约 14ns。

下面将讨论时钟在Linux 上的工作原理，如何从软件（角度）访问各种时钟，以及如何测量访问它们的开销。

继续阅读 →

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

呆鸥

Brains first and then Hard Work

月度归档：11月 2021

在Linux 中测量延迟