LWN:使用rseq()来帮助完成用户空间自旋锁!

AndréAlmeida在2023年欧洲开源峰会上提出了一种解决方案,利用Linux的可重启序列(rseq)功能来改进用户空间自旋锁,避免无谓的CPU浪费。通过检查线程在CPU上的状态,自适应性地决定是继续自旋还是切换到阻塞。尽管还有优化和测试的需求,这一方法显示出潜力。

关注了就能看到更多这么棒的文章哦~

User-space spinlocks with help from rseq()

By Jonathan Corbet
September 22, 2023
OSSEU
ChatGPT translation
https://lwn.net/Articles/944895/

之前五月份的时候,André Almeida在使用自适应自旋方式(adaptive spinning)创建用户空间自旋锁(user-space spinlocks)的工作 进行了一些工作。当时,这项工作因为Linux中目前没有一种方法能快速确定指定线程是否实际在CPU上执行而停滞不前。此后在2023年欧洲开源峰会上,Almeida又回来继续讨论了如何克服这个困难。

070168825b4fc6ead46fc7560c99019b.png

他首先对锁相关的原语(locking primitives)以及自旋锁的工作原理进行了概述。简而言之,自旋锁之所以被命名为自旋锁,是因为如果尝试获取锁失败,代码将在一个循环中重新检查其状态(因此称为“自旋”),直到锁可用为止。在内核中相对容易实现自旋锁,因为根据自旋锁操作的规则,锁的持有者目前必定正在系统中的某个CPU上运行,应该很快释放锁;这确保了自旋导致的CPU时间损失会很小。

在用户空间,情况更加复杂。一个线程可能正在持续试图获取自旋锁,但是锁的当前持有者已被抢占,根本不在运行。在这种情况下,锁不会很快释放,自旋就只会浪费CPU时间。在最坏的情况下,正在自旋的线程可能正是阻止它所需的锁被释放的线程,这意味着自旋线程正在主动阻止其所需的锁被释放。在这种情况下,代码应该停止自旋,马上休眠,直到锁被释放。

然而,这样做需要有一种方式能让获取锁的这部分代码知道锁的所有者不在运行。可以为此添加一个系统调用,但系统调用开销很大;在这种情况下,系统调用开销可能很容易超过由锁保护的关键部分(critical section)中花费的时间。如果必须要调用进入内核,最好是等到锁被释放后再阻塞。真正需要的是一种不进行系统调用就能获取这些信息的方法。

在五月份的讨论中提到了使用可重启序列 (restartable sequences)功能来获取这些信息。这个子系统在scheduler调度器内有hook,用于跟踪任务抢占等事件;它还使用一个共享内存段(shared-memory segment)来将某些信息传递给用户空间。也许可重启序列也可以用来解决这个问题?

可重启序列代码的维护者Mathieu Desnoyers迅速回应并提供了一个实现这一功能的补丁。这个补丁在内核和用户空间之间共享的 rseq 结构中添加了一个新的成员:

struct rseq_sched_state {
/*
 * Version of this structure. Populated by the kernel, read by
 * user-space.
 */
__u32 version;
/*
 * The state is updated by the kernel. Read by user-space with
 * single-copy atomicity semantics. This field can be read by any
 * userspace thread. Aligned on 32-bit. Contains a bitmask of enum
 * rseq_sched_state_flags. This field is provided as a hint by the
 * scheduler, and requires that the page holding this state is
 * faulted-in for the state update to be performed by the scheduler.
 */
__u32 state;
/*
 * Thread ID associated with the thread registering this structure.
 * Initialized by user-space before registration.
 */
__u32 tid;
  };

state 字段包含一组描述了所关注进程的执行状态的flag,这是此方案的关键。这里只定义了一个flag, RSEQ_SCHED_STATE_FLAG_ON_CPU 。每当与该结构关联的线程被放置到CPU上执行时,都会设置这个flag;如果线程因任何原因停止运行,则该标志会再次被清0。

这些信息足以在用户空间实现自适应自旋。如果尝试获取自旋锁失败,第一步是检查持有锁的线程的 rseq_sched_state (这里隐含了一个要求就是这种通信发生在可以访问彼此的可重启序列状态的线程之间)。如果检查显示线程正在运行,那么自旋等待锁被释放就有意义的(当然,需要在循环内部进行检查,以检测随后持有者是否被抢占了)。否则,会进行系统调用,以简单地阻塞住,直到锁被释放。

不过,Almeida总结说他仍然不完全确定这个想法是否能够充分发挥其潜力。还有需要进行优化cache行为,并且将自适应自旋集成到POSIX线程锁定原语中,并进行大量的性能基准测试工作。但这种方法似乎很有可行性,剩下的只是具体工作量而已。
[感谢Linux基金会支持我们前往此活动。]

全文完
LWN 文章遵循 CC BY-SA 4.0 许可协议。

欢迎分享、转载及基于现有协议再创作~

长按下面二维码关注,关注 LWN 深度文章以及开源社区的各种新近言论~

format,png

内容概要:本文详细介绍了利用二维时域有限差分法(2D FDTD)对光子晶体90度弯曲波导进行数值仿真的Matlab代码实现。该仿真方法旨在精确分析光子晶体波导在弯曲结构下的光传输特性,揭示其导光机制与缺陷模式的调控原理。资源包含完整的Matlab程序代码,支持对空间网格划分、介电常数分布、边界条件(如PML吸收边界)及光源参数等关键仿真要素的灵活设置与优化,便于用户复现结果并开展深入研究。通过仿真可直观获得光场在波导中的传播动态、透射谱特性以及能量损耗情况,为高性能光子器件的设计与优化提供理论依据和技术支持。; 适合人群:具备电磁场理论、光学基础和Matlab编程能力,从事光子学、集成光学或纳米光子器件研究的研究生、科研人员及工程技术开发者。; 使用场景及目标:①学习和掌握FDTD方法在周期性介质(光子晶体)器件仿真中的具体应用流程;②研究90度弯波导的光传输性能,分析弯曲损耗来源并探索低损耗结构优化方案;③作为光子集成电路中关键无源器件的设计与教学参考案例,服务于学术研究与工程实践。; 阅读建议:建议结合光子晶体能带理论与FDTD算法基本原理进行系统学习,运行代码时应逐步调整结构参数与仿真设置,观察光场演化和输出结果的变化,以深化对物理现象的理解,并可在此基础上拓展至其他复杂光子结构(如分束器、谐振腔)的仿真分析。
内容概要:本文系统研究了基于共识的捆绑算法(Consensus-Based Bundle Algorithm, CBBA)在多智能体多任务分配中的应用,重点聚焦于远程太空船交会与维修任务中的相对运动规划(RPO)问题。通过构建多航天器协同任务场景,采用Matlab代码实现了CBBA算法的全过程仿真,展示了其在分布式决策框架下高效完成任务分配的能力。研究深入探讨了任务收益建模、路径规划约束、通信延迟与动态重规划等关键环节,验证了CBBA在确保任务分配一致性、避免资源冲突、适应动态环境变化以及优化整体任务效能方面的优越性能,为复杂空间任务中的自主协同提供了可靠的技术路径。; 适合人群:具备控制理论、航天动力学、分布式优化或多智能体系统等相关背景,从事航天任务规划、智能优化算法研究或相关工程实践的研究生、科研人员及航空航天领域工程师。; 使用场景及目标:①为多航天器在轨服务(如交会对接、空间维修)提供高效、鲁棒的分布式任务分配解决方案;②深入理解CBBA算法的核心机制及其在高动态、强约束空间任务中的适应性与优化潜力;③推动分布式人工智能算法在航天工程实际系统中的集成与应用验证。; 阅读建议:建议读者结合提供的Matlab代码,重点剖析任务建模逻辑、收益函数设计、共识迭代过程及收敛性分析模块,通过修改场景参数进行仿真实验,以深化对多智能体协同决策机制与算法性能边界条件的理解。
内容概要:本文研究了一种计及自适应预测修正的微电网模型预测控制(MPC)优化调度方法,并提供了基于Matlab的完整代码实现。该方法融合自适应预测机制与MPC滚动优化框架,有效应对微电网中可再生能源出力波动、负荷需求不确定性等多重挑战,显著提升调度决策的精度与系统鲁棒性。通过构建动态反馈校正机制,实时修正预测模型误差,优化未来时段的运行策略,实现对微电网内部分布式电源、储能系统及可控负荷的协同调控,达成经济性、稳定性与环保性多目标的综合优化。所提方法具有较强的工程实用性与理论价值,为现代智能微电网的能量管理系统提供了可靠的技术支撑。; 适合人群:具备电力系统分析、优化控制理论基础及Matlab编程能力的研究生、科研人员,以及从事微电网、智能配电系统、新能源并网等领域技术研发的工程技术人员。; 使用场景及目标:①应用于高校与科研机构开展微电网优化调度算法的仿真研究与性能验证;②服务于电力企业或能源科技公司开发先进能量管理系统(EMS),提升微电网运行效率与可再生能源消纳能力;③作为自动化、电气工程等专业的高级教学案例,帮助学生深入理解MPC在复杂能源系统中的建模、优化与反馈控制全过程。; 阅读建议:建议读者结合Matlab代码逐模块分析算法实现流程,重点掌握预测模型构建、滚动优化求解及反馈修正机制的设计逻辑,可通过调整预测时域、权重系数与扰动场景等参数进行仿真实验,深入理解各环节对系统性能的影响。
内容概要:本文围绕电力系统短期负荷预测问题,深入研究了基于极限学习机(ELM)及其智能优化算法的应用方法,提出并实现了白鲸优化算法(BWO)和鹭鹰优化算法(IBOA)对ELM模型的关键参数进行寻优的技术路径。通过Matlab编程实现,优化后的模型有效提升了预测精度,降低了原始ELM因随机初始化带来的不稳定性和误差波动,增强了模型在面对电力负荷不确定性变化时的泛化能力和鲁棒性。研究系统阐述了ELM的基本原理、两种新型群智能优化算法的搜索机制及其在解决非线性参数优化问题上的优势,并通过实验对比验证了优化模型在均方根误差(RMSE)、平均绝对百分比误差(MAPE)等指标上的显著优越性,为电力系统负荷预测提供了高效可靠的解决方案。; 适合人群:具备电力系统分析、人工智能算法理论基础及Matlab编程能力的高校研究生、科研机构研究人员以及电力公司从事负荷预测、电网调度与能源管理的工程技术人员。; 使用场景及目标:①应用于电网调度中心的短期负荷预测业务,提高预测准确性,保障电力供需平衡;②为智能优化算法在电力工程领域的落地应用提供可复现的技术范例;③支撑电力市场出清、发电计划制定、储能系统配置及需求侧响应等关键决策环节; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,重点理解ELM网络结构搭建、适应度函数设计、优化算法迭代流程及预测结果后处理等关键步骤,通过调整数据集和参数设置,深入掌握模型调优技巧,并尝试将该方法迁移至风电、光伏功率预测等相似时序预测任务中。
下载代码方式:https://pan.quark.cn/s/d305330341ec 在当代科技领域中,华为作为中国顶尖的科技企业,持续研发先进技术以优化用户使用感受。鸿蒙操作系统(HarmonyOS)是由华为独立设计的一款面向多场景的分布式操作系统,其目标在于消除不同设备间的隔阂,促成无障碍的联合工作。本指南将详尽阐释在非华为品牌的个人电脑上,如何运用鸿蒙超级终端、多屏联动(多视窗)特性以及NFC芯片,使这些功能得到充分的发挥。 鸿蒙超级终端作为鸿蒙系统的关键特性之一,它将多样化的设备整合为一个统一体,使用户能够在多个设备之间无拘无束地转换和共享资源。对于非华为电脑的使用者而言,或许需要借助华为的电脑助手软件或特定的鸿蒙OS应用来实现与鸿蒙设备的对接。在完成相关软件的安装和配置后,用户能够借助超级终端特性将第三方电脑与华为手机、平板及其他鸿蒙设备进行配对,达成文件交换、屏幕显示同步乃至跨设备操作。 多屏联动(多视窗)特性是华为为增强工作效率而策划的特色功能。在非华为电脑上运用这一特性,用户能够将手机或平板的显示界面投射到电脑上,甚至可以在电脑上直接操控移动设备的应用,达成两个显示界面间的流畅配合。例如,用户可以在电脑上撰写文档的同时,在手机上查阅资料,两者同步进行,显著提升了工作效率。 NFC(近场通信)芯片是物联网技术的一种实践,它能够储存数据并与具备NFC功能的设备展开互动。在华为的生态系统里,NFC芯片常被用于迅速启动特定任务,如激活多屏联动。只需将设定了相应指令的NFC芯片贴附在电脑或手机上,轻轻触碰,就能自动启动多屏联动,极为便捷。 在实践这个指南的过程中,用户应留意以下几点: 1. 保证你的非华为电脑具备NFC功能,并且已安装了最新的华为电脑助...
内容概要:本文提出了一种基于非合作博弈理论的居民负荷分层调度模型,并采用双层鲸鱼优化算法进行求解,旨在应对风电出力不确定性下的电力系统负荷调度问题。该模型通过构建系统运营商与居民用户之间的双层博弈架构,上层以最小化负荷峰谷差为目标制定激励性电价信号,下层用户则在电价引导下优化用电行为以降低电费支出,最终实现纳什均衡状态。双层鲸鱼优化算法被用于高效求解该嵌套优化问题,在保证全局寻优能力的同时提升了收敛精度。仿真结果表明,该模型能有效实现削峰填谷,改善负荷曲线形态,增强电网对可再生能源的消纳能力,具有良好的应用前景。; 适合人群:具备一定电力系统基础知识和优化算法背景的研究生、科研人员及从事智能电网、需求响应、能源管理等领域的工程技术人员。; 使用场景及目标:①应用于高比例可再生能源接入的配电系统中,实现居民侧负荷的智能化调控;②为电力公司设计分时电价或激励型需求响应机制提供理论依据与技术支持;③作为双层优化、智能算法与博弈论在能源系统中融合应用的教学与研究案例。; 阅读建议:读者应重点关注非合作博弈的建模逻辑与双层优化问题的分解方法,建议结合Matlab代码实现部分,动手复现仿真过程,深入理解鲸鱼算法在上下层迭代求解中的实现细节,并尝试将其推广至多主体能源交互、虚拟电厂调度等更广泛的场景中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值