基于托管指针字节码的线程间数据传输

本文通过对比实验证明了使用托管指针字节码进行线程间数据传输的效率优势,并提供了具体的代码实现。
本代码演示了如何用托管指针的字节码进行线程间数据传输的。不知何故,直接用AAuto原生的数值数组传输比用托管指针字节码慢了很多,请大家斧正,在此不胜感激!话不多说,各位看了如下代码自会明白。
先把如下代码(文件名nb.aau)编译成用户库,便于在main.aau中调用:

namespace nb
import raw
class DOUBLE{
    double v=0
}
class INT32{
    int v=0
}
//数值数组转化为托管指针字节码,数值默认类型为double
num2byte=function(numarr,numtype='double'){
    
var len
    
var ele
    
if numtype=='double'{
        ele=DOUBLE()
        len=8
    }
    
else{
        ele=INT32()
        len=4
    }
    
var bytearr=raw.malloc(len*#numarr)
    
for i=1;#bytearr;len{
        ele.v=numarr[(i+len-1)/len]
        
var tmp=raw.malloc(ele)
        
for j=0;len-1
            bytearr[i+j]=tmp[j+1]
    }
    
return bytearr  
}
//托管指针字节码转化为数值数组,数值默认类型为double
byte2num=function(bytearr,numtype='double'){
    
var len
    
var ele
    
if numtype=='double'{
        ele=DOUBLE()
        len=8
    }
    
else{
        ele=INT32()
        len=4
    }
    
var numarr={}
    
for j=1;#bytearr/len
        numarr[j]=raw.convert(bytearr,ele,len*(j-1)).v
    
return numarr
}


主调程序main.aau:

import time.performance
import nb
//托管指针字节码与数值数组的相互转化
io.open()
io.print(
"==========================================")
io.print(
"* 托管指针字节码与数值数组的相互转化示例 *")
io.print(
"==========================================")
io.print(
"示例 1: 小规模,验证一下结果")
var numarr={1;2;255;256;257}
io.print(
"原始数值数组:")
for j=1;#numarr
    io.stdout.write(numarr[j],
' ')
io.print()
var bytearr=nb.num2byte(numarr,'int')
io.print(
"数值数组 --> 字节码:")
for j=1;#bytearr
    io.stdout.write(bytearr[j],
' ')
io.print()
io.print(
"字节码 --> 数值数组:")
var numarr2=nb.byte2num(bytearr,'int')
for j=1;#numarr2
    io.stdout.write(numarr2[j],
' ')
io.print(
'\n')
io.print(
"示例 2: 大规模,测一下运行效率")
numarr={}
for j=1;200000
    numarr[j]=j
io.print(
"数组数组长度",#numarr)
var tk=time.performance.tick()
bytearr=nb.num2byte(numarr,
'int')
io.print(
"数值数组 --> 字节码:",time.performance.tick()-tk,'毫秒')
tk=time.performance.tick()
numarr2=nb.byte2num(bytearr,
'int')
io.print(
"字节码 --> 数值数组:",time.performance.tick()-tk,'毫秒')
io.print(
'\n')
io.print(
"========================")
io.print(
"*  线程间数值数据传输  *")
io.print(
"========================")
fnum=
function(numarr){
    
var s=0
    
for j=1;#numarr
        s+=numarr[j]
    io.print(
"  数组元素之和:",s)
}
fbyte=
function(bytearr){
    
import nb
    
var numarr=nb.byte2num(bytearr,'int')
    
var s=0
    
for j=1;#numarr
        s+=numarr[j]
    io.print(
"  数组元素之和:",s)
}
numarr={}
for j=1;10000
    numarr[j]=j
io.print(
"数组数组长度",#numarr)
io.print(
'利用数值数组:')
tk=time.performance.tick()
handle=thread.create(fnum,numarr)
thread.wait(handle)
io.print(
"耗时:",time.performance.tick()-tk,'毫秒')
io.print(
'利用字节码:')
tk=time.performance.tick()
bytearr=nb.num2byte(numarr,
'int')
handle=thread.create(fbyte,bytearr)
thread.wait(handle)
io.print(
"耗时:",time.performance.tick()-tk,'毫秒')
execute("pause")
io.close()

某次运行结果:

==========================================
* 托管指针字节码与数值数组的相互转化示例 *
==========================================
示例 1: 小规模,验证一下结果原始数值数组:
1 2 255 256 257
数值数组 --> 字节码:
1 0 0 0 2 0 0 0 -1 0 0 0 0 1 0 0 1 1 0 0
字节码 --> 数值数组:
1 2 255 256 257
示例 2: 大规模,测一下运行效率

数组数组长度    200000
数值数组 --> 字节码:   1531.6426094919 毫秒
字节码 --> 数值数组:   100.48708815128 毫秒

========================

*  线程间数值数据传输  *
========================
数组数组长度    10000
利用数值数组:  
数组元素之和:        50005000
耗时:      352.52849365026 毫秒
利用字节码: 
数组元素之和:        50005000
耗时:      19.031126827002 毫秒
注:系统配置 WinXP SP3,intel core2 CPU Quad Q8300 2.50GHz,内存金士顿两条共4GB。
【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!
内容概要:本文系统介绍了基于最小势能原理(即能量法)的物理信息神经网络(PINNs)在求解固体力学二维问题中的理论框架与应用实践,并提供了完整的PyTorch代码实现案例。该方法通过将物理系统的总势能泛函嵌入神经网络的损失函数中,利用深度学习框架直接求解满足控制方程和边界条件的位移场近似解,避免了传统数值方法对网格划分的依赖。文章重点剖析了基于变分原理的能量形式如何替代强形式偏微分方程构建损失项,提升了求解的稳定性与泛化能力。同时,研究对比了不同PINNs架构与训练策略在处理复杂几何形状、非均匀材料属性及非线性力学行为时的精度、收敛性与计算效率,验证了其在处理经典弹性力学问题(如平面应力/应变问题)中的有效性与潜力。配套代码便于读者复现结果并拓展至更广泛的工程应用场景。; 适合人群:具备一定深度学习基础和固体力学知识的研究生、科研人员及工程技术从业者,特别适用于从事计算力学、智能仿真、物理驱动建模、结构分析等方向的研究者。; 使用场景及目标:①掌握基于能量法的PINNs建模范式,理解其相较于传统有限元法的优势与局限;②研究物理信息神经网络在无网格求解复杂边界与非线性问题中的能力;③对比不同神经网络结构对求解精度与收敛速度的影响,推动PINNs在工程实际中的落地应用。; 阅读建议:建议读者结合所提供的PyTorch代码逐模块分析网络构建、能量泛函定义、边界条件施加及训练流程设计,深入理解物理约束与机器学习模型的融合机制,并鼓励在自定义问题中调整网络参数、采样策略与损失权重以优化性能。
【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值