最近在用MATLAB做工作空间计算,for循环次数较多,运算非常慢,同学说可以使用并行计算,于是尝试,大开眼界。
一、使用方法
参考文章:Matlab并行计算(新手)_a99h的博客-CSDN博客
在较新版本的matlab中,不需要使用p=parpool(n)来手动开启线程池,操作变得更简单。
1. 首先,设置线程数量
(注:MATLAB 2023a已经不需要设置线程数量了,这一步可以直接跳过)
在任务管理器中查看cpu的线程数量:
按 ctrl+shift+esc 打开任务管理器,点击性能 -> cpu
在折线图那里右键将图形更改为逻辑处理器,就可以看到cpu每个线程的利用率;我的电脑是12核20线程,因此有20个小窗。记住这个线程数。
在MATLAB中点击主页 -> 预设 -> parallel computing Toobox, 调整parallel pool下面的数字,最大不能超过刚才在任务管理器里看到的最大线程数。如果给的太大,系统其他软件可能会卡死,所以别太大,克制一点。
这样,线程池的线程数量就设置好了。
2. 然后在代码中将 for 改为 parfor
例:
原代码:
a = randn([1,1000]);for i = 1000 a(i) = a(i)^2;end
修改为 parfor:
a = randn([1,1000]);parfor i = 1000 a(i) = a(i)^2;end
二、注意事项
注:parfor是并行计算,同时计算多个线程,因此不能在内部打断点调试,在里面输出变量时也不会在命令行显示。我在计算时使用了 try, 也可以使用pause(1)来定位出错的位置:当pause(1)生效时,pause(1)所在行之前的代码可以认为是没出错的。
parfor 的使用存在很多限制,下面一一说明。
parfor循环要求:
任务间必须独立循环间次序独立循环体的限制:
不能引入变量(eg.eval,load,global,etc.)不能含有break或return声明不能嵌套另外的parfor循环1. 每次循环之间不可以有依赖于别的循环计算出的结果。
2. 交换循环的次序不影响每次循环的结果
针对以上两条,举例:使用10线程计算,则 i=1,2,3,...,10 的循环可能是同时进行的。若不独立,则会出现错误。
3. 不能使用全局变量,这是因为若某次循环中改变了全局变量的值,可能导致其他正在进行的线程的该变量值也发生变化从而引发混乱,因此禁用全局变量。
4. 亲测可以使用load, 只是load的结果要赋值给循环内新声明的变量,例:
% 导入数据 data_name = strcat('X:/data_1/data/',num2str(process_i)); load_data = load(data_name);
5. 在使用并行计算时,可以认为循环内不在工作区内生成数据。因此,所有需要调用外部函数的命令都要将需要的变量传递给外部函数
6. parfor内不能使用save 保存变量,但是可以将save写到外部函数后调用,例如,我想保存工作区里的变量值,则可以创建新函数,在parfor里调用parsave即可:
function parsave(data_name, data) save(data_name, 'data');end
7. parfor里画图是不会弹出图窗的,可以通过保存 fig (或jpg等格式)文件记录图窗:
plot(x,y) % 画图 fig_name = strcat('X:/data_1/figs/00_90_processed/',... num2str(process_i),'.fig'); %生成图像名称 saveas(gcf,fig_name); % 保存图像
8. parfor内部的for循环不能直接使用 j=j+1
% 下面的代码是不允许的parfor i=1:10000 for j = 1:200 j=j+1; endend% 可以声明一个新的变量曲线救国parfor i=1:10000 for j = 1:200 a = j; a=a+1; endend