如何找到parfor的最佳工人数?

如何在Amazon的虚拟机上找到 parfor 的最佳工作人员数量?

在哪些情况下我应该使用物理数量,而在哪些情况下应该使用逻辑核心数量?

为此有“ 经验法则”吗?

我运行一个已编译的代码(一个可执行代码)。

lcy0851 回答:如何找到parfor的最佳工人数?

enter image description here

  

Q 如何在Amazon的虚拟机上找到 parfor 最优个工人?em>

在类似的,仅部分定义的情况下,我从类似的主要异议开始,例如那些 above “根据什么的标准函数(效用乐趣/惩罚乐趣)进行优化参数和成本-[时间](首先是部分结果的延迟,端到端完成),[空间](是:缓存和RAM占用空间),缩放,外部性(能源成本,{所拥有的|租赁的)基础设施成本,R&D-成本,设计/工程成本,质量保证成本,验证/认证成本,其他相关人工成本,风险缓解策略的成本-仅举几例??”,在第2句中由{{3 }}讲述了刘易斯·卡罗尔(Lewis Carroll)的智慧,并刻在《爱丽丝梦游仙境》中:

  

” Alice:我应该走哪条路?
  猫:这取决于你要去的地方。
  爱丽丝:我不知道。
  猫:那么走哪条路都没关系。”

这告诉我们有关
如果没有
任何&所有标准 pre -定义的情况:
(没有目标),任何道路都会带您到达那里...”


但是,大约50年前,这个问题已经解决:

Gene AMDAHL博士(1967)根据肯尼思·E·奈特(Kenneth E. KNIGHT)教授(1966)的工作解决了这个问题,解决方案是采用“ 递减收益法”,以前者Amdahl Law的名字命名。有关细节以及当代对天真应用的原始作品(头顶天真和原子量的作品)的批评,请阅读@Dev-iL

第0步:测试/ 记录 的所有纯 [SERIAL] 部分的净时间strong> C ode- u nder- R 观看( CuR ),它们位于希望的“之前”和“之后” -具有parfor语法构造函数。

步骤1:测试/ 记录所有 parfor -{实例 > + 终止}-间接费用。在这里,请为呼叫签名和返回值的类型和大小获取所有适当缩放的参数(CuR必须花费一些时间来对每个em序列化/反序列化所有'em,并且还必须花费额外的时间用于SER / DES来准备/传输/收集每个“远程”-parfor-ed结果),MEM-alloc的规模-如果仅进行一些“浅”计算,与CuR相比,这也要花费大量时间-密度或内存区域的重用效率不高的并行CuR恰好被考虑在内)。其中一些附加的间接费用(记录在[TIME]域中)是在代码的parfor装饰的部分内部累积的(在纯{{{1} }代码执行,因此测试/基准测试可能需要一些工作才能隔离这些[SERIAL]版的“怀疑操作”内部的附加成本,如果有的话,它们会分配并从不重复使用较大的内存区域等。费用模型力求将费用减少到外部支付的基础设施费用的美分)。

步骤2:测试/ 记录:工作单元的原子性引入了最后一批工作单元的“孤立”时间,该时间永远不会更快(由于工作单元的原子性-工作时间不可分割,因此没有其他免费的处理器内核会有所帮助

  

...应使用物理的编号,并使用逻辑核心的数量?

第3步测试/ 记录所提供的任何一种(无论是带有“营销”标签的)代码类型的实际偷工/净工作比率执行单元(由于延迟长,偷窃率高而导致效率低下的虚拟设备,即,对于任何形式的主要是计算密集型并行工作者,效率都会降低)

第4步测试/ 记录实际频率/缓存大小/ RAM引起的CPU饥饿状态,这实际上将导致“工作单元”那里”的执行情况比在{local- | private-grid-}-计算基础架构。

第5步: 比较考虑中的任何数量的核心/类型的全部应计成本,并使用到期时间(和 适当放松 ,通过上述步骤0:4中记录的所有无效效率参数,并使用任何基础设施提供商的价格计划,您将获得在任何给定条件下使用更多/更少资源的大致成本时间/财务预算约束。

所有荣誉归于Gene.AMDAHL博士,他的工作为所有销售尽可能多的“廉价”标签但性能不佳且只能​​共享的玩具的市场营销人员所讨厌(是的,虚拟化还意味着另一层添加-开销并导致在硅上共享共执行( parfor缓存耗尽,其代价是多次“ 0.5 [ns]”重新获取先前已经缓存的数据,再次“跨越” NUMA区域-边界导致重复的RAM-I / O通道瓶颈是在此提及的最少损失)-共享/虚拟化引入的CPU标记工作原理将向您显示您的计算所窃取的CPU标记的数量,有效负载没有得到别人的支持,而是共享了由您以“每小时使用”的基础在您的控制范围之外支付的非常相同的“多云天堂梦”)。

对于很少运行临时性,低计算强度(显然不是DSP的DSP,不是吗?),跨域通信/协调最少,合理大小的任务队列可能有益的云从分布式,延迟掩盖,(天真)-强力执行许多这样的“浅”和“不需要很多”工作单元(从从HPC级计算的角度来看),但听起来很“便宜”-( just )的价格计划使人意识到,自己的私有基础设施将要花费成本(如果在适当的时候决定,已经花费了这些费用),与使用“廉价”租用第二,第三,第n次租车相同。

  

[甚至可以向真实的企业询问其成本调整和对现实生活的责任,即使是“顾问的演员”梦cloudy以求的事情,也有动手的故事存在,请毫不犹豫地问:o)]

因此,由您根据上下文制定最优费用的决定由您决定。总是。

本文链接:https://www.f2er.com/3129344.html

大家都在问