AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题

问题[gridengine](server)

Martin Hope
GP92
Asked: 2016-10-03 09:35:50 +0800 CST

Sun Grid Engine (SGE) 中的 h_rss 和 h_vmem 有什么区别?

  • 4

据我了解,

  • mem_free可以指定在具有可用内存 = 的主机中提交作业mem_free,而
  • h_vmem是作业可以消耗的内存的硬限制,如果作业达到h_vmem,作业会崩溃?我认为我们可以将h_vmem主机的总物理内存设置为接近总物理内存,这样作业就不会开始使用交换并减慢服务器速度。

那是什么h_rss?它似乎与的定义相同h_vmem.

还是我误解了h_vmem?h_vmem用于保留它可能需要的额外内存而不是所需的最小内存()mem_free?但是如果超过内存不要崩溃,所以作业可以超过h_vmem?

如果我的第二种解释h_vmem是正确的,那么我猜,对于要在主机中提交的作业,该作业必须同时满足mem_free和h_vmem(给定h_vmem不是 INFINITY)。

如果我的第一个解释h_vmem是正确的,那么我想,对于要在主机中提交的作业,该作业可以mem_free单独满足而无需满足h_vmem,因为它只保留可用空间,如果没有可用空间,它没关系?

cluster gridengine scheduler grid
  • 2 个回答
  • 7359 Views
Martin Hope
jmp242
Asked: 2016-06-15 07:54:21 +0800 CST

由于网络端口阻塞,SGE/OGS 2011 中断 Ansys Workbench Mechanical 启动

  • 0

我们正在 EL6 上运行 SGE / OGS 计算集群,并尝试启动交互式 Ansys Workbench。这适用于使用带有 X 转发的 SSH,但使用 qrsh 无法运行机械组件 - 工作台本身确实启动正常。

看起来它无法启动/连接到它试图在 localhost 上访问的高端口。我们认为这可能是网格软件的问题?如何允许使用环回上的高端口?我们在整个计算基础设施中使用 kerberos 进行身份验证,因此它使用票证来登录交互式作业。

linux redhat gridengine
  • 1 个回答
  • 85 Views
Martin Hope
John McGehee
Asked: 2016-01-02 12:04:54 +0800 CST

SGE Grid Engine 错误“qsub:未知选项”

  • 0

我使用命令向 SGE 提交作业qsub并收到错误消息:

qsub: Unknown option

什么未知的选项?

gridengine
  • 1 个回答
  • 6720 Views
Martin Hope
GP92
Asked: 2015-06-12 10:17:31 +0800 CST

qsub 正在工作,但 qrsh 失败,并且仅当使用 -l 显式指定资源时。为什么?

  • 0

提交简单的交互式作业以打开 shell 时出现以下错误:qrsh -V -cwd -verbose -q nsnel6.q -l h_vmem=12.000G tcsh

local configuration arslox51 not defined - using global configuration
Your job 8450878 ("tcsh") has been submitted
waiting for interactive job to be scheduled ...timeout (5 s) expired while waiting on socket fd 4


Your "qrsh" request could not be scheduled, try again later.

在未指定资源的情况下提交作业成功。

我也检查了资源,它们是可用的。他们有 30 多台主机,许多作业正在运行。但资源绰绰有余。

qsub 使用相同的资源,但只有 qrsh 面临这个问题。只有极少数情况下它在 qrsh 中工作。

与此错误有关local configuration arslox51 not defined - using global configuration吗?还有这个错误是关于什么的?

我的 SGE 版本是 6.1

gridengine
  • 1 个回答
  • 1402 Views
Martin Hope
GP92
Asked: 2015-06-03 10:46:47 +0800 CST

SGE为什么会有槽的概念?

  • 2

根据 SGE 5.3 手册,

Slots - 可以在该队列中同时执行的作业数

我对这些概念很陌生,想从一一理解开始。

假设,如果 RAM 为 10G,如果有 10 个插槽,因此每个插槽 1G,那么是否只能运行小于 1G 的作业?如果这项工作只需要一些 0.5G,那将浪费该插槽中剩余的 0.5G 对吗?如果是这样,那么如果没有资源优化,那么网格有什么用呢?

而如果一个2G的job在多个slot之间共享,这叫parallel job还是normal job呢?

SGE v5.3 和 v6.0 及更高版本中的队列和插槽概念有什么区别吗?

gridengine
  • 1 个回答
  • 2015 Views
Martin Hope
Pavel
Asked: 2015-03-07 04:39:01 +0800 CST

如何设置 SGE 以进行以下调度:“首先尝试在队列 A 中运行,如果没有可用的 A 插槽,则尝试在队列 B 中运行”?

  • 0

假设您有两个队列,队列 A 使用一些新硬件,队列 B 使用旧硬件。此外,对于 SGE 作业,两个队列具有相同数量的节点和插槽,例如每个队列有 10 个插槽。

现在我提交了 10 个工作。如果两个队列都是空的并且节点具有相同的负载,我猜有 5 个作业将在队列 A 中运行,其中 5 个在队列 B 中运行。但是由于 B 的硬件较旧,因此这些作业将需要更长的时间才能完成。

有没有办法让 SGE 在“退出”到旧队列 B 之前先尝试“填充”队列 A 中的快速节点?我在询问问题的用户和管理员方面。

gridengine
  • 1 个回答
  • 301 Views
Martin Hope
Daniel
Asked: 2014-01-11 08:12:02 +0800 CST

qstat 输出 jclass 是什么意思?

  • 4

qstat输出是什么jclass意思?

$ qstat -help
UGE 8.1.4

$ qstat -u myusername
job-ID  prior   name       user         state submit/start at     queue                          jclass                         slots ja-task-ID 
------------------------------------------------------------------------------------------------------------------------------------------------
123456 5.87507 AAA        aaaaa        r     01/01/2011 00:11:43 [email protected]                                        24
gridengine
  • 1 个回答
  • 286 Views
Martin Hope
mousee
Asked: 2012-11-09 00:39:17 +0800 CST

SGE:停机计划

  • 1

我需要计划停机时间以通过 Sun Grid Engine 维护我的环境(或我的环境的某些部分)。是否有可能以某种方式使用回填信息告诉网格引擎仅计划集群上那些能够完成的作业(我有回填信息)直到第二天早上 10 点?然后我可以在上午 10 点依赖所有计算节点都是干净的事实,作业只是排队,没有计划任何作业,这样我就可以开始维护了吗?

感谢您的时间。

鼠标

gridengine
  • 1 个回答
  • 145 Views
Martin Hope
erimar77
Asked: 2012-06-08 13:11:07 +0800 CST

Grid Engine 资源要求

  • 1

有谁知道设置使用特定集群节点的要求。我有一台 128G RAM 的服务器,我想闲置它直到用户特别请求类似-l h_vmem=100G

Grid Engine 能做这样的事情吗?

gridengine
  • 1 个回答
  • 80 Views
Martin Hope
dmcer
Asked: 2010-04-13 17:04:48 +0800 CST

Sun Grid Engine:自动终止空闲的交互式作业

  • 1

我们正在考虑在小型计算集群上使用Sun Grid Engine 。目前,当前的设置非常粗糙,只涉及让人们通过 ssh 连接到一台开放的机器来运行他们的工作。

我们希望允许交互式作业,因为这应该可以简化从手动启动作业到使用qsub. 但是,有人担心,如果我们这样做,人们可能会不小心让他们的交互式会话闲置并阻止其他作业在机器上运行。这个问题不仅仅是理论上的问题,因为我们之前尝试过使用 OpenPBS,并且人们在屏幕会话中打开交互式工作并基本上在机器上露营时存在问题。

无论如何配置 SGE 以自动终止空闲的交互式作业?看起来这是在 2007 年作为增强功能(问题 #:2447)提出的。但是,该请求似乎从未得到实施。

linux user-management cluster job-control gridengine
  • 2 个回答
  • 934 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve