我正在将机器从 CentOS7 升级到 Rocky9。我已经成功完成了几十次,但在较新的 Dell R440 上遇到了问题。
当新操作系统启动时,我在 DRAC 中收到一个错误,在总线 2 设备 0 功能 0 处的组件上检测到致命错误。
我尝试更换主板但问题仍然存在。
这可能吗?(操作系统可能导致(可能的)硬件错误)?
- 编辑
我能够在多台 R440 上重现此问题
我正在将机器从 CentOS7 升级到 Rocky9。我已经成功完成了几十次,但在较新的 Dell R440 上遇到了问题。
当新操作系统启动时,我在 DRAC 中收到一个错误,在总线 2 设备 0 功能 0 处的组件上检测到致命错误。
我尝试更换主板但问题仍然存在。
这可能吗?(操作系统可能导致(可能的)硬件错误)?
我能够在多台 R440 上重现此问题
(centos 7.x)
我有 syslog-ng 设置来解析 snmptrapd 消息,以便我可以格式化它们以供以后消化。问题是 syslog-ng 仅输出 n-1 消息。IE 如果 snmptrapd.log 中有 10 行 syslog-ng 仅输出 9 行。如果我向 snmptrapd 发送一条新消息(消息 #11),那么 syslog-ng 将输出第 10 条消息。
系统日志-ng.conf:
@version:3.27
@include "scl.conf"
log {
source {
snmptrap(filename("/var/log/snmptrapd.log"));
};
destination {
file("/var/log/syslog-ng.log");
};
};
snmptrapd.conf:
authCommunity log,execute,net public
authCommunity log,execute,net localtrap
format2 %.4y-%.2m-%.2l %.2h:%.2j:%.2k %B [%b]:\n%v\n
outputOption s
我尝试在format2的末尾添加一个额外的换行符,但它没有帮助。(虽然 snmptrapd.log 确实得到了附加行)
我想使用 rsyslog 来捕获来自 SAN、路由器等的事件。(这将被转发到 kafka 并最终被弹性搜索)到目前为止 - 这工作正常。我在 /etc/rsyslog.d 的配置文件中配置了这个
不起作用的是所有本地日志流量(来自运行 rsyslog 的主机)也被转发。我需要一种将本地日志发送到“标准”本地端点并将远程日志发送到 kafka 的方法。
这可以使用 rsyslog 吗?
是否可以找出哪些主机正在使用 yp 服务器?我想删除/更新充当 yp-server 的旧 VM,但不清楚哪些客户端在那里。
我一直在研究从 puppet 导出的 JMX 指标,但不清楚如何解释它们。这个特定的应该是测量包编译器,但(对我来说)不清楚它在说什么。
示例数据:
{
"request": {
"mbean": "puppetserver:name=puppetlabs.localhost.compiler.compile.develop",
"type": "read"
},
"value": {
"Mean": 515.8850223496175,
"StdDev": 15.410435420213828,
"75thPercentile": 533,
"98thPercentile": 533,
"RateUnit": "events/second",
"95thPercentile": 533,
"99thPercentile": 533,
"Max": 853,
"Count": 188,
"FiveMinuteRate": 0.004556108829698143,
"50thPercentile": 502,
"MeanRate": 0.0026130935976092762,
"Min": 386,
"OneMinuteRate": 0.002335841296852807,
"DurationUnit": "milliseconds",
"999thPercentile": 533,
"FifteenMinuteRate": 0.003374163757709876
},
"timestamp": 1543151404,
"status": 200
}
似乎有几种类型的统计数据混合在一起。[Rate|Duration]Unit 对应什么?Mean / stddev 看起来很简单..但他们测量的是什么?这是说“515 事件/秒”还是“515 毫秒/事件”?“平均速率” - “.002 事件/秒或毫秒/事件”?
我有一个预先存在的 k8 集群,我想添加一个节点。似乎存在版本问题,我不确定如何解决。
当我尝试加入新节点时(使用kubeadm join
):
...
[kubelet] Downloading configuration for the kubelet from the "kubelet-config-1.12" ConfigMap in the kube-system namespace
configmaps "kubelet-config-1.12" is forbidden: User "system:bootstrap:rsezn8" cannot get configmaps in the namespace "kube-system"
在现有节点上:
[root@kube0 ~]# kubeadm version
kubeadm version: &version.Info{Major:"1", Minor:"12", GitVersion:"v1.12.1", GitCommit:"4ed3216f3ec431b140b1d899130a69fc671678f4", GitTreeState:"clean", BuildDate:"2018-10-05T16:43:08Z", GoVersion:"go1.10.4", Compiler:"gc", Platform:"linux/amd64"}
[root@kube0 ~]# rpm -qa | grep kube
kubeadm-1.12.1-2.x86_64
kubernetes-cni-0.6.0-2.x86_64
kubectl-1.12.1-2.x86_64
kubelet-1.12.1-2.x86_64
在(假定的)新节点上:
[root@kube4 ~]# rpm -qa | grep kube
kubectl-1.12.1-0.x86_64
kubelet-1.12.1-0.x86_64
kubernetes-cni-0.6.0-0.x86_64
kubeadm-1.12.1-0.x86_64
在主节点上:
[root@kube-master kubernetes]# kubectl get configmap -n kube-system
NAME DATA AGE
coredns 1 106d
extension-apiserver-authentication 6 106d
filebeat-config 1 16d
filebeat-inputs 1 16d
kube-proxy 2 106d
kubeadm-config 1 106d
kubelet-config-1.11 1 106d
kubernetes-dashboard-settings 1 105d
weave-net 0 106d
[root@kube-master kubernetes]# kubelet --version
Kubernetes v1.12.1
当我查看此问题的先前解决方案(此处)时,似乎新节点的版本高于现有节点。在我的情况下,相反的情况(不知何故)是正确的。(yum update
不显示任何较新的版本)
另一个问题是kubelet-config-1.11。这是我的问题吗?我该如何解决?
如果您使用pdnsutil add-record它允许创建重复的 dns 条目。有什么方法可以防止这种情况吗?
经过多次恳求和案例构建,我的团队获得了购买 4 个节点并启动 cassandra 集群的预算。每台机器都有 3x1Tb 驱动器,所以我想知道跳过 1 路冗余并镜像数据驱动器是否合理。
数据将被备份,因此这不是问题。
似乎在如此小的分组中丢失机器的可能性很低。
这是合理的还是我错过了一些更大的问题/因素?
XenServer 6.5 似乎已经发布,并且在很多方面都比 6.2 快很多。
当我安装 6.2 时,我接受了各种默认设置,最终得到了一个笨拙的分区系统。Root 相当小(并且永远耗尽空间),而 250Gb 分区是空的。为此,我正在考虑使用 v6.5 进行重建。
我一直在阅读有关该过程的信息,显然您不能在同一个池中混合使用 6.2 和 6.5。如果我一次取出一个池成员 (3),重建它们并将它们放入一个新池中,我可以移动各种虚拟机吗?
编辑:
要将 XenServer 从 6.2 升级到 6.5 - 从池主服务器开始,逐步完成每台服务器。如果您已完成重新分区,则不必再次执行编辑步骤 - 只要您在 6.5 安装期间选择“升级”,它就不会重新分区磁盘。
我有许多想要通过 nagios/nsclient 监控的 Windows 客户端。我在两个 win7 x64 和一个 win2012 r2 上安装了最新的 nsclient。其中一台 win7 工作,而其他两台机器could not complete SSL handshake
在尝试从 nagios 机器连接时返回(libexec/check_nrpe -H hostname -c check_cpu)。
我试过的:
sslv3 alert: unexpected message
(win7) 或failed to establish secure connection: no shared cipher
(win2012)我一直在试图弄清楚工作和非工作 Windows 7 系统之间有什么不同,并试图将其应用于 Windows 2012 系统。
我最近安装了这个操作系统版本(5.0.2)并且想知道这张图。迄今为止,当涉及到 Cassandra 时,我很难找到一个衡量“集群容量”的指标。神奇的是,datastax 似乎有了答案。如何?
为了便于理解,我使用 Cassandra 的最新/最大(已发布)版本设置了一个 4 节点集群。这四个节点是使用几乎完全默认的设置按顺序启动的,并且似乎可以正常通信。
然后我创建了一个模式,如下所示:
CREATE KEYSPACE first WITH replication = {
'class': 'SimpleStrategy',
'replication_factor': '1'
};
创建一个包含 5 列的简单表并添加约 100K 行数据。一切都很好。每个客户都可以获得数据,所以我认为它是均匀分布的。
所以我正在研究一种备份策略并开始处理快照等问题。在每台机器上运行后nodetool snapshot
,我想知道它创建了什么。我转到第一台机器并查看/var/lib/cassandra/data/first,发现它是空的。嗯..第二台机器..同样的事情..第三台..最后在第四台机器上,我看到数据文件夹和快照目录中的文件。
运行nodetool ring
显示每个系统大约拥有25%,但负载严重偏向(似乎)最终拥有所有数据的一个系统。
所有数据真的都在这台机器上吗?我在配置中错过了哪一步?
我将一个 16 节点的 cassandra 集群(复制因子 2)放在一起,并希望为nodetool repair
. gc_grace_seconds是默认值。
两个问题:
nodetool repair
必须在每个系统或每个 # 系统/复制因子系统上运行?(我的 16 个节点的 IE,复制因子为 2 - 8 个系统 - 每对一个)假设情况:
replication_factor
为 1 并使用SimpleStrategy
.这是否意味着现在丢失了 1/N 的数据?
如何知道什么时候应该为 cassandra 集群增加容量?错误信息?表现?其他一些迹象?
由于使用 Cassandra 进行容量规划是一门(看似)黑魔法,知道从哪里开始以及何时增长可能会有些问题。
有一个由 3 台服务器组成的池。都是 Xen v6.2。今天早上以通常的方式应用了最新的补丁:
这以前有效。
今天早上第一个奴隶不会退出维护模式。已尝试多次重新启动,“重新启动工具堆栈”,甚至将其从池中删除。大多数报告“无法转发消息,因为无法联系服务器。服务器可能已关闭或可能存在网络连接问题。”
我知道情况并非如此,因为我可以从子网中的其他地方通过 SSH 连接到机器。
关于我哪里出错以及如何解决这个问题的建议?
我们最近丢失了一台 NFS 服务器。它用于导出带有 ISO 文件的驱动器,以用于 XenServer 修补/更新/等。服务器已被替换,但无法从 XenCenter 或通过命令行删除安装的驱动器。
我试过的:
(使用这些说明):
错误信息:
Error code: SR_BACKEND_FAILURE_140
Error parameters: , Incorrect DNS name, unable to resolve.,
该卷不再出现在 /etc/mtab 中,但 Xen 拒绝放开它。
关于其他地方的建议?
我正在使用 linux 和 windows 服务器的混合体,并希望使用 AD 绑定到集中式 LDAP 身份验证过程。
我最近安装了一个 Windows 2012 R2 服务器作为域控制器。我有 LDAP 信息来访问我们公司的 LDAP 服务器,但还没有找到如何设置密码推荐过程。人们建议改用 OpenDJ 或 OpenLDAP,但我想我至少会尝试使用本机应用程序来获得此设置。经过数小时的阅读和查看后,我认为这行不通。
有关如何进行此操作的建议?
摘要:我在subdom.company.com有一些设备。如果我只能让我的域连接/指向它,则ldap.company.com上有一个 LDAP 服务器可用于身份验证。我应该继续使用 Windows 2012 R2 还是切换到 Samba?其他途径?
更新:直到最近我们的设备几乎完全是 CentOS/Debian。我们使用 NIS 来维护帐户,一切都很好。现在我们正在添加更多的 Windows 客户端,并有机会让大公司的服务器处理我们的所有身份验证。IE 不再需要在每个文件服务器(通过 samba)上为 Windows 客户端设置这些。