docker images | grep noded
回显示例如下:
1 | noded v7.0.RC1 ef801847acd2 29 minutes ago 133MB |
... env: - name: NODE_NAME valueFrom: fieldRef: fieldPath: spec.nodeName imagePullPolicy: Never command: [ "/bin/bash", "-c", "--"] args: [ "/usr/local/bin/noded -logFile=/var/log/mindx-dl/noded/noded.log -logLevel=0 -reportInterval=5" ] securityContext: readOnlyRootFilesystem: true allowPrivilegeEscalation: true volumeMounts: - name: log-noded ...
kubectl apply -f noded-v{version}.yaml
启动示例如下:
serviceaccount/noded created clusterrole.rbac.authorization.k8s.io/pods-noded-role created clusterrolebinding.rbac.authorization.k8s.io/pods-noded-rolebinding created daemonset.apps/noded created
kubectl get pod -n mindx-dl
回显示例如下,出现Running表示组件启动成功。
1 2 3 4 | NAME READY STATUS RESTARTS AGE ... noded-fd6t8 1/1 Running 0 74s ... |
参数 |
类型 |
默认值 |
说明 |
---|---|---|---|
-reportInterval |
int |
5 |
|
-monitorPeriod |
int |
60 |
节点硬件故障的轮询检测周期,取值范围为60~600,单位为秒。 |
-version |
bool |
false |
是否查询当前NodeD的版本号。
|
-logLevel |
int |
0 |
日志级别:
|
-maxAge |
int |
7 |
日志备份时间,取值范围为7~700,单位为天。 |
-resultMaxAge |
int |
7 |
pingmesh结果备份文件保留的天数。取值范围为【7-300】,单位为天。 说明:
该参数仅支持在Atlas 900 A3 SuperPoD 超节点、Atlas 9000 A3 SuperPoD 集群算力系统上使用。且所使用的驱动版本需≥24.1.RC1。 |
-logFile |
string |
/var/log/mindx-dl/noded/noded.log |
日志文件。 说明:
单个日志文件超过20 MB时会触发自动转储功能,文件大小上限不支持修改。转储后文件的命名格式为:noded-触发转储的时间.log,如:noded-2023-10-07T03-38-24.402.log。 |
-maxBackups |
int |
30 |
转储后日志文件保留个数上限,取值范围为1~30,单位为个。 |
-h或者-help |
无 |
无 |
显示帮助信息。 |