Problemas con Rig RX580 biosmod + NVIDIA 1050ti

Hola a todos, pues ya llevo un tiempo minando con un Rig GPU que consta de tres tarjetas ATI RX580 con biosmod + una NVIDIA 1050ti con el SO en ubuntu 18.04 + undervolt
La moneda que estoy minando es ethereum en nanopool con el software nanominer 1.8.1

Todo el sistema me trabaja a 100,66MH/s, cada RX a 29.4MHs con un consumo por tarjeta de 87w y un voltaje de 0.89v, y la NVIDIA a 12.45MH/s

El problema que tengo es que cuando le da se para el proceso, a veces falla una tarjeta RX y otras veces otra, he probado a cambiar voltajes, frecuencias y nada, los paros no son siempre en un tiempo determinado, aveces me lo hace en minutos y otras veces en días.
La verdad que ya no sé que tocar más a ver si alguien me puede echar una mano

hola buenos dias, puedes hacer varias cosas para aislar el problema,
1 mira de cambiar el programa q mina por ejemplo si usas nanominer pasate a phoenix
2controla las temperaturas
3deja solo una tarjeta o dos para ver si funciona o no, si te falla reduce el overclock
4 toca las conexiones eléctricas después de horas de funcionamiento si se calienta alguna mas de lo normal quizás sea eso

1 me gusta

Lo que dice jose6, si es fallo de hardware, debe ser sobrecalentamiento o sobretensión… aunque no sería tan aleatorio como dices.

Si es de la fuente lo tienes facil, saca una de las RX580 y prueba.

Si es de alguna de las gráficas, bájate el Free Download HWiNFO Sofware | Installer & Portable for Windows, DOS y comprueba en la pestaña sensor si todos los valores son correctos, aunque tengas buenas temperaturas de coreGPU ( por el undervolt), podrías tener malas en las VRM´s o la MemoriaVram ( por refrigeración)… incluso las VRMs de la placa base ( mas dificil al no llevar carga el procesador) y tambien comprueba los valores y estabilidad de la linea +12v. de la fuente.

No especificas si simplemente se para el proceso de minado en el soft, el S.O., o si crashea directamente todo el rig.

Doy por entendido que las BiosMod de las RX580 son las propias de cada marca de memorias de las gráficas ( en caso de que sean distintas).

Si es fallo de soft, prueba con otra versión o directamente con otro soft del minero o cambia versión de drivers.

Saludos.

P.D.: Me acabo de dar cuenta que estás en Ubuntu, no tienes HwInfo, mal asunto. :neutral_face:

Hola, gracias por los consejos, de temperatura no es, por que aunque sea en linux tengo herramientas para ello, la que uso que va muy bien es netdata que es en entorno web, te informa de todo hasta de como va internet, ósea de todo.
Empezaré desde 0 a ver que averiguo, gracias a todos