Impossible de faire fonctionner 1 GPU : WATCHDOG: GPU 2 hangs in OpenCL call, exit
-
@sygmacrypt Normalement l’ordre des cartes correspond simplement à la prise PCI express du PC, tu as juste à changer le riser de port pci pour changer son chiffre, un souci de riser peu etre pour le coup
-
@raniva Je sais que cet ordre correspond aux prises PCIe, j’ai réussi à identifier quel port correspond à quel numéro mais ce que je n’ai pas compris c’est pourquoi quand une des cartes était sur un des ports, j’avais le bon affichage pour TOUTES les cartes et que le fait de la changer de port (avec le même riser), mes cartes sont identifiés comme ci-dessus.
Mais ce n’est pas grave, comme j’ai dit cela n’a pas d’impact sur le minage. Juste une incompréhension de l’identification. -
@sygmacrypt justement , ca peut poser souci si l’identification des cartes merde, ca ne devrait pas, pas d’impact sur le minage oui, sur le montage de l’ensemble ca peut.
-
Eureka !
Après les différents tests et recherches, j’ai découvert que le problème provenait du nouveau riser. En connectant la GPU à la carte mère directement, je n’avais pas de problèmes. En essayant ce riser avec une autre GPU, j’ai également rencontré le problème.
Je suis actuellement entrain de miner avec les 2 RX580 sans problème. -
La nouvelle carte semble fonctionner correctement, un nouveau riser est en route.
Cependant, un autre problème est apparu …
Les fans de la RX570 ne fonctionnent plus correctement.
Jusqu’à maintenant, tous les ventilateurs des GPU tournaient en moyenne de 30% en permanence pour une température aux alentours de 50°C.Mais depuis que j’ai fait fonctionner la RX580, les ventilateurs de la RX570 ne tournent plus en permanence !
Ils ne tournent pas du tout, la GPU chauffe jusqu’à atteindre 75 °C et les fans démarrent. Cela se produit à plusieurs reprises jusqu’à ce que la GPU atteigne (au bout de la 3eme ou 4eme fois) 80°C et Claymore stoppe la carte !
Claymore indique 25% alors qu’en réalité ils ne tournent pas du tout. La GPU s’arrete et ne rédemarre plus. Je dois restart le miner ou le rig.J’ai défini les paramètres de ventilateurs dans le profil d’OC sur HiveOS ainsi que dans la conf de Claymore mais rien ne change !
Pourquoi les fans se mettent tout à coup à ne plus fonctionner correctement ?
-
Au début, la GPU prend bien les paramètres définis dans Claymore et dans l’OC (40%)
Mais quelques minutes plus tard, les fans s’arretent. Ils redémarrent 3 fois quand les 75°C sont atteints puis s’arrêtent définitivement et la GPU s’arrêtera à son tour définitivement quans 82°C sont atteints. -
@sygmacrypt Peut-être en encore un problème de Riser…
Tu es en autofan? Tu as essayé une valeur fix pour tes ventilo?
-
@le_choux Je n’ai jamais rencontré ce problème auparavant. J’ai inversé le riser avec une RX580 et elle fonctionne correctement, le problème ne vient pas du riser.
Je suis et j’ai toujours été en autofan sur HiveOS. J’ai appliqué une valeur fixe (40%) dans le profil d’OC et dans Claymore. Cela fonctionne pour les RX580, et quelques minutes pour la RX570 avant que les ventilos s’arrêtent …
-
@sygmacrypt Dans tes valeurs tu n’es pas a 40% si on regarde tes screens, elle sont a 23%,32 et 40%
tu dois avoir un renseignement de fan qui n’est pas bon, tu met quoi dans hiveos ? -
J’ai désactivé l’autofan. Les valeurs définies dans le profil d’OC n’ont aucun impact.
Par contre, la défnition du paramètre -fanmin dans la conf Claymore a une influence ! En ayant défini 30 pour la RX570, j’avais le même problème mais qu’avec un seul fan ! Un seul fan tournait seulement jusqu’à atteindre 75°C et le second a démarré puis s’est éteint quand la température est redescendu à 62°C.
En définissant le paramètre -fanmin à 40, les 2 fans tournent constamment (40% selon le relevé de Claymore) et garde une température constante de 50-51°C (données de Claymore) -
@sygmacrypt fanmin c’est la valeur minimale de la ventil au démarrage
-
@raniva Je ne veux pas définir 40% pour les 2 RX580 (GPU0 et GPU1) qui fonctionnent correctement en auto et qui ne dépassent jamais 45°C.
-
@sygmacrypt pourtant si tu definie fanmin a 40 , c’est ce que tu leur dis
-
@raniva J’ai défini uniquement pour la RX570 (GPU2) :
Mon profil d’OC (qui n’a eu aucun impact) :
Je souhaiterais justement rester en auto pour les 2 RX580 et définir 40% sur la RX570 (l’auto étant non fonctionnel) mais que ce soit dans Claymore ou HiveOS, soi on définir une seule valeur pour toutes les GPU, soi on en définit une pour chacune.
Est-il possible de modifier la valeur d’une seule carte uniquement ? Par exemple, auto, auto, 40 pour n’appliquer ce paramètre qu’à GPU2 ?
-
@sygmacrypt je ne pense pas que tu puisse mixer les deux,
Pourquoi ne pas fixer les parametres toi meme , tu te prend la tete pour rien.Perso je met -tt 1 dans mes parametres claymore (donc laisse la gestion par hiveos de la ventil) et je met la valeur des ventil en % dans claymore OC , jamais eu de souci.
Si t’as piece est bien ventilé ou que la temperature est relavitement constante pas de souci de monté en temperature. -
@raniva a dit dans Impossible de faire fonctionner 1 GPU : WATCHDOG: GPU 2 hangs in OpenCL call, exit :
Pourquoi ne pas fixer les parametres toi meme , tu te prend la tete pour rien.Perso je met -tt 1 dans mes parametres claymore (donc laisse la gestion par hiveos de la ventil) et je met la valeur des ventil en % dans claymore OC , jamais eu de souci.
Jusqu’à maintenant j’étais en auto et hiveos s’en occupait. Mais depuis hier, j’ai ce problème je ne sais pas pourquoi.
Mais ne t’inquiète pas, j’ai défini -fanmin 20,20,40, ce qui permet à la RX570 d’être toujours à 40% à 51°C et mes 2 RX580 se règlent automatiquement étant donné que 20% n’est pas suffisant :
Concernant la pièce, elle est fraiche à température constante donc pas de soucis de ce côté là.Je regarderai comment se comportent les fans quand je recevrai le nouveau riser et que je rebrancherai la RX560 (retiré temporairement car c’est la moins performante et je ne peux pas la connecter directement à la carte mère à cause des câbles PCIe trop courts)
Merci pour ton aide
-
@sygmacrypt Je ne m’inquiete pas, tu demandes juste de l’aide et je donne file un conseil, sur le coup de la reconnaissance des ports PCI c’etait bien les risers que je t’avais conseillé de voir.
Tu m’as répondu aussi que ce n’etait pas grave pour l’identification au final le souci etait bien le riser, perso mettre fanmin sur certaines carte m’a poser pas mal de souci sur certaines cartes d’ou le faite de ne rien définir presque dans claymore et tout faire sous l’OC hiveosMais ne t’en fais pas pour moi, je ne m’inquiete que pour ma famille, le reste osef