Incident la XPOWER

Joi, 6 iunie în 2019, chiar de Înălțarea Domnului Iisus Hristos, am avut emoții mai mari cu calculatorul care se ocupă de numerele între 161 și 240 de cifre.
Poate că și de la sclipeala vreunui fulger care face scurtă întrerupere de curent, pompa care împinge lichidul de răcire a procesorului (EK-XTOP DDC PWM Elite) a încetat temporar să facă împingerea de circulație, așa că 7980XE-ul s-a încins mai tare și au fost opriri de sistem.

Chiar dacă există ventilație funcțională în jurul procesorului, inclusiv la radiatorul cooler-ului, totuși circularea acelui lichid (EK-CryoFuel) este importantă, altfel procesorul ajunge la 99 de grade și amețește placa de bază, nu doar că se auto-stinge sau stă așa de încins fără să se stingă.

Fenomenul, care în englezește se cheamă CPU Overheating, este tare periculos și trebuie să nu se întâmple, ideal, niciodată.
Asta ca să putem folosi rodnic procesorul cât mai mult timp.

La început, la prima foarte-încingere, procesorul dă auto-stingerea la un moment dat (se vede că-i de generație 2017 și pus pe o placă de bază din același an - MSI X299 XPOWER GAMING AC - cu BIOS din decembrie 2018), așa că sistemul se blochează și-apoi... pleumv, se stinge mustăreala.
Dar dacă procesul se repetă (pompa nu circulă lichidul acela), fie se stinge calculatorul după niște secunde de la pornire, de zici iar că „s-o fi stresat bateria de la BIOS, aoleu, ce de firăraie, până s-o scot”, fie rulează în gol, iar procesorul este fierbinte pe spate, frige la atingere.
Iar pe urmă, un timp, nici măcar nu mai pornește DEFEL placa de bază, deși apeși butonul unității centrale și, poate, chiar și direct pe placă - deci nici măcar acel ȚÂC-CLANC specific situației când bateria de BIOS are nevoie de aer.

Și te întrebi dacă nu cumva, Doamne păzește, ai stricat... ai ars procesorul, ai tirlindit placa de bază pe undeva - asta deși ARE lumină în ledurile elementare de CMOS și de Power (ăla de-l apeși direct pe placă cu degetul, ca să aprinzi calculatorul fără să butonezi unitatea centrală). Tai puțin curentul (ori de la priză, dacă are întrerupător - prizele moderne au și așa ceva -, ori de la sursa calculatorului, dacă are și ea, că și sursele mai moderne au așa ceva). Apoi poți iar aprinde placa, dar vezi că rulează în gol și nu apare imaginea pe ecran, sau dacă totuși apare și poți intra în BIOS, primești peste ochi o „CPU overheating alert”, de te miri de ce - asta deși deja ai simțit că frige „al zgaibei” de neobișnuit de tare pe spate, alias backplate-ul de procesor al plăcii.

Și, întrebându-te de ce așa și văzând în față, realizezi că este ceva în neregulă la cooler - la circularea lichidului salvator care, normal, face răcire la procesorul care merge. Vezi că în rezervor nu se mișcă nimic, deși lichidul vizibil în rezervorul parțial plin are o anumită mișcare în mod normal, vibrează de la procesul de circulare pe care-l face pompa de EKWB. Deci pompa, tă-nă-nă, NU mai merge.

Apeși pe butonul de CMOS în ideea că resetezi BIOS-ul, îmblânzești setările lui la normal și poate scapi. Și urmărești îngrijorat LED-urile de alarmă ale plăcii, acelea care îți indică, respectiv, dacă nu ai RAM, dacă nu ai video, dacă nu ai procesor... patru sunt, dacă nu mă înșel, și care-i în neregulă se face alb, atâta doar că dacă-s patru nu îmi dau seama acum ce alertează al patrulea, cred că lipsa BIOS-ului. Și chiar dacă toate sunt în regulă (nestricate), tot nu scapi de urmarea faptului că pompa nu se mișcă așa cum trebuie.

Și chiar nu își dă drumul, primești iar smetia de „Overheating alert” peste ochi.

Te temi să mai porcești... pardon, să mai PORNEȘTI procesorul așa, că o atitudine din asta fierbinte chiar că riscă să te lase DE MARE PORC, să faci distrugere dizgrațioasă.
Pe loc te gândești cât e de greu să interschimbi pompa asta cu o alta, că trebuie să demontezi două sisteme din astea de răcire a procesorului - pe cel afectat și pe cel cu pompă identică de la alt calculator - și să scurgi bine lichidul deoparte, din ambele, să nu se piardă. Refuzi să crezi că chiar ți-a murit pompa și nu-și revine, și mai vrei să o testezi.

Dar NU mai pui deocamdată procesorul să funcționeze, plus că îți amintești de o metodă minimală de testare a funcționării Coolerului fără să conectezi toată placa de bază - așa că scoți conectorul ei ATX de 24 de pini, care face pornirea principală, plus că decuplezi și procesorul (cei 12 pini EPS), ca să nu mai aibă nici el treabă deocamdată, dar chiar și așa, de la sursă mai vin alte cabluri (pentru HDD-uri, pentru unele ventilatoare). Iar mufa mare de ATX trebuie să o bagi într-un cuplor special care a venit cu cooler-ul de la EKWB, destinat să testezi cu el strict buna funcționare electrică a sistemului de răcire cu pompă, fără să pornești placa de bază. Dacă faci această înfigere, nu mai ai nevoie să apeși niciun buton, pornirea sursei calculatorului se face automat, ca de-ai apăsa pe butonul obișnuit al unității.

Dar când la sursă mai sunt cuplate alte cuple (pardon de pleonasm) care nu sunt scoase din relația cu placa de bază, afară de ATX-24 și de cei trei conectori de câte 4 pini EPS ai procesorului, oricum au loc porniri de ventilatoare și chiar aprinderea unei părți din placa de bază. Dar sigur, ea nu se mai aprinde cu totul, lipsită fiind de conectorul principal, dătător de putere (ATX-ul acela mare) și, pentru binele lucrării de tentativă de refacere, procesorul doarme și el. Și vezi că nici nu mai pornesc ventilatoarele cooler-ului (plus încă ceva din ventilația carcasei, că deh, AI DECONECTAT parțial placa, în punctul ei esențial), dar din nefericire și pompa doarme și lichidul din tubăraia EKWB stă pe loc.

Pornești și stingi așa „mustăria electrică” de mai multe ori la rând, trăgând și băgând la loc cuplorul de culoare albă peste mufa ATX-24 de la sursă (deci niciun buton), și pui mâna pe pompă să o simți dacă mișcă ceva. Simți unele vibrații periodice ale ei, dar, trist lucru, lichidul din rezervor nu se mișcă, deci pompa continuă să nu pună „sângele de răcire” în mișcare. Deși acum ventilatoarele radiatorului EKWB dorm și ele pentru că nu primesc din placa de bază impulsul necesar (deoarece acel ATX-24 este în altă parte), totuși, normal, ar trebui să vezi mișcarea lichidului, că în fapt scopul acelui „short” alb (sau cum să îi zicem) este tocmai să verifici că răcirea cu pompă merge bine.

Te rogi ca pompa să-și revină, în același timp cântărind greutatea posibilității de a o înlocui cu alta (demantelând alt sistem funcțional, dar care stă pe pauză de ceva timp) și, apoi, câte zile și cât ai de dat ca să cumperi altă pompă de la EKWB... ca oricare cooler EKWB să funcționeze cum trebuie, fără piese lipsă sau stricate. Determini lichidul din rezervor și tuburi să facă niște „mișcare” pe dinăuntru, înadins ca să vezi, la încercările de a porni pompa, dacă se mișcă concret ceva sau nu. Iar când ai la dispoziție și alt sistem cu același principiu de răcire a procesorului și același model de pompă, dai drumul și acolo, pui mâna pe pompa lui ca să o compari cu cea care nu-ți merge și să simți deosebirile. Bun, ambele vibrează, dar cealaltă pompă își face treaba, pe când cea care te supără... nu.
Pui mâna pe procesor, cu îngrijorare, și el nu mai e fierbinte, că l-ai deconectat, dar e tot... cald.

Și vorba aceea, între timp scoți conectorii pompei (pe cel de 3 pini CPU FAN, dar vibrațiile ei inutile continuă, apoi efectiv și pe cel electric de la partea de fire SATA dinspre sursă) și îi bagi la loc, că poate-poate măcar așa o trage un „respiro” și și-o reveni, dacă o scoți și-o pui iar în... priză. Te uiți la lichidul din circuit, căruia i-ai schimbat poziția, și tot nu-l vezi în mișcare. Te gândești la înlocuirea temporară a pompei cu piesa „de rezervă” și la data când poți cumpăra una nouă, amânând plata unei anumite facturi pentru asta...

Dar la un moment dat lichidul își schimbă singur poziția, iar ce se vede în rezervor reintră în mișcare. Așadar, pompa... TOCMAI ȘI-A REVENIT.

Bucurie, dar fără gesturi pripite asupra plăcii. Mai poți să pui lichid în rezervor, ca să fie puțin mai mult acolo, că de la multă căldură și folosire intensă, el mai scade mililitric cu timpul; apoi, dacă ajunge prea sus în rezervor, ajungi și tu să NU îl mai vezi mișcându-se chiar dacă pompa merge, dar urmează să îți dai seama din BIOS (când resosești în el) dacă temperatura e bine sau nu, plus că poți pune mâna pe spatele „animalului”, adică al procesorului, ca să simți dacă e iar fierbinte sau nu.

Ai de pus la loc ATX-ul în placa de bază, apoi de recuplat procesorul (pinii EPS). Te mai uiți să vezi ce ALTCEVA nu merge pe placă (un ventilator de memorii, dar care pesemne că are nevoie de energie suplimentară furnizată din BIOS, când setezi Full speed pentru toate ventilatoarele, adică toată aerisirea să ruleze puternic mereu - că vezi că nu pornește nici dacă pui alt ventilator din același model, și e greu de crezut că s-a stricat și acel SYS FAN). Asta cu uitatul o faci când ai repus ATX-ul, pornind placa normal, dar procesorul încă este decuplat. Totuși, lichidul din rezervor vibrează iar, deci pompa merge. Și urmează să-i mai dai lichid.

În fine, repui procesorul în acțiune, ajungi iar în BIOS, vezi că nu mai are 99 de grade... dar și setările le-ai făcut Default, așa că ai pierdut tot overclocking-ul de dinainte și trebuie să te uiți din nou și pentru discul care trebuie încărcat la pornire. Dacă ți se mai blochează o dată, repornești; pui pompa într-o poziție bună, în picioare, că a stat într-o rână, și poți umbla iar prin BIOS.

Numai că incidentul ăsta cu placa, pompa și procesorul tocmai a băgat frica prin tine - poate că dacă lași mai jos frecvența procesorului o să fie mai bine. Așa, și cei 128 de GB de memorie, care înainte erau la 3733 de megaherți, pot să ruleze la 3200, iar procesorul, care avea 4300 până acum pentru toate nucleele, să fie lăsat la 4100, cu voltaj și Load line calibration automat stabilite în BIOS și VRM-ul procesorului să nu treacă de suta de grade, așa, protectiv - dar frecvențele mai mici să presupună temperaturi mai mici, mai ales când a și venit sezonul cald, ambiental vorbind - luna iunie -, că poate că pompa a luat-o razna de la prea multă căldură (frecvență mare la procesor, cu foarte mult timp de folosință continuă) și atunci mai îmblânzești procesorul... și memoria.

Și speri că așa o să lucreze calculatorul mai rezonabil.

Termini cu BIOS-ul (unde repui setarea cea cu ventilatoarele la maximum) și vrei să intri în sistem, dar acolo, de la blocaje, sunt erori prin sistemul de fișiere al sistemului de operare (pardon de repetiție) și, fiind Arch Linux, primești o nouă cârmeală peste ochi sub forma unui „fsck” care trebuie rulat manual pentru erorile din „filesystem”, și procesul de încărcare a sistemului este „bailed out”. Ai parte de o „UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY”.

Mai umbli prin BIOS la discul de încărcare, dar tot nu scapi de eroarea asta și, uitându-te mai atent, vezi că ți se dă să rulezi manual în consola (Shell) rootfs - parcă așa îi zice - comanda fsck urmată de parametrul cu numele luuung, lung, al partiției cu sistemul, ceva cu .../by-uuid/..., litere și cifre.
Tastezi numele ăla lung cu răbdare și reușești într-adevăr să pornești fsck-ul, răspunzând pe parcurs cu da la mai multe întrebări legate de corecții.
La urmă, dacă scrii „exit” repornești; pe urmă, slavă Domnului, nu mai ai parte de nicio eroare la începutul încărcării Linuxului, adică /dev/sdc1 este „clean”, ai un sistem curat și intri la loc.

Reiei treburile întrerupte mai devreme și te uiți cu preocupare la datele termice și de frecvență pe care ți le dă în Linux programul „i7z” despre procesorul Intel - cât sunt de calde nucleele.
Ești sub relativ control, dar tot te-ai speriat pentru mai devreme.
Și așa temperaturile pe nuclee „e” destul de mari la lucru, „batâr” să nu mai ajungi printre nouăzeci și sută.

*
Adevărul este că XPOWER-ul a lucrat foarte mult timp în mod continuu, și temperaturile procesorului au putut fi mari, mai ales la încărcări epocale ale procesorului (peste 50-70 la sută).
De asta este corect acum să gândim preventiv asupra micșorării protective a frecvențelor noastre. Overclocker-ii înfocați au tocmai problema aceasta: că sunt înfocați; cei mai puțin înfocați trebuie să-și dozeze și ei cu grijă performanțele.

Calculatoarele astea pot fi comparate cu niște... soții care se supără: când bărbatul a călcat pe bec și soția îl ceartă, e bine să mai lase de la el din parametri, ca să nu se certe iar. Și ele să fie din nou bine.

**
De acum, cum un astfel de incident chiar BAGĂ FRICA în tine, este bine să consideri opțiunea aceea de a lucra cu frecvențe mai blânde, ca să aperi procesorul și ca să nu se supere iar pompa.

Comentarii

Postări populare