
hi,
so, hier wie schon länger versprochen nun mal ein "review" mit dem thema:
wie teste ich, ob mein system richtig stabil ist.
"zu" oft kann ich hier im forum über probleme und fragen lesen die in diese richtung zielen.
("was habt ihr für übertaktungsfehler?"... )
ACHTUNG!
die folgenden test's stressen die hardware sehr stark.
es kann zu mehr oder weniger harten chrashes und abstürzen kommen.
es können daten verlorengehen... es ist auf zu starke erwärmung der komponenten zu achten...
es ist also mit gefühl und bedachtheit vorzugehen!
es bezieht sich haptsächlich auf overclockte systeme.
... aber auch auf supersilent getrimmte systeme die z.b. in spec laufen,
aber durch undervolting auch an ihre stabilitätsgrenzen stoßen.
die folgenden ausführungen stellen haptsächlich meine persönlichen, aber auch "allgemein gültige" test's dar.
ich sammelte damit schon einige erfahrungen.
z.b. mit verschiedenen boards und tualatin cpu's und deren kombinationen miteinander:
- Asus TUSL2-C
- ABIT ST6
- celeron 1.00A
- celeron 1.10A
- celeron 1.30
- PIII-S 1.40
meine persönliche kombination kann man dann ganz unten finden.
es ist oft zu lesen, daß bestimmte fehler bestimmte ursachen haben.
z.b. mit diesem fehler hast du zu wenig vcore, oder dieses game stürzt ab bei zu scharfen ram timings.
ich konnte solche dinge nicht schlüssig feststellen!
es gibt folgende instabilitätsursachen:
- die cpu ist an ihrer grenze
- der pci ist an seiner grenze
- der ram ist an seiner grenze
- das netzteil ist an seiner grenze
- ... weiteres
- kombinationen von ursachen, die dann in diesen grenzbereichen auch sehr seltsame fehler hervorrufen können.
===== die cpu ist an ihrer grenze =====:
um die cpu stabil zu o'cen gibt es zwei varianten:
- mehr vcore
- effektivere kühlung
mehr vcore macht stabiler.
aus mehr vcore resultiert aber mehr wärme.
mehr wärme macht instabiler.
je nach individuellen bedingungen ist das eine oder andere von vorteil.
meist sind zwischenlösungen möglich und nötig.
es wird also immer ein kompromiss werden.
ne effektive kühlung ist aber generell das A&O.
zum testen gibt z.b. das programm Prime95Prime95.
eigentlich ist es ein Primzahlensucher@home ist, ähnlich wie seti.
es enthält eine testruotine "Torture Test", welche selbst die kleinsten instabilitäten (rundungsfehler) aufspührt.
(es enthält auch einen kleinen benchmark)
es "heizt" gleichzeitig recht gut, was die kühlung gleich mit prüft.
(hier gibt's dazu 'ne ausfühliche beschreibung)
prime 95 ist prioritätsmäßig sehr zrückhaltend und läuft auf idle.
(auch ein ändern der priorität auf normal oder high ändert an dieser sache nichts)
es ist darauf zu achten, daß z.b. kein seti im hintergrund läuft.
seti läuft auch auf idle, aber prime ist noch zurückhaltender und bekommt dadurch nur wenig cpu zeit ab.
das bremst aber die "wirkung" von prime95 und auch die erwärmung der cpu.
prime95 testet ausschließlich die cpu stabilität.
wenn das sys durch zu hohen pci recht wackelig ist, die cpu aber stabil läuft, meldet prime95 auch null fehler.
(z.b. tusl2c, welches zwischen 126MHz und 133MHz fsb (42MHz-44MHz pci) gewisse instabilitäten aufweist)
siehe "der pci ist an seiner grenze"
so ruft man den torture test auf:

so sollte er dann stundenlang laufen:

so sollte es nicht aussehen, dann ist's instabil.
(bessere kühlung und/oder mehr vcore ist nötig), oder weniger takt


als weiteren test hat sich burnmmx.exe bewährt.
es heizt die cpu wie kein anderes prog , noch besser als prime95, burnp6.exe, burnmmx.exe, cpu stabilility test...
(edit: gild nur für Tualatin-cpu's, für P4 bitte burnP6 verwenden, ansonsten ähnliches verhalten)
es ist sehr sensibel und beendet sich selbst bei instabilitäten durch simples (selbst)schließen des dos-fensters.
burnmmx ergänzt sich auch sehr gut mit prime95, mitunter "finden" beide jewals "übersehene" fehler...
zum beenden von burnmmx.exe Strg + c drücken.
zu sehen gibt es bei diesem prog eigentlich nichts außer dem blinkenden cursor


===== der pci ist an seiner grenze =====:
(edit2: kann bei p4-systemen übersprungen werden, da sie fast immer über ein pci-fix verfügen)
hier gibt es leider nicht so viele möglichkeiten:
- Vi/o anheben
- hochwertige komponenten wählen (z.b. aufmerksam signaturen lesen

zu hohen pci speed kann man hauptsächlich mit wildem multitasking entlarven.
hier kann man einen meiner test's finden.
leider hat nicht jeder solch einen teiler zur verfügung,
welcher cpu und ram in stressfreie regionen zurücksetzt und allein den pci-bus stresst.
3DMark2001(nicht SE) konnte ich für mich als einer der härtesten stabilitätstest auf pci-instabilitäten ausmachen.
(z.b. tusl2c, welches zwischen 126MHz und 133MHz fsb (42MHz-44MHz pci) gewisse instabilitäten aufweist)
dieser test stresst auch gleichzeitig das gesamte system.
wenn der default bench durchlief, dann crashte er meist bei immer einer dieser beiden szenen.
also slektierte ich die tests mit folgenden Einstellungen:
- starte 3DMark2001
- drücke "Change..." bei Selected Tests
- drücke "Costum"
- drücke "Clear" (alle haken raus)
- nur anklicken oben bei "Game Performance":
- Game 2 - Dragothic High Detail.
- Game 3 - Lobby High Detail.
- drücke ok.
- drücke "Change..." bei Options.
- haken in die beiden oberen kästchen bei "Benchmark" "Disable title..." und "Looping".
- drücke ok.
- drücke Benchmark.
es läuft jetzt in einer endlosschleife, beenden mit Esc

hier mal ein schnappschuss von meinem desktop nach einer übertriebenen übertaktung bei ca. 1638MHz.

(mit celeron 1300, noch ohne wasserkühlung... wahr aber wohl etwas cpu bedingt)
3DMark 2001 crashte und zu sehen ist eine mischung von meinem desktop und game 3 lobby high detail.
es sollte also stunden laufen, aber nicht so enden wie in meinem Bild


===== der ram ist an seiner grenze =====:
hier gibt es wieder mehrere möglichkeiten:
- die speichertimings zurücknehmen

- die speicher spannung / Vi/o anheben
- besseren speicher verwenden
hier hat sich memtest zuverlässig bewährt.
es ist unter win lauffähig, was die sache gegenüber anderen memtestern sehr vereinfacht.
es sind zwei versionen enthalten.
die zweite (1.2) ist möglicherweise minimal empfindlicher, crasht aber bei fehlern etwas härter....???
so sollte es normal aussehen:

und so sollte es nicht aussehen:

===== das netzteil ist an seiner grenze =====:
hierfür ist sicherlich ersteinmal ein starkes nt von vorteil.

auch die individuelle sys zusammenstellung ist hier entscheidend.
logisch wäre hier zum test wiederum zahlreiche looping durchläufe von 3DMark2001SE im default-benchmark.
das belastet nicht nur die cpu, sondern auch die graka und das ganze system.
diese gesamtbelastung sollte dann schon recht aussagekräftig sein.
===== hier nun meine ganz persönlichen test-einstellungen =====:
pci speed, ramtest und netzteilttest mache ich im prinzip wie oben, mit einigen anpassungen.
beim pci test mit 3DMark2001 laufen im hintergrund Prime95 und burnmmx mit (beide priorität idle).
auch beim ramtest ist das so.
beim cpu test, der am häufigsten vorkommt, bastelte ich mir eine kombination aus prime und burnmmx.
sie laufen dabei immer gleichzeitig!
wie oben beschrieben, ergänzen sie sich gegenseitig und finden auch kleinste fehler, einzeln und gemeinsam.
wie oben beschrieben, ist prime sehr zurückhaltend in der priorität (fanatisch idle).
es ist also von vorteil (siehe oben), die priorität von burnmmx auch auf idle zu setzen,
so daß prime auch noch 'ne chance zum werkeln hat.
so läuft dann prime mit ca. 10 % cpu zeit, burnmmx mit ca. dem rest.
die cpu-zeitverteilung prüfe ich mit wintop.
zum setzen der priörität nutze ich prcview, welches eine 32bit dos exe enthält. (ganz brauchbar in batch-dateien)
zum prüfen von temperaturen und spannungen nutze ich MotherBoardMonitor5.
zum einfachen starten aller tools hab ich mir eine batchdatei geschrieben.
sie startet alle programme und setzt die prioritäten mittels commandlineoptionen.
(ich nutze win98se, aber os'se wie winxp sollten damit auch keine probs haben

zum grafikkarte und deren speicher übertakten nutze ich folgendes:
es ist im prinzip derselbe test mit DMark2001 wie bei pci speed (siehe oben).
jedoch als test nur allein den nature, alles andere aus.
Selectet Tests --> Costum --> Game Performance --> Game 4 - Nature.
nur mit diesen test ca. 25 mal durchlaufen lassen.
das stresst speziell den grafik-speicher, er wird gut warm.

das hat sich bei mir am empfindlichesten herrausgestellt.
bei auftretenden grafikfehlern sofort mit Esc beenden! (neustart kann erforderlich werden)
Prime95 oder burnmmx laufen bei diesem test nicht im hintergrund.

so, ist ja ne mächtig lange abhandlung geworden...
generell sind diese tests sehr stressig für die komponenten.
wenn die testes bestanden sind, hat man schon eine ziemliche garantie,
das das system in der normalen praxis sehr stabil sein wird.
alle tests sollten aber schon einige zeit laufen, ideal sind 24 stunden.
diese tests bieten sozusagen eine schnellübersicht,
um in der täglichen anwendung auch extremste anforderungen zu bestehen.
ich hoffe, etwas zur stabilität beigetragen zu haben.

________________________________________________
edit: zeilenumbrüche angepasst.
edit2:einige aktuelle anpassungen z.b. p4
edit3: links aktualisiert