Signal 11 pri izradi kernel

BitWizard B.V.

Source: http://bitwizard.nl/sig11/

 

Ovaj FAQ opisuje ono što je mogući uzroci su za efekat koji smeta puno ljudi u zadnje vrijeme. Naime da je linux (*) – kernel (ili bilo koji drugi veliki paket po tom pitanju) sastaviti nezgoda sa “signal 11”. Uzrok može biti softver ili (najvjerojatnije) hardver. Čitajte da biste saznali više.
(*) Naravno, ništa nije Linux specifičan. Ako vaš hardver lisnatom, Linux, Windows 3.1, FreeBSD, Windows NT i NextStep će sve nesreći.

Sig11 FAQ

PITANJE

Signal 11, šta to znači?

ODGOVOR

Signal 11, ili službeno poznat kao “segmentacije kriv”, znači da program pristupa memorijski prostor koji nije je dobio. To je obično bug u programu. Dakle, ako pišete svoj program, to je najvjerojatnije uzrok. Međutim, ovaj FAQ će se koncentrirati na mogućnosti osim toga.

PITANJE

Moje (kernel) sastaviti nezgoda sa

gcc: Internal compiler error: program cc1 got fatal signal 11

Ono što nije u redu sa kompajler? Koju verziju kompajler mi je potrebno? Ima li nešto nije u redu sa kernel?

ODGOVOR

Najvjerojatnije nema ništa loše sa svojim instalacije, vaš kompajler ili kernel. Vrlo vjerojatno ima neke veze sa hardverom. Postoje razne podsistema koji mogu biti u pravu, a tu su i razne načine da ga popravi. Čitajte, i ćete saznati više. Postoje dva izuzetka od ovog “pravila”. Možete biti ponestaje virtualne memorije, ili ste mogli instalirati Red Hat 5.x, 6.x ili 7.x. Postoji više o tome pred kraj.

PITANJE

Ok to ne može biti softver, Kako znam sigurno?

ODGOVOR

Prva omogućava pobrinite se da je hardver koji uzrokuje vaše probleme. Kada je “marke” prestaje, jednostavno upišite “da” još jednom. Ako se sastavlja još nekoliko datoteka prije zaustavljanja, to mora biti hardver koji vas izaziva probleme. Ako se odmah ponovo zaustavlja (i.e. skenira nekoliko direktorije sa “ništa da se uradi za xxxx” pred bombardovanje u isto mjesto), pokušajte

dd if=/dev/HARD_DISK of=/dev/null bs=1024k count=MEGS

Promijeniti HARD_DISK na “HDA” u ime vašeg hard disk (npr HDA ili SDA. Ili koristite “DF”.). Promijenite Megs na broj megabajta glavne memorije koje imate. To će dovesti do prvih nekoliko megabajta vašeg hard disk za čitanje iz diska, prisiljavajući C izvorne datoteke i GCC binarni da se ponovo pročita sa diska sledeći put kada ga pokrenete. Sada tip napraviti ponovo. Ako i dalje zaustavlja na istom mjestu Počinjem da se pitam da li čitate pravo FAQ, jer počinje da liči na softverski problem nakon svega …. Zavirite u “ono što su i druge mogućnosti “pitanje ….. Ako bez ovog” dd “naredba kompajler drži na zaustavljanju na istom mjestu, ali se kreće na drugo mjesto nakon što ste koristili” dd “definitivno imaju disk-> transfer ram problem.

PITANJE

Šta to zapravo znači? Jeste li sigurni da je to hardverski problem?

ODGOVOR

Pa, kompajler pristupiti memoriji izvan svog asortimana memorije. Ako se to dogodi na rad hardvera to je programiranje greška unutar kompajler. To je razlog zašto se kaže “interne greške kompajler”. Međutim, kada je hardver povremeno okreće malo, GCC koristi toliko pokazivači, da je vjerovatno završiti pristup nešto izvan svog obraćanja opsega. (Random adrese su uglavnom izvan rješavanju klasa, kao iako tvoj glavni memorije može biti značajan dio 4G danas, obično samo mali dio se preslikava u bilo kojem procesu. 🙂 Čini se da danas, svako sa “signal 11 “problemi biva usmjerena na ovoj stranici. Ako razvijate svoju softvera ili imaju softver koji nije debagovani sasvim dovoljno “, signal 11” (ili segmentacija greška) je još uvijek vrlo jak nagovještaj da nešto nije u redu sa programom. Tek kada program kao što je “gcc” koji radi za skoro svi ostali se srušiti na skup (npr Linux-kernel), koji je takođe dobro testiran, onda postaje nagovještaj da nešto nije u redu sa hardverom. Ako je slomljena neke softverske komponente kao vozač hardver u vašem sistemu, to bi moglo izazvati simptome koji su vrlo blizu onima kvara hardvera. Međutim, kada je vozač je neispravan da je više vjerojatno da će izazvati ozbiljne probleme u kernel, nego samo izaziva kompajler za sudar.

PITANJE

Uredu. Ja mogu imati hardverski problem što je to?

ODGOVOR

Ako se desi da je hardver može biti:

  • Glavne memorije. Vaš glavni memorija može dobiti povremeno malo pogrešno. Ako se to dogodi na “piše”, nećete vidjeti nikakve pariteta grešaka. Postoji nekoliko načina da to popravi:
    • Brzina memorije je možda previše sporo. Povećati broj stanja čekanja u BIOS-u. Ovo bi moglo biti uzrokovani autoconfig opciju AMIBIOSs: to može znati samo 486s radi upto 80 MHz, a vi trenutno kupiti verzije 100 MHz. – Pat V.
    • Brzina memorije je možda previše sporo. Dobiti brže DRAM SIMM. Na primjer tekući ASUS matične ploče zahtijevaju 60 ns DRAM ako imate 100 ili 133 MHz procesor (Pogledajte u priručnik matične ploče). Čuo sam izvještaje da 70 ns također radi, problemi pouzdanost kao slučajni sig11 da pripadaju mogućnosti …. (ne bih uzeti rizik) – Andrew Eskilsson ([email protected])
    • Možda mislite da možete pokrenuti svoj 100MHz SDRAMs na 100MHz. U pravu! pročitao http://www.bitwizard.nl/sig11/sdram zašto mislim da je to slučaj. Potreban vam je najmanje jedan stepena brzine brže od brzine oni su ocijenjeni za.
    • Tu je loš čip na jednom od SIMM. Ako ste vlasnik više od 1 banka memorije možda ćete moći povući SIMM i vidite da li je problem nestaje. Budite oprezni za statička !!!
    • Rukuje nam je bilo teško ovde prošle sedmice. Ispostavilo se da SVE 4 16Mb SIMM su razbijena u tome što oko jednom pala malo na sat. Ovo je bilo dovoljno da se sruši mašinu za oko jedan dan, ili srušiti kernel sastaviti za oko sat vremena. Novi set SIMM radi savršeno. Trebalo mi je dugo za dijagnozu ove, jer su svi 4. SIMM su jednako pogođeni, tako ostavljajući pola memorije od nije umjesto njega.
      Mark Kettner ([email protected]) navodi da njegov sistem je sposoban da vodi moje memorije test za 2300 puta bez greške, ali onda otkrivena oko 10 grešaka. Zatim je nastavio ponovo otkrivanje nema grešaka za nekoliko stotina staza ….. U njegovom slučaju kernela sastavlja je mnogo efikasniji način otkrivanja zdravstvenog sistema (u najstabilnija konfiguracija sistema može sastavljati oko 14 zrna prije ide Berserk). Njegovo rješenje je bilo da “trguje u” staroj memorije za takozvani “memorije nadogradnju”. Trgovkinja zatim “testove” u znak sjećanja na njih tester, koji odobrio memoriju. On je tada dobio dobar popust na novi memorijski :-).
    • Čini se da su neki 30-72 pin konvertera može uzrokovati greške memorije. (Pogledajte kako je star ovaj unos je ko sjeća 30pin SIMM Međutim, sve ove stvari držati savršeno za SIMM? <-> DIMM pretvarača, ili socket370 <-> utor 1 pretvarače) (To nije dokazano da li je 4 SIMMS u pretvarač otišao loše, ili ako je SIMM konverter je kriv za SIMMS je savršeno funkcionira godinama prije nego što su se uselili u pretvarač ….) -. Naresh Sharma ([email protected]) . Paul Gortmaker ([email protected]) dodaje da je SIMM pretvarače treba da ima najmanje 4 obilaznici kondenzatora da bi napajanje od SIMM čista.
    • Ako je osvježavanje DRAM ne funkcioniše kako treba, u DRAM će polako gube informacije. Neki (486) matičnih ploča prestanu osvježavajuće ispravno kada uključite “skriveni refresh”. Čini se da se program pod nazivom “dram” oko koje se takođe unerediti osvježavanja uzrokovati probleme sig11. – Hank Barta ([email protected]), Ron Tapia ([email protected])
    • Broj čekanja država može biti preniska. Povećati broj stanja čekanja u BIOS za fix. Intel Endeavour odbor ne dozvoljava vam da povećate memoriju čekati država. To može navodno se odredi treperi na MR BIOS u matičnu ploču. – David Hale ([email protected])
    • Neke memorijske module jednostavno ne vole da rade zajedno s drugima. Posebno oni oboje rade zajedno nemaju. Ovo je najvjerojatnije dogoditi ako se miješati različitih marki i veličina. Zvanično ako se držite specifikacije za sve module, to uvijek radi. Nezvanično ponekad nailaze na probleme.
  • Cache memorije. Vaš cache memorije može dobiti povremeno malo pogrešno. Keš obično nisu opremljeni pariteta. Možete dijagnosticirati da je to slučaj isključivanjem keš u BIOS-u. Ako se problem nestane to je vjerojatno cache. Postoji nekoliko načina da to popravi:
    • Brzina cache memorije može biti presporo. Povećati broj stanja čekanja u BIOS-u.
      Brzina cache memorije može biti presporo. Dobiti brže SRAM čipove.
    • Tu je loš čip u kešu. Malo je vjerovatno da možete zamijeniti čips tako lako kao i sa SIMM. Budite oprezni za statička !!! – Joseph Barone ([email protected])
    • Keš može biti postavljen na “pisati nazad”, dok postoji bug u napišete leđa implementaciju vašeg čipseta. Matična ploča gdje se to dogodilo bio “MV020 486VL3H” (sa 20M RAM) – Scott Brumbaugh ([email protected]) (mail adresa ne radi Scott: Vrati se na mene sa važećom povratnu adresu.)
    • Matična ploča može zahtijevati jumper za prebacivanje između Cache na štapiću i staromodan dip chip cache. (JP16 na Rev 2.4 ASUS P / I-P55TP4XE matične ploče)
  • Transfere disku. Blok dolazi iz diska mogu nastati povremeno malo pogreška.
    • Ako imate ovaj problem, vi ste najvjerojatnije morati učiniti “dd” naredbu da “potez” problem s jednog mjesta na sljedeći ….
    • Neki IDE harddisks ne mogu da podnesu “irq_unmasking” opciju. To može pokazati samo pod opterećenjem. I to može pokazati kao sig11.
    • Neke postavke mogu da podnesem DMA u nekim konfiguracijama. Mario Moder navodi da njegov sistem konačno počeo da radi ispravno nakon omogućavanja 32-bitni-io i za njegovu HD i njegov CD pogon. – Mario Moder ([email protected])
    • Imaš li Kalok 31xx? Baci ga u smeće. (Ili ga proda DOS korisnik Update:. Nisam čuo Kalok godinama Verovatno bista Pogoni i ne rade sa W95 usput…)
    • SCSI? Prestanak? A Short Bus može i dalje raditi (nepouzdano da je) sa lošim prestanka. Dugo autobus može dobiti greške u svakom slučaju. Možeš li uključiti pariteta na domaćina i disk?
  • Sam CPU. Neki serija procesora imaju mnogo veći postotak od njih da se to dogodi da se “loš”. Prije nekoliko godina: original Intel Pentium-120-a. Prije nekoliko godina AMD K6 / 2-300-a (1998, proizvedena je u sedmica 34 do 39!). I nedavno AMD K6 / 2-450-a. Neki ljudi mogu odlučiti da kažu 400MHz je za njih prihvatljiv, ali ako se ispostavi da je problem, imate pravo na novi procesor. Idite i razmijeniti ga gdje ste ga kupili. (Zaboravite na one P120, to nije vrijedno truda … 😉 – Guillaume Cottenceau ([email protected]) i Mark Keegan ([email protected])
  • Sam CPU. Neki serija K6 procesora jednostavno imaju dizajn bug. Pročitajte http://www.multimania.com/poulot/k6bug.html i zatim se pobrinite vam K6 razmijenjeni. – Rongen ([email protected]).
  • Overclocking. Cyrix P-166 procesori rade na 133MHz, a ne na 166. Ovo mora biti logično da se momci u Cyrix, ali niko drugi. Ti ih overclocking ako ih rade na 166MHz ….. (Napomena:. Neke od ovih FAQ je prilično stara sad AMD je počeo da radi istu stvar:. XP1800 je nastup na 1533MHz)
  • Overclocking. Neki proizvođači (ili privatne osobe) smatra da je moguće overclock neki CPU-a. Neki od njih mogu raditi drugi ne. Možda želite isprobati isključivanjem turbo (imajte na umu da je većina Pentium matične ploče više ne podržavaju režim ne-turbo) i vidjeti da li je problem nestaje. Provjerite brzinu procesora u odnosu (otisnut na to, pažljivo uklonite ventilator ako je potrebno) sa onim što kažu da je matična ploča skakači ili postavke BIOS-a …. Čini se da čak i Intel možda griješimo u ovoj oblasti. Sada imam nekoliko pouzdane izvještaje da će zvanični Pentium sig11 na njihovom nominalnom broju obrtaja, ali ne po nižoj brzini. Što se tiče neke brzine je matična ploča je samo naglasio teže manjoj brzini procesora, (120 MHz-> matična ploča radi na 60MHz, 100MHz-> matična ploča radi na 66 MHz), mislim da je malo vjerovatno da to nema nikakve veze sa matičnom pločom. Osim toga novi 120MHz procesor sada radi ispravno. – Samuel Ramac ([email protected]). Ovo nije jedinstven za Intel ili bilo koji od konkurenata.
  • Overclocking. Trenutno, brzine procesora, rasipanje snage itd itd su sve tako blizu “prednost” da svaki sada i onda pouzdan korporacije kao što je Intel morati posegnuti za trikovima koje Overklokeri koriste za poboljšanje performansi. Rezultati također može usporediti: Random Zatvaranja, sig11, itd itd
  • Temperatura CPU. Visoka brzina procesora može pregrijati bez ispravne hladnjaka. To može biti uzrokovan ventilator mana. (Moj lični ‘486 ima ventilator koji traje nekoliko minuta da se do brzine. Verovatno nikada neće stvarno FAIL jer je sada rashodovani :-). CPU može postati nestalna ako je “gurnuo” sastavljanjem kernel. Ovaj problem postaje još gore ako onemogućite “HALT” na LILO komandnoj liniji. Linux pokušava da isključivanje CPU izvršavanjem “zastoj” uputstvo kada je sustav u mirovanju. Ovo čuva vlast, a samim tim i temperatura procesora padne kada je sustav u mirovanju. Vi stoga možda neće primijetiti ovaj problem kada jednostavno uređivanje, a to bi moglo površinu tek nakon nekoliko sati CPU intenzivne poslove kada je temperatura okoline je visoka. Ako imate Pentium sa Fdiv bug, preporučljivo je da se trguje ih na Intel. Oni će vam poslati novu koji prekonfigurisana sa službenim Intel odobrio FAN. Također imajte na umu da većina normalnih ljepila su vrlo loše termičke provodnika. Ne postoji poseban termo ljepilo na raspolaganju koje treba koristiti kada je potrebno da se lijepi na CPU ventilator. – Arno Griffioen ([email protected]), – W. Paul Mills ([email protected]) – Alan vjetra ([email protected])
    Intel kaže da je dozvoljena temperatura se kreće za izvan procesora je:
    0-85 C: Intel486 SX, Intel486 DX, IntelDX2, IntelDX4 procesor
    0-95 C: IntelDX2, IntelDX4 OverDrive® procesore
    0-80 C: 60 MHz Pentium® procesor
    0-70 C: 66-166 MHz Pentium procesor
    Za više informacija o tome kako mjeriti ovu i neke potvrda onoga što sam rekao ovdje, pogledajte: http://pentium.intel.com/procs/support/faqs/iarcfaq.htm (posebno pitanja Q5, Q6 i Q12 Dokument postaje. malo zastarjela, ali je i dalje vrlo precizan. čini se da pitanja krećete malo tu i tamo kao dobro.) (Intel je sada preselio datoteke. Nisam mogao pronaći novi. da li postoji neko ko može da mi ukaže na novu lokaciju ???)
  • CPU napona. Neke matične ploče omogućuju vam da izaberete CPU napona. Neke matične ploče loše dokumentirati postavke jumper da je to upravljati. Čini se da je 5V procesor može i dalje raditi većinu vremena na 3.3 volti ….. – Karl Heyes ([email protected])
    RAM napona. Čini se da proizvođači sada pripremaju za 3.3V RAM-a. Većina memorije je sada 3.3V. (Ali pazite ako imate odbor sposoban postavljanje RAM napon: 3,3 V RAM će se slomiti na 5V …..) (Čuvši malo o tome, mislim da je prekidač mora biti automatski.)
  • Lokalni bus preopterećenja. Na 25 MHz vam dozvoljeno da imaju 3 VesaLocalBus (VLB) kartice, na 33MHz samo dva, na 40MHz samo jednom i pogodi šta na 50MHz NONE! (I.e. vam je dozvoljeno da pokrenete sistem sa lokalnim autobusom 50MHz, ali onda ti nije dozvoljeno korištenje bilo VLB kartice). Neki sistemi počnu da se ponašaju peruta kad preopteretiti VLB. Čak i kada VLB nije preopterećena (preko granice gore navedeno), sistem može izgubiti nekoliko nanosekundi margine dodavanjem dodatnih VLB karticu, tako da će biti potrebno da dodate keš čekati državu ili nešto nakon što Dodao sam novi VLB kartica …. – Richard Postgate ([email protected])
  • Upravljanja energijom. Neki laptopi (i danas su “zelene” PC-a) imaju funkcije upravljanja energijom. Oni mogu ometati Linux. Jedna od karakteristika može spasiti memorijsku sliku u HD i vratiti RAM-a kada pritisnete tipku. Ovo zvuči zabavno, ali Linux upravljačke programe ne očekujemo da je isključena hardver između dva pristupa. Neki mogu oporaviti, ali drugi ne. Pokušajte da ga isključite, ili omogućavanje “APM podrške” u kernel. – Elizabeth Ayer ([email protected])
  • Nagomilavanje prašine. Neki prašina može provesti malo i stvoriti slab kratak. To bi moglo povećati kapacitivnosti negdje, i degradiraju karakteristike vremena. To bi moglo ometati termalni protok, i dovesti do pregrijavanja komponenti. Moglo bi čak i kratak skakača vezu! Preporučujem da svake godine ili tako, to je dobra ideja da se otvori računalo, i usisa unutra. Savjet: Oni pamuk-on-a-stick stvarčice pomažu udaranjem prašinu iz nepristupačnih mesta … – Craig Graham ([email protected]). Neko drugi mi je rekao: ako ne možete, koristite zrak pod pritiskom da eksplodira stvari umjesto usisivača. Poželjno je uraditi van.
  • Sam CPU. Nekoliko ljudi prijavljuju da su pronašli ništa kriv, osim CPU-a. Ovo takođe može biti nekompatibilnost između procesora i matične ploče. Talas izveštaja koji se odnose Intel procesora je prošlo (februar ’97). Novi talas izvještaja dolazi u koje se okrivljuju Cyrix / IBM 6×86 procesora. Iako to može zaista biti CPU, to bi moglo biti da je vaša matična ploča nije u skladu sa svojim procesorom. Barem sam vidio matičnu ploču priručnik spominje da nije kompatibilan sa starijim 6×86-a. Moje vlastito iskustvo je da su ovi uređaji nisu loše, a na kernel kompiliranja sam benchmark je P166 + da je ekvivalentna sa P155 (1,3 puta brže od P120).
  • Memorija rupu. Mnoge moderne matičnih ploča omogućava vam da koristite stare ISA grafičke kartice sa jednim ili dva megabajta linearnih frame buffer. Da bi to postigli, moraju mapirati memoriju neposredno ispod 16Mb. Niko zapravo ikada koristili ovu funkciju, ali ako okrenete memorije rupa (ili podrška LFB u nekim BIOS) na, vaš uređaj će svakako biti lisnatom ….. – Paul Connolly ([email protected])
  • X i AMD nekompatibilnosti. Postoji problem sa gomilom modernih AMD-ove čipove koji ne nositi neke operacije baš tako dobro kao što bi trebalo. Ako imate AMD-a, i X11 često napušta sa “Signal 11 uhvaćeni”, onda bi mogao biti žrtva ovog pitanja. Pokušajte ponovo pokretali sa “mem = nopentium”. – Matthew Beale ([email protected]).
  • Microcode. Posebno SMP sistemima, CPU možda trebati nadogradnju. S obzirom da je Pentium podjela katastrofa, Intel imaju procesore polje nadogradi! CPU se može udario nekoliko verzija posebnim instrukcije iz BIOS-a. Ove nadogradnje obično dolaze sa svojim BIOS-a, pa se potrudite se da koristite najnoviji BIOS, posebno ako imate SMP sistema. – Jeffrey Friedl (Email zadržano).

PITANJE

RAM problema vremena? petljao sam sa bios postavke prije više od mjesec dana. Prikupio sam brojne jezgra u međuvremenu i ništa nije u redu. To ne može biti vremena RAM-a. Zar ne?

ODGOVOR

Pogrešno. Da li mislite da proizvođači RAM imaju mašinu koja čini 60 ns RAM i još jedan koji čini 70 ns RAM? Naravno da ne! Oni čine gomilu, a zatim ih testirati. Neki ispunjavaju specifikacije za 60 ns, drugi ne. Oni mogu biti 61 ns ako bi proizvođač morati staviti broj na to. U tom slučaju to je vrlo verovatno da radi na računaru kada na primjer je temperatura ispod 40 stepeni Celzijusa (čipovi postaju sporiji kada se temperatura raste. To je razlog zašto neki superračunara potrebno toliko hlađenje).

Međutim, “dolazak ljeta” ili dug posao kompiliranja može gurnuti temperatura unutar računara preko “granice”. – Philippe Troin ([email protected])

PITANJE

Sam sjebao u ne kupuju ECC memorije, jer je on bio nešto jeftiniji. Osjećam se kao budala. Trebao sam kupio skuplje ECC memorije. Zar ne?

ODGOVOR

Kupuje skuplje ECC memorije i matične ploče štiti vas od određene vrste grešaka: Oni koji se javljaju nasumično prolaskom alfa čestica.

Jer većina ljudi može reproducirati “signal 11” Problemi u roku od pola sata pomoću “gcc”, ali ih ne mogu reproducirati testiranjem memorije satima u redu, koji dokazuje da mi se da nije samo slučajni alfa čestica bacanje malo. To bi se uočili test memorije previše. To znači da se nešto drugo događa.

Imam utisak da najviše problema sig11 su uzrokovani tajming grešaka na CPU <-> cache <-> memorija put. ECC na glavnu memoriju ne pomogne u tom slučaju.

Kada treba kupiti ECC? a) Kada mislite da je to potrebno. b) Kad ima puno RAM-a. (Zašto ne cut-off broj? Zato što cut-off promjene s vremenom, baš kao i “PUNO”.) Neki ljudi osjeća jak o svakome koriste ECC memorije. Mislim da razloga “a)”.

PITANJE

Problemi sa memorijom? Moje BIOS testira moju memoriju i kaže mi its ok. Imam ovaj fensi DOS program koji mi govori moja memorija je u redu. ne može biti memorije u pravu?

ODGOVOR

Pogrešno. Test memorije u BIOS-u je potpuno beskoristan. Može čak i povremeno u redu više memorije nego stvarno je na raspolaganju, a kamoli test da li je to dobro ili ne.

Jedan moj prijatelj koristi imati 640h PC (da, to je bilo jako davno) koja je imala jedan 64kbit čip umjesto 256kbit čip u drugom 256k banke. To znači da je praktično imao 320k radne memorije. Ponekad BIOS će testirati 384K kao “OK”. U svakom slučaju, samo određene aplikacije propasti. Bilo je vrlo teško dijagnosticirati stvarni problem …

Većina problema memorija samo doći pod posebnim okolnostima. Te okolnosti su jedva ikada. gcc Izgleda da ih ostvare. Neke memorijske testove, posebno BIOS testove memorije, zar ne. Ja više ne radi na stvaranju disketu sa linux kernel i dobro pamćenje tester na njemu. Zaboravi na mene muči o tome ……

Razlog je taj test pamćenja uzrokuje CPU da izvrši samo nekoliko instrukcija, a obrasci pristupa memoriji imaju tendenciju da se vrlo redovne. Pod ovim okolnostima, samo mali podskup uspomene pokvari. Ako studirate elektrotehnike i zainteresovani za testiranje memorije, magistarski rad može biti da shvati šta se dešava. Postoje kompjuterski proizvođača koji bi želeo da sponzor takvog projekta s nekim hardverom koji klijenti tvrde da su nepouzdani, ali ne propušta proizvodnju testove ……

PITANJE

Da li se to dogodilo tek kad sam sastaviti kernel?

ODGOVOR

Ne. Ne postoji način vaš hardver mogu znati da ste sastavljanja kernel. To samo tako dogodi da je kernel kompiliranja je vrlo teško na vaš hardver, tako da se samo dogodi puno kad sastavljanja kernel. Sastavljanje drugih velikih paketa kao što su gcc ili glibc često pokrene sig11.

  • Ljudi su vidjeli “random” srušio na primjer prilikom instalacije pomoću instalacija Slackware skriptu …. – [email protected]
  • Drugi se “General greške zaštite” iz kernel (sa crashdump). To su obično u / var / adm / messages. – [email protected]
  • Neki vide bzip2crash sa “signal 11” ili “interni kvar tvrdnja (# 1007).” Bzip2 je prilično dobro testiran, tako da ako se razbije, to vjerojatno nije bug u bzip2. – Julian Seward ([email protected])

PITANJE

Ništa ruši na NT, Windows 95, 98, Milennium ili XP. To mora biti nešto Linux specifični.

ODGOVOR

Prije svega, Linux naglašava vaš hardver više nego sve gore navedeno. Neki OS kao što su Microsoft oni gore navedeni nesreći u nepredvidive načine u svakom slučaju. Niko neće zvati Microsoft i reći: “Hej, prozore kutija srušio danas”. Ako ipak učinite, oni će vam reći da ste, korisnik, napravio grešku (pogledajte intervju sa Bill Gates u njemačkoj magazina ….) i da od sada radi, treba da ćuti.
Oni OS su nešto više “predvidivo” nego Linux. To znači da Excel može uvijek biti stavljen u istu memorijsko područje. Stoga kada se pojavi bit greške, to je uvijek excel da je dobije. Excel će srušiti. Ili Excel će srušiti drugu aplikaciju. U svakom slučaju, to će čini se biti jedna aplikacija koja ne uspije, a ne odnose na memoriju.
Ono što sam siguran je da je čisto instaliran Linux sistem treba biti u mogućnosti da kompajliranje kernela bez bilo kakve greške. Svakako nije sig-11 one. (** Izuzetak:. Red Hat 5.0 sa Cyrix procesorom Vidi drugdje **.)
Stvarno Linux i gcc stresa hardver više u odnosu na druge OS. Ako vam je potrebna ne-linux stvarčica koja naglašava vaš hardver do tačke rušenje, možete pokušati Winstone. – Jonathan Bright ([email protected])

PITANJE

Da li je uvijek signal 11?

ODGOVOR

Ne. Drugih signala kao što su četiri, šest i sedam se javiti povremeno. Signal 11 je najčešći ipak.
Dokle god je uzimajući oštećen memorije, svašta se može dogoditi. Ja bih očekivao loše binarne do mnogo češće nego što zaista doći. U svakom slučaju, čini se da su šanse su jako naklonjena GCC dobiti signal 11. Također vidi:

  • free_one_pmd: ulaz loše direktorija 00000008
  • upozorenje EXT2-fs (uređaj 08:14): ext_2_free_blocks bitom već odobrenje za blok 127916
  • Interna greška: bad swap uređaj
  • Pokušavajući da oslobodi nepostojeće swap-stranici
  • kfree ne-kmalloced memorije …
  • scsi0: REQ prije WAIT DISCONNECT IID
  • Mogućnosti za rukovanje kernela NULL pokazivač dereference na virtualne adrese c0000004
  • put_page: stranica već postoji 00000046
  • nevažeći operand: 0000
  • Whee .. inode promijenjen ispod nas. Reci Linus
  • CRC greška – zaustavljena sistema (U uncompress Linux kernela)
  • Segmentacija greška
  • “Ne može riješiti simbol”
  • učiniti [1]: *** [sub_dirs] Error 139
  • čine: *** [linuxsubdirs] Greška 1
  • Sistem X Window može da prekine sa “uhvaćen signal xx”

Prvih nekoliko onih slučajeva u kojima kernel “osumnjičenih” kernel-programiranje-greške koja je zapravo uzrokovana loše memorije. Posljednjih nekoliko ukazuju na programe koji završavaju sa nevolje.
– S.G.de Marinis ([email protected])
– Dirk Nachtmann ([email protected])

PITANJE

Šta da radim?

ODGOVOR

Evo nekih stvari koje treba probati kada želite saznati šta nije u redu … NAPOMENA: Neke od njih će značajno usporiti računalo dolje. Ove stvari imaju za cilj da se računalo da funkcionira kako treba i omogućiti vam da suziti ono što nije u redu s njim. Sa ovim informacijama možete na primjer pokušati dobiti neispravne komponente zamijenjen se prodavcu.

  • Jumper matičnu ploču za niže CPU i brzina autobusa.
  • Uđite u BIOS-a i reći da “Load BIOS defaults”. Pobrinite se da pisati postavke diska dole unaprijed.
  • Onemogućiti cache (BIOS) (ili ga izvucite ako je na “štap”).
  • boot kernel sa “Linux mem = 4M” (onemogućava memorije iznad 4Mb).
  • Pokušajte uzimanje pola memorije. Probajte oba poluvremena u red.
    Gusle sa postavke osvježavanja (BIOS)
  • Pokušajte zaduživanja memorije od nekog drugog. Poželjno je ovo trebalo da bude memorije koja radi pod Linuxom besprijekorno u drugom rublja … (Silicon Graphics Indy strojevi su također lijepo mete posuditi memoriju)
  • Ako želite da proverite da li je rješenje stvarno radi pokušati sljedeće skripte:
#!/bin/sh
   #set -x
   t=1
   while [ -f log.$t ] 
     do
     t=`expr $t + 1`
   done

   while true
     do
     make clean
     make -k bzImage > log.cur 2>&1
     mv log.cur log.$t
     t=`expr $t + 1`
   done

sve je rezultiralo logfiles je trebao biti isti (i.e. iste veličine, i isti sadržaj). Svako zrno build potrebno je oko 4 minute na 1GHz Athlon sa 512MB memorije. (I oko 3 mjeseca na 386 sa 4Mb :-).

  • Drugi način za testiranje ako vaš trenutni setup je stabilan može biti pokrenuti “md5sum” na datoteke različitih veličina (dd if = / dev / random od = testfile bs = 1024k count =). Ako dvaput koristiti datoteku veličine vašeg RAM-a, bit ćete da ostvarite svoje disk. Ako koristite datoteku od 4 do 10 Mb manji od RAM, vi ćete ostvariti svoj RAM / CPU.
    Da li je ova metoda hvata sve moguće probleme, međutim, nije sigurno. GCC izvršava mnogo različitih instrukcija u različitim naredbama i md5sum možda jednostavno nije pogodio pravo slijed instrukcija koje gcc radi. Ali ako md5sum dovodi do grešaka, može učiniti brže nego kernel kompilacije. – Rob Ludvik (Rob @ no spam)

Najteži dio je da će većina ljudi biti u stanju da sve gore navedeno osim zaduživanja memorije od nekog drugog, a ne pravi razliku. Ovo čini vjerojatno da je to stvarno je RAM-a. RAM je nekada bio jedan od najskuplji dijelova PC, tako da radije ne dođe do tog zaključka, ali, žao mi je, imam puno reakcija koje na kraju se ispostavi da je RAM-a. Međutim, ne očajavajte samo još: RAM ne može biti u potpunosti propao: uvijek možete probati za trgovinu ga za različite ili više RAM-a.

PITANJE

Imala sam RAM testiran u RAM-tester uređaja, i oni su OK. ne može biti RAM zar ne?

ODGOVOR

Pogrešno. Čini se da su greške koje se trenutno dešavaju u RAMS nisu otkriti RAM-testeri. Moglo bi biti da je vaša matična ploča ne pristupa RAM u sumnjivim način ili na drugi način zabrljati gore RAM dok je u vašem računalu. Prednost je da možete prodati svoj RAM nekome ko i dalje ima povjerenje u svoju RAM-tester ……

PITANJE

Koji drugi hardver može biti problem?

ODGOVOR

Pa, svaki hardverski problem u računaru. Ali stvari koje je lako provjeriti prvo treba provjeriti. Tako, na primjer, sve vaše kartice treba biti dobro postavljena u matičnoj ploči.

PITANJE

Zašto je Red Hat instalirati bombardovanja na mene?

ODGOVOR

Red Hat 5.x, 6.x i 7.xi instalirati ima problema na nekim mašinama. Pokušajte pokrenuti instalaciju sa samo 32M. Ovo se obično radi sa mem = 32m kao boot parametar.
Moglo bi biti da postoji čitanje greške na CD-u. Instalater upravlja ovo manje-nego-savršen ….. Pobrinite se da vaš CD je bez greške! Čini se da će instalater bombu na marginalne CD!

Ljudi prijavljuju, a ja sam vidio svojim očima, da Red Hat instalira može poći po zlu (sudar sa signalom 7 ili signal 11) na strojevima koji su potpuno u redu. Moja mašina je bila i još uvijek je 100% pouzdana (zapravo mašinu sam testirao ovo je do sada pouzdano mrtav). Ljudi ulaze u nevolje brisanjem starih “radi dobro” distribucije, a onda žele da instalirate noviju distribuciju Red Hat. Vraćajući se tada više nije opcija, jer da se vratimo na 5.x takođe rezultira u istom “srušio prilikom instalacije”.

Patrick Haley ([email protected]) navodi da je pokušao sve konfiguracije memorije do 96MB (32 i 64) i da samo kada je instaliran 96MB, instalaciju raditi. To je također u skladu sa mojim iskustvom (Red Hat instalira što nije): Pokušao sam instalirati na 32M mašinu.

NOVO: Čini se da to može biti zbog problema kernel. Kernel može (temporarliy) isprazni, memorije i ubiti trenutni proces. Popravak Hubert Mantel ([email protected]) je na: http://juanjox.linuxhq.com/patch/20-p0459.html.

Ako je to zaista slučaj, pokušajte prebacivanje na drugu virtualnu konzolu (ctrl-alt-F2) i tipa “sync” tamo svakih nekoliko sekundi. To smanjuje količinu memorije koje hard disk-odbojnika … Ja bih bila veoma zahvalna sluh od vas, ako ste vidjeli Red Hat instalirati sudaru dva ili više puta za redom, a zatim su bili u stanju da završi instalirati koristeći ovaj trik !!!

Šta ti radiš da se zaobiđe ovaj problem? …

  • Koristite SuSE. To je bolje: to ne pada za vrijeme instalacije. (Osim toga, zapravo je bolje. 😉
  • Možda ste pokrenuli u loše blok na CD-u. To može biti pogon zavisni. Ako je to slučaj, pokušajte da kopiju CD-a u drugi pogon. Pokušajte zaduživanja neko kopiju Red Hat.
  • Pokušajte konfiguriranje gigabajt swap. Imam dva nezavisna izvještaje koji navode da su dobili preko sa svirku swap. Molim vas javite mi ako to pomaže!
  • Modificirati “postavke” za hard disk. Mijenja postavke iz “LBA” na “Normal” u bios je pomogla za najmanje jedna osoba. Ako pokušate ovo, ja bih stvarno zahvalan ako bi mi E-mail: Voleo bih da čujem od vas, ako to pomaže ili ne. (I šta tačno promijenjen da ga na posao)
  • Dobio sam mašinu za instaliranje instaliranjem minimalni osnovni sistem, a zatim dodavanjem paketa instaliranog sistema.
  • Neko je predložio da se stroj može biti out-of-memorije kada se to dogodi. Probaj da swap particije spreman. Također, instalacija može biti “pripremljen” za rukovanje sa malim mem situacijama, ali misjudging situaciju. Na primjer, to može učitati RAMDISK, ostavljajući samo 1M slobodnog RAM-a, a zatim pokušava da učitate 2M aplikacija. Dakle, ako imate 16M RAM-a, podizanje sistema sa mem = 14M zapravo mogu pomoći, kao “opterećenje RAMDISK” fazi bi onda ne i instalaciju bi onda znati pokrenuti sa CD-a umjesto sa RAMDISK. (Instalira radio za> 8M mašine. Da li je to još uvijek istina?)
  • Pokušajte, u jednoj sesiji očistiti disk svih particija koje će se koristiti Linux. Reboot. Zatim pokušajte instalaciju. Ili pregrađivanjem ručno, ili tako što je instalirati program shvatiti. (Pretpostavljam da Red Hat ima tu mogućnost previše, SuSE se …) Ako se to radi za vas, ja bih zahvalan ako bi mi reći.
  • A oštećen preuzimanje takođe može uzrokovati ovo. Duh.
  • Neko javlja da se instalira na 8Mb strojevi više ne rade, a da se instalira ungracefully izlazi sa sig7. – Chris Rocco ([email protected])
    Jedna osoba javlja da onemogućavanje “BIOS sjeni” (sistem i VIDEO), pomogao mu. Kao što je Linux ne koristi BIOS shadowing ne pomaže. Neki računala čak i mogu vam dati 384K dodatni RAM-a, ako onemogućite shadowing. Samo je onemogućili, i da vidimo šta će se desiti. – Philippe d’Offay ([email protected]).

PITANJE

Koje su druge mogućnosti?

ODGOVOR

Drugi su primijetili sljedeće mogućnosti:

  • Kompajler i libc uključeni u Red Hat 5.0 imaju čudan interakciju sa Cyrix procesora. To ruši kompajler, ovo je vrlo čudno. Ja mislim da je jedini način da to može biti slučaj kada je Cyrix ima bug koja je prošla neopaženo sve ovo vrijeme, i pouzdano dobiva aktivira kad se to gcc sastavlja Linux kernel. U svakom slučaju, ako želiš sastaviti kernel, trebalo bi da dobije novi kompajler i / ili libc na web stranici Red Hat. (Početak u početnu stranicu, a zatim kliknite na ispravke).
  • Sastavljanje 2.0.x kernel sa 2.8.x GCC ili bilo egcs ne radi. Postoji nekoliko bugova u kernel koji se ne pojavljuju jer GCC 2.7.x radi loš posao optimizacije to. gcc 2.8.x i egcs samo baciti neke od koda, jer mi nije rekla da to ne radi. U svakom slučaju, obično se kernel koji izgleda kao da rade, ali je smiješan bugova. Na primjer X može srušiti sa signalom 11. Oh, i prije nego što pitate, ne da neće biti fiksna. Ne trudi se Alan ili Linus o tome u redu? – Hans Peter Verne ([email protected])
  • Pentium-optimizaciju-gcc (onaj sa brojem verzije završava u “p”) ne sa zadanim opcijama na pojedine izvorne datoteke kao floppy.c u kernelu. Je “okidači” su u kernel, libc iu samoj gcc. To se lako dijagnosticira kao “nije problem hardvera” jer se uvijek događa na istom mjestu. Možete ili onemogućiti neke optimizacije (pokušati -fno-prikažite-petlje prvi) ili koristite drugi gcc. – Evan Cheng ([email protected]) (Drugim riječima:.. GCC 2.7.2p sudara sa sig11 na floppy.c Zaobilaženje-1: Koristite običan GCC Zaobilaženje-2: Ručno sastaviti floppy.c sa “-o” umjesto “-O2”.)
  • Loša veza između diska i sistema. Na primjer IDE kablovi dozvoljeno samo da bude 40cm (16 “) dugo. Mnogi sistemi dolaze sa više kablova. Također se skida IDE stalak može dodati dovoljno problema srušiti sistem.
  • Loše propustio konfigurisati GCC – neki delovi iz jedne verzije, neke od drugog. Nakon nekoliko tjedana na kraju sam ponovno instaliranje od nule da sve u redu. – Richard H. Derr III ([email protected]).
  • Gcc ili rezultat aplikacija može raskinuti sa sig11 kada je program vezan protiv SCO biblioteke (koji dolaze sa IBC). Ovo se dešava na nekim aplikacijama koje imaju -L / lib u svojim LDFLAGS ….
  • Kada sastavljanju kernel sa ELF kompajler, ali konfiguriran za a.out (ili obrnuto, zaboravio sam) ćete dobiti signal 11 na prvi poziv “LD”. To se lako prepoznati kao softverski problem, jer se uvijek javlja na prvi poziv “LD” u toku izrade. – REW
  • Ethernet kartica, zajedno sa loše konfiguriran PCI BIOS-a. Ako vaš (ISA) Ethernet kartica ima otvor na ISA bus, možda će biti potrebno da ga konfigurirati negdje u BIOS setup ekranima. U suprotnom, hardver će izgledati na PCI sabirnici za zajedničku memoriju području. Kao ISA kartica ne može reagirati na zahtjeve na PCI sabirnici, čitate prazne “zrak”. To može dovesti do segmentacije kvarova i kernel padova. – REW
  • Korumpirana swap particije. Tony Nugent ([email protected]) izvještava da je imala taj problem i to riješiti jedan mkswap na svom swap particije. (Ne zaboravite da ukucate “Sync” pre nego što bilo šta drugo nakon mkswap -. Louis J. LaBash Jr. ([email protected]))
  • NE2000 kartice. Neki jeftini NE2000 kartice možda zabrljaju sistema. – Danny ter Haar ([email protected]) Ja osobno možda imao sličnih problema, kao i moj mail server srušio teško svaki sada i onda (jednom dnevno). Sada se čini da je 1.2.13 i puno od 1.3.x kernela imaju ovu bug. Nisam ga video u 1.3.48. Verovatno ima negdje fiksirano u međuvremenu …. – REW
  • Napajanje? Ne, ja ne mislim tako. Moderan teška sistem sa dva ili tri hard disk, i SCSI i IDE neće preći 120 Watts ili tako nešto. Ako imate gomilu starih harddisks i stare kartice za proširenje zahtjeva napajanje će biti veći, ali i dalje je vrlo teško doći do granice napajanja. Naravno, neki ljudi uspevaju da pronađu opterećenja starih harddisks pune veličine i instalirati ih u njihova velika-kula. Možete zaista preopteretiti Napajanje na taj način. – Greg Nicholson ([email protected]) Neispravan napajanje može, naravno, pružaju marginalne snage, što uzrokuje sve neispravnog kojima ste čitali u ovoj datoteci …. – Thorsten Kuehnemann (Thorsten @ actis.de)
  • Nekonzistentan ext2fs. Nekim slučajevima može izazvati kernel kod sistema ext2 datoteku rezultirati Signal 11 za Gcc. – Morten Welinder ([email protected])
  • CMOS bateriju. Čak i ako ste postavili BIOS-a kao želiš, moglo bi se mijenja natrag na “loš” postavke pod nos ako je CMOS baterija je loša. – Heonmin Lim ([email protected])
  • Ne ili premalo prostora za razmjenu. Gcc ne dostojanstveno rukovati “iz memorije” stanju. – Paul Brannan ([email protected])
  • Nespojivo biblioteke. Kada imate simbolički link iz “libc.so.5” ukazujući na “libc.so.6”, neke aplikacije će bombardovati sa sig11. – Tržišta Brooks ([email protected]).
  • Pokvaren miša. Nekako, čini miša da bi mogao da se probije na način koji uzrokuje neki programi (u vezi miš) za sudar s Sig11. Vidio sam da se to dogodi na X server koji će srušiti ako brzo preselio miša. Matthew možda nije ni su u pokretu njegovog miša. – REW i Matthew Duggan ([email protected]).
  • Loše sjedi RAM-a. Pobrinite se da vaše RAM pravilno umetnut u utičnicu …. – Carroll Kong ([email protected]).

PITANJE

Otkrio sam da radi ….. otkriva greške mnogo brže nego samo sastavljanje kernela. Molimo vas da spomenuti ovo na svoje stranice.

ODGOVOR

Mnogi ljudi email me notama ovako. Međutim, ono što mnogi ne shvataju je da su se susreli jednom slučaju problematičnih hardvera. Osoba preporučujući “unzip -t” dogodilo da imaju određenu slomljena DRAM štap. I unzip se desilo sa “find” da mnogo brže nego kernel kompilacije.
Međutim, siguran sam da je za mnoge druge probleme, kernel kompajliranje BI ga naći, dok su ostali testovi ne. Mislim da je kernel kompajliranje je dobro, jer naglašava mnogo različitih dijelova računara. Mnogi drugi testovi samo ostvariti samo jednom području. Ako se to područje dogodi da se slomi u vašem slučaju, to će pokazati problem mnogo brže nego “kernel kompajliranje” volje. Ali, ako je računar OK na tom području i slomljena u drugu, “brže” test može samo reći da računalo je u redu, a test kernel kompajliranje bi rekao da nešto nije u redu.

U svakom slučaju, možda baš kao i popis šta ljudi misle su dobre testove, kojima su, ali ne kao generalni kao test “probati i sastaviti kernel” ….

  • Pokrenite unzip pri izradi zrna. Koristite zipfile o veliki kao RAM-a.
  • koristiti “memtest86” naći na: http://www.memtest86.com/.
  • učiniti dd if = / dev / hda od = / dev / null pri izradi zrna.
  • pokrenuti md5sum na velikim stablima.

Imajte na umu da bez obzira na brz način možete naći da ti kažem da je računar slomljena, to neće garantirati računalo je u redu ako je takav test odjednom više ne propadne. Uvijek sam preporučujem da nakon izmenite sa stvarima da to rade, trebalo bi pokrenuti test kernel-sastavi 24 sata.

PITANJE

Zašto nije “memtest86” prvi koji će pokušati ako sumnjam probleme sa pamćenjem?

ODGOVOR

Slobodno to učini. Neke od ovih je crne magije. Međutim, kada je “memtest86” vam govori da je vaš RAM-a je u redu, možete biti u iskušenju da verujem u to. To vam kažem da ne može naći nikakve probleme. To ne govorim da je vaš RAM-a je bez mane.
U mom iskustvu, problemi u vezi RAM-a ponekad nije pronađen pomoću memorije tester. Obrasci su sve lijepo i redovne. Neki problematično RAM jednostavno radi dobro pod takav stres, ali ne pod više nestalan obrasce stres izazvan “gcc” ili “zip”.

Zato i dalje preporučujemo da probate provjeru sistem pomoću kernel kompilira i ne uzdajući memorijske tester ….

PITANJE

Ja ne vjerujem. Kome je ovo dogodilo?

ODGOVOR

Pa za jedan lično mi se dogodilo. Ali ne moraš mi vjerovati. Takođe se dogodilo:

(Email me sa svojom pričom, možda ćete dobiti da se ovdje spomenuo … 🙂 —- Ažuriranje: Volim da čujem šta se desilo. Ovo će mi omogućiti da pogodi šta se dešava najviše, i držati ovaj fajl što precizniji. Međutim, sada imam oko 500 različitih mail adrese ljudi koji su imali sig-11 problema. Ne mislim da je korisno zadržati na dodavanju imena “random” ljudi na ovoj listi. Šta ti misliš?

Ja sam zainteresovan za nove priče. Ako imate problem, a nisu sigurni šta je to, to može pomoći da me kontaktirate. Moja radoznalost me obično voziti za odgovor na vaše pitanje dok ne nađete u čemu je problem ….. (s druge strane, ja dobiti ljut kad je vaš problem jasno opisano 🙂

© 1996-2017 – BitWizard B.V. je registrirani zaštitni znak