Ausfallzeit

Sali Heine Dezember 24, 2016 A 8 0
FONT SIZE:
fontsize_dec
fontsize_inc

Der Begriff wird verwendet, um Stillstandszeiten zu beziehen, wenn ein System nicht verfügbar ist. Ausfallzeiten und Ausfalldauer bezeichnet eine Zeitdauer, die sich das System nicht zu erbringen oder ihre primäre Funktion. Zuverlässigkeit, Verfügbarkeit, Wiederherstellung und Nichtverfügbarkeit sind verwandte Konzepte. Die Nichtverfügbarkeit der Anteil einer Zeitspanne, dass ein System nicht verfügbar oder offline. Dies ist normalerweise ein Ergebnis der System andernfalls wegen eines ungeplanten Ereignisses, oder wegen der routinemäßigen Wartung zu funktionieren.

Der Begriff wird häufig zu Netzwerken und Servern verwendet. Die häufigsten Gründe für ungeplante Ausfälle sind Systemausfälle oder Kommunikationsausfälle.

Der Begriff wird auch häufig in industriellen Umgebungen in Bezug auf Ausfälle in industriellen Fertigungsanlagen angewendet. Einige Einrichtungen messen die Ausfallzeit während einer Arbeitsschicht entstehen, oder während einer 12 oder 24-Stunden-Zeitraum. Eine weitere gängige Praxis ist es, jedes Ereignis als Ausfallzeiten mit einem Operations, elektrischen oder mechanischen Ursprungs identifizieren.

Das Gegenteil von Ausfallzeiten ist die Betriebszeit.

Typen

Industrie-Standards für den Begriff "Ausfalldauer" oder "Wartung Duration" können verschiedene Initiationspunkt und Abschluss damit die folgende Klarstellung sollte verwendet werden, um Konflikte in der Vertragsdurchführung zu vermeiden:

  • "Schlüsselfertige" das ist die fesselnde aller Ausfallarten. Ausfall oder Wartung beginnt mit Betreiber der Anlage oder Ausrüstung Drücken der Abschaltung oder Stopp-Taste, um einen Stillstand in Betrieb zu initiieren. Wenn nicht anders angegeben, Ausfall oder Wartung gilt als abgeschlossen, wenn die Anlagen oder Ausrüstungen ist wieder im Normalbetrieb bereit, Fertigungs beginnen oder mit System oder Gitter oder bereit, Aufgaben als Pumpe oder Kompressor durchzuführen bereit synchronisiert werden.
  • "Breaker Breaker" Dieser Ausfall oder Wartung beginnt mit Betreiber der Anlage oder Ausrüstung Entfernen der Stromkreis, nicht den Regelkreis aus dem Betrieb. Dies würde immer noch erlauben, für die Ausrüstung, um abgekühlt oder auf Umgebungstemperatur, so dass Ausfall / Wartungsarbeiten zubereitet oder eingeleitet werden, gebracht werden. Je nach Gerätetypen, "Breaker Breaker" Ausfall kann vorteilhaft sein, wenn Vertrags Kontrollen bezogene Wartung dieser Art von Wartungsarbeiten sind möglich während die wichtigsten Geräte ist immer noch auf Abkühlung oder im Stand-by werden. Wenn nicht anders angegeben, ist diese Art von Ausfall als abgeschlossen, wenn der Strom Schaltung ist über Eingriff des Leistungsschalters wieder eingeschaltet.
  • "Der Abschluss der Lock out / Tag-out" Dieser Ausfall oder Wartung beginnt mit Betreiber der Anlage oder Ausrüstung Entfernen der Stromkreis, Ausrücken der Steuerschaltung und der Durchführung anderer Neutralisation der potentiellen Energie und Gefahrenquellen Dieser Punkt der Erfüllungsperiode ist typischerweise der letzte Phase des Ausfalls Einleitung des Verfahrens vor der eigentlichen Arbeit beginnt auf der Anlage, Anlagen oder Ausrüstungen. Man sollte beachten, dass Sicherheitsunterweisung sollte immer nach dem LOTO Aktivität, bevor eine Arbeit durchgeführt. Wenn nicht anders angegeben, ist diese Art von Ausfall als abgeschlossen, wenn das Gerät mechanische Fertigstellung und bereit erreicht hat, um auf langsamen-Rolle für viele Schwerdrehmaschinen, Bump-Test oder Dreh Check für Motoren, etc. platziert werden, sondern muss Rückkehr folgen oder eine Arbeitserlaubnis pro LOTO Verfahren.

Jede Online-Tests, Leistungstests und Tuning erforderlich ist sollte nicht in Richtung der Ausfalldauer zu zählen, wie diese Aktivitäten werden in der Regel nach Abschluss der Ausfall oder Wartungsereignis durchgeführt und sind außer Kontrolle der meisten Wartungsunternehmen.

Charakteristik

Ungeplante Ausfallzeiten kann das Ergebnis eines Softwarefehler, menschliches Versagen, Ausfall des Geräts, Funktionsstörungen, hohen Bitfehlerrate, Stromausfall, Überlastung durch die Kanalkapazität, eine kaskadierende Ausfall usw. mehr als sein

Telekommunikationsausfall Klassifikationen

Ausfallzeiten können durch Fehler in Hardware, Software, Verbindungsausrüstung, drahtlose Übertragung, und / oder Kapazität verursacht werden.

Die Fehler können aufgrund von Schäden, Ausfall, Konstruktion, Verfahrens, Engineering, Überlast, Umwelt, geplante Ausfallzeiten, andere oder unbekannt vorkommen.

Die Fehler können in der Verantwortung des Kunden / Dienstanbieter, vender / Lieferanten, Nutzen, Regierung, Auftragnehmer, Endkunde, öffentliche einzelnen, höhere Gewalt, andere oder unbekannt sein.

Auswirkung

Ausfälle durch Systemausfälle verursacht werden, können schwerwiegende Auswirkungen auf die Nutzer von Computer / Netzwerksysteme, insbesondere jene Branchen, die auf eine fast 24-Stunden-Service verlassen:

  • Medizinische Informatik
  • Kernkraft und andere Infrastruktur
  • Banken und anderen Finanzinstituten
  • Luftfahrt, Fluglinien
  • Berichterstattung
  • E-Commerce und Online-Transaktionsverarbeitung
  • Persistent Online-Spiele

Ebenfalls betroffen sind, können die Nutzer von einem Internetdienstanbieter und andere Kunden eines Telekommunikationsnetzes zu sein.

Unternehmen können Geschäfts wegen Netzwerkausfall verlieren, oder sie können auf Vertragsverzug, was zu finanziellen Verlusten.

Diese Personen oder Organisationen, die durch Ausfallzeiten betroffen sind, können empfindlicher auf bestimmte Aspekte sein:

  • einige sind von der Länge eines Ausfall betroffen - es ihnen wichtig ist, wie viel Zeit es braucht, um von einem Problem zu beheben
  • andere sind empfindlich gegenüber dem Zeitpunkt eines Ausfalls - Ausfälle während der Stoßzeiten beeinflussen sie die meisten

Die anspruchsvollsten Anwender sind solche, die eine hohe Verfügbarkeit erfordern.

Berühmte Ausfälle

Am Muttertag, Sonntag, 8. Mai 1988, brach ein Feuer im Hauptschaltraum des Hinsdale Zentrale der Illinois Bell-Telefongesellschaft. Einer der größten Vermittlungssysteme in dem Zustand, verarbeitet die Anlage mehr als 3,5 Millionen Anrufe pro Tag während seiner 38.000 Kunden, darunter zahlreiche Unternehmen, Krankenhäuser und Flughäfen O'Hare und Midway Chicago.

Nahezu die gesamte AT & amp; T ging Netzwerk von 4ESS Maut Tandems Schalter in und außer Dienst immer und immer wieder auf 15. Januar 1990 zu stören Fern-Service für die ganze Nation. Das Problem von selbst abgeführt, wenn der Verkehr verlangsamt. Ein Softwarefehler gefunden.

AT & amp; T verlor seine Frame-Relay-Netzwerk 26 Stunden am 13. April 1998. Dies wirkte sich viele Tausende von Kunden und Banktransaktionen waren einer Unfall. AT & amp; T versäumt, die Service-Level-Vereinbarung über ihre Verträge mit Kunden zu erfüllen und musste 6600 Kunden-Accounts zu erstatten, kostet Millionen von Dollar.

Xbox Live hatten intermittierende Ausfallzeit während der Ferienzeit 2007-2008, die 13 Tage dauerte. Die erhöhte Nachfrage von Xbox 360 Käufer wurde als Grund für die Ausfallzeiten gegeben; um Wiedergutmachung für die Service-Themen zu machen, bot Microsoft ihren Nutzern die Möglichkeit, ein freies Spiel zu erhalten.

Sonys PlayStation Network April 2011 Ausfall begann am 20. April 2011 und wurde nach und nach auf 14. Mai 2011 wieder ab in den Vereinigten Staaten. Dieser Ausfall ist die längste Zeit, die der PSN ist offline seit seiner Gründung im Jahr 2006 war Sony hat das Problem festgestellt wurde durch ein Eindringen von außen, die in der Beschlagnahme von Daten in Folge verursacht. Sony berichtete am 26. April 2011, dass eine große Menge an Benutzerdaten waren von der gleichen Hack, der in der Ausfallzeit in Folge gewonnen.

Telstra Ryde Schalter nach dem Wasser in die elektrische Schalttafel egressed aus fort nassem Wetter Ende 2011 gescheitert. Das Ryde Switch ist eines der größten flächen Schalter in Australien, und betroffen über 720.000 Dienstleistungen.

Service-Levels

Im Service Level Agreements, ist es üblich, einen Prozentwert, der durch Division der Summe aller Ausfallzeiten Zeitspannen durch die Gesamtzeit eines Referenzzeitdauer berechnet wird, zu nennen. 0% Ausfallzeiten bedeutet, dass der Server die ganze Zeit.

Für Internet-Server Ausfallzeiten von über 1% pro Jahr oder noch schlimmer als inakzeptabel angesehen werden, da dies bedeutet, eine Ausfallzeit von mehr als 3 Tage pro Jahr. Für E-Commerce und anderen industriellen Einsatz jeder Wert über 0,1% ist in der Regel als nicht akzeptabel.

Reaktion und die Verringerung der Auswirkungen

Es ist die Pflicht der Netzwerkdesigner, um sicherzustellen, dass ein Netzwerkausfall nicht geschieht. Wenn es passiert, wird eine gut durchdachte System weiterhin die Auswirkungen eines Ausfalls zu verringern, indem er lokalisiert Ausfälle, die nachgewiesen werden kann und fixiert so bald wie möglich.

Ein Prozess muss vorhanden sein, um eine Fehlfunktion zu erkennen - Netzwerküberwachung - und um das Netzwerk zu einem Arbeitszustand wieder herzustellen - dies in der Regel beinhaltet eine Helpdesk-Team, das ein Problem, eine der ausgebildeten Ingenieuren zusammensetzt beheben können; eine separate Helpdesk-Team ist, um Feld Benutzereingabe, die sein können, besonders anspruchsvoll während einer Stillstandszeiten in der Regel notwendig.

Ein Netzwerk-Management-System kann verwendet werden, um fehlerhafte oder erniedrigenden Komponenten vor der Kundenbeschwerden, mit proaktiven Störungsbeseitigung zu erkennen.

Risikomanagement-Techniken kann verwendet werden, um die Auswirkungen von Netzwerkausfällen auf eine Organisation zu bestimmen und welche Aktionen erforderlich sind, um das Risiko zu minimieren. Risiko kann durch Verwendung von zuverlässigen Komponenten, von der Durchführung von Wartungsarbeiten, wie Upgrades, indem Sie redundante Systeme oder durch einen Notfallplan oder Business Continuity-Plan, minimiert werden. Technische Hilfe können Fehler mit Fehlerkorrekturcodes, Weiterverbreitung, Checksummen oder Diversity-Schema zu reduzieren.

Eine der größten Ursachen von Ausfallzeiten ist eine Fehlkonfiguration, wo eine geplante Änderung schief geht. Typischerweise Organisationen vertrauen auf manuellen Aufwand, den Prozess der Konfigurationssicherungen zu verwalten, aber dies erfordert hoch qualifizierte Ingenieure mit der Zeit, den Prozess über eine Multi-Vendor-Netzwerk zu verwalten. Automatisierungs-Tools zur Verfügung, um Backups zu verwalten, aber es gibt sehr wenige Lösungen, die Konfigurationswiederherstellung, die benötigt wird, um die Gesamtwirkung des Ausfalls zu minimieren, zu behandeln.

Planning

Eine geplante Stilllegung ist das Ergebnis eines geplanten Aktivitäten des Anlagenbesitzers und / oder durch einen Dienstleister. Diese Ausfälle, die oft während der Wartungsfenster geplant ist, kann verwendet werden, um Aufgaben, einschließlich der folgenden durchzuführen:

  • Unterlassene Instandhaltung, zum Beispiel ein latenter Hardwarereparatur oder eine latente Neustart zu bereinigen, die verstümmelten Speicher
  • Diagnostics, um einen detektierten Fehler zu isolieren
  • Hardware-Fehler reparieren
  • Fixieren eines Fehler oder Auslassungen in einer Konfigurationsdatenbank oder Unterlassen in einer aktuellen Konfigurationsdatenbank Wechsel
  • Fixing Fehler in Anwendungsdatenbank oder einen Fehler in einer aktuellen Anwendungsdatenbank Wechsel
  • Software-Patching / Software-Updates, um einen Softwarefehler zu beheben.

Ausfällen kann auch als Ergebnis einer vorhersagbaren natürliches Ereignis, beispielsweise Sun Ausfall vorgesehen werden.

Wartungsstillstandszeiten haben, um in der Industrie, die sich auf Computersysteme beruhen sorgfältig geplant werden. Der Prozess der schrittweise Abbau Teile des Systems für die Aktualisierung, ohne dass die Gesamtfunktionalität - In vielen Fällen kann systemweite Ausfallzeiten mit, was ist ein "Rolling Upgrade" bezeichnet abgewendet werden.

Vermeidung

Für die meisten Websites ist Website-Monitoring zur Verfügung. Website-Überwachung ist ein Dienst, "Monitore" Ausfallzeiten und Benutzer auf der Website.

Andere Nutzungs

Ausfallzeiten können auch die Zeit beziehen, wenn das Humankapital oder anderen Vermögenswerten nach unten gehen. Zum Beispiel, wenn Mitarbeiter in Meetings oder nicht in der Lage, ihre Arbeit durchführen aufgrund einer anderen Einschränkung, sind sie nach unten. Dies kann ebenso teuer sein, und kann das Ergebnis von einem anderen Vermögenswert als nach unten. Dies ist auch allgemein bekannt als "Totzeit" bezeichnet wird.

Dieser Begriff wird auch in Fabriken oder industrielle Zwecke verwendet. Siehe Total Productive Maintenance.

Messausfallzeiten

Es gibt viele externe Dienstleistungen, die verwendet werden können, um die Verfügbarkeit und Ausfallzeiten sowie die Verfügbarkeit eines Dienstes oder einen Host überwachen. Ein bemerkenswertes Beispiel ist Pingdom.

  Like 0   Dislike 0
Vorherige Artikel Ruccones
Nächster Artikel Planetary Grand Tour
Bemerkungen (0)
Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha