Technische Veröffentlichungen mit Bezug zu RV

Betarisiken bei Eignungsprüfungen

Zusammenfassung:

Die Monte-Carlo-Methode wurde auf Studienpläne für Eignungsprüfungen (EA) angewendet, um deren Effektivität zu untersuchen. Die Wahrscheinlichkeiten, dass die berechneten z-Werte größer als 3 sind, während der tatsächliche Wert kleiner als 2 ist, und dass die berechneten z-Werte kleiner als 2 sind, während die tatsächlichen Werte größer als 3 sind, wurden für eine Reihe unterschiedlicher Situationen berechnet: Anzahl der Teilnehmer von 5 bis 30, unterschiedliche Verhältnisse von Wiederholbarkeit zu Reproduzierbarkeit und Anzahl der Testergebnisse pro Teilnehmer, Einführung oder Nicht-Einführung von Ausreißern mit z-Werten von 3,5 bis 10. Für jede Situation werden die Wahrscheinlichkeiten diskutiert, dass echte Ausreißer nicht erkannt werden und dass Fehlalarme ausgelöst werden. Es werden Ratschläge und Schlüssel zur Überprüfung und Verbesserung der Effektivität von realen EA-Programmen vorgeschlagen.

Zusammenfassung der Schlussfolgerungen :

  1. Das Verhältnis λ=σr/(σL×Nr) ist für die Kontrolle der Effizienz eines EP-Schemas (EP: Eignungprüfung) von größter Bedeutung, sogar noch mehr als die Anzahl der Teilnehmer. Die EP-Anbieter sollten sich dann um Nr kümmern, die Anzahl der Testergebnisse pro Teilnehmer, die sie anfordern;
  2. Selbst unter ungünstigen Bedingungen ist das α-Risiko immer sehr gering (weniger als 0,7 %);
  3. Robuste Algorithmen verbessern die Effizienz des EP-Programms (d. h. das β-Risiko) auf Kosten des α-Risikos (das immer sehr niedrig bleibt). Dies ergibt sich aus einer deutlich besseren Schätzung der Standardabweichung der Referenz, wenn ein Ausreißer unter den Teilnehmern vorhanden ist und wenn diese robusten Algorithmen verwendet werden;
  4. Eine Anzahl von 6 Teilnehmern ist groß genug, um einen stark abweichenden Teilnehmer zu erkennen, vorausgesetzt, dass gute EP-Bedingungen (d. h. ein niedriger Wert von λ) gegeben sind;
  5. EP mit einer geringen Anzahl von Teilnehmern ist (fast) immer besser als gar keine EP.

Die Referenznormen ISO 5725-2 und ISO 13528 empfehlen, keinen Ringversuch mit weniger als 12 Teilnehmern zu organisieren. Dies ist sinnvoll für ISO 5725-2, deren Ziel es ist, die Leistungsfähigkeit eines Prüfverfahrens zu bestimmen. Für die ISO 13528, deren Ziel es ist, die Leistungsfähigkeit eines Labors zu überprüfen, ist es weniger sinnvoll. Es ist offensichtlich, dass das β-Risiko 100% beträgt, wenn keine EP organisiert wird: ein Labor, das ein Problem hat, kann es überhaupt nicht erkennen! Folglich ist es für Prüfverfahren, die von einer kleinen Anzahl von Labors durchgeführt werden, offensichtlich besser, eine EP mit 6 Teilnehmern zu organisieren als gar keine. In diesen Fällen sollte der EP-Anbieter besonders auf die Anzahl der Testergebnisse pro Teilnehmer achten, die er anfordert, um einen angemessenen λ-Wert zu gewährleisten und folglich eine möglichst gute Effizienz sicherzustellen.

Vollständigen Text auf Englisch ansehen: Beta risks in proficiency testing

Vollständigen Text auf Französisch ansehen: Risques béta lors d'essais d'aptitude

Geeignete Rankits für Normalwahrscheinlichkeitsdiagramme und Standardabweichungswahrscheinlichkeitsdiagramme

Normalwahrscheinlichkeitsdiagramme werden in der Regel verwendet, um zu prüfen, ob eine Verteilung als gaußförmig angesehen werden kann, um zu veranschaulichen, ob einige Zahlen wahrscheinlich Ausreißer sind, und um mit Hilfe einer linearen Regression ihren Mittelwert und ihre Standardabweichung zu schätzen. In gleicher Weise können "SD-Wahrscheinlichkeitsdiagramme", die auf der Verteilung der Standardabweichungsschätzungen basieren, sehr nützlich sein, um ähnliche Ziele zu erreichen: prüfen, ob eine Homoskedastizitätshypothese akzeptiert werden kann oder nicht, Schätzungen visualisieren, die wahrscheinlich Ausreißer sind, und die wahre zugrunde liegende Standardabweichung schätzen. In der Praxis ist eine Änderung der Variablen erforderlich, um den Rang jedes Wertes in eine entsprechende kumulierte Wahrscheinlichkeit und eine inverse Gauß-Transformation umzuwandeln, um einen "Rangit" zu erhalten, der als Ordinate für diese Diagramme verwendet werden kann. Gleichungen in der Form (i-a)/(N+1-2a) mit 0 ≤ a ≤ 1 werden in der Regel zur Bestimmung der geeigneten kumulierten Wahrscheinlichkeiten verwendet. Tatsächlich hat die Wahl des "a"-Wertes, zumindest für kleine Werte von N, einen großen Einfluss auf die später gezogenen Schlussfolgerungen. Dieses Dokument:

  • Erörtert die Gründe für diese Gleichungen;
  • Bewertet ihre Angemessenheit für eine Reihe von Situationen und Arten von Verteilungsgesetzen;
  • schlägt Gleichungen zur Bestimmung von "a"-Werten als Funktion von N vor, die bessere Rangordnungen als die üblicherweise verwendeten liefern und es ermöglichen, Mittelwerte und/oder Standardabweichungen ohne Verzerrungen für eine Reihe von Situationen zu schätzen;
  • schlägt eine genaue Methode zur Bestimmung der Hüllkurven des Vertrauens für Normalwahrscheinlichkeitsdiagramme und Wahrscheinlichkeitsdiagramme einer beliebigen Verteilung vor, deren kumulative Funktion bekannt ist.

Vollständigen Text auf Englisch ansehen: Appropriate rankits for normal probability plots

Vollständigen Text auf Französisch ansehen: Rankits appropriés pour diagrammes de probabilités cumulées