Prof. Dr. Helmut Rüßmann

Allgemeine Beweislehre und Denkgesetze*

* Erstveröffentlichung in Recht und Politik 1982, 62 bis 69
Die Ausführungen stimmen in Auszügen mit der Kommentierung des Beweisrechts überein, die der Verfasser für die Reihe Alternativkommentare (hier AK-ZPO) des Luchterhand Verlages verfaßt hat.

I. Zum Stand des Beweisrechts

Um einen vor Gericht getragenen Konflikt zu entscheiden, genügt es nicht, daß der Richter das Recht kennt und es auf jede ihm unterbreitete Sachverhaltsdarstellung anzuwenden weiß. Er muß auch darüber befinden, welche Sachverhaltsdarstellung er seinem Urteil zugrunde legen darf. Unter logischen Gesichtspunkten nimmt im Rahmen der Gesamtentscheidung die Entscheidung über den Sachverhalt, die Tatfrage, denselben Rang ein wie die Entscheidung über die heranzuziehenden Normen und ihre Interpretation, die Rechtsfrage [1]. In einer formal korrekt begründeten Entscheidung [2] folgt das im Tenor festgehaltene Urteil logisch aus in der Regel drei Prämissenklassen. Die erste wird aus generellen Normen des Gesetzes-, Gewohnheits- und/oder Richterrechts gebildet, die danach auszuwählen sind, daß die Rechtsfolgeanordnung eine Antwort auf das Entscheidungsbegehren ermöglicht. Die zweite besteht aus der Beschreibung des singulären tatsächlichen Geschehens, von dem der Richter bei seiner Entscheidung ausgeht, und die dritte aus Sprach- oder Bedeutungsregeln, welche die “logische Kluft” zwischen Normformulierung und Sachverhaltsbeschreibung überbrücken müssen, die immer dann entsteht, wenn zur Sachverhaltsbeschreibung andere als die in der Formulierung der Normen enthaltenen Begriffe verwendet werden.

Eine formal korrekt begründete Entscheidung kann das Ziel der inhaltlich richtigen Entscheidung durch Fehler in jeder der drei Prämissenklassen gleichermaßen verfehlen. Es mag sein, daß eine gültige Norm übersehen, eine ungültige Norm herangezogen wird. Dem Richter können auch Fehlinterpretationen gültiger Normen unterlaufen. Und schließlich ist es möglich, daß er zwar die Klippen der Rechtsfrage umschifft, d.h. die einschlägigen gültigen Normen vollständig heranzieht und die in ihnen enthaltenen Begriffe nach den Regeln der Kunst auf die Sachverhaltsbeschreibung hin entfaltet, aber dennoch falsch entscheidet, weil die von ihm zugrunde gelegte Sachverhaltsdarstellung nicht korrekt ist. Kernbereich der Regeln korrekter Sachverhaltsrekonstruktionen ist das Beweisrecht. Ihm kommt in der praktischen Entscheidungstätigkeit jedenfalls der erstinstanzlichen Gerichte häufig eine überragende Bedeutung zu. Diese Bedeutung schlägt sich aber weder in der Ausbildung des juristischen Nachwuchses noch in der wissenschaftlichen Durchdringung des Problemfeldes nieder. Es fehlt nicht nur an der intensiven Kontaktpflege zu solchen Realwissenschaften, die sachlich/inhaltlich etwas zur Beantwortung der Tatfrage beisteuern können, wie etwa die Aussagepsychologie zur Beurteilung des Realitätsgehalts von Zeugenaussagen oder die Biologie zur Frage einer umstrittenen Abstammung. Es müßte auch und vornehmlich eine metatheoretisch/formale Analyse der Sachverhaltsrekonstruktion geleistet werden, welche vom Stande der modernen Wissenschaftstheorie aus Möglichkeiten und Strukturen der Bestätigung von Sachverhaltsannahmen aufschlüsselt und so den Juristen in die Lage versetzt, im interdisziplinären Gespräch die Zusammenhänge zu klären, die ihm bei der Beantwortung der aus den verschiedensten Bereichen stammenden Sachverhaltsfragen helfen können.

Ziel der folgenden Ausführungen ist es, die Grundzüge einer allgemeinen Beweislehre zu umreißen. Das Hauptaugenmerk soll dabei den Regeln gelten, nach denen, von Indizien ausgehend, auf nicht beobachtete und/oder nicht beobachtbare, rechtlich relevante Sachverhaltsannahmen geschlossen werden kann. Die Rekonstruktion dieser Regeln erlaubt zugleich eine Präzisierung dessen, was man als Denkgesetze bezeichnet. Es sind die in Logik und Mathematik entwickelten formalen Transformationsregeln, welche in allen Welten und damit unabhängig vom jeweiligen Erfahrungsbereich gültig sind: 2 + 2 = 4, mag man nun Äpfel, Birnen, Juristen oder Akten zusammenzählen. Hat die Marktfrau in eine leere Tüte zunächst zwei und dann noch einmal zwei Äpfel getan, so gebieten die Denkgesetze, anzunehmen, daß sich in der Tüte vier Äpfel befinden. Derselbe formale Zusammenhang trägt, wenn der Wachtmeister auf einen leeren Aktenbock zunächst zwei und dann noch einmal zwei Akten legt. Eine ganz andere Frage ist es allerdings, ob die Marktfrau wirklich zweimal zwei Äpfel in die Tüte und der Wachtmeister tatsächlich zweimal zwei Aktenstücke auf den Bock gelegt hat. Darüber können nicht formale Regeln, nicht Denkgesetze Auskunft geben, sondern nur gültige Erfahrungen. Angesichts der Trivialität des formalen Zusammenhangs 2 + 2 = 4 ist man leicht geneigt, seine Aufmerksamkeit allein der problematischen Gültigkeit der in Erfahrungssätzen behaupteten Einzelerfahrungen und Erfahrungszusammenhänge zuzugeben. Der Neigung nachzugeben ist indessen fatal, weil gerade sie es ist, die die Entwicklung einer allgemeinen Beweislehre verhindert, welche auch komplizierte formale Zusammenhänge in Rechnung stellen muß, um die (nie zur Gänze auszuschließenden) gefühlsmäßigen Einschätzungen “des gesamten Inhalts der Verhandlungen und des Ergebnisses einer etwaigen Beweisaufnahme” (§ 286 Abs. 1 Satz 1 ZPO) durch die Denkgesetze zu kontrollieren und zu verhindern, daß das Ergebnis einer gefühlsmäßigen Einschätzung die Denkgesetze verletzt.

II. Rekonstruktion der Bestätigungsmöglichkeiten von Sachverhaltsbehauptungen

1. Eigenwahrnehmung

Die einfachste Möglichkeit, sich von der Wahrheit einer Behauptung zu überzeugen, ist die Eigenwahrnehmung des Behaupteten. Sie setzt, wie jeder Versuch, eine Behauptung zu bestätigen, die vorgängige Klärung der Sinnfrage voraus: Was soll eigentlich mit einer Behauptung gesagt sein? Die Lösung dieses Sprachproblems, das der Praktiker beim Studium mancher Schriftsätze spürt, muß in der Praxis keine unüberwindbaren Schwierigkeiten aufwerfen, da man Verständigungsfragen mit einer immer konkreter und anschaulicher werdenden Sprache angehen kann bis hin zu einem Grundvokabular, dessen Bedeutung durch hinweisende Beispiele erläutert wird [3]. Aber auch wenn man sich des Sinnes einer Behauptung wegen der gemeinsamen Sprachpraxis für sicher hält, können der Eigenwahrnehmung des Behaupteten noch vielfältige Grenzen gesetzt sein. Die sprachlich einfachste Form einer Behauptung ist die, daß einem Gegenstand eine Eigenschaft oder mehreren Gegenständen eine Relation zugeschrieben wird. Es kann nun sein, daß in dem Zeitpunkt, in dem die Wahrheit einer solchen Behauptung überprüft werden soll, entweder der Gegenstand selbst oder aber die ihm zugeschriebene Eigenschaft nicht mehr existiert. Aber auch bei existenten Gegenständen und existenten Eigenschaften kann die Wahrnehmung daran scheitern, daß die Eigenschaften nicht (jedenfalls nicht direkt) beobachtbar sind. Das gilt zum Beispiel für alle physischen und psychischen Dispositionen wie die Zerbrechlichkeit eines Gegenstandes oder die Einstellungen und Fähigkeiten eines Kandidaten [4]. Ein praktisch überaus bedeutsames Beispiel für eine nicht direkt beobachtbare Relation bildet die Kausalbeziehung zwischen zwei Ereignissen. Schließlich muß der zur Wahrnehmung einer an sich wahrnehmbaren Eigenschaft Aufgerufene den ihm zu Gebote stehenden Wahrnehmungsapparat auf Verläßlichkeit überprüfen. Nicht jeder kann Entfernungen schätzen, Farbdiskriminierungen vornehmen oder Geräusche unterscheiden. Auch gilt es zu bedenken, daß schon die Wahl eines Wahrnehmungsstandorts zu systematischen Wahrnehmungsverzerrungen führen kann. Doch soll von alledem an dieser Stelle nicht weiter gehandelt werden.

2. Fremdwahrnehmung

Wenn die Eigenwahrnehmung des in einer rechtlich relevanten Behauptung Behaupteten nicht möglich ist, kommt, soweit es überhaupt um die Behauptung beobachtbarer Vorgänge geht, die Fremdwahrnehmung des Behaupteten in Betracht. Über die Fremdwahrnehmung erhält das Gericht einen Bericht, dessen Verläßlichkeit durch zahlreiche Unsicherheitsfaktoren beeinträchtigt sein kann, um deren systematische Erfassung insbesondere die Aussage- und Vernehmungspsychologie bemüht sind. Auch diesem Fragenkreis kann hier nicht der ihm gebührende Raum gegeben werden [5].

3. Erschließung

Wenn die Behauptung über ein rechtlich relevantes Sachverhaltsmerkmal weder aufgrund einer Eigenwahrnehmung noch aufgrund eines vertrauenswürdigen Berichts über die Fremdwahrnehmung des betreffenden Merkmals für wahr erachtet werden kann, bleibt dem Gericht nur eine Möglichkeit, ein die Beweislastfrage aufrufendes non-liquet zu vermeiden: das Sachverhaltsmerkmal zu erschließen. Da die fragliche Sachverhaltsbehauptung regelmäßig ein singuläres, raum-zeitlich begrenztes Ereignis beschreibt, das nach Voraussetzung in der gegebenen Entscheidungslage weder wahrgenommen worden ist noch wahrgenommen werden kann, sind folgende Prämissen für das Erschließen erforderlich [6]: 1. Sätze über andere singuläre Ereignisse, die man wegen eigener oder fremder Wahrnehmung oder auch wegen Offenkundigkeit als wahr annimmt (im folgenden Indizien genannt); 2. Sätze über generelle (im Idealfall raum-zeitlich unbegrenzt gültige) Zusammenhänge von Merkmalen (im folgenden Erfahrungssätze genannt). Ob Indizien und Erfahrungssätze einen Schluß und wenn ja, welchen Schluß sie auf das fragliche Sachverhaltsmerkmal zulassen, ist eine Frage der das Arbeiten mit Erfahrungssätzen regelnden Denkgesetze. Mit ihnen sind die formalen Operationen angesprochen, die nicht nur die Umformungs- und Schlußregeln der deduktiven Logik, sondern auch die Regeln des wahrscheinlichkeitsmathematischen und statistischen Räsonierens umfassen.

Von den Regeln für das Arbeiten mit sind die Probleme des Erarbeitens von gültigen Erfahrungssätzen (im Jargon der Wissenschaftstheorie empirischen Gesetzen und Theorien) zu unterscheiden. Da generelle Erfahrungssätze über die gemachten Erfahrungen hinaus Geltung beanspruchen, kann ihre Geltung immer nur hypothetisch sein, unabhängig davon, ob in den Erfahrungssätzen selbst ein ausnahmsloser (deterministischer) oder ein nur statistischer Zusammenhang zwischen zwei Merkmalen oder Merkmalsklassen behauptet wird. Die hypothetische Geltung bedeutet, daß man nie sicher sein kann, nicht durch neue Erfahrungen eines Besseren belehrt zu werden [7].

a) Deterministische Erfahrungssätze

Die Unterscheidung zwischen deterministischen und statistischen (probabilistischen) Erfahrungssätzen spielt für die Verwendung dieser Sätze eine bedeutende Rolle. Die die Verwendung deterministischer Erfahrungssätze regelnden Denkgesetze sind die Regeln der deduktiven Logik [8]. Ihre wichtigste Eigenschaft ist es, daß sie die Wahrheit der Prämissen zweifelsfrei auf den regelgerecht gefolgerten Satz übertragen. Der Verwender braucht lediglich darauf zu achten, welche Art der deterministischen Verknüpfung zwischen einem Indiz (I) und dem gesuchten Sachverhaltsmerkmal (G) in den - als gültig unterstellten - Erfahrungssätzen behauptet wird, um mit mathematisch-logischer Gewißheit zu entscheiden, ob und welche Stellungnahme ihm das derzeitige empirische Wissen zum fraglichen Sachverhaltsmerkmal erlaubt. Die Grundverknüpfungen sind Wenn-dann-Verknüpfungen, welche entweder umkehrbar sowohl “wenn I, dann G”, als auch “wenn G, dann I” (1) behaupten oder aber nicht umkehrbar “wenn I, dann G” (2) bzw. “wenn G, dann I” (3) behaupten. Im Falle (1) kann man das Indiz eine sowohl hinreichende als auch notwendige Bedingung für das gesuchte Merkmal, im Falle (2) eine hinreichende und im Falle (3) eine notwendige Bedingung nennen. (2) erlaubt den Schluß von I auf G (modus ponens), (3) von Nicht-I auf Nicht-G (modus tollens) und (1) trägt beide Schlußmöglichkeiten in sich. Selbstverständlich gibt es im deterministischen Bereich Kettenschlußmöglichkeiten von I auf G - bei Erfahrungssätzen “wenn I, dann H” und “wenn H, dann G” - und Mehrfachschlüsse auf G - bei den Indizien I₁ und I₂ und den Erfahrungssätzen “wenn I₁, dann G” und “wenn I₂, dann G”. Das alles ist unproblematisch und verlangt allein die Beherrschung einiger Grundregeln der deduktiven Logik.

b) Statistische Erfahrungssätze

Für die Arbeit mit statistischen Erfahrungssätzen steht ein ähnlich einfach zu handhabendes Verwendungsregelsystem nicht zur Verfügung. Statistische Wenn-dann-Verknüpfungen zwischen I und G können lauten “wenn I, dann G mit der Wahrscheinlichkeit r” (1) oder “wenn G, dann I mit der Wahrscheinlichkeit r” (2) [9]. r kann man sich intuitiv als Angabe der relativen Häufigkeit vorstellen, mit der bei (1) G in der Bezugsklasse I und bei (2) I in der Bezugsklasse G vorkommen, und die Wahrscheinlichkeit läßt sich als die Chance deuten, bei einer Zufallswahl aus der Bezugsklasse auf das betreffende Merkmal zu stoßen [10].

Von I als hinreichender oder notwendiger Bedingung für G läßt sich bei statistischen Zusammenhängen nicht sprechen, da (1) es durchaus zuläßt, daß I ohne G, und (2) es zuläßt, daß G ohne I auftritt, mag der Wert für r auch sehr nahe bei 1 liegen. Die Wahrscheinlichkeit 1 gilt für das sichere Ereignis, die Wahrscheinlichkeit 0 für das unmögliche Ereignis [11]. Alle anderen Ereignisse haben eine Wahrscheinlichkeit zwischen 0 und 1 mit einem notwendigen Patt zwischen dem Ereignis und seinem Gegenteil, dem Komplementereignis [12], bei 0,5. Die Wahrscheinlichkeit des Ereignisses und die Wahrscheinlichkeit des Komplementereignisses addieren sich immer zu 1 (mathematischer Wahrscheinlichkeitsbegriff) [13]. In der Prozentsprechweise multipliziert man diese Werte mit 100. Die Frage ist, welche Schlüsse auf ein gesuchtes Ereignis G die statistischen Erfahrungssätze (1) und (2) bei gegebenem I erlauben. Dieser Frage haben Juristen bislang nur wenig Aufmerksamkeit geschenkt. In der Wissenschaftstheorie wird sie dagegen ausgiebig und kontrovers auch dort diskutiert, wo die Schlußmöglichkeit entsprechend dem modus ponens der deduktiven Logik auf der Hand zu liegen scheint: bei einem statistischen Erfahrungssatz der Art (1) mit einem r größer als 0,9 [14]. Die überkommene Definition der Wahrscheinlichkeit als relative Häufigkeit auf lange Sicht (Grenzwert der relativen Häufigkeit) läßt es manchem Wahrscheinlichkeitstheoretiker problematisch erscheinen, einem Einzelereignis einen Wahrscheinlichkeitswert zuzusprechen [15]. Die Information, daß ein Ereignis der Art G bei gegebenem I auf lange Sicht in 90% der Fälle eintritt, sagt ihm zufolge nichts darüber, ob es im konkreten vom Gericht untersuchten Fall auch eingetreten ist. Das ist in der Tat richtig, begründet aber keinen Einwand gegen einen Schluß auf die Wahrscheinlichkeit von G, der dem Gericht in einer praktischen Entscheidungssituation einen Anhalt dafür geben soll, ob es vernünftig ist, eher von G als von Nicht-G auszugehen, wenn die zur Verfügung stehenden Informationen völlige Sicherheit über G nicht vermitteln [16]. Welcher Unsicherheitsgrad für die praktische Entscheidung tolerabel ist, ist eine Frage des erforderlichen Beweismaßes. Je höher man das Beweismaß schraubt, desto mehr Entscheidungen zuungunsten der beweisbelasteten Partei muß man in Kauf nehmen bis zu der Extremposition, nur noch nach Beweislastgrundsätzen entscheiden zu können [17].

Selbst wenn man den Wahrscheinlichkeitsschluß auf das Einzelereignis G nicht prinzipiell verwerfen will, muß man sich die Folgeschwierigkeiten vergegenwärtigen, die dann entstehen, wenn man es mit Kettenverknüpfungen von I über H zu G oder mit Mehrfachschlüssen von I₁ zu G und I₂ zu G zu tun hat. Für diese in der Praxis außerordentlich häufigen komplexen Informationslagen gibt es kein mathematisches Modell, das für alle Fälle eine verläßliche Berechnung der Gesamtwahrscheinlichkeit für das gesuchte Merkmal aus den in den einzelnen Informationsstufen geltenden Wahrscheinlichkeitswerten ermöglichte. Versuche, die von Schreiber in Deutschland, Ekelöf und seinen Schülern in Schweden in dieser Richtung unternommen worden sind, halten - ganz abgesehen davon, daß in der schwedischen Diskussion unnötigerweise ein vom mathematischen Wahrscheinlichkeitsmaß (Intervall von 0 bis 1) abweichender Beweiswert (Intervall von minus 1 bis plus 1) bevorzugt wird - einer kritischen Überprüfung nicht stand [18]. Schlimmer noch: eine statistische Information kann eine andere völlig entwerten, ohne daß man an der Wahrheit beider Informationen zweifeln müßte. Dieses Problem wird in der wissenschaftstheoretischen Literatur als Mehrdeutigkeit statistischer Systematisierungen behandelt [19]. In einem schon klassischen Beispiel fragt man nach der Religionszugehörigkeit einer bestimmten Person, von der man nichts anderes weiß, als daß sie aus Schweden stammt und zu den Lourdespilgern zählt. Schweden sind zu 90% protestantisch, Lourdespilger zu 90% katholisch. Das in seiner Wahrheit nicht angezweifelte objektive Erfahrungswissen zeichnet zwei Annahmen mit hoher subjektiver Wahrscheinlichkeit aus, die sich gegenseitig widersprechen. Hier hilft nicht die Mathematik; hier helfen nur Informationen über die Religionszugehörigkeit der schwedischen Lourdespilger. Wenn die nicht zur Verfügung stehen [20], muß man sich einer Entscheidung über die Religionszugehörigkeit der fraglichen Person enthalten. Das gilt leider nicht nur bei sich paralysierenden Argumenten. Auch wenn jedes Indiz mit dem ihm entsprechenden Erfahrungssatz für sich eine hohe Wahrscheinlichkeit für das gesuchte Merkmal gibt, kann es durchaus sein, daß beide Indizien zusammen das Auftreten des gesuchten Merkmals sehr unwahrscheinlich machen oder gar ausschließen [21]. Für die Erschließungsmöglichkeiten von Sachverhaltsmerkmalen aufgrund von Indizien und statistischen Erfahrungssätzen bedeutet das: Statistische Syllogismen in Anlehnung an den modus ponens der deduktiven Logik sind grundsätzlich nur dann vertretbar, wenn statistische Erfahrungssätze zur Verfügung stehen, deren Wenn-Komponente das gesamte für das Merkmal relevante Indizienmaterial eines Falles erfaßt. Da jedes zusätzliche Indiz die Bezugsklasse des statistischen Erfahrungssatzes, das zu untersuchende Kollektiv, kleiner macht, hat man häufig bezweifelt, daß für eine nennenswerte Zahl von Fällen hinreichend geprüfte und bewährte Erfahrungssätze (Geltungsproblem!) zur Verfügung stehen [22].

c) Likelihoodbetrachtungen

Der bislang allein ins Auge gefaßte statistische Syllogismus ist nicht die einzige Möglichkeit, mit Indizien und statistischen Erfahrungssätzen Überlegungen zu einem fraglichen Sachverhaltsmerkmal anzustellen. Eine andere liegt in der sog. Likelihoodbetrachtung [23]. Sie ist den juristischen Theoretikern weitgehend verborgen geblieben [24], obwohl sie in der Praxis etwa bei der Auswertung biostatistischen Materials zur Feststellung einer behaupteten Vaterschaft - die Richtlinien des Bundesgesundheitsamts für die Erstattung von Blutgruppengutachten sprechen ausdrücklich vom “Likelihood-Quotienten” - aber auch bei allgemeinen Beratungen über die Grundlagen der Überzeugungsbildung eine wichtige Rolle spielen, ohne als Likelihoodbetrachtung erkannt und benannt zu werden [25]. Eine Likelihoodbetrachtung ist dadurch charakterisiert, daß sie die Wahrscheinlichkeitswelt von den Füßen auf den Kopf zu stellen scheint. Während man normalerweise danach fragt, wie wahrscheinlich ein unbekanntes Ereignis aufgrund bekannter Indizien ist und eine Antwort mit Hilfe des statistischen Syllogismus sucht [26], fragt man bei der Likelihoodbetrachtung nach der Wahrscheinlichkeit der bekannten Ereignisse unter der Annahme des unbekannten Ereignisses [27].

Der dabei erhaltene Wert ist die Likelihood des unbekannten Ereignisses. Seiner Ermittlung liegt bei dem unbekannten Ereignis G und dem bekannten Ereignis I ein statistischer Erfahrungssatz der Art (2) zugrunde mit dem unbekannten Ereignis als Wenn-Komponente und dem bekannten Ereignis als Dann-Komponente. Die Likelihood des unbekannten Ereignisses ist keine Wahrscheinlichkeit im mathematischen Sinne; d.h. sie genügt nicht den Axiomen der mathematischen Wahrscheinlichkeitstheorie. Ihr absoluter Wert, sei er nahe bei 1 oder nahe bei O, ist für die Wahrscheinlichkeit des unbekannten Ereignisses unerheblich. Likelihoodbetrachtungen sind allein als Vergleich mehrerer Likelihoods von praktischer und theoretischer Relevanz. Es kommt auf das Likelihood-Verhältnis [28] miteinander rivalisierender Hypothesen über das unbekannte Ereignis an. Bei einem unbekannten Sachverhaltsmerkmal G fragt man also nach der Wahrscheinlichkeit der feststehenden Indizien unter der Annahme G einerseits und der Annahme Nicht-G andererseits und entscheidet sich u.U. für die Hypothese, die mit den schon feststehenden Ergebnissen der Sachverhaltsrekonstruktion besser vereinbar ist, weil die feststehenden Ergebnisse unter dieser Hypothese wahrscheinlicher als unter der konkurrierenden Hypothese sind. Auch hier stellt sich natürlich die Frage, wie groß das Übergewicht für eine der rivalisierenden Annahmen sein muß, um der endgültigen Entscheidung zugrunde gelegt zu werden. Das ist eine Frage des Beweismaßes.

Die Angabe einer präzisen Endwahrscheinlichkeit aufgrund einer Likelihoodbetrachtung ist jedenfalls nur unter ganz besonderen Voraussetzungen möglich. Man muß nicht nur die Wahrscheinlichkeit eines festgestellten Befundes unter der Annahme des gesuchten Merkmals (x) [29] sowie unter der Annahme der Negation des gesuchten Merkmals (y) [30] kennen. Man muß auch die Ursprungswahrscheinlichkeit für das gesuchte Merkmal (u) [31] vor Kenntnis des Befundes angeben können. Dann läßt sich mithilfe des Bayestheorems [32] die Endwahrscheinlichkeit (w) nach der Formel

berechnen [33].

Die durch Umformung des Bayes-Theorems gewonnene Formel macht einen wichtigen mathematischen Zusammenhang deutlich, den man bei Likelihood-Betrachtungen immer im Auge behalten sollte. Um eine jedenfalls 0,5 (oder 50%) übersteigende Endwahrscheinlichkeit zu erhalten, muß kleiner als 1 sein. Das ist nur dann der Fall, wenn kleiner als der Kehrwert von ist. Mit anderen Worten: Die in u zum Ausdruck kommende Chance für das gesuchte Merkmal muß größer sein als die durch ausgedrückte Chance. In einem Satz: Wenn die Likelihood für G die für Nicht-G übersteigt, darf man von einer aufgrund der getroffenen Feststellungen I veränderten Wahrscheinlichkeit w für G, die über 0,5 (0%) liegt, nur dann ausgehen, wenn die ohne die getroffenen Feststellungen bestehende Ursprungswahrscheinlichkeit (u) für G größer ist als . Das ist bei großen Differenzen zwischen y und x regelmäßig der Fall.

III. Likelihood-Erwägungen als Grundmodell einer allgemeinen Lehre vom Indizienbeweis

1. Theoretische Grundlegung

Dem Leser, der sich bis jetzt nicht schon dadurch hat abschrecken lassen, daß das Kennenlernen von Denkgesetzen ein längeres Verweilen bei einem Absatz erfordert, als dies normalerweise bei der Lektüre einer juristischen Abhandlung der Fall ist, sei schließlich entdeckt, daß allein die auf dem Bayes-Theorem aufbauenden Likelihood-Betrachtungen eine tragfähige Grundlage für die allgemeine Lehre vom Indizienbeweis hergeben. Denn sie ermöglichen - unter noch anzugebenden Voraussetzungen - eine korrekte Einschätzung der Wahrscheinlichkeit eines gesuchten Merkmals auch dort, wo mehrere Indizien festgestellt sind, die je für sich mit dem gesuchten Merkmal in keinem ausnahmslosen, sondern nur in einem statistischen Zusammenhang stehen. Bender/Röder/Nack [34] haben für diese Situation das anschauliche Bild des Beweisrings geprägt, in dem sich die vielfältigen Indizien wie ein Ring um das gesuchte Merkmal legen. Mit der Aufgabe, die Stärke eine solchen Beweisrings aufgrund der statistischen Verknüpfungen der verschiedenen Indizien im Beweisring zum gesuchten Merkmal einzuschätzen, ist unser Gefühl regelmäßig überfordert. Hier verspricht nun das Bayes-Theorem Hilfe, weil es uns bei Unabhängigkeit der Indizien untereinander erlaubt, unsere Einzelkenntnisse über die Zusammenhänge der Indizien mit dem gesuchten Merkmal Schritt für Schritt auf die Gesamtstärke des Beweisrings hin auszuwerten.

Wir fragen, wie sich die Wahrscheinlichkeit für das gesuchte Merkmal (G) ändert, wenn wir die Information über ein zusätzliches Indiz (I) erhalten [35]. Die Antwort gibt das Bayes-Theorem [36], wenn wir kennen oder doch wenigstens einzuschätzen vermögen:

die Wahrscheinlichkeit von G ohne I (u) = p(G);
die Wahrscheinlichkeit von I unter G (x) = p(I|G);
die Wahrscheinlichkeit von I unter Nicht-G (y) = .

Bender/Röder/Nack [37] nennen den Quotienten die abstrakte Beweiskraft von I. Das ist in der Tat eine ebenso einprägsame wie treffende Vokabel, weil die Wahrscheinlichkeit für G unter I um so stärker wächst, je größer die abstrakte Beweiskraft (bei Werten über 1) ist, und um so stärker abnimmt, je kleiner die abstrakte Beweiskraft (bei Werten unter 1) ist. In die Formel des Bayes-Theorems geht allerdings nicht die abstrakte Beweiskraft, sondern der Kehrwert der abstrakten Beweiskraft ein.

Haben wir auf diese Weise eine neue Wahrscheinlichkeitseinschätzung für das gesuchte Merkmal errechnet, so dürfen wir, sofern die Indizien voneinander unabhängig sind, mit dem neuen Wert als Ausgangspunkt auf die nämliche Weise Informationen über weitere Indizien verwerten, bis schließlich alle Indizien eines Beweisringes in die Kalkulation einbezogen sind [38]. Seinen mathematisch gleichwertigen Ausdruck findet das Verfahren der Mehrfachanwendung (oder des wiederholten “Draufsetzens”) des Bayestheoems in der Formel

Das Verfahren führt, wie schon mehrfach betont, nur dann zu korrekten Ergebnissen, wenn die Indizien voneinander unabhängig sind, und zwar sowohl unter G als auch unter Nicht-G. Unabhängig sind die Indizien, wenn die Wahrscheinlichkeit ihres gemeinsamen Auftretens unter G gleich dem Produkt der Auftretenswahrscheinlichkeiten jedes einzelnen Indizes unter G ist und wenn die Wahrscheinlichkeit ihres gemeinsamen Auftretens unter Nicht-G gleich dem Produkt der Auftretenswahrscheinlichkeiten jedes einzelnen Indizes unter Nicht-G ist [39]. Ob tatsächlich Unabhängigkeit der Indizien im explizierten Sinne vorliegt, ist eine empirische und damit nicht mit formalen Denkregeln zu beantwortende Frage.

Auch die völlige oder teilweise Abhängigkeit der Indizien in einem Beweisring nötigt nicht dazu, gänzlich auf die rationale Kontrolle unserer Einschätzungen mit Hilfe von Likelihood-Erwägungen zu verzichten. Man muß vielmehr die abhängigen Indizien in Gruppen zusammenfassen [40] und für die jeweilige Gruppe fragen: Wie häufig trifft man sie unter G und wie häufig unter Nicht-G an? Sind hier plausible Einschätzungen möglich, ist zugleich der Grund für die beschriebenen Likelihood-Erwägungen gelegt.

2. Ein praktisches Beispiel

Zum Abschluß ein Beispiel im Anschluß an Bender/Röder/Nack [41]. An ihm mag nun der Leser selbst prüfen, ob es sinnvoll ist, gefühlsmäßige Einschätzungen über die Wahrscheinlichkeit eines Ereignisses mit Hilfe des Theorems von Bayes zu überprüfen.

Ein junger Polizist hat über die Wirksamkeit eines Röhrchentests zur Identifizierung von Alkoholisierten folgendes gelernt:

die Wahrscheinlichkeit der Verfärbung eines Röhrchens unter Alkoholisierten beträgt 0,95 [42] (x);
die Wahrscheinlichkeit der Verfärbung eines Röhrchens unter Nichtalkoholisierten beiträgt 0,01 [43] (y);

Die Dienstanweisung des Polizisten lautet:

Wenn mehr als 50% Wahrscheinlichkeit dafür spricht, daß jemand unter Alkohol gefahren ist, ist eine Blutentnahme zu veranlassen.

Bei einer allgemeinen, nicht auf Alkoholfahrer zielenden Verkehrskontrolle läßt der Polizist einen Autofahrer ohne besonderen Anhaltspunkt blasen. Das Röhrchen verfärbt sich. Ist der Polizist aufgrund der Dienstanweisung gehalten, eine Blutentnahme zu veranlassen?

Als ich diese Frage in einer Lehrveranstaltung 40 Studenten stellte, antworteten aus dem Gefühl heraus 39 mit Ja und einer mit Nein. Wie lautet die Antwort des Lesers? Wenn er sie niederlegt, bevor er weiterliest, eröffnet er sich eine Testmöglichkeit.

a) Die Bedeutung der Ursprungswahrscheinlichkeit

Die abstrakte Beweiskraft des festgestellten Indizes (Verfärbung des Röhrchens) für das gesuchte Merkmal (Alkoholfahrer) ist mit 95 sehr hoch. Das wird viele Studenten verleitet haben, eine mehr als 50%ige Wahrscheinlichkeit für Alkoholfahrerschaft anzunehmen [44]. Sie haben dabei allerdings übersehen, daß die abstrakte Beweiskraft für sich allein gar nichts besagt. Erst wenn die Ursprungswahrscheinlichkeit für Alkoholfahrerschaft ohne Wissen um die Verfärbung des Röhrchens bekannt ist, können wir mit der abstrakten Beweiskraft der Verfärbung eine zuverlässige Einschätzung für die veränderte Wahrscheinlichkeit abgeben. Was ist also die Wahrscheinlichkeit dafür, bei einem zufällig und nicht im Hinblick auf bestimmte Verdachtsmerkmale herausgegriffenen Autofahrer auf einen Alkoholfahrer zu stoßen?

0,0001, wenn man schätzt, daß auf 10.000 Autofahrer ein Alkoholfahrer kommt;
0,001, wenn man schätzt, daß auf 1.000 Autofahrer ein Alkoholfahrer kommt;
0,01, wenn man schätzt, daß auf 100 Autofahrer ein Alkoholfahrer kommt.

Die Wahrscheinlichkeit für Alkoholfahrerschaft nach Verfärbung beträgt bei (a) 0,0094 (etwa 1%), bei (b) 0,0868 (etwa 9%) und bei (c) 0,4897 (etwa 49%) [45].

In keinem Fall ist der Wert erreicht, der zur Anordnung einer Blutentnahme führen sollte.

Nehmen wir für die folgenden Überlegungen den Wert (b) zum Ausgangspunkt (u = 0,001) und fragen wir, wie sich unsere Wahrscheinlichkeitseinschätzungen ändern (sollten), wenn zur Verfärbung des Röhrchens (I1) noch die folgenden Indizien hinzutreten:

I₂ - der Fahrer fuhr Schlangenlinie auf einer durch Straßenlaternen gut ausgeleuchteten Straße;
I₃ - das Licht war nicht eingeschaltet;
I₄ - der Fahrer konnte die Richtung auf dem Kreidestrich nicht halten.

Wenn wir I₂ bei Alkoholisierten in 20% der Fälle (x₂ = 0,2) und bei Nichtalkoholisierten in 1% der Fälle (y₂ = 0,01) antreffen, beträgt der abstrakte Beweiswert für I₂ 20. Die Werte für I₃ mögen mit x₃ = 0,3 und y₃ = 0,02 (abstrakter Beweiswert 15) und schließlich für I₄ mit x₄ = 0,8 und y₄ = 0,1 (abstrakter Beweiswert 8) geschätzt werden. Dann ergibt die Mehrfachanwendung des Bayes-Theorems eine Wahrscheinlichkeit für Alkoholfahrerschaft von 0,9956 (mehr als 99%).

b) Die Unabhängigkeit der Indizien

Bevor wir uns mit dem errechneten Wert zufriedengeben, müssen wir uns allerdings noch fragen, ob die Indizien auch wirklich unabhängig voneinander sind. Denn nur unter dieser Bedingung führt ja die Mehrfachanwendung des Bayes-Theorems zu zutreffenden Einschätzungen der Gesamtwahrscheinlichkeit auf der Grundlage verschiedener Einzelwahrscheinlichkeiten.

Haben wir also Grund zu der Annahme, daß das Zusammentreffen der vier Indizien sowohl unter Alkoholisierten wie unter nichtalkoholisierten Autofahrern durch Zufall bestimmt ist mit der Folge, daß die Wahrscheinlichkeit des gemeinsamen Auftretens jeweils gleich dem Produkt der Auftretenswahrscheinlichkeiten der einzelnen Indizien unter alkoholisierten und nichtalkoholisierten Autofahrern ist. Oder ziehen etwa die Schlangenlinienfahrer die Ohne-Licht-Fahrer unter den Alkoholisierten magisch an, während unter den nichtalkoholisierten Fahrern möglicherweise gerade die den Strichtest nicht bestehen, die auch schon Schlangenlinien gefahren sind?

Wo immer wir Abhängigkeiten vermuten, müssen wir Indizfamilien bilden und die Wahrscheinlichkeit einzuschätzen versuchen, die Indizfamilie unter den alkoholisierten Fahrern einerseits und den nicht alkoholisierten Fahrern andererseits anzutreffen. Im konkreten Fall könnte man an eine Indizfamilie aus I2, I3 und I4 denken, der als einziges unabhängiges Indiz I1 gegenübersteht, weil die Verfärbung des Teströhrchens bei alkoholisierten wie bei nichtalkoholisierten Fahrern unabhängig davon ist, ob diese das Licht eingeschaltet hatten. Schlangenlinien gefahren sind und auf dem Kreidestrich gehen konnten. Nehmen wir für die zu einer Familie zusammengeschlossenen Indizien I2, I3 und I4 die Wahrscheinlichkeit 0,15 unter den alkoholisierten Fahrern und die Wahrscheinlichkeit 0,005 unter den nichtalkoholisierten Fahrern an, so erhalten wir einen abstrakten Beweiswert für die Indizfamilie von 30 und eine mit den Denkgesetzen übereinstimmende Einschätzung der Wahrscheinlichkeit für Alkoholfahrerschaft unter Berücksichtigung aller Indizien von 0,7405 (=74%).

Das mag genügen, um zu zeigen, wie man seine Überzeugungsbildung mit Hilfe von nichttrivialen Denkgesetzen kontrollieren kann. Ein beliebter Einwand gegen derartige Überlegungen macht geltend, es sei unsinnig, exakte Wahrscheinlichkeiten auf der Grundlage unsicherer Einzelwahrscheinlichkeiten zu berechnen. Der Einwand verfängt nicht. Wer sagt, er glaube, die Marktfrau habe erst zwei und dann noch einmal zwei Äpfel in die leere Tüte getan, ganz sicher sei er sich seiner Beobachtungen aber nicht, besitzt nicht die Freiheit zu sagen, aufgrund seiner Beobachtungen müßten 5 Äpfel in der Tüte sein. Wir würden ihm einen Verstoß gegen die Denkgesetze entgegenhalten. Wer dem zustimmt und dennoch Likelihood-Erwägungen zur Kontrolle seiner Überzeugungsbildung mit dem genannten Einwand ablehnt, gibt lediglich zu erkennen, daß ihm das Erlernen nichttrivialer Denkgesetze zuviel ist. Sein Motto bleibt das fehlverstandene: “Iudex non calculat”, oder, wenn er es lieber modern und amerikanisch hat: “Lawyers are wordsmiths, not number crunchers” [46].