Prof. Dr. Helmut Rüßmann

Zur Mathematik des Zeugenbeweises

*Erstveröffentlichung in: Festschrift für Heinrich Nagel, 1987, S. 329 bis 351

Die elektronische Fassung ist inhaltlich nicht geändert, verwendet aber andere mathematische Symbole als die Druckfassung.

Im wissenschaftlichen Werk Heinrich Nagels nimmt das Beweisrecht eine hervorragende Stellung ein [1]. Mathematische Untersuchungen finden sich dort allerdings nicht. Den Versuchen seines Freundes Per Olof Ekelöf [2] und dessen Schülern [3] begegnet er mit der Skepsis des Praktikers, der in seinem Leben unzählige Beweise erhoben und dabei keine Hilfe von der Mathematik beansprucht hat [4]. Ob er sie hätte erhalten können, ist eine offene Frage. Ihr will ich im folgenden nachgehen und mit einer Grundlagenuntersuchung, deren Früchte für die praktische Arbeit vielleicht nicht unmittelbar geerntet werden können, einen Mann ehren, der wie nur wenige andere theoretische und praktische Interessen in einer Person vereinigt.

Die Überschrift nennt zwei Bereiche, die sich wie Feuer und Wasser zu verhalten scheinen: auf der einen Seite die mit der Logik exakteste Wissenschaft, auf der anderen Seite das unzuverlässigste Beweismittel. Wie will man beide miteinander verbinden? Die Frage so zu stellen, bedeutet die Wiederholung eines verbreiteten Differenzierungsmangels. Die Mathematik ist mit der Logik eine formale Wissenschaft, die uns als solche nichts über die reale Welt erzählt. Der Zeuge hingegen soll gerade als Beweismittel für reale Vorgänge dienen. Wenn man seine Fähigkeiten, dies zu tun, mit den Leistungen anderer vergleicht, darf man nicht die Mathematik zum Vergleich heranziehen, sondern muß sich solchen Wissenschaften zuwenden, die wie der Zeuge etwas über reale Begebenheiten aussagen wollen. Das sind die sog. empirischen Wissenschaften. Deren Irrtumsanfälligkeit ist nun in der Wissenschaftstheorie ein ebensolcher Gemeinplatz wie die Unzuverlässigkeit des Zeugenbeweises in der Prozeßrechtstheorie, wenn auch die Irrtumsanfälligkeit der empirischen Wissenschaften eher bei der Formulierung genereller Hypothesen als bei Berichten über Beobachtungen in Erscheinung tritt. Ohne Zweifel aber nutzen die irrtumsanfälligen empirischen Wissenschaften die Mathematik in großem Umfang und mit großem Erfolg. Die unbestechliche Exaktheit auf der einen Seite steht mithin nicht in unversöhnlichem Gegensatz zur irrtumsanfälligen Erforschung der realen Welt auf der anderen Seite. Sie bietet im Gegenteil ein Mittel zur Präzisierung empirischer Aussagen und ein Organon der Kritik, wenn es um zusammenfassende Einschätzungen zu einem fraglichen empirischen Merkmal auf der Grundlage anderer empirischer Merkmale geht. Eine Untersuchung zur Mathematik des Zeugenbeweises hat ihren Schwerpunkt im letzteren Bereich. Es geht nicht darum, den Zeugenbeweis zu mathematisieren, um ihn an der Sicherheit und Unbestechlichkeit eines mathematischen Beweises [5] teilhaben zu lassen. In ihrer Kritikfunktion wollen wir die Mathematik bemühen, um zu sehen, ob sie uns vor Fehleinschätzungen bei intuitiven Gesamtbetrachtungen zum Beweiswert einer und/oder mehrerer Zeugenaussagen zu einem fraglichen Ereignis bewahren kann.

Ich beginne meine Analyse mit den Axiomen und Theoremen der überkommenen mathematischen Wahrscheinlichkeitstheorie und frage, was von ihrem Standpunkt aus zu typischen Beweissituationen gesagt werden kann. Damit grenze ich mich - mindestens vorläufig - von den Versuchen Cohens ab, mit einem anderen Axiomen- und Regelsystem als dem der überkommenen mathematischen Wahrscheinlichkeitstheorie das juristische Beweisverfahren zu rekonstruieren und zu normieren [6]. Eine Notwendigkeit zum Modellwechsel bestünde erst, wenn das Modell der überkommenen mathematischen Wahrscheinlichkeitstheorie sich als ungeeignet erwiese. Bevor wir ein solches Urteil fällen, müssen wir erst einmal seine Tragweite ausmessen. Das geschieht hier in vier Schritten. Zunächst werde ich das mathematische Instrumentarium einführen (A). Sodann stelle ich ein mathematisches Modell für den Zeugenbeweis vor, das ich im Rahmen der überkommenen Wahrscheinlichkeitstheorie für den Alternativkommentar zur Zivilprozeßordnung [7] entwickelt habe (B). Danach will ich ein Beispiel zur Diskussion stellen und an ihm das Modell testen (C). Abschließend wird die Tragweite des Modells ausgemessen und eine Tür in eine Wahrscheinlichkeitswelt mit anderen Axiomen als denen der überkommenen Wahrscheinlichkeitstheorie geöffnet.

I. Das mathematische Instrumentarium

1. Zeichenerläuterung

Im folgenden werden einige Symbole verwendet, die vornehmlich dem Zweck dienen, die gedanklichen Entwicklungen einerseits abzukürzen und andererseits möglichst präzise zu gestalten. Soweit diese Symbole nicht zum Allgemeingut zählen, sollen sie hier kurz vorgestellt werden.

“p” steht für Wahrscheinlichkeit. Zusammen mit dem Ereignis, dem eine Wahrscheinlichkeit zugesprochen werden soll, kann p einen Wert zwischen 0 und 1 annehmen. Will man etwa zum Ausdruck bringen, daß die Wahrscheinlichkeit für ein Ereignis E 80% betrage, so kann man das kurz und bündig in die Form “ ” kleiden.

“q” steht ebenfalls für eine Wahrscheinlichkeit und zwar für die, die für das Gegenteil der mit p gebildeten Wahrscheinlichkeitsaussage gilt.

“ ” steht für die Menge aller möglichen Fälle, über die eine Wahrscheinlichkeitsaussage gebildet wird.

“ ” steht für eine bedingte Wahrscheinlichkeit und besagt: “Unter der Bedingung A beträgt die Wahrscheinlichkeit für E...”, oder anders ausgedrückt: “Wenn A, dann E mit einer Wahrscheinlichkeit von ...”.

Es ist möglich, daß sowohl auf der Bedingungsseite wie auch auf der Ereignisseite mehrere Bedingungen bzw. Ereignisse angesprochen werden, wobei die Mehrheiten durch eine Oder- und/oder eine Undverknüpfung gebildet sein können. Schließlich mögen auch Negationen gebildet werden, um negative Bedingungen zu formulieren oder das Nichteintreten eines Ereignisses zum Ausdruck zu bringen. Wir verwenden für diese Operationen folgende Symbole:

“ ” für die Undverknüpfung, die Schnittmenge;

“ ” für die Oderverknüpfung, die Vereinigungsmenge;

“ ” für die Negation, die Komplementmenge von A.

Wir benötigen dann noch einige Vergleichsoperatoren, mit deren Hilfe unter anderem Größenvergleiche angestellt werden können:

“=” steht für “ist gleich”,

“>” steht für “ist größer als”;

“<” steht für “ist kleiner als”;

“ ” steht für “beträgt mindestens”;

“ ” steht für “beträgt höchstens”.

2. Die Axiome der überkommenen Wahrscheinlichkeitstheorie [8]

Axiom 1 besagt, daß die Wahrscheinlichkeit eines Ereignisses E einen Wert zwischen 0 und 1 hat. Damit wird der Wahrscheinlichkeitsraum festgelegt. Der Wert entspricht der von der Umgangssprache her vertrauten Prozentsprechweise.

Axiom 2 besagt, daß die Wahrscheinlichkeit des sicheren Ereignisses 1 beträgt. Im Rahmen der überkommenen Theorie können wir für das sichere Ereignis auch die Tautologie notieren. Eine andere Möglichkeit als das Eintreten von E oder dem Komplementereignis gibt es nicht.

Axiom 3 ist auch als spezielles Additionsprinzip bekannt und besagt, daß die Wahrscheinlichkeit für das Auftreten von E oder A gleich der Summe der Einzelwahrscheinlichkeiten für E und A ist, wenn das gemeinsame Auftreten von E und A ausgeschlossen ist [9]. Sollte das gemeinsame Auftreten von E und A nicht ausgeschlossen sein, gilt das allgemeine Additionsprinzip, das für die axiomatische Charakterisierung des Wahrscheinlichkeitsbegriffs aber schon nicht mehr erforderlich ist:

3. Einige Definitionen und Theoreme

(5) enthält die Definition der bedingten Wahrscheinlichkeit. Ihre Bedeutung kann man sich im Rahmen der überkommenen Wahrscheinlichkeitstheorie leicht klarmachen [10]. Aus ihr läßt sich durch Umformung das wichtige allgemeine Multiplikationsprinzip gewinnen:

Unter einer Zusatzbedingung ergibt sich ein besonderes Multiplikationsprinzip. Diese Zusatzbedingung ist die statistische Unabhängigkeit von A und E. Sie ist verwirklicht, wenn . Dann nämlich gilt:

(7) verwendet man auch zur Definition der statistischen Unabhängigkeit zweier Ereignisse voneinander.

Dieses Theorem besagt, daß die Wahrscheinlichkeit eines Ereignisses immer gleich 1 minus der Wahrscheinlichkeit des Komplementereignisses ist. Das Theorem folgt unmittelbar aus den Axiomen 2 und 3 [11]. Es gilt auch im Bereich bedingter Wahrscheinlichkeiten:

9. .

10.

(10) nennt man die Laplace-Wahrscheinlichkeit. Sie folgt unmittelbar aus den Axiomen und erinnert an die klassische Definition der Wahrscheinlichkeit [12], wonach die Wahrscheinlichkeit in der Zahl der günstigen geteilt durch die Zahl der möglichen Fälle besteht. Die Laplace-Wahrscheinlichkeit gilt selbstverständlich auch im Bereich bedingter Wahrscheinlichkeiten:

11.

12.

(12) enthält das Bayestheorem. Es könnte die Grundlage einer allgemeinen Beweislehre, einer allgemeinen Lehre vom Indizienbeweis, werden, weil es angibt, wie sich eine Wahrscheinlichkeitseinschätzung ändert bzw. ändern sollte, wenn zu bisherigen Informationen neue Informationen (Indizien) hinzutreten [13]. In unserer Darstellung ist A Platzhalter für eine neue Information. Auf welches Wissen es ankommt, um die Beweiskraft von A zu bestimmen, macht eine Umformulierung des Theorems deutlich, die sich daraus ergibt, daß Zähler und Nenner des Bruchs durch den Zähler geteilt werden. Das ergibt

13.

Hier zeigt sich, daß es auf zwei Quotienten ankommt. In dem einen ist die Information über die Ausgangswahrscheinlichkeit für E enthalten, in dem anderen die Beweiskraft von A für E. Diesen anderen Quotienten nennt man auch den Likelihoodquotienten. Seine Auswertung verlangt Erfahrungen oder begründete Schätzungen darüber, wie häufig ein als Indiz auszuwertendes Merkmal A auftritt, wenn das gesuchte Merkmal E vorliegt, und wie häufig es auftritt, wenn das gesuchte Merkmal E nicht vorliegt. Bender und Nack verwenden die Umkehrung des Likelihoodquotienten zur Definition der abstrakten Beweiskraft eines Indizes [14].

4. Die Ableitung des Bayestheorems

Das Bayestheorem gilt als eine mathematische Trivialität [15]. Trotzdem möchte ich zeigen, wie man es aus den oben angeführten Axiomen, Theoremen und Definitionen der Wahrscheinlichkeitstheorie ableiten kann. Das schult den Umgang mit dem vielleicht noch nicht vertrauten Instrumentarium. Den Ausgangspunkt bildet die Definition der bedingten Wahrscheinlichkeit:

Hier läßt sich wegen des allgemeinen Multiplikationsprinzips (6) der Zähler ersetzen durch p(E) * p(A,E) und wir erhalten:

14.

Wegen der Äquivalenz von A mit dürfen wir p(A) in (14) wie folgt ersetzen:

15.

Axiom 3 macht aus dem Nenner . Die beiden Summanden dieses Ausdrucks werden mithilfe des allgemeinen Multiplikationsprinzips (6) umgeformt, und man erhält mit

das Bayestheorem.

12.

5. Der Beweisring [16]

Unter einem Beweisring wollen wir mit Bender und Nack [17] eine Mehrzahl von Indizien verstehen, die Informationen für das gesuchte und zu beweisende Merkmal E enthalten und sich wie ein Ring um E herumlegen. Wenn A und B diese Informationen enthalten, so können wir nach unseren bisherigen Entwicklungen sagen. Wir suchen den Wert für . Sollten wir den nicht kennen, können wir auf das Bayestheorem zurückgreifen und entsprechend seiner Formulierung in (13) schreiben:

16.

Auch (16) erfordert aber noch statistische Informationen über komplexe Bündelungen, während uns möglicherweise nur Informationen über den statistischen Zusammenhang je eines Indizes zum gesuchten Merkmal zur Verfügung stehen, Informationen von folgender Gestalt also: ; ; ; ; ; . Was wir suchen, ist ein Modell, das es uns erlaubt, solche Einzelinformationen zu einer Gesamtwahrscheinlichkeit auszuwerten, ohne sogleich zur täuschungsanfälligen Gesamtschau greifen zu müssen.

Unter bestimmten Irrelevanzannahmen und Unabhängigkeitsbedingungen gibt es tatsächlich ein solches Modell. Es hat die Gestalt:

17.

Die Begründung von (17) muß zeigen können, unter welchen Voraussetzungen die Veränderung des zweiten Summanden im Nenner von (16) erfolgen darf.

Das allgemeine Multiplikationsprinzip (6) macht aus und in (16) beziehungsweise . Der Schritt zu (17) ist nur dann erlaubt, wenn das Auftreten von A die Wahrscheinlichkeit von B unter E und unter nicht verändert, mithin und unabhängig von A sind. Dann nämlich gelten die Irrelevanzbedingungen:

die den Übergang von (16) auf (17) ermöglichen.

Noch ungelöst ist das Problem der Anfangswahrscheinlichkeit. [18] Auch hier bietet sich aber wenigstens eine Teillösung an, wenn man folgendes bedenkt. Das Bayestheorem lautet

13.

Wenn man bei (11) Zähler und Nenner des Bruchs durch den Zähler teilt, erhält man

18.

Nun kann man deutlich einen Zusammenhang zwischen den verschiedenen Quotienten sehen und wie folgt ausdrücken:

19.

oder auch

20.

Jetzt kann man in (17) eine durch (20) legitimierte Einsetzung vornehmen und erhält nach Kürzung der Quotienten zur Anfangswahrscheinlichkeit

21.

Die hier einzusetzenden Werte sind uns nach den oben (nach 16) gemachten Voraussetzungen bekannt.

6. Die Beweiskette

Bei der Beweiskette [19] fehlen uns die statistischen Informationen, die uns unmittelbar etwas über die Wahrscheinlichkeit von E unter dem Indiz A sagen könnten. Wir wissen nur etwas über den Zusammenhang von A zu einem Zwischenglied Z und etwas über den Zusammenhang von Z zu E, haben also Informationen der Art und . Wir suchen den Wert für . Bender und Nack [20] schlagen für diese Situation folgendes Modell vor:

22.

Dieses Modell läßt sich nicht als allgemeingültig beweisen [21]. Nur unter bestimmten Zusatzannahmen darf es Gültigkeit beanspruchen. Zum Beweise greifen wir zunächst ein anderes Modell auf, in dem das Gleichheitszeichen in (22) durch das Beträgt-mindestens-Zeichen ersetzt wird:

23.

Auch (23) gilt allerdings nur unter den folgenden Irrelevanzbedingungen

Jetzt läßt sich zeigen:

24.

Wendet man das allgemeine Multiplikationsprinzip auf beide Summanden an, so ergibt sich

25.

Die Berücksichtigung der Irrelevanzbedingungen ergibt

26.

(26) ist äquivalent mit (23).

Nur wenn der zweite Summand in (26) den Wert 0 annimmt, gilt das von Bender und Nack vorgeschlagene Modell. Das ist der Fall, wenn oder wenn .

So gerüstet können wir es jetzt wagen, die Mathematik des Zeugenbeweises auf der Grundlage der überkommenen Wahrscheinlichkeitstheorie in Angriff zu nehmen.

II. Der Zeugenbeweis

1. Die relevanten Beurteilungskriterien

Die für die Beurteilung des Beweiswertes einer Zeugenaussage relevanten Gesichtspunkte lassen sich in einer Irrtumslehre, die sich mit den ungesteuerten Verfälschungen einer Zeugenaussage befaßt, und einer Lügenlehre, die von den gesteuerten Verfälschungen einer Zeugenaussage handelt, beschreiben. Das habe ich an anderer Stelle getan [22]. Hier nun soll es darum gehen, ob man die vielfältigen Gesichtspunkte, die für die Beurteilung eine Rolle spielen, in einem das Zusammenspiel strukturierenden und analysierenden Modell zusammenfassen kann, welches uns im Idealfall ermöglicht, begründete Schätzungen für Einzelgesichtspunkte in eine Rechnung für den Gesamtbeweiswert einer oder auch mehrerer Aussagen einzustellen und so unsere Glaubwürdigkeitseinschätzung einer Kontrolle durch die Mathematik zu unterwerfen.

2. Mathematische Modelle

Ein Modell für die Bewertung der Aussage eines Zeugen stammt von Kaplan. Er hält die Wahrscheinlichkeit, daß der Zeuge eine korrekte Bekundung gegeben hat, für das Produkt aus “all the independent probabilities that go into the reliable communication of information. Thus /it/ may be expressed as the product of probabilities: (1) that the witness was not mistaken in what he saw; (2) that he has remembered what he thinks he saw; (3) that he has meant to tell us what he remembered; (4) that he has been able to communicate what he intends to tell us; (5) that we have correctly understood what he has communicated” [23]. In durchaus vergleichbarer Weise zerlegt Ekelöf [24] die Glaubwürdigkeitsprüfung in Teilbereiche. Er bezieht sie auf die Wahrscheinlichkeit für die Kausalitätsannahme, daß das rechtsrelevante reale Ereignis und nicht irgendetwas anderes die Bekundung des Zeugen verursacht hat, und fragt nach der Kausalität des Ereignisses für das Wahrnehmungsbild, des Wahrnehmungsbildes für das Erinnerungsbild und des Erinnerungsbildes für die Bekundung. Die Wahrscheinlichkeiten, die den einzelnen Kausalgliedern zugeordnet werden, ergeben multipliziert die Gesamtwahrscheinlichkeit dafür, daß das Ereignis die Bekundung verursacht hat. Auch Bender/Nack heben - jedenfalls für einen Teilbereich - auf die Multiplikationsregel ab, wenn sie für die Zerlegung der Irrtumsmöglichkeiten eine Beweiskette bilden [25].

Zu einem neben den Irrtumsmöglichkeiten auch die Lüge umfassenden Modell entwickeln sie jedoch keine eindeutigen Vorstellungen. Einmal [26] wollen sie die Irrtumslehre und auch Teile der Lügenanalyse (Persönlichkeit, Motivation, Aussagesituation) heranziehen, um eine plausible Ausgangswahrscheinlichkeit zu bestimmen, auf die mittels Likelihooderwägungen die Kriterien der Aussageanalyse “draufgesetzt” werden. Zum anderen [27] behandeln sie die Irrtumsfreiheit und die subjektive Wahrhaftigkeit als zwei getrennte, aber notwendige Voraussetzungen für den zwingenden Schluß von der Aussage auf den Inhalt der Aussage.

3. Analyse und Kritik

In allen Modellen steckt ein Körnchen Wahrheit, machen sie doch darauf aufmerksam, wie voraussetzungsvoll die begründete Annahme eines rechtlich relevanten Ereignisses auf der Grundlage einer Zeugenbekundung ist. Doch ist keines der Modelle frei von Zweifeln, soweit die Anwendung von Sätzen der überkommenen Wahrscheinlichkeitstheorie (Multiplikationsregel, Bayestheorem) empfohlen wird, da wir in weiten Bereichen nicht wissen, ob die Anwendungsbedingungen gegeben sind, unter denen allein diese Sätze zu den angestrebten korrekten Gesamtbeurteilungen führen. Kaplan spricht von “independent probabilities”, und in der Tat ist die Multiplikationsregel für das gemeinsame Auftreten zweier unabhängiger Ereignisse definiert (Paradigma: der Wurf mit zwei Würfeln). Entwickeln sich aber die Aufnahme eines Erlebnisses und der Abruf dieses Erlebnisses so unabhängig voneinander wie die Ergebnisse zweier Würfel bei einem Wurf? Diese Frage dürfen wir nach allem, was wir etwa über die Zusammenhänge von Aufmerksamkeit und Gefühlsbeteiligung für Wahrnehmung und Gedächtnis wissen [28], getrost verneinen. Wir sollten darum aber die Heranziehung der Multiplikationsregel nicht sofort verwerfen. Möglicherweise leistet sie auch da noch gute Dienste, wo Unabhängigkeit im skizzierten Sinne nicht gewährleistet ist. Denken wir uns zum Beispiel die Glieder Wahrnehmung, Erinnerung und Wiedergabe in der Irrtumskette durch Filter voneinander getrennt, deren Durchlässigkeit für den Informationsfluß von den unterschiedlichsten Umständen abhängt, so gibt die Multiplikationsregel korrekt die am Ende zu erwartende Informationsmenge an gleichgültig, ob die Durchlaßwahrscheinlichkeiten der Filter voneinander abhängig sind oder nicht. Man muß nur unter Ausnutzung aller zur Verfügung stehenden Informationen die Durchlaßwahrscheinlichkeit jedes einzelnen Filters bestimmen.

a) Das Filtermodell

Wenn das Filtermodell dem Informationsfluß in einer Zeugenbekundung über Beobachtung, Abruf und Wiedergabe empirisch gerecht wird, so gibt für es die Multiplikationsregel ein mathematisch geeignetes Modell ab. Ob das Filtermodell ihm gerecht wird, hängt davon ab, ob man die an einer Mengenvorstellung über Informationen entwickelte Annahme übertragen darf auf den Sicherheitsgrad einer einzelnen Information. Da man aber auch den Sicherheitsverlust an Filtern exemplifizieren kann, sehe ich nicht, was gegen eine solche Übertragung sprechen sollte. Die Wahrscheinlichkeit der Irrtumsfreiheit läßt sich darum mit dem Produkt aus der Sicherheit der Wahrnehmung, der Sicherheit des Abrufs (Erinnerung) und der Sicherheit der Wiedergabe angeben. Bei der Bestimmung der einzelnen Sicherheiten sind alle zur Verfügung stehenden Informationen zu berücksichtigen, wobei es sich durchaus ergeben kann, daß Beweisketten und Beweisringe zum Tragen kommen, die mit der Multiplikationsregel und dem Bayestheorem einer Kontrolle durch die Denkgesetze unterworfen werden können [29].

b) Der Einbau der Lügenlehre

Die Möglichkeit gesteuerter Verfälschungen ist in den bisherigen Entwicklungen noch nicht berücksichtigt worden. Wir müssen sie aber in Rechnung stellen, wenn wir den Vertrauensgrad ermessen wollen, welcher einer Aussage gebührt. Vielleicht ist es auch hier möglich, im Filterbild zu bleiben und einen weiteren Filter einzuziehen, dessen Durchlaßwahrscheinlichkeit (für zutreffende Informationen) gleich der Wahrscheinlichkeit für das Fehlen gesteuerter Verfälschungen ist. Wir hätten dann in das mathematische Gesamtmodell lediglich einen weiteren Faktor einzustellen, der das Gesamtprodukt gleich läßt oder senkt. So verlockend dieser Weg wegen seiner Einfachheit scheint, so schwierig sind doch die mit ihm verbundenen Interpretationsprobleme. Wir müssen uns erst einmal Klarheit darüber verschaffen, auf welche Art von Ereignissen oder Aussagen sich unsere Wahrscheinlichkeitsanalysen eigentlich beziehen: auf die Wahrscheinlichkeit des rechtlich relevanten Ereignisses A (1), auf die Wahrscheinlichkeit der Wahrheit der Aussage des Zeugen mit dem Inhalt: “A” (2) oder auf die Wahrscheinlichkeit der Wahrheit der Aussage des Zeugen mit dem Inhalt: “Ich habe erlebt, daß A” (3).

Unser Interesse gilt letztlich einer Bestimmung von (1) auf der Grundlage von (3). (1) und (2) stehen in einem analytischen Zusammenhang, weil die Wahrscheinlichkeiten von (1) bzw. (2) notwendig gleich sind. Das ist bei (1) bzw. (2) und (3) keineswegs der Fall. Zwar dürfte die Wahrheit von (3) auch die Wahrheit (2) bedeuten. Nicht aber ist die Unwahrheit von (3) gleichbedeutend mit der Unwahrheit von (2). Wahrscheinlichkeitstheoretische Konsequenz aus dieser Situation muß eine außerordentliche Vorsicht bei der Anwendung der Negationsregel sein. Sie besagt, daß die Wahrscheinlichkeit der Wahrheit der negierten Aussage (des Komplementereignisses) gleich 1 minus der Wahrscheinlichkeit der Wahrheit der Aussage (des Ereignisses) ist. Diese Regel gilt selbstverständlich auch für eine Aussage der Art (3). Nur ist das Negat hier: “Die Aussage: “Ich habe erlebt, daß A”, ist falsch” und nicht: “Die Aussage: “A”, ist falsch”.

c) Einheitsmodell für Irrtum und Lüge

Interpretationsprobleme entstehen dann, wenn Irrtumsanalyse und Lügenanalyse sich auf unterschiedliche Aussagen beziehen sollten. Sicher ist, daß die Lügenanalyse bei (3) ansetzt, mit der Folge, daß das Feststehen einer Lüge nicht zugleich die Nichtwahrheit von A belegt. Die Lüge kann sich ja allein auf das Erleben eines im übrigen stattgehabten Ereignisses beziehen. Dagegen läßt sich für ungesteuerte Verfälschungen eine Interpretation denken, bei der die Wahrscheinlichkeit des Irrtums gleich der Wahrscheinlichkeit des Negats von (2) oder des Komplementereignisses von (1) ist. Wenn wir uns indessen darauf verständigen, daß auch die Wahrscheinlichkeit ungesteuerter Verfälschungen einer Aussage sich auf Aussagen der Art (3) bezieht (Beispiel: Traum einer realen Begebenheit), dann schwinden die Schwierigkeiten, ungesteuerte Verfälschungen (Irrtum) und gesteuerte Verfälschungen (Lüge) in ein einheitliches Modell zu integrieren. Es ist ein Modell für die Vertrauenswürdigkeit (Wahrscheinlichkeit der Wahrheit) einer Behauptung der Art (3), nämlich: “Ich habe erlebt, daß A”. Die Wahrheit dieser Aussage ist genau dann gegeben, wenn sowohl ungesteuerte Verfälschungen als auch gesteuerte Verfälschungen ausgeschlossen sind. Unsicherheiten über das Vorliegen dieser beiden notwendigen (und zusammen hinreichenden) Bedingungen können als Wahrscheinlichkeitsaussagen über das Vorliegen der einen oder anderen Bedingung notiert werden. Das Produkt der Einzelwahrscheinlichkeiten ergibt die Wahrscheinlichkeit der Wahrheit der Aussage: “Ich habe erlebt, daß A”. Für die Berechnung der Wahrscheinlichkeit einer Aussage aus den Wahrscheinlichkeiten für die notwendigen Bedingungen dieser Aussage gibt die Multiplikationsregel ein geeignetes mathematisches Modell.

4. Zwischenergebnis

Wir kommen somit unter einigen Präzisierungen zu dem gemeinsamen Kern der Modellvorstellungen von Kaplan, Ekelöf und Bender/Nack. Wie mögliche Berechnungen für die Wahrscheinlichkeit der jeweils notwendigen Bedingungen im Modell aussehen könnten, führen allein die letzteren aus. Dabei machen sie namentlich für die Auswertung von Glaubwürdigkeitskriterien bei der Prüfung gesteuerter Verfälschungen immer wieder von Likelihooderwägungen auf der Grundlage des Bayestheorems Gebrauch [30]. Die erforderliche Ausgangswahrscheinlichkeit für die Wahrheit der Aussage wird mit 0,5 normiert [31]. Das klingt plausibel und kann doch zu Schwierigkeiten führen, wenn etwa drei Zeugen zum Erscheinungsbild einer Ampel aussagen: Z1: “Die Ampel zeigte grün”, Z2: “Die Ampel zeigte gelb”, Z3: “Die Ampel zeigte rot”. Mit der Normierung der Ausgangswahrscheinlichkeit von 0,5 für alle drei Aussagen laufen wir Gefahr, Axiom (2) der Wahrscheinlichkeitstheorie zu verletzen [32]. Daß im übrigen Likelihooderwägungen für die Auswertung von Glaubwürdigkeitskriterien eine zentrale Rolle spielen können und sollen, legt die Entwicklung dieser Kriterien nahe [33]. Vorsicht müssen wir allerdings bei der Frage nach der Unabhängigkeit der Kriterien walten lassen. Sie ist nicht ohne weiteres gewährleistet. Im Gegenteil: die von Bender/Nack präsentierte Gegenüberstellung von Realitätskriterien und Lügensignalen [34] deutet auf starke Abhängigkeit bis zur Analytizität hin. Hier würde bei unbesehener Mehrfachanwendung des Bayestheorems dem einen oder anderen Indiz ein ungebührliches Gewicht, ein Übermaß an Beweiskraft, zugemessen werden.

5. Offene Fragen

Wenn wir die Wahrscheinlichkeitsanalyse einer Zeugenbekundung auf die Aussage: “Ich habe erlebt, daß A.” (im folgenden mit “ ” abgekürzt) beziehen, steht noch eine Antwort auf zwei Fragen aus. Die erste Frage zielt auf die Schlußmöglichkeiten von einer Wahrscheinlichkeitsaussage über (abgekürzt “ ”) auf eine Wahrscheinlichkeitsaussage über A (abgekürzt “ ). Die zweite Frage hebt auf das Zusammenrechnen mehrerer voneinander unabhängiger Zeugenbekundungen ab (abgekürzt “ ”).

a) Der Übergang von der Aussage zum Ereignis

Für die Antwort auf die erste Frage bietet sich ein allgemeingültiges Schlußschema aus der Wahrscheinlichkeitstheorie an [35]. Es lautet als Schlußregel formuliert:

27.

und besagt umgangssprachlich: Die Wahrscheinlichkeit für A ist mindestens so groß wie das Produkt aus der Wahrscheinlichkeit für und der Wahrscheinlichkeit für A unter der Bedingung . Da die Wahrscheinlichkeit für A unter der Bedingung 1 (oder 100 %) beträgt (unter der Bedingung der Wahrheit von ist auch A wahr), können wir auch kurz sagen: Die Wahrscheinlichkeit für das rechtsrelevante Ereignis A aufgrund einer Zeugenbekundung ist mindestens so groß wie die Wahrscheinlichkeit der Wahrheit von .

b) Das Zusammenfassen mehrerer Zeugenaussagen

Für die zweite Frage stehen im zeitgenössischen deutschsprachigen Schrifttum zwei miteinander konkurrierende Antworten zur Diskussion. Schreiber [36] will den Beweiswert mehrerer Beweismittel mit der Formel

28.

zu einem Gesamtbeweiswert zusammenfassen. Ekelöf [37] schlägt demgegenüber vor, die Wahrscheinlichkeit, daß jedenfalls eine von mehreren Bekundungen von dem Ereignis induziert worden ist, nach dem Additionstheorem der überkommenen Wahrscheinlichkeitstheorie (4) zusammen mit der Unabhängigkeitsannahme (5) zu bestimmen:

29.

Bei Licht besehen gehen Schreiber und Ekelöf von unterschiedlichen Beweiswertdefinitionen aus. Schreiber nimmt als Beweiswert den aus dem Schlußschema folgenden Wert für p(A). Ekelöf dagegen bestimmt als Beweiswert dafür, daß das Ereignis die Aussage verursacht hat. Den Wert, den Schreiber braucht, haben wir nicht, weil gleich oder größer rs ist. Eine denkbare Vereinbarung, immer vom Mindestwert rs auszugehen, führt in Schwierigkeiten, wenn kleiner als 0,5 ist. Messen wir etwa wegen des Aufenthalts des Zeugen an einem anderen Ort den Wert 0 zu (der Zeuge hat das behauptete Ereignis nicht erleben können), dann führt die Anwendung der Schreiber-Formel mit unserer Vereinbarung zu , was eklatant falsch sein kann. Das Ereignis A mag stattgefunden haben, ohne daß der Zeuge es erlebt hat. Für die Verwendung der Schreiber-Formel muß der abnehmende Beweiswert einer Zeugenaussage für das Ereignis A auf der von 1 bis 0,5 reichenden Wahrscheinlichkeitsskala zum Ausdruck gebracht werden. Dazu fehlt uns eine Umrechnungsformel. Hätten wir die, stünden wir vor dem weiteren Problem, daß die Schreiber-Formel nur bei einer Ausgangswahrscheinlichkeit für A von 0,5 ohne die Zeugenaussagen zu korrekten Ergebnissen führt [38]. Ekelöfs Ansatz gerät nicht in diese Schwierigkeiten. Er gibt indessen eine Antwort auf die Frage nach der Wahrscheinlichkeit der Wahrheit von , die uns nur interessiert, wenn sie auch unser Ausgangsproblem korrekt umreißt. Fragen wir nach der Wahrscheinlichkeit von A unter der Annahme von oder unter der Annahme von ? Es scheint nicht ausgeschlossen, daß wir unser Problem tatsächlich mit der Oder-Verknüpfung (Vereinigungsmenge) korrekt beschreiben, weil uns eine Aussage mit genügt. Wir können ja im Anschluß an unsere Schlußregel (27) und die dortige Diskussion ohne weiteres eine auf mehrere Aussagen abhebende Regel formulieren:

30. .

Das Additionstheorem erlaubt uns die Berechnung von r. Die Aussagen müssen allerdings unabhängig voneinander sein. Bei mehr als zwei Zeugenaussagen ist darauf zu achten, daß aus mathematischen Gründen zunächst das Ergebnis für zwei Aussagen berechnet wird, auf dieses mit derselben Operation die dritte Aussage gesetzt wird, auf das dann erhaltene Ergebnis die vierte und so fort. Mit einer anderen Formulierung der Regel für die Berechnung von r haben wir diese Schwierigkeiten bei mehr als zwei Aussagen nicht. Sie ist dem Additionstheorem für unabhängige Ereignisse äquivalent und lautet:

31.

oder in der auf Beweiswerte abhebenden Sprache von (28) und (29)

32. .

6. Die Reichweite des Modells

Das Modell ist nur für die Situation entwickelt worden, in der jede der Aussagen die rechtlich relevante Sachverhaltsbehauptung zum Inhalt und keine der Aussagen einen positiven Beweiswert für das Gegenteil des Aussageinhalts hat. Sind diese Voraussetzungen nicht gegeben, muß man komplexere Modelle in Erwägung ziehen. Da ist es nicht a limine auszuschließen, daß man auch Regeln entwickeln und heranziehen muß, die den Rahmen der überkommenen mathematischen Wahrscheinlichkeitstheorie sprengen (dazu unten D). Zunächst aber soll noch ein Testfall im gegebenen mathematischen Rahmen diskutiert werden.

III. Ein Testfall

In der Festschrift für Sören Hallden finden wir in der Form eines Streitgesprächs ein glänzend geschriebenes Essay [39] um die korrekte Lösung für die folgende Fallgestaltung:

Zwei Taxigesellschaften sind in einer Stadt tätig. Die Taxis der Gesellschaft A sind grün, die der Gesellschaft B sind blau. Die Gesellschaft A stellt 15% der Taxis, die Gesellschaft B die verbleibenden 85%. Eines Tages kommt es zu einem Unfall mit Fahrerflucht. Das fliehende Auto war ein Taxi. Ein Zeuge sagt aus, es habe sich um ein grünes Taxi gehandelt. Das Gericht läßt den Zeugen auf seine Fähigkeit untersuchen, grüne und blaue Taxis unter nächtlichen Sichtbedingungen zu unterscheiden. Das Untersuchungsergebnis ist: In 80% der Fälle identifiziert der Zeuge die Farbe zutreffend, in 20% der Fälle irrt er sich.

Wie hoch ist die Wahrscheinlichkeit, daß es sich bei dem fliehenden Taxi um ein Taxi der Gesellschaft A gehandelt hat?

Lazy, der Gesprächspartner mit dem gesunden Menschenverstand, gibt die Wahrscheinlichkeit mit 80% an. Basie, ein Baysianer, sucht ihn darüber zu belehren, daß die Wahrscheinlichkeit um 41% herum betrage. Daisy, ein Anhänger der Ekelöf-Schule, hält es eher mit Lazy, muß aber letztlich zu problematischen Kausalitätsannahmen Zuflucht nehmen, derentwegen Lazy vorschlägt, Dr. Hazy von der Philosophischen Fakultät aufzusuchen. Von dem Besuch sind die Beteiligten bisher noch nicht mit einer Antwort zurückgekehrt ....

Wir müssen versuchen, die Antwort selbst zu finden! Welche Informationen bietet uns die Fallschilderung?

Wir erfahren etwas über die Verteilung von Taxis der A-Gesellschaft und der B-Gesellschaft, aus der wir den Satz gewinnen können: Die Wahrscheinlichkeit, daß ein Taxi der A-Gesellschaft an dem Unfall beteiligt war, beträgt 15%: .
Wir erfahren etwas über die Beobachtungsfähigkeit des Zeugen. Wenn man dem Zeugen ein Taxi der A-Gesellschaft unter den Sichtbedingungen zur Unfallzeit präsentiert, dann sagt er in 80% der Fälle grün. Wir notieren dafür: . Präsentiert man ihm ein Taxi der B-Gesellschaft, so sagt er in 20% der Fälle ebenfalls grün. Daraus wird spezifiert auf die A-Gesellschaft: .

Fragt man nun nach , dann hat man in der so aufbereiteten Informationssituation alle Angaben für die Anwendung des Bayestheorems (12). Das Ergebnis ist das von Basie, nämlich . [40]

Basie hätte auch eine Antwort für das Hinzutreten eines weiteren vom ersten Zeugen unabhängigen Zeugen mit denselben Testergebnissen parat. Er könnte wegen der Unabhängigkeit der Zeugenaussagen zur Mehrfachanwendung des Bayestheorems (17) greifen und erhielte für , eine unseren Intuitionen entsprechende Steigerung der Wahrscheinlichkeit für A.

Bei der gegebenen Informationslage stimmt allein Basies Einschätzung für die Beteiligung eines Taxis der A-Gesellschaft mit den Regeln der Mathematik überein. Wer daran rütteln möchte, verstößt gegen das Gebot der umfassenden Berücksichtigung aller zugänglichen Informationen. Dazu gehört nun einmal auch die Grundverteilung der grünen und blauen Taxis in der betroffenen Stadt. Kausalitätserwägungen helfen darüber nicht hinweg [41].

Die Sache hat allerdings einen kleinen Schönheitsfehler. Das Räsonnement von den Aussagen “Grün” zu der Annahme, daß es sich um ein grünes Taxi und damit um ein solches der A-Gesellschaft gehandelt habe, hat so gar nichts mit dem gemein, was wir unter (B) zur Mathematik des Zeugenbeweises entwickelt haben. Sollte die Entwicklung schon dadurch widerlegt sein?

Hüten wir uns vor überstürzten Antworten! Das Beispiel weist zwei Besonderheiten auf, die so speziell sind, daß man darauf kein allgemeines Modell errichten sollte. Einmal verfügen wir mit der Grundverteilung und den Testergebnissen ausnahmsweise über statistische Erfahrungssätze, die eine Auswertung mithilfe des Bayestheorems gestatten. Zum anderen schließt Basie im Testfall die Möglichkeit, von den Zeugen belogen zu werden, aus. In einem allein die Irrtumsmöglichkeiten berücksichtigenden Modell dürften wir in der Tat eine Interpretation wählen, die die Wahrscheinlichkeit der Wahrheit der Aussage einschließlich der Negationsregel für das Komplement unmittelbar auf das fragliche Ereignis überträgt [42]. So sieht indessen unsere Welt nicht immer aus. Das allgemeinere Modell trägt dem Rechnung, indem es erstens die Möglichkeit der Lüge nicht ausschließt und zweitens einen die Lüge und den Irrtum umfassenden Interpretationsansatz wählt, der die unmittelbare Übertragung der Wahrscheinlichkeit der Wahrheit der Aussage einschließlich der Negationsregel für das Komplement auf das fragliche Ereignis eben nicht gestattet [43]. Unangemessen wäre das allgemeinere Modell erst dann, wenn es gegenüber der im konkreten Testfall möglichen Auswertung der Informationen nach dem Bayestheorem zu unvertretbaren Abweichungen führte.

Das ist indessen nicht der Fall. Im Rahmen des allgemeineren Modells fragen wir nach der Wahrscheinlichkeit . Ein Faktor im Rahmen der für maßgeblichen Beweiskette wird durch die Irrtumsmöglichkeiten bei der Aufnahme des Ereignisses A bestimmt. Zur Bestimmung dieses Faktors sind die Informationen über die Grundverteilung und die Unterscheidungsfähigkeit der Zeugen von Bedeutung. Das Ergebnis ist kein anderes als das von Basie für die Gesamtanalyse vorgeschlagene. Unterstellen wir weiter, daß alle anderen Glieder in der Kette den Faktor 1 erhalten, so ist der Wert für und der Wert für nach dem Additionstheorem = 0,65. Als Ergebnis für A erhalten wir dann: Bei nur einem Zeugen beträgt die Wahrscheinlichkeit dafür, daß es sich um ein Taxi der A-Gesellschaft gehandelt hat, mindestens 41%. Mit einem weiteren Zeugen steigt die Wahrscheinlichkeit auf mindestens 65%. Die Resultate sind weniger präzise als die mit dem Bayestheorem erhältlichen. Sie sind aber nicht falsch. Der größere Spielraum ist dem größeren Allgemeinheitsgrad des Modells geschuldet. Der Testfall widerlegt das allgemeinere Modell somit nicht, sondern beweist seine Korrektheit im analysierten Rahmen.

IV. Ein noch allgemeineres Modell?

Die Möglichkeiten der überkommenen mathematischen Wahrscheinlichkeitstheorie scheinen mit den bisherigen Entwicklungen ausgereizt. Das entbindet uns allerdings nicht von der Frage, ob wir damit schon ein für die Mathematik des Zeugenbeweises geeignetes Modell gefunden haben. Wir haben schon oben zur Reichweite des Modells angemerkt, daß mit ihm nur solche Situationen erfaßt werden, in denen die Aussagen das rechtlich relevante Ereignis zum Inhalt haben und nichts für das Gegenteil hergeben [44]. Nun lassen sich aber durchaus auch solche Situationen denken, in denen man einer Aussage mit dem Inhalt nicht nur nichts für A, sondern im Gegenteil etwas für entnehmen möchte: “Wenn dieser Zeuge A aussagt, dann spricht vieles für !” Einer solchen Situation können wir auch in unserem gegenüber dem Bayestheorem allgemeineren Ansatz nicht mehr Rechnung tragen. Ein weiteres Problem tritt hinzu. Was ist, wenn ein Zeuge A und ein anderer aussagt? Sicher können wir für beide Aussagen getrennt eine Glaubwürdigkeitsbewertung nach unserem Ansatz durchführen. Die möge das Ergebnis r für und s für haben. Das bedeutet: Aufgrund von ist , und aufgrund von ist . Ganz unabhängig davon, daß wir hier mit Ergebnissen konfrontiert werden könnten, in denen ist [45], ist völlig offen, wie wir die widersprechenden Aussagen zu einer konsistenten Gesamtbewertung für A und zusammenfassen sollen.

Ein allgemeines Modell, das beansprucht, auch die in unserem Modell nicht erfaßten Situationen zu meistern, ist vor mehr als 200 Jahren von Johann Heinrich Lambert [46] vorgestellt worden. Um es auch für die deutsche Diskussion dem unverdienten Vergessen zu entreißen [47], möchte ich Lambert zunächst in seiner eigenen Sprache zu Wort kommen lassen:

§ 237. Man setze zween Zeugen, die einerley aussagen. Des ersten Glaubwürdigkeit sey so beschaffen, daß er gegen 10 Wahrheiten 3 Unwahrheiten und 1 Lüge sagt: das ist, daß man ihm in 10 Fällen glauben, in 3 Fällen nicht glauben, und in einem Fall das Gegentheil glauben müsse, wenn man die Wahrheit treffen will. Dieses drücken wir nun so aus 10a + 3u + 1e. Eben so sey die Glaubwürdigkeit des andern 12a + 5u + 2e. Werden nun diese Fälle mit einander multiplicirt, so ist das Produkt

120aa + 86au + 15uu + 11eu + 2ee + 32ae.

Aus diesem Product wird 32ae weggelassen, weil es unmöglich ist, dem einen Zeugen die Aussage und dem anderen das Gegentheil zugleich zu glauben. Ferner wird 120aa + 86au zusammengezogen, und 206a daraus gemacht. Denn ungeacht man in den 86 Fällen dem einen Zeugen nicht glaubt, so glaubt man doch dem anderen. Auf gleiche Art zieht man 2ee und 11eu zusammen, und macht 13e daraus. Denn bey den 11eu fällt der Glaube auf das Gegentheil der Aussage. Demnach haben wir 206a + 15u + 13e für die Glaubwürdigkeit eines Zeugen, der so viel gilt, als beyde erstere zusammengenommen. Kömmt noch ein dritter Zeuge dazu, so wird seine Glaubwürdigkeit mit der erstgefundenen auf eben die Art multiplicirt, um die von einem Zeugen zu finden, der so viel gilt als alle drey zusammengenommen. Die allgemeine Formel ist diese:

Zeuge, Ma + Nu + Pe
Zeuge, ma + nu + pe
__________________________________________

Beyde, (Mm + Mn + mN)a + Nn.u + (Pp + Pn + pN)e.

Ist des einen Zeugen Glaubwürdigkeit vollständig, so ist n=p=0, demnach fallen im Product alle Glieder, u,e, weg, welches anzeigt, daß die übrigen Zeugen seine Glaubwürdigkeit, weder vermehren noch vermindern, weil alle übrigbleibende Fälle a sind. Hingegen wo keines Zeugen Glaubwürdigkeit vollständig ist, da kömmt in der Summe von allen noch immer u und e vor, und folglich auch nur Wahrscheinlichkeit für die Aussage.

§ 238. Sind die Zeugen in der Aussage nicht einstimmig, so sagen sie entweder ganz verschiedene Sachen oder das Gegentheil, weil die Aussage immer positiv seyn, und die Sache nicht dahingestellt lassen solle. Sagen sie ganz verschiedene Sachen, so kömmt keine Berechnung der Summe ihrer Glaubwürdigkeiten vor. Hingegen kömmt sie vor, wenn einige das Gegentheil sagen. In diesem Fall verwandelt man nur ihre Glaubwürdigkeit in die Glaubwürdigkeit des Gegentheils, und so wird, um bey vorigem Beyspiel zu bleiben, wenn der zweyte Zeuge das Gegentheil aussagt, 12a + 5u + 2e in 2a + 5u + 12e verwandelt. Nimmt man nun den ersten Zeugen 10a + 3u + e dazu, so ist die Summe der Glaubwürdigkeiten 76a + 15u + 53e, welche von der vorigen merklich verschieden ist. Ist der Zeuge, so das Gegentheil sagt, vollständig glaubwürdig, so wird in der allgemeinen Formel M=N=0, und so bleiben in dem Product nur die Fälle e, so daß folglich die Glaubwürdigkeit jeder anderer Zeugen demselben keinen Abbruch thut. Es ist auch an sich unmöglich, daß von zween Zeugen, die beyde eine vollständige Glaubwürdigkeit haben, der eine das Gegentheil der Aussage des anderen sagen sollte. Setzt man diesen Fall, so wird in der Formel M=N=n=p=0, und demnach in dem Product alle Glieder = 0. Das will nun sagen, es komme kein solcher Fall vor.

Schon bei der ersten Formel fällt auf, daß Lambert den Wahrscheinlichkeitsraum für eine Aussage in drei Bereiche aufteilt, einen für A (bei Lambert mit a, im folgenden mit p bezeichnet), einen für (bei Lambert mit e, im folgenden mit q bezeichnet) und einen dritten für den Unbestimmtheitsraum (u) zwischen A und . Da der Gesamtraum in Übereinstimmung mit Axiom (2) der überkommenen Wahrscheinlichkeitstheorie = 1 ist, muß man nach der Lambert-Aufteilung einen Satz akzeptieren können, in dem p + q < 1 ist. Dieser Satz verstößt gegen die Axiome der überkommenen Wahrscheinlichkeitstheorie. Wenn wir ihn akzeptieren, vollziehen wir den Übergang von der überkommenen additiven Wahrscheinlichkeitstheorie zu einer nicht-additiven Wahrscheinlichkeitstheorie. Shafer [48] hat gezeigt, daß in einer solchen nicht-additiven Wahrscheinlichkeitstheorie als mathematischer Beweistheorie die Lambert-Analyse in die folgenden Formeln für die Auswertung mehrerer Zeugenaussagen mündet:

32.

für die fragliche Sachverhaltsbehauptung und

33.

für die Negation der fraglichen Sachverhaltsbehauptung.

Der Unsicherheitsbereich (u) taucht in diesen Formeln nicht mehr auf. Er ergibt sich aus der nach Addition des q-Gesamtwerts und des p-Gesamtwerts verbleibenden Differenz zu 1.

Das von uns unter (B) entwickelte - gegenüber dem Bayestheorem allgemeinere - Modell ist in diesem noch allgemeineren Modell für die Auswertung mehrerer Zeugenaussagen zu einem Beweisthema und seinem Gegenteil enthalten. Was mich zögern läßt, es endgültig zu akzeptieren, sind Interpretations- und Übergangsschwierigkeiten. Mit der unter (B III 2 und 3) vorgeschlagenen Interpretation für konnten wir die bedingte Wahrscheinlichkeit bilden und sodann mit einer allgemeingültigen Schlußregel von auf übergehen. Jetzt aber sollen wir überlegen, was eine Aussage für A oder auch für austrägt und dafür p-Werte und/oder q-Werte angeben, die hernach bei mehreren Aussagen - durchaus in Übereinstimmung mit unserer Intuition - zu einem Gesamtwert nach den Lambert/Shafer-Formeln zusammengefaßt werden können. Was aber ist mit dem “Austragen für A und/oder ” gemeint? Wie kommt man von der Glaubwürdigkeitsanalyse zum fraglichen Sachverhaltsereignis? Die Konditionalisierung der überkommenen Wahrscheinlichkeitstheorie hat hier keinen Platz mehr. Sie ist durchaus konsequent von der schwedischen Beweiswertschule aufgegeben worden [49]. Eine präzise Antwort auf die obigen Fragen ist indessen auch diese Schule bislang schuldig geblieben [50]. Es bleibt noch Raum für weitere Grundlagenforschungen zur Mathematik des Zeugenbeweises.

Footnotes

[1] Vgl. nur die Monographie: Die Grundzüge des Beweisrechts im europäischen Zivilprozeß, eine rechtsvergleichende Studie, 1967; Kapitel VII aus Internationales Zivilprozeßrecht, 2. Aufl. 1983; das Stichwort Evidence, Law of in der Encyclopaedia Britannica.

[2] In deutscher Sprache zugänglich über Ekelöf, Beweiswert, Festschrift für Fritz Baur, 1981, S. 343 ff.; in englischer Sprache über Ekelöf, My Thoughts on Evidentiary Value, in: Gärdenförs/Hansson/Sahlin (Hrsg.), Evidentiary Value: Philosophical, Judicial, and Psychological Aspects of a Theory, Essays dedicated to Sören Hallden, 1983, S. 9 ff.

[3] Vgl. Anders Stening, Bevisvaerde, 1975 (schwedisch mit einer englischen Zusammenfassung); zur Diskussion in Schweden überhaupt die Beiträge in dem von Gärdenförs/Hansson/Sahlin herausgegebenen Sammelband Evidentiary Value, a.a.O. (alle in englischer Sprache).

[4] Diese Einschätzung habe ich in persönlichen Gesprächen mit Heinrich Nagel gewonnen.

[5] Eine Sicherheit, die auch mathematikintern nur im Verhältnis zu den angenommenen Axiomen und Ableitungsregeln gilt!

[6] Vgl. Jonathan Cohen, The Probable and the Provable, 1977.

[7] Vor Jahren angekündigt erscheint er vielleicht noch vor dieser Festschrift.

[8] In der folgenden Darstellung werden die mathematischen Sätze nach ihrer erstmaligen Einführung fortlaufend numeriert. Das erleichtert Verweisungen und erspart Wiederholungen.

[9] Aufgrund dieses Axioms kann man die überkommene Wahrscheinlichkeitstheorie auch als additiv bezeichnen. Später werden wir die Frage aufwerfen, ob nicht für das Zusammenfassen mehrerer Zeugenaussagen eine nicht-additive Wahrscheinlichkeitsauffassung das angemessenere Modell abgibt (unten D).

[10] Zu einer Konditionalisierung zwischen Aussage und Ereignis greift man auch im Rahmen der Rekonstruktion des Zeugenbeweises, solange man sich der Mittel der überkommenen Wahrscheinlichkeitstheorie bedient (vgl. unten B V 1).

[11] In einer nicht-additiven Wahrscheinlichkeitstheorie wird es nicht gelten.

[12] Vgl. zu den unterschiedlichen Begriffsbestimmungen Ernst Ludwig Nell, Wahrscheinlichkeitsurteile in juristischen Entscheidungen, 1983, S. 18 ff.

[13] Vgl. dazu schon Rüßmann, Allgemeine Beweislehre und Denkgesetze, Recht und Politik 1982, 62 ff.

[14] Vgl. Bender/Nack, Tatsachenermittlung vor Gericht, Bd. I, Glaubwürdigkeits- und Beweislehre, 1981, Rdnrn. 411 ff.

[15] So die Charakterisierung von Nell, Wahrscheinlichkeitsurteile in juristischen Entscheidungen, 1983, S. 51.

[16] Anregungen zu den mathematischen Ableitungen für den Beweisring und die Beweiskette habe ich durch einen Briefwechsel mit Herrn Staatsanwalt Günther Hähn, Berlin, gewonnen.

[17] A.a.O., Rdnr. 403.

[18] Vgl. hierzu auch Nell, Wahrscheinlichkeitsurteile ..., a.a.O., S. 54 ff.

[19] Vgl. zur Beschreibung Bender/Nack, a.a.O., Rdnr. 404.

[20] A.a.O., Rdnr. 406.

[21] Vgl. dazu schon das Widerlegungsbeispiel bei Koch/Rüßmann, Juristische Begründungslehre, 1982, § 32.

[22] Vgl. Physiologische und psychologische Streiflichter zum Zeugenbeweis, Festschrift für Wassermann, 1985, S. 789 ff.; Die Zeugenvernehmung im Zivilprozeß, DRiZ 1985, 41 ff.

[23] Zitiert nach Eggleston, Evidence, Proof, and Probability, 1978 S. 153.

[24] In: Festschrift für Baur, 1981, S. 343 ff.

[25] A.a.O., Rdnr. 497.

[26] A.a.O., Rdnr. 483.

[27] A.a.O., Rdnr. 499.

[28] Vgl. AK-ZPO/Rüßmann, vor § 373 Rdnrn. 26, 27, 34 f.

[29] Vgl. Bender/Nack, a.a.O., Rdnrn. 482 ff.

[30] A.a.O., Rdnrn. 500 ff.

[31] A.a.O., Rdnr. 482.

[32] Diesen Hinweis verdanke ich Herrn Staatsanwalt Günther Hähn, Berlin. Die Wahrscheinlichkeit für alle möglichen Ampelzustände darf nicht größer als 1 sein.

[33] Vgl. AK-ZPO/Rüßmann, vor § 373 Rdnr. 44.

[34] A.a.O., Rdnr. 361.

[35] Vgl. Koch/Rüßmann, Juristische Begründungslehre, 1982, § 32.

[36] Rupert Schreiber, Theorie des Beweiswerts für Beweismittel im Zivilprozeß, 1968, S. 31.

[37] In: Festschrift für Baur, 1981 S. 353.

[38] Hinter ihr verbirgt sich nichts anderes als das Bayestheorem mit der Ursprungswahrscheinlichkeit von 0,5. Vgl. auch Eggleston, Evidence, Proof, and Probability, 1976, S. 168.

[39] Gärdenförs, Probabilistic Reasoning and Evidentiary Value, in: Gärdenförs/Hansson/Sahlin, Evidentiary Value, a.a.O., S. 44 ff.

[40] Dieser und die im Text folgenden Werte sind auf die zweite Stelle hinter dem Komma gerundet. In der Prozentsprechweise ergibt das nur ganze Zahlen.

[41] Vgl. dazu Rüßmann, Indizien, Kausalität und Wahrscheinlichkeit, in: Pasternack (Hrsg.), Erklären, Verstehen, Begründen, Schriftenreihe des Zentrums Philosophische Grundlagen der Wissenschaften, Bd. 1, 1985, S. 139, 146 ff.

[42] Vgl. dazu oben unter B III 3.

[43] Vgl. dazu oben unter B III 2.

[44] Erreicht haben wir das durch die Interpretation von A* mit: “Ich habe erlebt, daß A.” Vgl. dazu oben B III 2 und 3.

[45] Das wäre eine Verletzung von Axiom (1) und (2) der Wahrscheinlichkeitstheorie.

[46] Neues Organon, oder Gedanken über die Erforschung und Bezeichnung des Wahren und dessen Unterscheidung von Irrtum und Schein, 1764.

[47] Für die anglo-amerikanische Diskussion hat das u.a. Glenn Shafer besorgt mit der Arbeit: Non-additive Probabilities in the Works of Bernoulli und Lambert, Archive for History of Exact Sciences 19 (1978), S. 309 ff.

[48] A.a.O., S. 358 ff.

[49] Der von Stening, Bevisvaerde, 1975, propagierte Übergang von der “Themamethode” zur “Wertmethode” ist nichts anderes als die Aufgabe der wahrscheinlichkeitstheoretischen Konditionalisierung. Zu den Interpretationsschwierigkeiten vgl. Koch/Rüßmann, Juristische Begründungslehre, 1982, § 35 2.

[50] Vgl. noch einmal die Beiträge in dem Sammelband “Evidentiary Value”, a.a.O. (N. 2).