Anwendung der repräsentativen Einzelfallprüfung bei Honorarkürzungen
Gründe:
I. Streitig ist die Rechtmäßigkeit einer Honorarkürzung wegen unwirtschaftlicher Behandlungsweise.
Der Kläger, als Laborarzt zur vertragsärztlichen Versorgung in E. zugelassen, rechnete im Quartal II/1997 112.610 kurative
Behandlungsfälle, 8.617 Mutterschaftsvorsorgefälle und 13 Fälle mit sonstigen Hilfen ab. Dadurch überschritt er den aus 12
Laborarztpraxen im Bereich der Kassenärztlichen Vereinigung (KÄV) Nordbaden ermittelten Fachgruppendurchschnitt um 174 % (kurativ)
bzw um 192 % (Mutterschaftsvorsorge). Mit dem Fallwert (kurativ) von 136,28 DM lag er 13,1 % über dem Fachgruppendurchschnitt.
Bei einzelnen Leistungen überschritt er den Fachgruppendurchschnitt erheblich.
Auf Grund eines gemeinsamen Prüfantrags der beigeladenen Landesverbände der Krankenkassen und der KÄV unterzog der Prüfungsausschuss
die Honorarabrechnung des Klägers, die zuvor sachlich-rechnerisch richtiggestellt worden war, der Wirtschaftlichkeitsprüfung.
Als Grundlage diente eine gutachterliche Stellungnahme des ebenfalls im Bereich der KÄV zugelassenen Laborarztes Dr. S., die
dieser nach Überprüfung von 11.281 Fällen, in denen Abrechnungen für die Tage 14. bis 18. April 1997 enthalten waren, angefertigt
hatte. Er beschrieb darin 33 Vorgehensweisen, bei denen dem Kläger unwirtschaftliches Handeln vorzuwerfen sei, und schlug
zudem die Durchführung von insgesamt 19 sachlich-rechnerischen Richtigstellungen vor. Auf der Grundlage seiner Feststellungen
regte Dr. S. an, die Abrechnung des Klägers um insgesamt 19.118.690 Punkte oder - fiktiv auf der Grundlage eines Punktwertes
von 10 Pf - um 1.911.869 DM zu kürzen. Dieser Betrag ergab sich durch Hochrechnung der in der Stichprobe von 10,02 % aller
kurativen Fälle festgestellten Unwirtschaftlichkeiten bei den einzelnen Leistungen auf 100 %.
Der Prüfungsausschuss übernahm in seinem Bescheid vom 29. Februar 2000 den Vorschlag des Gutachters sowie dessen Begründungen
und ergänzte sie hinsichtlich jedes beanstandeten Punktes um Fallbeispiele, die jeweils mit Patientenname und zugehöriger
Krankenkasse bezeichnet waren. Außerdem wandelte er in 68 - nicht näher bezeichneten - Fällen die vom Kläger abgerechnete
Kombination der Leistungen nach den Nummern 4438, 4716 und 4298 des Einheitlichen Bewertungsmaßstabs für vertragsärztliche
Leistungen (EBM-Ä [zusammen 2.600 Punkte]) in Nr 4805 EBM-Ä (250 Punkte) um, wodurch sich die Kürzung um weitere 159.800 Punkte
erhöhte. Insgesamt setzte der Prüfungsausschuss eine Honorarkürzung von 1.927.849,00 DM vor Berücksichtigung des Auszahlungspunktwertes
fest.
Der Kläger berief sich in seinem Widerspruch gegen diese Entscheidung zunächst darauf, dass Dr. S. als sein unmittelbarer
Konkurrent befangen sei, weil ihm die verfügten Kürzungen über eine Erhöhung des Punktwertes der Fachgruppe unmittelbar zugute
kämen. Des weiteren bezog er sich auf eine gutachtliche Stellungnahme zu den 33 beanstandeten Punkten, die Prof. Dr. M. vom
Institut für Klinische Chemie des Universitätsspitals Zürich auf seinen Auftrag hin angefertigt hatte. Prof. Dr. M. gelangte
zu der Bewertung, die ausgesprochenen Kürzungen seien ganz überwiegend nicht gerechtfertigt. Der Beklagte beauftragte daraufhin
den im Bereich der KÄV Hessen niedergelassenen Laborarzt Dr. R. mit der Begutachtung der Beschwerdesache. Dr. R. stellte in
seinem Gutachten den 33 im Prüfbescheid beanstandeten Punkten jeweils die Stellungnahme des Prof. Dr. M. gegenüber und gab
dazu seine eigene Bewertung unter Auflistung sämtlicher betroffener Fälle ab. In einem zusätzlichen 34. Punkt listete er weitere
von ihm festgestellte Auffälligkeiten auf. Sein Kürzungsvorschlag belief sich auf insgesamt 19.400.220 Punkte. Das Gutachten
des Dr. R. wurde den Prozessbevollmächtigten des Klägers am 12. September 2000 übersandt. Mit Telefax vom 5. Oktober 2000
lehnten diese Dr. R. ebenfalls wegen Besorgnis der Befangenheit ab, weil auch er in beruflicher Konkurrenz zum Kläger stehe.
Im weiteren Verlauf des Widerspruchsverfahrens wurde ein Gutachten des Statistikers Prof. Dr. G. vom 28. September 1999 zur
"Genauigkeit einer stichprobenweisen Einzelfallprüfung in Abhängigkeit von der Gesamtzahl der Behandlungsfälle des zu prüfenden
Kassenarztes", das die KÄV im Prüfungsverfahren hinsichtlich des nachfolgenden Quartals III/1997 eingeholt hatte, eingeführt.
Prof. Dr. G. gelangte darin zu dem Ergebnis, dass die Prüfung und Hochrechnung einer Stichprobenquote von 0,9 % einer Praxis
mit 30.000 Fällen (dh 270 Fälle) je Quartal dieselbe Relation - nicht die absolute Höhe - einer zumutbaren fehlerhaften Kürzung
zur Folge habe wie die Hochrechnung des Prüfungsergebnisses einer Stichprobenquote von 20 % (oder 200 Fällen) bei einer Praxis
mit 1.000 Behandlungsfällen. Der Kläger erhob Einwendungen gegen die Richtigkeit dieses Gutachtens, indem er eine kritische
Würdigung durch Prof. Dr. M. vorlegte.
Der Beklagte wies den Widerspruch des Klägers zurück. In dem 211 Seiten umfassenden Widerspruchsbescheid vom 15. März 2002
ist ausgeführt, der Befangenheitsantrag gegen den Sachverständigen Dr. R. sei durch Beschluss des Beschwerdeausschusses abgelehnt
worden, weil er nicht innerhalb von zwei Wochen nach Kenntniserlangung von der Person des Sachverständigen gestellt worden
sei und zudem kein Befangenheitsgrund ersichtlich sei. Auch der Beweisantrag des Klägers auf Einholung eines weiteren statistischen
Gutachtens von Prof. Dr. C. von der Universität Bonn sei abzulehnen gewesen, weil dieser über keine besseren oder anderen
Erkenntnisquellen verfüge als Prof. Dr. G.
Der Beklagte sah unter Berufung auf die Ausführungen von Prof. Dr. G. die Prüfmethode der "stichprobenweisen Einzelfallprüfung"
als sachgerecht und praktikabel an. Danach genüge bei der Praxis des Klägers eine Stichprobenquote von 10 % für eine ausreichend
genaue Hochrechnung. Für die Stichprobe seien die fünf Abrechnungstage 14. bis 18. April 1997 zufällig ausgewählt worden,
welche ca 10 % der Fälle der Praxis umfassten. Diese Auswahl sei nicht nur praktikabel, sondern auch zweckmäßig, weil hierdurch
eine Momentaufnahme der gesamten Laborpraxis entstehe; dass sich "Ausreißertage" darunter befänden, sei nicht ersichtlich.
Ein statistischer Vergleich mit der Fachgruppe der Laborärzte sei nicht sachgerecht, da bei kleineren Fachgruppen - hier 12
Laborärzte im Bereich der KÄV Nordbaden - die stichprobenweise Einzelfallprüfung mit Hochrechnung nach Auffassung des Sachverständigen
Prof. Dr. G. zu genaueren Ergebnissen führen könne als der Vergleich des zu prüfenden Arztes mit wenigen Ärzten seines Fachgebiets.
Er - der Beklagte - sei auch berechtigt, andere als in der Prüfvereinbarung verankerte Prüfmethoden anzuwenden, wenn in besonders
gelagerten Fällen keine der bisher in der Praxis entwickelten und durch die Rechtsprechung bestätigten Prüfmethoden geeignet
seien.
In der Sache schloss sich der Beklagte jeweils den Darlegungen seines Sachverständigen Dr. R. vollinhaltlich an und stellte
die daraus resultierenden Streichungen bzw Umsetzungen in einer Liste zusammen. Den insgesamt für zutreffend erachteten Kürzungsbetrag
ermittelte er, indem zunächst für jede einzelne Abrechnungsnummer deren für unwirtschaftlich erachtete Gesamtzahl innerhalb
aller Beanstandungen festgestellt wurde. Dies ergab einen Katalog von 94 beanstandeten Abrechnungsnummern. Bei 28 Gebührenordnungsnummern
in der geprüften Stichprobe von 11.281 Fällen wurde die Streichung einer einzigen Leistung verfügt. Wie bei allen anderen
Nummern auch wurden sodann die zu streichenden Leistungen auf 100 % der Fälle hochgerechnet. Dem so ermittelten Wert an zu
streichenden Leistungen wurde die Ansatzhäufigkeit der betreffenden Leistung in der Anzahlstatistik nach sachlich-rechnerischer
Richtigstellung gegenübergestellt. Sofern die Häufigkeit der Leistungsnummer in der Anzahlstatistik geringer war als die Zahl
der nach Hochrechnung zu streichenden Leistungen, wurde diese geringere Zahl gestrichen, dh die Leistungsnummer blieb unvergütet.
Die Gesamtzahl der auf diese Weise zu kürzenden Leistungen belief sich auf 20.714.880 Punkte. Hiervon wurden - ebenfalls nach
Hochrechnung - 202.250 Punkte im Hinblick auf erfolgte Umsetzungen zugunsten des Klägers abgezogen, sodass sich ein Kürzungsvolumen
von 20.512.630 Punkten ergab. Von diesem bereinigten Kürzungsvolumen zog der Beklagte sodann einen Sicherheitsabschlag in
Höhe von 5 % ab, sodass die verbleibende Kürzung 19.486.998,5 Punkte umfasste. Der Beklagte berief sich bei der Bemessung
dieses Sicherheitsabschlags auf seinen Ermessensspielraum und darauf, dass bereits bei einer Stichprobenquote von nur 0,9
% der Gesamtfallzahl eine Konfidenzwahrscheinlichkeit von mindestens 95 % gegeben sei, durch die erfolgte Prüfung von 10 %
der Fälle aber ein wesentlich zuverlässigeres Ergebnis erzielt werde. Unter Beachtung des Verböserungsverbots sei die etwas
geringere Kürzung der Honoraranforderung durch den Prüfungsausschuss zu bestätigen gewesen.
Die Klage gegen den Widerspruchsbescheid ist ebenso wie die Berufung ohne Erfolg geblieben. Das Landessozialgericht (LSG)
hat keine hinreichenden Gründe dafür gesehen, dass der Kläger unter Zugrundelegung der Ansicht eines objektiv und vernünftig
denkenden Beteiligten Misstrauen gegen die Unparteilichkeit des Sachverständigen Dr. R. haben könne. Der Bescheid des Beklagten
sei auch in materieller Hinsicht rechtmäßig. Er habe zu Recht angenommen, dass die Regelprüfmethode des statistischen Kostenvergleichs
wegen der geringen Größe der Vergleichsgruppe nicht habe herangezogen werden können. Deshalb habe er sich der Methode einer
stichprobenweisen Einzelfallprüfung mit Hochrechnung bedienen dürfen. Angesichts der hohen Zahl an Behandlungsfällen reiche
es aus, wenn nur ungefähr 10 % aller Fälle einer Einzelfallprüfung unterzogen worden seien. Die von den Prüfgremien in nebenamtlicher
Tätigkeit wahrgenommene Wirtschaftlichkeitsprüfung müsse praktikabel bleiben. Zudem sei die Behandlungsweise des Klägers durch
sich wiederholende Untersuchungsabläufe geprägt, bei denen er aus medizinisch-wissenschaftlichen Gründen immer dieselben Leistungen
für erforderlich halte. Aus diesem Grunde könne bereits anhand weniger Einzelfälle davon ausgegangen werden, dass in allen
Fällen, in denen die jeweiligen Untersuchungen erfolgten, dieselben Leistungen in gleichem Umfang berechnet worden seien.
Bei dieser Sachlage sei es nicht erforderlich gewesen, ein weiteres Sachverständigengutachten zur Genauigkeit der stichprobenweisen
Einzelfallprüfung in Abhängigkeit von der Gesamtzahl der Behandlungsfälle einzuholen. Nicht zu beanstanden sei auch die zufällige
Auswahl der geprüften Behandlungsfälle der Abrechnungstage vom 14. bis 18. April 1997. Die Behandlungsweise des Klägers sei
in dem in den Punkten 1 bis 34 des Widerspruchsbescheids beschriebenen Umfang unwirtschaftlich. Die Stellungnahmen des Dr.
R., auf die sich der Beklagte gestützt habe, seien nachvollziehbar. Deshalb bestehe kein Anlass, ein Sachverständigengutachten
zur Notwendigkeit der vom Kläger erbrachten Leistungen einzuholen. Auch die Höhe der festgesetzten Honorarkürzung sei rechtsfehlerfrei
ermittelt worden. Der Beklagte sei nicht verpflichtet gewesen, einen höheren Sicherheitsabschlag als 5 % des errechneten Kürzungsbetrags
einzuräumen, da er zu Recht von einer hohen Konfidenzwahrscheinlichkeit ausgegangen sei. Schließlich habe der Beklagte nicht
mehr Leistungen gestrichen, als der Kläger überhaupt berechnet habe.
Mit seiner Revision rügt der Kläger eine Abweichung von den Anforderungen, die das Bundessozialgericht (BSG) für die Prüfmethode
der Einzelfallprüfung mit Hochrechnung im Urteil vom 8. April 1992 (BSGE 70, 246, 254 f = SozR 3-2500 § 106 Nr 10 S 52 f) aufgestellt habe und die im Urteil vom 14. Juli 1993 (6 RKa 13/91 - USK 93115) bekräftigt worden seien. Insbesondere habe der Sicherheitsabschlag nicht auf 5 % reduziert werden dürfen. Darüber
hinaus sei die Durchführung der Einzelfallprüfung fehlerhaft, weil zu keiner Zeit offen gelegt wurde, nach welcher Methode
oder nach welchen abstrakten Kriterien die Stichprobe ausgewählt worden sei; dies verletze das rechtliche Gehör. Das LSG habe
außerdem gegen seine Verpflichtung zur Amtsermittlung verstoßen, indem es kein weiteres statistisches Gutachten herangezogen
und auch kein zusätzliches medizinisch-technisches Gutachten über die Richtigkeit seiner - des Klägers - Leistungsabrechnung
eingeholt habe. Das vom Beklagten und vom LSG zur Stützung seiner Ansicht verwertete Gutachten des Dr. R. beruhe wesentlich
auf dem Vorgutachten des als befangen ausgeschlossenen Dr. S. und sei daher nicht verwertbar. Die Entscheidung des LSG verletze
zudem §
106 Fünftes Buch Sozialgesetzbuch (
SGB V), indem sie die rechtswidrige Wahl der Prüfungsmethode durch den Beklagten gebilligt habe. Eine eingeschränkte Einzelfallprüfung
komme nach der Rechtsprechung des BSG nur in Betracht, wenn aussagekräftigere Beweismethoden nicht zur Verfügung stünden.
Dies sei hier jedoch der Fall, denn die Größe der Vergleichsgruppe von 12 Laborärzten schließe die statistische Vergleichsprüfung
nicht aus. Da dem Beklagten bei der Auswahl der Prüfungsmethode und der Beurteilung der Geeignetheit der statistischen Vergleichsprüfung
entgegen der Auffassung des LSG kein Beurteilungsspielraum zukomme, habe die Einzelfallprüfung mit Hochrechnung nicht durchgeführt
werden dürfen. Weiterhin habe keine Reduzierung der Anforderungen an die Einzelfallprüfung mit Hochrechnung erfolgen dürfen.
Bei den geprüften Laborleistungen müsse berücksichtigt werden, dass derzeit ca 3.500 verschiedene Untersuchungsleistungen
abgerechnet werden könnten, von denen jede einzelne ihre spezifischen Besonderheiten aufweise. Bei einer derartigen Vielfalt
an Leistungen könne eine repräsentative Stichprobe nur erreicht werden, wenn auch der Umfang der Stichprobe entsprechend groß
gewählt werde. Die Halbierung der Stichprobe durch den Beklagten habe dazu geführt, dass bei zahlreichen Untersuchungsarten
nur ein einziger Behandlungsfall mit der entsprechenden Leistung in der Stichprobe enthalten gewesen sei; Beanstandungen bei
diesen geringen Fallzahlen rechtfertigten indes nicht den Schluss, der Kläger habe in den nicht überprüften gleichartigen
Behandlungsfällen in gleicher Weise unwirtschaftlich gehandelt.
Das LSG habe des weiteren die Grenzen des dem Beklagten zukommenden Beurteilungsspielraums verkannt, indem es die im Widerspruchsbescheid
behaupteten Unwirtschaftlichkeiten trotz seiner - des Klägers - detaillierten Einwendungen insgesamt und ohne nachvollziehende
Prüfung unter Hinweis auf die Besetzung des Beklagten mit sachkundigen Vertretern akzeptiert habe. Schließlich habe der Beklagte
ausweislich seines Bescheids im Rahmen der Wirtschaftlichkeitsprüfung sachlich-rechnerische Richtigstellungen durchgeführt
und deren Ergebnisse von der Stichprobe auf 100 % hochgerechnet. Das sei nach der gefestigten Rechtsprechung des BSG unzulässig.
Zudem habe er unstatthafte Doppelkürzungen vorgenommen, indem er die Absetzungen auf Grund der Höchstwertregelungen des EBM-Ä
bei zahlreichen im Einzelnen angegebenen Leistungsnummern nicht hinreichend berücksichtigt habe. Diese stünden den Praxisbudgets
in der Wirkung gleich. Für letztere habe das BSG bereits entschieden, dass Honorarkürzungen bei budgetierten Leistungen grundsätzlich
nur mit dem Wert erfolgen dürften, den diese Leistungen im Budget tatsächlich hätten. Diese Doppelkürzung habe beispielsweise
bei der Leistung nach Nr 4417 EBM-Ä dazu geführt, dass er - der Kläger - auf Grund der Kombination der Kürzungen letztlich
keine einzige dieser Leistungen vergütet erhalten habe.
Der Kläger beantragt,
das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003, das Urteil des Sozialgerichts Karlsruhe vom 11.
Dezember 2002 und den Bescheid des Beklagten vom 15. März 2002 aufzuheben und den Beklagten zu verpflichten, erneut über den
Widerspruch gegen den Bescheid des Prüfungsausschusses vom 29. Februar 2000 unter Beachtung der Rechtsauffassung des Gerichts
zu entscheiden;
hilfsweise, das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003 aufzuheben und die Sache zur erneuten
Verhandlung und Entscheidung an das Landessozialgericht zurückzuverweisen.
Der Beklagte beantragt,
die Revision zurückzuweisen.
Er hält das Urteil des LSG für zutreffend. Der Kläger habe nicht substantiiert dargelegt, weshalb der Sachverständige Dr.
R. befangen gewesen sein soll. Eine statistische Vergleichsprüfung sei im Hinblick auf die Inhomogenität der nur aus 12 Laborarztpraxen
bestehenden Vergleichsgruppe ausgeschlossen. Zudem habe eine Auswertung der Anzahlstatistiken des Klägers ergeben, dass 37
% der von ihm abgerechneten Gebührenordnungsnummern nur von 50 % oder weniger Ärzten der Fachgruppe erbracht würden. Die Besonderheiten
des Falles hätten es erfordert, bei der deshalb durchgeführten Einzelfallprüfung mit Hochrechnung eine geringere Zahl von
Behandlungsfällen als die bislang geforderten 20 % aller Fälle zu prüfen. Entgegen dem Vortrag des Klägers habe er - der Beklagte
- keine sachlich-rechnerische Richtigstellung vorgenommen, obwohl er hierzu im Rahmen einer Annexkompetenz ohne weiteres befugt
sei. Auch die Höchstwertregelungen des EBM-Ä seien beachtet worden; die verfügten Kürzungen hätten nicht dazu geführt, dass
für einzelne Leistungen eine Vergütung vollständig entfallen sei. Im Hinblick auf die standardisierten Abrechnungsvorgänge
sei es nicht erforderlich gewesen, einen höheren Sicherheitsabschlag als 5 % zu gewähren.
Die zu 1. beigeladene KÄV Baden-Württemberg, die zum 1. Januar 2005 die Rechtsnachfolge der ursprünglich beigeladenen KÄV
Nordbaden angetreten hat, stellt keinen Antrag und schließt sich im Übrigen den Ausführungen des Beklagten an. Die weiteren
Beigeladenen äußern sich im Revisionsverfahren nicht.
II. Die Revision des Klägers ist begründet. Die Vorinstanzen haben die Klage gegen den Bescheid des Beklagten zu Unrecht abgewiesen.
Dieser ist rechtswidrig und beschwert den Kläger im Sinne von §
54 Abs
1 Satz 2
Sozialgerichtsgesetz (
SGG). Der Beklagte war nicht berechtigt, von der Regelprüfmethode einer statistischen Vergleichsprüfung abzuweichen. Außerdem
hat er bei Durchführung der Einzelfallprüfung mit anschließender Hochrechnung ohne rechtfertigenden Grund gegen die ihn bindenden
Festlegungen zu dieser Methode in der Prüfvereinbarung verstoßen. Bereits aus diesen Gründen muss der Bescheid aufgehoben
und der Beklagte verpflichtet werden, unter Beachtung der Rechtsauffassung des Senats erneut über den Widerspruch des Klägers
gegen den Bescheid des Prüfungsausschusses zu entscheiden. Die darüber hinaus von der Revision geltend gemachten Verfahrensmängel
sind deshalb ohne Bedeutung.
Rechtsgrundlage für Honorarkürzungen wegen unwirtschaftlicher Behandlungsweise ist §
106 Abs
2 Satz 1
SGB V in der hier noch maßgeblichen Fassung des Gesundheitsstrukturgesetzes (GSG - vom 21. Dezember 1992, BGBl I 2266). Danach wird die Wirtschaftlichkeit der Versorgung durch arztbezogene Prüfungen ärztlicher
und ärztlich verordneter Leistungen nach Durchschnittswerten beurteilt. Nach den hierzu von der Rechtsprechung entwickelten
Grundsätzen ist die statistische Vergleichsprüfung die Regelprüfmethode (stRspr, s BSG SozR 4-2500 § 106 Nr 4 RdNr 5, mwN).
Die Abrechnungswerte des Arztes werden mit denjenigen der Fachgruppe oder mit denen einer nach verfeinerten Kriterien gebildeten
engeren Vergleichsgruppe im selben Quartal verglichen. Ergänzt durch die sog intellektuelle Betrachtung, bei der medizinisch-ärztliche
Gesichtspunkte berücksichtigt werden, ist dies die Methode, die typischerweise die umfassendsten Erkenntnisse bringt. Ergibt
die Prüfung, dass der Behandlungsaufwand des Arztes je Fall bei dem Gesamtfallwert, bei Sparten- oder Einzelleistungswerten
in offensichtlichem Missverhältnis zu dem durchschnittlichen Aufwand der Vergleichsgruppe steht, ihn nämlich in einem Ausmaß
überschreitet, das sich im Regelfall nicht mehr durch Unterschiede in der Praxisstruktur oder in den Behandlungsnotwendigkeiten
erklären lässt, hat das die Wirkung eines Anscheinsbeweises der Unwirtschaftlichkeit (stRspr, zB BSG SozR 4-2500 § 106 Nr
3 RdNr 8, mwN).
Die Prüfgremien sind jedoch berechtigt und verpflichtet, ausnahmsweise auch andere Prüfmethoden anzuwenden oder neu zu entwickeln,
wenn sich im Einzelfall die Prüfung nach Durchschnittswerten als nicht aussagekräftig oder nicht durchführbar erweist (BSGE
75, 220, 224 = SozR 3-2500 § 106 Nr 24 S 135; BSGE 84, 85, 86 f = SozR 3-2500 § 106 Nr 47 S 250 f; SozR aaO Nr 55 S 310 f). Im Interesse einer gleichmäßigen Rechtsanwendung hat der
Senat allerdings betont, dass plausible Gründe vorliegen müssen, um von einer Vergleichsprüfung nach Durchschnittswerten abzusehen
(BSGE 77, 53, 58 = SozR 3-2500 § 106 Nr 33 S 189). So ist als Voraussetzung für die Anwendung eines sog Vertikalvergleichs verlangt worden,
dass einem Horizontalvergleich nach Durchschnittswerten die Grundlage entzogen ist, weil entweder der zu prüfende Arzt eine
unvergleichbare individuelle Praxisausrichtung hat oder weil dessen Grundannahme, die Vergleichsgruppe handele im Durchschnitt
insgesamt wirtschaftlich, nicht zutrifft (BSGE 84, 85, 86 = SozR 3-2500 § 106 Nr 47 S 250; SozR aaO Nr 55 S 308). Der Senat hat zudem klargestellt, dass generelle Bedenken der
Prüfgremien gegen die Geeignetheit der Regelprüfmethode einer statistischen Vergleichsprüfung nach Durchschnittswerten keine
Rechtfertigung dafür sein können, zu der Methode einer repräsentativen Einzelfallprüfung mit anschließender Hochrechnung überzugehen.
Deshalb ist die Begründung, eine repräsentative Einzelfallprüfung führe zu einem genaueren und gerechteren Ergebnis als die
Prüfung nach Durchschnittswerten, als Überschreitung der Grenzen des Beurteilungsspielraums zurückgewiesen worden (BSGE 77,
53, 56 = SozR 3-2500 § 106 Nr 33 S 187).
Darüber hinaus geht der Senat in ständiger Rechtsprechung davon aus, dass die Vergleichsprüfung nach Durchschnittswerten nicht
nur hinsichtlich des Gesamtfallwertes, sondern unter der Voraussetzung einer hinreichenden Vergleichbarkeit ebenso auch zur
Überprüfung der Wirtschaftlichkeit des Ansatzes einer einzelnen Leistungsposition bzw mehrerer zu Leistungssparten zusammengefasster
Leistungspositionen des EBM-Ä herangezogen werden kann (BSG SozR 4-2500 § 106 Nr 3 RdNr 9 mwN; zur Bestimmung der Grenze zum
offensichtlichen Missverhältnis bei Einzelleistungsprüfungen s auch Urteil vom heutigen Tage, B 6 KA 79/03 R - juris). Die Prüfung nach Durchschnittswerten setzt allerdings voraus, dass die Vergleichsgruppe ausreichend groß und hinreichend
homogen zusammengesetzt ist, um statistisch aussagekräftige Ergebnisse zu erhalten (BSG SozR 3-2500 § 106 Nr 36 S 204; BSG
SozR 4-2500 § 106 Nr 2 RdNr 11 ff). Die Kriterien der Homogenität und der Größe einer Vergleichsgruppe stehen dabei in einer
Wechselbeziehung zueinander in dem Sinne, dass eine Gruppe um so größer sein muss, je weniger homogen sie ist, während für
sehr homogene Gruppen auch kleine Zahlen ausreichend sein können (Clemens in Schulin, Handbuch des Sozialversicherungsrechts,
Band 1, Krankenversicherungsrecht, 1994, §
35 RdNr 58; Engelhard in Hauck/Noftz,
SGB V, Stand Dezember 2004, K §
106 RdNr 333 f). In diesem Sinne hat der Senat für den statistischen Vergleich von Röntgenleistungen bei Internisten eine Gruppengröße
von neun Ärzten mit derselben Röntgengenehmigung für ausreichend erachtet (BSG, Urteil vom 27. April 1982 - 6 RKa 7/79 = USK 82196). Bei Pathologen hat die Instanzrechtsprechung im Hinblick auf deren hohe Fallzahlen bereits eine aus sieben
bis neun Praxen bestehende Vergleichsgruppe genügen lassen (vgl Engelhard in Hauck/Noftz, aaO RdNr 334).
Das Festhalten an der Prüfung nach Durchschnittswerten als Regelprüfmethode beruht auch darauf, dass diese Prüfart in ihrem
Anwendungsbereich in praktikabler Weise und mit vertretbarem Aufwand zu tragfähigen Erkenntnissen führt. Auch wenn mit dieser
Beweismethode nicht alle Unwirtschaftlichkeiten in vollem Umfang aufgedeckt werden können, genügt sie doch am besten den Erfordernissen
einer effizienten und gleichmäßigen Wirtschaftlichkeitsprüfung der Quartal für Quartal in sehr großer Zahl anfallenden vertragsärztlichen
Leistungen. Dem gegenüber kann der mit einer eingeschränkten Einzelfallprüfung verbundene Aufwand zur Verifizierung von Unwirtschaftlichkeiten
unter Berücksichtigung aller dem Arzt in jedem Einzelfall zur Verfügung stehenden Einwendungen um ein Vielfaches höher sein
und letztlich - wie der vorliegende Fall zeigt - dazu führen, dass die Prüfung nicht mehr in angemessener Zeit und mit noch
beherrschbarem Aufwand in rechtsstaatlich einwandfreier Weise abgewickelt werden kann. Die weiteren Prüfmethoden können daher
immer nur dann herangezogen werden, wenn und soweit auf Grund besonderer Umstände die Regelprüfmethode keine beweistauglichen
Ergebnisse liefert.
Auf dieser Grundlage können die Gründe, die der Beklagte im Widerspruchsbescheid benannt hat, im vorliegenden Fall ein Absehen
von der Anwendung der Regelprüfmethode der statistischen Vergleichsprüfung nicht rechtfertigen. Der Beklagte hat ausgeführt,
bei kleinen Fachgruppen könne die stichprobenweise Einzelfallprüfung mit Hochrechnung der Kürzungen zu genaueren Ergebnissen
führen als der Vergleich des zu prüfenden Vertragsarztes mit den wenigen Ärzten seines Fachgebiets. Unabhängig davon, dass
bei Laborärzten Praxisbesonderheiten in diesem Sinne nicht gesehen werden könnten, würden diese auch nur dann zum Tragen kommen,
wenn ein Vergleich mit der Fachgruppe erfolge. Diese Begründung lässt nicht erkennen, dass der Beklagte das Leistungsverhalten
in der Fachgruppe anhand der Abrechnungsstatistiken näher analysiert und auf dieser Grundlage eine Bewertung vorgenommen hat,
ob die Gruppe bei den für die Prüfung wesentlichen Leistungen für einen statistischen Vergleich hinreichend groß und - in
wechselseitiger Abhängigkeit - ausreichend homogen ist.
Von den 12 Laborärzten im Bereich der KÄV erbrachten nach den Angaben der Beigeladenen zu 1. im Revisionsverfahren immerhin
acht Praxen Leistungen in einem Umfang, dass von hauptberuflich in Vollzeit betriebenen Laboren ausgegangen werden kann. Dies
stellt bei entsprechender Homogenität eine für die Prüfung nach Durchschnittswerten ausreichend große Vergleichsgruppe dar.
Darüber hinaus ist eine fehlende Homogenität insbesondere bei den wenigen Leistungen, die den überwiegenden Teil der vom Beklagten
für unwirtschaftlich erachteten und deshalb gekürzten Leistungen ausmachen, nicht ohne weiteres ersichtlich. Beispielsweise
wurde die Leistung nach Nr 4298 EBM-Ä, auf die fast ein Drittel des gesamten Kürzungsvolumens entfällt, von neun der 12 Laborarztpraxen
abgerechnet. Die Leistung nach Nr 4515 EBM-Ä, auf die weitere 20 % der Kürzungssumme entfallen, brachten 11 Laborärzte in
Ansatz. Die Leistung mit dem dritthöchsten Kürzungsbetrag, Nr 4625 EBM-Ä, rechneten 10 der 12 Laborarztpraxen ab, und zwar
im Durchschnitt in genau derselben Häufigkeit wie der Kläger. Der Hinweis des Beklagten darauf, dass bei Laborärzten Praxisbesonderheiten
nicht gesehen werden könnten, weist vielmehr darauf hin, dass er insgesamt von einer relativ homogenen Leistungsstruktur in
dieser Fachgruppe ausging. Der Beklagte hat die Vergleichsgruppe von 12 Laborärzten auch nicht als generell ungeeignet zur
Durchführung einer statistischen Prüfung beurteilt, sondern die Abweichung von der Regelprüfmethode lediglich damit gerechtfertigt,
dass die stichprobenweise Einzelfallprüfung mit Hochrechnung "zu genaueren Ergebnissen führen könne". Diese auch in dem Gutachten
von Prof. Dr. G. nicht näher belegte Möglichkeit rechtfertigt es jedoch nicht, bei kleinen Vergleichsgruppen generell und
ohne Untersuchung ihrer Homogenität von der in §
106 Abs
2 Nr
1 SGB V als Regelprüfmethode ausgestalteten Durchschnittsprüfung abzusehen und auf die mit erheblichen Nachteilen behaftete eingeschränkte
Einzelfallprüfung mit Hochrechnung auszuweichen. Nur wenn die fehlende Homogenität oder eine zu geringe Größe der Vergleichsgruppe
belegt und auch keine Abhilfe durch eine Vergrößerung der Vergleichsbasis - etwa im Wege der Einbeziehung der Abrechnungswerte
von weiteren Ärzten derselben Fachgruppe aus anderen KÄVen (vgl BSG, Urteil vom 19. November 1985, 6 RKa 13/84 = USK 85215; Urteil vom 1. Oktober 1990, 6 RKa 32/89 = USK 90102) - möglich ist, kann auf eine der nachrangigen Prüfmethoden zurückgegriffen werden. Die Darlegungen des Beklagten
im Widerspruchsbescheid lassen eine Prüfung dieser Voraussetzungen nicht sichtbar werden; sie zielen vielmehr darauf, bei
kleinen Vergleichsgruppen in unstatthafter Weise stets der Einzelfallprüfung den Vorzug gegenüber einer Prüfung nach Durchschnittswerten
zu geben.
Auch die Erwägungen im Urteil des SG können nicht plausibel machen, dass die Fachgruppe der Laborärzte im Bezirk Nordbaden "ausgesprochen inhomogen" ist. Die
Inhomogenität der erbrachten ärztlichen Leistungen kann nicht dadurch belegt werden, dass nur sieben von 12 Praxen (dh 58
%) und nur hinsichtlich ihrer Fallzahlen und Gesamtfallwerte betrachtet werden. Es mag sein, dass bei näherer Untersuchung
einzelner selten oder nur schwerpunktmäßig von wenigen Praxen erbrachter Leistungsnummern der zahlreichen Leistungen aus Abschnitt
O des EBM-Ä eine hinreichende Homogenität nicht mehr angenommen werden kann. Das rechtfertigt es dann aber nur, in Bezug auf
diese betroffenen Einzelleistungen eine nachrangige Prüfmethode zur Anwendung zu bringen. Bei allen anderen Leistungsnummern,
die keine Anzeichen für Inhomogenität aufweisen, muss es bei der Regelprüfmethode des Vergleichs nach Durchschnittswerten
verbleiben. Denn soweit aussagekräftige statistische Vergleichszahlen vorliegen, dürfen diese bei der Prüfentscheidung nicht
unberücksichtigt bleiben (BSGE 77, 53, 60 = SozR 3-2500 § 106 Nr 33 S 191).
Abgesehen von der nicht ausreichend begründeten Wahl der nachrangigen Prüfmethode einer repräsentativen Einzelfallprüfung
mit anschließender Hochrechnung kann der Bescheid des Beklagten auch noch aus einem anderen Grund keinen Bestand haben. Denn
selbst wenn hinsichtlich einzelner Leistungen diese Prüfmethode in zulässiger Weise herangezogen werden kann, war der Beklagte
doch nicht berechtigt, ohne zwingende Gründe von den in der Prüfvereinbarung normativ vorgegebenen Regeln für die Durchführung
einer repräsentativen Einzelfallprüfung mit anschließender Hochrechnung abzuweichen. Nach den Feststellungen des Berufungsgerichts
ist in § 16 Abs 4 der für das Prüfungsquartal geltenden Prüfvereinbarung vorgesehen, dass bei der Prüfung einer repräsentativen
Anzahl von Beispielsfällen mindestens 20 % der Fälle zu untersuchen und im Rahmen der Hochrechnung der festgestellten Unwirtschaftlichkeit
auf die Gesamtheit aller Fälle ein Sicherheitsabschlag von 25 % vorzunehmen ist. Diese Regelung entspricht ersichtlich den
Vorgaben, die das BSG als regelmäßige Voraussetzung für die Zuverlässigkeit dieser Beweismethode aufgestellt hat (BSGE 70,
246, 255 = SozR 3-2500 § 106 Nr 10 S 52 f). Entgegen der Auffassung der Vorinstanzen ist der Beklagte bei Durchführung der Wirtschaftlichkeitsprüfung
grundsätzlich an die Bestimmungen der Prüfvereinbarung gebunden. Bei der auf der Grundlage von §
106 Abs
3 Satz 1 und
3 SGB V abgeschlossenen Prüfvereinbarung handelt es sich um einen Normvertrag auf der Ebene des Gesamtvertrags. Zu den wesentlichen
Merkmalen eines solchen Normvertrages gehört es, dass seine Regelungen für die von ihm betroffenen Beteiligten verbindlich
sind. Nur soweit die Vorschriften in der Prüfvereinbarung gegen höherrangiges Recht verstoßen, insbesondere mit den bundesrechtlichen
Vorgaben zur effektiven Überwachung der Wirtschaftlichkeit der ärztlichen Leistungserbringer nicht vereinbar sind, sind sie
nach den allgemeinen Regeln der Normenhierarchie nichtig und damit auch für den Beklagten nicht maßgeblich (BSGE 77, 53, 60 = SozR 3-2500 § 106 Nr 33 S 191; Nr 51 S 278; Nr 53 S 289 f).
Ein solcher Fall liegt hier indessen nicht vor. Es ist nicht ersichtlich, dass bei Beachtung der Regelungen in § 16 Abs 4
der Prüfvereinbarung eine wirksame Überwachung der Wirtschaftlichkeit der Vertragsärzte im Anwendungsbereich der Prüfmethode
der repräsentativen Einzelfallprüfung mit anschließender Hochrechnung verhindert wird. Wie der vorliegende Fall zeigt, trägt
vielmehr gerade die Heranziehung dieser nachrangigen Prüfmethode ohne zwingenden Grund zu einem Verlust an Effizienz der Wirtschaftlichkeitsprüfung
bei. Wird hingegen der Vorrang der Prüfung nach Durchschnittswerten auch hinsichtlich der Einzelleistungen beachtet, ist das
Problem des Prüfaufwands bei der in der Prüfvereinbarung vorgeschriebenen Begutachtung von mindestens 20 % der Behandlungsfälle
bei übergroßen Fallzahlen wesentlich entschärft.
Auch hinsichtlich des vorgesehenen Sicherheitsabschlags von 25 % im Rahmen der Hochrechnung der festgestellten Unwirtschaftlichkeit
sind zwingende Gründe für eine Reduzierung nicht erkennbar. Der Sicherheitsabschlag berücksichtigt den Umstand, dass selbst
bei einer Konfidenzwahrscheinlichkeit von 95 % oder höher ein Restrisiko verbleibt, dass der hochgerechnete Kürzungsbetrag
unrichtig und damit zu hoch ist. Die absolute Höhe der - potentiellen - Unrichtigkeit des Kürzungsvolumens (sog "Konfidenzbereich"
der hochgerechneten Kürzung) nimmt mit zunehmender Gesamtfallzahl der geprüften Grundgesamtheit sogar zu. Da jede einzelne
Honorarkürzungsmaßnahme mit an Sicherheit grenzender Wahrscheinlichkeit rechtmäßig sein muss, ist über einen ausreichend bemessenen
Sicherheitsabschlag zu gewährleisten, dass die hochgerechnete Kürzung in jedem Einzelfall nicht zu hoch ausfällt. Dem trägt
der Abschlag von 25 % Rechnung. Es genügt aus Rechtsgründen nicht, dass sich - wie geltend gemacht - Kürzungen über den Verlauf
längerer Zeiträume nach derselben Methode als "statistisch gerecht" ausgleichen mögen. Die Rechtmäßigkeit von Honorarkürzungen
setzt voraus, dass sie sich in dem zu Grunde liegenden Prüfzeitraum mit an Gewissheit grenzender Wahrscheinlichkeit als rechtmäßig
erweisen (§
128 SGG). Denn ob es überhaupt über einen längeren Zeitraum zu nachfolgenden Prüfungen und Kürzungsmaßnahmen kommt, steht nicht fest,
zumal die Wirtschaftlichkeitsprüfung gerade auf eine Verhaltensänderung der Ärzte, bei denen unwirtschaftliches Handeln festgestellt
worden ist, abzielt.
Im Übrigen ist die Vorgehensweise des Beklagten im Einzelnen in sich widersprüchlich und führt zu nicht zu rechtfertigenden
Ergebnissen. So ist bei der Überprüfung der Stichprobe von 11.181 Behandlungsfällen (mit über 15.000 Behandlungsscheinen)
der Ansatz von drei Leistungen nach Nr 4378 EBM-Ä als unwirtschaftlich erkannt worden. Diese drei Leistungen wurden auf 30
als unwirtschaftlich erbrachte Leistungen hochgerechnet, wobei der Kläger diese Leistung insgesamt nur elfmal abgerechnet
hatte. Dieser elfmalige Ansatz der Leistungen ist gestrichen worden, obwohl der zweifelhafte Ansatz von drei Leistungen bei
11.181 Behandlungsfällen keine Rückschlüsse auf eine unwirtschaftliche Behandlungsweise zulässt.
Des Weiteren wurden die auf der Grundlage der Einzelfallprüfung mit anschließender Hochrechnung als unwirtschaftlich erkannten
Leistungen in vollem Umfang gestrichen. Dabei wurde nicht berücksichtigt, dass ein erheblicher Teil der Leistungen bereits
nach Anwendung des Regelwerkes nicht vergütet worden war und damit nur die verbleibenden Ansätze dieser Leistungen in Höhe
des als unwirtschaftlich erkannten Prozentsatzes der hochgerechneten Leistungen hätte gestrichen werden dürfen. Die auch insoweit
rechtswidrige Vorgehensweise des Beklagten wird exemplarisch belegt durch die Kürzung bei der Leistung Nr 4417 EBM-Ä. Auf
der Grundlage der Hochrechnung wurden hier 1.847 Ansätze der Leistung als unwirtschaftlich erkannt. Diese hatte der Kläger
insgesamt 3.837 mal abgerechnet. Hiervon setzte die KÄV in Anwendung des Regelwerkes 3.063 Leistungen ab, sodass dem Kläger
noch der Ansatz von 774 Leistungen verblieb. Ausgehend von einer als unwirtschaftlich erkannten Quote von ca 50 % hätten die
verbleibenden Leistungen auch nur in diesem Umfang gekürzt werden dürfen. Unter Zugrundelegung der nach der Hochrechnung als
unwirtschaftlich erkannten 1.847 Leistungsansätze hat der Beklagte jedoch - im Widerspruch zu seinen eigenen Festlegungen
in Höhe eines nur 50 %igen unwirtschaftlichen Ansatzes - alle 774 verbliebenen Leistungen nach Nr 4417 EBM-Ä als unwirtschaftlich
gekürzt.
Der Beklagte hat die im Einzelnen aufgeführten Vorgaben hinsichtlich der Auswahl der Prüfmethode und der konkreten Durchführung
einer gegebenenfalls statthaften repräsentativen Einzelfallprüfung mit anschließender Hochrechnung nicht beachtet. Sein Bescheid
ist daher aufzuheben. Er wird nunmehr unter Beachtung der Rechtsauffassung des Senats erneut über den Widerspruch des Klägers
gegen den Prüfbescheid vom 29. Februar 2000 zu entscheiden haben.
Die Kostenentscheidung beruht auf §
197a Abs
1 Satz 1
SGG iVm §§
154 ff
Verwaltungsgerichtsordnung (
VwGO). Danach trägt der unterlegene Beklagte die Kosten des Verfahrens in allen Instanzen (§
154 Abs
1 VwGO). Eine Aufteilung der Kosten des Revisionsverfahrens gemäß §
155 Abs
2 VwGO ist nicht erforderlich, obwohl der Kläger hier zunächst - erstmals - eine vollständige Aufhebung des Widerspruchsbescheids
beantragt, sich später aber auf einen Bescheidungsantrag beschränkt hat (§
99 Abs
3 Nr
2 SGG). Denn der in Verfahren der Wirtschaftlichkeitsprüfung aus prozessualen Gründen zweckmäßige Bescheidungsantrag ändert nichts
daran, dass das wirtschaftliche Interesse des Vertragsarztes regelmäßig auf die Beseitigung der Honorarkürzungen abzielt (vgl
Wenner/Bernard, NZS 2003, 568, 572), sodass der Streitwert auch bei einem solchen Antrag den vollen Kürzungsbetrag umfasst. Dementsprechend hat die nachträgliche
Beschränkung des Revisionsbegehrens auf eine Neubescheidung auch bei der Kostengrundentscheidung keine Auswirkungen; der Kläger
muss deshalb auch keinen Bruchteil der Kosten für das Revisionsverfahren tragen. Die Beigeladenen können keine Kostenerstattung
beanspruchen, da sie keine Anträge gestellt haben (§
162 Abs
3 VwGO).