Screen Scraping – Wann ist das Auslesen und die Veröffentlichung fremder Daten zulässig ?

Die Masse an Informationen im Internet macht es zunehmend schwieriger sich in der Vielzahl von Angeboten zu orientieren, Relevantes von Irrelevantem zu trennen oder auch sich einfach einen Überblick zu verschaffen.

Aus diesem Grund wird (wohl zu Recht) oft prognostiziert, dass Aggregatoren (oder anderen Intermediären) im Internet die Zukunft gehört. Aggregatoren sammeln alle Arten von (Medien-)inhalten und Informationen und stellen diese für eine bestimmte Zielgruppe in aufbereiteter Form neu zusammen.

Da Informationen aller Art im Internet die entscheidenden Wirtschaftsgüter sind, wird solcherlei Verarbeitung von Daten und vor allen deren Veredlung auch weiter an Bedeutung gewinnen. Bereits heute sieht man, dass Aggregatoren in vielen Bereichen als Gatekeeper fungieren, von deren (Nicht-)Vermittlung – wie z.B. bei Preisvergleichsseiten – bereits heute schon einiges abhängt. Auch die „Informationsmaschine“ Google profitiert stark von dieser Entwicklung.

Um fremde Daten auslesen und in entsprechend aggregierter Form veröffentlichen zu können, setzen viele Unternehmen das sogenannte „Screen Scraping“ oder auch „Web Scraping“ als Technologien ein, die der Gewinnung von Informationen durch gezieltes Extrahieren der benötigten Daten dienen. Diese Unternehmen agieren nachfolgend als Informationsvermittler, die besondere Werte schaffen, indem sie Daten aus verschiedenen Informationsquellen sammeln, organisieren und verfügbar machen.

Typisches Beispiel für die wachsende Zahl an Aggregatoren sind die Preisvergleichsportale (wie www.guenstiger.de, www.billiger.de, www.idealo.de)oder auch andere Internetbörsen für Flüge oder andere touristische Angebote, die die Angebote zahlreicher Einzelanbieter auf der eigenen Webseite in aggregierter Form zugänglich und damit vergleichbar machen.

Aber auch in vielen anderen Bereichen stellt die Zusammenstellung und Auswertung von (fremden) Daten ein interessantes Geschäftsmodell dar, wie eine Vielzahl von News-Aggregatoren zeigt (z.B. Socialmedian, Yigg oder auch Rivva). Wenn die etablierten Medienanbieter hier nicht mithalten, droht ein Verlust ihrer (noch) zentralen Rolle. Zu der Frage inwieweit Texte und News „übernommen“ werden dürfen vgl. auch meine Beitrag Contentdiebstahl & Recht – Vorgehen gegen die Übernahme von Texten im Internet

Im Grunde genommen sind auch die Suchmaschinen wie Google, Yahoo & Co nichts anderes als Datenauswertungen, die den Nutzern das Suchen und Finden von Informationen im Internet erleichtern sollen.

Die Aggregatoren selbst rechtfertigen sich oft mit dem Argument, dass sie ja eigentlich nur als Traffic-Treiber zu den Content-Seiten fungieren. Doch nicht immer entspricht es den Interessen des eigentlichen Dateninhabers, dass fremde Anbieter ihre Seiten auslesen und im Internet (noch einmal) veröffentlichen. Mit der wachsenden Bedeutung solcher Aggregatoren drohen im übrigen natürlich auch Mißbrauchsrisiken, wenn z.B. die Daten nämlich nicht mehr neutral ausgewertet werden, sondern Einfluss auf die Bewertung oder das Ranking genommen und so die Weiterleitung zu einzelnen Seiten kanalisiert wird.

Zu der Frage, wann und unter welchen Voraussetzungen das Auslesen fremder Webseiten ohne ausdrückliche Zustimmung zulässig ist, hat kürzlich das OLG Frankfurt (Entscheidung vom 5.3.2009 Az. 6 U 221/08) geurteilt. Mit dem Urteil und den sich daraus ergebenden Schlussfolgerungen bezüglich des Urheberrechts- und Datenbankschutzes, aber auch des Wettbewerbsrechts beschäftigt sich der nachfolgende Beitrag.

I. Die Entscheidung des OLG Frankfurt

In dem Gerichtsverfahren stritten sich ein Flugunternehmen und der Betreiber einer Webseite, die neben vielen anderen Anbietern eben auch die Angebote der Webseite dieses Flugunternehmens indiziert und über eine entsprechende Suchfunktion im Internet angeboten hatte.

Die Frankfurter Richter sahen zunächst einmal kein Problem, weil die ausgelesenen Reisedaten nicht urheberrechtlich geschützt seien. Eine Argumentation die man meines Erachtens gut nachvollziehen kann.

Neben dem urheberrechtlichen Schutz sind Betreiber entsprechender Seiten aber oft auch als Datenbankhersteller gemäß §87b Abs.1 UrhG gegen die Verwendung ihrer Daten geschützt.

Das OLG Frankfurt entschied jedoch, dass das Flugunternehmen auch hieraus im vorliegenden Fall keine Unterlassungs- oder Schadenersatzansprüche herleiten kann, weil eben nur unwesentliche Teile der Datenbank genutzt würden.

Hierzu wird weiter ausgeführt:

Die Datensätze einzelner Flugverbindungen, die die Antragstellerin gegebenenfalls ausliest und auf ihrer eigenen Internetseite wiedergibt, können nicht als „wesentliche Teile“ der Datenbank im Sinne des Gesetzes angesehen werden. Diese Datensätze sind auch nicht gemäß § 87 b I, 2 UrhG geschützt, da deren Nutzung durch die Antragstellerin sich im Rahmen einer normalen Auswertung der Datenbank hält und die berechtigten Interessen der Antragsgegnerin nicht unzumutbar beeinträchtigt. Im Rahmen der insoweit vorzunehmenden Interessenabwägung ist zu berücksichtigen, dass die Antragstellerin mit ihrem Angebot ein berechtigtes Bedürfnis der Verbraucher befriedigt, kostengünstige Angebot aufzufinden, und der Antragsgegnerin damit letztlich auch Kunden zuführt. Unter diesen Umständen kann dem Anliegen der Antragsgegnerin, ihre Kunden zum Zwecke der effektiven Bewerbung sonstiger Leistungen ausschließlich über die Nutzung ihrer eigenen Internetseite zum etwaigen Vertragsschluss zu führen, kein höheres Gewicht beigemessen werden.

Das Gericht stellte in dieser Sache maßgeblich darauf ab, dass die Informationen im Internet frei zugänglich seien und eben nicht durch technische Vorkehrungen gegen solche Datenextraktion geschützt seien. Für die Zulässigkeit des Screen Scraping spreche außerdem, dass das Flugunternehmen den Zugriff die Inhalte auch nicht vom Abschluss eines entsprechenden Nutzungsvertrages abhängig mache.

Demgemäß sei auch ein Verstoß gegen das virtuelle Hausrecht des Seitenbetreibers zu verneinen. Schließlich wurden auch die geltend gemachten wettbewerbsrechtlichen Ansprüche zurückgewiesen, weil mangels tatsächlicher Störungen des Betriebsablaufs des Flugunternehmens keine gezielte Behinderung im Sinne des § 4 Nr. 10 UWG angenommen werden könne.

II. Bewertung zum Scraping von Daten

Zunächst ist festzustellen, dass das Auslesen fremder Daten und die Veröffentlichung auf einer eigenen Internetplattform nicht schon grundsätzlich unzulässig ist.

Unter Berücksichtigung früherer Entscheidungen zum Datenbankschutz ist bei der Frage nach der Zulässigkeit von Screen Scraping aber sehr genau zu differenzieren. Dabei kommt es maßgeblich auf zwei Kriterien an.

Zum einen in welchem Umfang und welche Art von Daten aus der fremden Webseite ‚herausgezogen‘ und anderweitig verwendet werden. Soweit die extrahierten Daten urheberrechtlichen Schutz genießen, dürfte die anderweitige Veröffentlichung in aller Regel unzulässig sein. Soweit die Daten aber – z.B. wegen mangelnder Schöpfungshöhe – keinen Urheberrechtsschutz genießen (wie vorliegend die Flugdaten mit Preis), so ist für die Beurteilung der Rechtswidrigkeit maßgebend, ob wesentliche Teile der Datenbank extrahiert werden oder nur einzelne – nicht die Rechte des Datenbankherstellers tangierende – (Teil-)datensätze.

Weiterhin kommt es nicht nur nach dem oben dargestellten Urteils, sondern auch auf Grundlage der sogenannten Paperboy-Entscheidung des Bundesgerichtshofs (BGH) darauf an, ob der Betreiber der betroffenen Datenbank technische Maßnahmen ergriffen hat, um ein solches Auslesen der Daten durch Dritte zu verhindern. Wenn nämlich solche Mechanismen umgangen werden, kann man zumindest im Regelfall von einer Rechtsverletzung ausgehen. Andernfalls müsse – wenn kein Urheber- oder Datenbankrechte eingreife – die Datenextraktion eben geduldet werden.

Die Zulässigkeit des Screen Scrapings wird auch in anderen Rechtsordnungen in ähnlichen Kategorien diskutiert.

III. Praxistipps

Aus den vorgenannten Grundsätzen ergeben sich folgende Empfehlungen für Unternehmen die eine Extraktion und Aggregation fremder Webseiten zu ihrem Geschäftsmodell haben:

– extrahierte Daten dürfen nur dann veröffentlicht werden, wenn sie nicht über das Urheberrecht geschützt sind
– Daten dürfen ausgelesen und verwendet werden, wenn es sich dabei um unwesentliche Teile der Datenbank handelt
– technische Vorkehrungen gegen Screen-Scraping dürfen nicht umgangen werden

Seitenbetreiber, die zum Schutz ihrer Daten unabhängig davon, ob diese urheberrechtlich oder im Sinne einer Datenbank gemäß § 87 b UrhG geschützt sind, einen weiteren rechtlichen Ansatzpunkt begründen wollen, um bei der Aggregation ihrer Daten Unterlassung oder auch Schadenersatz begründen zu können, ist zu raten,

technische Vorkehrungen gegen das Auslesen zu installieren
– die Nutzung der Daten allgemein von einer Anmeldung und damit einem Nutzungsvertrag abhängig macht (natürlich nur wenn das auch ansonsten für das Geschäftsmodell passt). Einseitige Hinweise auf der Webseite, dass das Auslesen nicht erlaubt wird, dürften nach dem Urteil des OLG Frankfurt insoweit nicht weiterhelfen.

Wenn die ausgelesenen Daten urheberrechtlich oder als Datenbank geschützt sind, müssen betroffene Webseitenbetreiber die Extraktion keinesfalls dulden und haben entsprechende Unterlassungs- und Schadenersatzansprüche.

Aggregatoren stellen – unabhängig von der rechtlichen Zulässigkeit des konkreten Geschäftsmodells – eine gewisse Gefahr für die Anbieter der „originalen“ Inhalte. Diese ziehen Besucher und Page Impressions (PI) ab und versichen of selbst sich als Plattform für Werbung zu etablieren. Demgemäß geht Facebook in den USA bereits gerichtlich gegen Social Networking Aggregator Power www.power.com vor.

Aufgrund der interessanten Perspektiven, die das Internet gerade für Aggregatoren bietet, wird dies aber sicher nicht das letzte Urteil zu dieser Thematik gewesen sein. Betroffene Unternehmen sowohl der einen als auch der anderen „Seite“ sollten insofern die Rechtsprechung weiter beobachten…

Weiterführend zum Thema:

Contentdiebstahl & Recht – Vorgehen gegen die Übernahme von Texten im Internet

Big Data & Recht – Wem „gehören“ eigentlich Daten oder wie Google nun gegen SEO-Tools vorgeht

NACHTRAG 15.06.2009:

Bei NETZWERTIG.COM gibt es zu dem Artikel „Was werden die Newsmedien der Zukunft kosten?“ in den Kommentaren gerade eine spannnende Diskussion, die sich auch unter anderem auch mit dem Geschäftsmodell der Aggregation und deren Auswirkungen auseinandersetzt.

Gerne stehen wir bei weitergehenden Fragen oder Interesse an einem entsprechenden Inhouse Workshop telefonisch unter +49 (0) 711 860 40 025 oder via E-Mail carsten.ulbricht@menoldbezler.de zur Verfügung.

Comments

  1. Hier wurde mal wieder ein sehr interessantes Thema aufgegriffen.

    Trotzdem ist es dann wohl doch immer wieder Fall abhängig … ebenfalls stellt sich die Frage, was mit Daten passiert, die man nicht nur ausliesst, sondern selbst in einer Datenbank speichert. Gibt es hier einen (rechtlichen) Unterschied?

    Angenommen ich lade öffentlich zugängliche Veranstaltungsdaten (Fussballspiele/Volksläufe/etc.) vom DLV/DFB usw. herunter – wie sieht es hier aus?

    Könnten Sie hierzu Ihre Einschätzung in Bezug auf das obige Urteil abgeben?

  2. Hallo,
    der Beitrag ist zwar schon etwas älter, aber trotzdem ein sehr interessantes Thema.
    LG

  3. Danke für die gute Zusammenfassung, werde das bookmarken und ggfls. auf neuere Infos dazu sichten! Da wir etwas Ähnliches in unserer Branche beabsichtigen, kommen wir u.U. ggfls. noch auf Sie zu!

  4. Schöne Zusammenfassung der rechtlichen Seite zum Thema Screen Scraping.

  5. Hallo,
    sehr interessanter Beitrag! Wie sieht es denn aus, wenn man eine Reihe von Adressen z.b. aus Telefonbuch.de ausliest? Treffen die o.g. Kriterien zu?
    – ist eine Adresse urheberrechtlich geschuetzt? Oder gilt hier das gesamte Telefonbuch?
    – es werden nur 100 Adressen ausgelesen, was in Relation zum gesamten Telefobuch wohl als „unwesentlicher Teil der Datenbank“ angesehen werden kann.
    – es gibt keine technischen Vorkehrungen gegen Screen-Scraping, die umgangen werden koennten.
    Mich wuerde hierzu Deine rechtliche Meinung interessieren.

    • culbricht says:

      Vielen Dank für den freundlichen Kommentar.

      Eine Adresse ist urheberrechtlich sicher nicht geschützt. Eine Vielzahl von Adressen kann aber unter Umständen aber als Sammel- oder Datenbankwerk Schutz genießen. Die weiteren Fragen bedürfen auch hinsichtlich der datenschutzrechtlichen Beurteilung allerdings einer individuellen Prüfung…

      Mehr dazu auch unter http://www.rechtzweinull.de/archives/623-Big-Data-Recht-Wem-gehoeren-eigentlich-Daten-oder-wie-Google-nun-gegen-SEO-Tools-vorgeht.html

      Nachdem ich mit diesem Blog ja schon zahlreiche Informationen kostenlos im Internet zur Verfügung stelle, gleichzeitig dieses Know-How und die Beratung in diesem Bereich als spezialisierter Rechtsanwalt meine wirtschaftliche Grundlage darstellen, bitte ich ansonstehn aber um Verständnis, dass ich solcherlei spezifische Fragen nicht einfach kostenlos beantworten kann. Hinzu kommt, dass ich neben berufsrechtlichen Vorgaben die einer kostenlosen Rechtsberatung entgegenstehen für die Richtigkeit meiner Auskünfte ja auch hafte.

      Für weitergehende Fragen kann man mich gerne jederzeit – zunächst einmal natürlich völlig unverbindlich – telefonisch kontaktieren.

  6. Stefan Burger says:

    Hallo,
    danke für diesen informativen Artikel! Hat sich denn seit Verfassen des Artikels etwas geändert bezüglich der Zulässigkeit des Auslesens? Ich frage vor allem bezüglich der technischen Vorkehrungen, die ein Webseitenbetreiber einbauen kann: ist denn das Einsetzen eines Captchas eine technische Vorkehrung? Captchas können doch auch mittels Bots umgangen werden, ist dann das Scrapen immernoch zulässig?

  7. Suiram Taschenbier says:

    Danke für den super Artikel. Wie sieht es denn grob aus, wenn die Seite Facebook- und Twitter-Buttons anbietet, die zum Teilen der Inhalte einladen? Ist dies ein Hinweis darauf, dass ich die Inhalte in ggf. zusammengefasster Form auf meiner Seite einbinden darf?

  8. Hallo Herr Ulbricht,

    sehr guter Artikel!

    Wie schätzen Sie denn folgenden Fall ein?

    Auf einer Seite wird dem Nutzer ein Textfeld angeboten, in das er die URL einer anderen Webseite kopieren kann.
    Klickt er auf den Suchen-Button gibt es zwei Möglichkeiten:
    1. Teile des HTML Codes der eingetragenen URL werden ausgelesen und visuell aufbereitet. Der User hat dabei die Möglichkeit, manuell an der visuellen Aufbereitung der ausgelesenen Textteile Hand anzulegen, bevor er diese aufbereiteten Textteile in der Datenbank speichert.
    2. Für die eingegebene URL existiert bereits ein aufbereiteter Datensatz in der Datenbank. Dem User wird dieser Datensatz dargestellt.

    Hinweis: Die Datensätze aus der Datenbank (respektive die „geklauten“, aber auf andere Weise dargestellten, Textteile) werden nicht in einer öffentlich zugänglichen, filterbaren, Liste dargestellt. Man gelangt an die Datensätze ausschließlich über die Eingabe der zugehörigen URL in das Textfeld.

    Vielen Dank im Voraus

  9. Hallo Herr Ulbricht,

    super interessantes Thema. Wie sieht es mit folgendem Fall aus:

    – Auslesen der Daten einer öffentlichen Plattform (Beispiel Produktbewertungen auf Amazon)
    – Statistische Aufarbeitung der Daten (Beispiel: Welcher Hersteller hat über alle Produkte die besseren Bewertungen – Amazon oder Samsung?)
    – Veröffentlichung der Ergebnisse (Zusammenfassung, nicht die originalen Daten) unter Nennung der Quelle auf einer kommerziellen Seite

    Besten Dank im Voraus.

    • Ich war unaufmerksam: „Statistische Aufarbeitung der Daten (Beispiel: Welcher Hersteller hat über alle Produkte die besseren Bewertungen – Amazon oder Samsung?) „–> „Apple oder Samsung“ sollte es lauten.

      • culbricht says:

        Hallo Raoul,

        zunächst vielen Dank für den Kommentar.

        Zu der Frage ist zu sagen, dass man das so pauschal wohl kaum beantworten kann.

        Darüber hinaus bitte ich um Verständnis, dass ich entsprechend konkrete Rechtsfragen, für deren Beantwortung ich übrigens auch hafte, hier nicht „einfach so“ beantworten kann. Nachdem ich in meinem Blog zahlreiche Informationen ohnehin schon kostenlos öffentlich zur Verfügung stelle und unsere Beratung die wirtschaftliche Grundlage der Kanzlei darstellt, ist es wohl auch verständlich, dass man ggfls eben einen konkreten Auftrag erteilen muss.

        Schlussendlich verbietet übrigens auch unserer anwaltliches Berufsrecht eine kostenlose Beratung im Einzelfall.

        Man kann mich also jederzeit gerne – natürlich kostenlos und unverbindlich – anrufen oder anmailen, sein Anliegen schildern und ich geben ein konkretes Angebot für die Beratung ab. Dann bekommt der Mandant ein entsprechend individuelles Ergebnis, für dessen Richtigkeit ich dann natürlich auch gerne hafte.

        Also gerne Kontakt aufnehmen. Wir machen gegebenenfalls gerne auch Startup kompatible Angebote 😉

  10. Michael says:

    Hallo Herr Culbricht,
    vielen Dank für diesen ausführlichen Artikel. Ich hätte eine Frage zum Thema Urheberrecht. Wie kann man feststellen ob dieses auf einen Seiteninhalt zutrifft?

    Ich frage mich ob ich öffentlich zugängliche Daten zu Firmen scrapen darf. Dabei werden auf Unterseiten Kontaktdaten zu Unternehmen öffentlich gemacht, ohne Schutz (Login, Bild etc.) und diese Informationen findet man auch in jedem örtlichen und im Impressum der Firmen (Anschrift, Telefonnummer, Faxnummer).

    Vielen Dank.

  11. Sven Houverrold says:

    Hallo Herr Dr. Ulbricht,

    Sie haben diesen Text sehr gut dargestellt. Herzlichen Dank hierfür.

    Für ein kommendes Webprojekt möchte ich Kennzahlen von einer bzw. mehreren Informationswebseiten beziehen bzw. „Scrapen“. Diese Daten werden sicherlich vom Anbieter selbst eingekauft, da es sich um öffentliche Unternehmenskennzahlen handelt. Jedoch werden diese frei zugänglich für jedermann dargestellt. Es gibt also keinen Login oder einen Schutzmechanismus für diese Kennzahlen.

    Kann man auch in Ihren Augen dieses Kennzahlen-Werk von verschiedenen Seiten scrapen und selbst in eigenen Tabellen zusammenstellen? Bzw. diese Kennzahlen auch für eigene Berechnungen nutzen?

    Auf dem eigenen Webprojekt wird dem User gegen monatliches Entgelt eben dieser Service angoten, dass ein umfassendes Sammelwerk an Kennzahlen über eine Hand bezogen werden und analysiert werden kann.

    Ich freue mich auf Ihre Antwort und Einschätzung.

    Herzlichen Dank,
    Sven Houverrold

  12. Puh, das ist ja schwieriger als ich gedacht habe :-). Wir haben uns auch mit dem Thema Crawling beschäftigt und versuchen für Boote und Kajaks einen Crawler aufzustellen, aber auch Vereine und Mitglieder sollen gecrawlt werden. Dass das dann so einen rechtlichen Charakter aufweist hätte ich nicht gedacht, aber jetzt weiß ich dank des Beitrags zumindest schon etwas mehr.

    LG

    Jonathan

  13. Hallo,
    sehr interessanter Beitrag! Wie sieht es denn aus, wenn man eine Reihe von Adressen z.b. aus Telefonbuch.de ausliest? Treffen die o.g. Kriterien zu?
    – ist eine Adresse urheberrechtlich geschuetzt? Oder gilt hier das gesamte Telefonbuch?
    – es gibt keine technischen Vorkehrungen gegen Screen-Scraping, die umgangen werden koennten.

Speak Your Mind

*

Sicherheitsfrage *