Datenlecks Bild

Steueroptimierung in Ungarn: Nur 2 Prozent lokale Abgaben

Steueroptimierung in Ungarn: Nur 2 Prozent lokale Abgaben Ungarn ist für viele Unternehmer längst kein Geheimtipp mehr. Die niedrige Körperschaftsteuer von 9 Prozent...

Wofür brauchen Ausländer eine Steuernummer in Ungarn?

Wofür brauchen Ausländer eine Steuernummer in Ungarn? Wer als Ausländer in Ungarn mehr vorhat als eine Woche Urlaub am Balaton, begegnet früher oder später einer...

EWIV auflösen wegen Fehlern bei der Gründung

EWIV auflösen wegen Fehlern bei der Gründung Eine EWIV, die mit Fehlern gegründet wurde, ist kein Fundament – sie ist ein Zeitproblem. Wer bei der Gründung einer...

31. Januar 2026

Datenlecks beim Scannen: Wohin gehen Ihre Dokumente bei OCR und Cloud-Diensten

Als ich neulich meinen Steuerberater besuchte, fiel mir etwas auf, das mich nachdenklich stimmte: Er fotografierte meine Belege mit seinem Smartphone ab – schnell, effizient, praktisch. „Das geht direkt in die Cloud“, sagte er beiläufig. In diesem Moment fragte ich mich: Wohin genau? Und wer kann diese sensiblen Dokumente noch sehen? Diese Frage wurde zum Ausgangspunkt meiner Recherche, die mich tief in die Welt der OCR-Technologie, Cloud-Dienste und Datenlecks führte.

Die unsichtbare Reise Ihrer Dokumente

Wenn Sie heute ein Dokument scannen oder fotografieren, beginnt eine Reise, deren Route den meisten Nutzern völlig unbekannt ist. Ich traf mich mit mehreren Datenschutzexperten und IT-Sicherheitsspezialisten, um genau diese Route nachzuverfolgen. Was ich herausfand, war ernüchternd.

Die meisten modernen Scanner-Apps nutzen OCR-Technologie (Optical Character Recognition), um aus Ihren Bildern durchsuchbare Textdokumente zu machen. Klingt praktisch – und ist es auch. Aber hier beginnt bereits das Problem: Diese Texterkennung findet häufig nicht auf Ihrem Gerät statt, sondern in der Cloud. Ihre Dokumente verlassen also Ihr Smartphone oder Ihren Scanner und werden zu externen Servern hochgeladen.

Was ich bei meinem Test mit gängigen Apps entdeckte

Für meine Recherche testete ich verschiedene populäre Lösungen. Mit Microsoft Lens scannte ich ein Dokument und beobachtete den Datenverkehr. Tatsächlich: Die Datei wurde zur Verarbeitung an Microsoft Azure Computer Vision gesendet. Bei Google Drive war es ähnlich – hier kam die Google Cloud Vision API zum Einsatz. Selbst die beliebte Dropbox-Scanner-Funktion verarbeitet Dokumente auf externen Servern.

Ein IT-Sicherheitsexperte, den ich interviewte, erklärte mir: „Die wenigsten Nutzer wissen, dass ihre Dokumente oft mehrere Rechenzentren durchlaufen, bevor sie wieder auf dem eigenen Gerät landen. Und bei jedem Zwischenstopp besteht theoretisch die Gefahr eines Datenlecks.“

Ergänzend empfehlen wir:
Sind meine Daten noch sicher Die 5 besten Seiten zur Ueberpruefung von Datenlecks 2026

Die großen Player und ihre Datenschutz-Versprechen

Natürlich wollte ich wissen, wie die großen Anbieter mit dieser Verantwortung umgehen. Meine Recherche führte mich zu verschiedenen Anbietern und ihren Sicherheitskonzepten.

Microsoft und die EU Data Boundary

Bei Microsoft stieß ich auf das Konzept der „EU Data Boundary“. Die Idee klingt gut: Daten europäischer Kunden sollen Europa nicht verlassen. Doch wie ich bei Dr. Datenschutz las, gibt es hier noch erhebliche Einschränkungen. Nicht alle Microsoft 365-Dienste sind vollständig eingebunden, und bestimmte Support- und Diagnosedaten können weiterhin außerhalb der EU verarbeitet werden.

Ein Datenschutzbeauftragter, mit dem ich sprach, formulierte es so: „Es ist ein Schritt in die richtige Richtung, aber kein Garant für absolute Sicherheit. Die Europäische Datenschutzbeauftragte sieht das kritisch.“

Google und die KI-Kontroverse

Bei Google wurde es noch komplizierter. Die neue Funktion Gemini (früher Bard) integriert sich zunehmend in die Dokumentenverarbeitung. Doch wie ich in einer Beschwerde gegen Googles AI Overview las, gibt es erhebliche Bedenken bezüglich der Datennutzung. Die EU-Kommission und sogar Frankreichs Wettbehörde haben hier Untersuchungen eingeleitet.

Was mich besonders beunruhigte: Viele dieser KI-Systeme lernen aus den verarbeiteten Daten. Landet Ihr gescanntes Dokument also möglicherweise im Trainingspool einer KI? Die Antworten der Unternehmen blieben bei meinen Anfragen vage.

Amazon und die unsichtbaren Datenpfade

Besonders interessant wurde mein Gespräch mit einem Cloud-Architekten, der täglich mit AWS arbeitet. Er zeigte mir, wie Amazon Textract funktioniert – ein mächtiges OCR-Tool, das von vielen Unternehmen genutzt wird. „Das Problem“, erklärte er mir, „sind nicht die Dienste selbst, sondern ihre Konfiguration.“

Er führte aus: „Ich habe Fälle gesehen, wo Unternehmen ihre Dokumente in Amazon-S3-Buckets hochgeladen haben, die falsch konfiguriert waren. Plötzlich waren vertrauliche Geschäftsdokumente öffentlich zugänglich.“ Tatsächlich fand ich bei meiner Recherche mehrere dokumentierte Fälle solcher Datenlecks.

Die T-Systems betont in ihren Dokumentationen zwar die Sicherheitsfeatures von AWS, aber wie ich lernte: Sicherheit ist nur so gut wie ihre Implementierung.

Ergänzend empfehlen wir:
Insolvenz vermeiden: Unkonventionelle Rettungsstrategien für Ihre GmbH – Der praktische Leitfaden

Die versteckten Gefahren der OCR-Verarbeitung

Um die technischen Hintergründe besser zu verstehen, sprach ich mit einem Entwickler, der selbst OCR-Lösungen programmiert. Er erklärte mir die verschiedenen Verarbeitungsschritte und wo überall Sicherheitslücken lauern können.

Wo Ihre Daten überall Spuren hinterlassen

„Stellen Sie sich vor“, begann er, „Sie scannen eine Rechnung mit Ihrer Smartphone-App. Zunächst liegt das Bild im Arbeitsspeicher Ihres Telefons. Dann wird es komprimiert und hochgeladen – dabei durchläuft es Ihren Internetprovider. In der Cloud wird es temporär gespeichert, zur OCR-Engine weitergeleitet, dort verarbeitet, das Ergebnis wird zwischengespeichert, und dann kommt es zurück zu Ihnen.“

Bei jedem dieser Schritte hinterlassen Ihre Daten digitale Fußabdrücke. Wie ich bei Klippa las, unterscheiden sich die Anbieter erheblich darin, wie lange sie diese Zwischendaten speichern und wie sie sie schützen.

Der Fall ABBYY: Qualität versus Datenschutz

Bei meiner Recherche stieß ich auf ABBYY, einen der führenden Anbieter von OCR-Software. ABBYY FineReader Online bietet beeindruckende Erkennungsraten. Doch in einem Interview mit einem Datenschutzbeauftragten erfuhr ich: „Hochwertige OCR erfordert oft komplexe Serverinfrastrukturen. Je besser die Erkennung, desto mehr Rechenleistung – und desto mehr Daten müssen übertragen werden.“

Das Dilemma: Die beste Texterkennung gibt es oft nur zum Preis der Cloud-Verarbeitung. Lokale Lösungen wie Tesseract sind zwar datenschutzfreundlich, erreichen aber nicht die gleiche Qualität.

Vielleicht interessiert Sie auch:
GmbH Notdienst bei Zahlungsproblemen, Gesellschafterkonflikten und Haftungsfragen: Hilfe in 24h

Dokumentenmanagement und die rechtlichen Fallstricke

Mein nächster Gesprächspartner war ein Steuerberater, der mir die rechtlichen Aspekte erklärte. „Viele meiner Mandanten scannen ihre Belege selbst“, erzählte er. „Aber die wenigsten wissen, dass das ersetzende Scannen nach GoBD strengen Regeln unterliegt.“

Was das Finanzamt wissen will

Das Finanzamt und die Zollbehörden stellen klare Anforderungen an digitalisierte Dokumente. Sie müssen revisionssicher gespeichert werden. Doch was passiert, wenn diese Dokumente bei der Cloud-Verarbeitung kompromittiert werden? „Ein Datenleck kann im schlimmsten Fall bedeuten, dass Ihre digitalisierten Belege nicht mehr anerkannt werden“, warnte mich der Steuerberater.

Die d-velop-Plattform bietet hier interessante Lösungsansätze mit integrierten Dokumentenmanagementsystemen, doch auch hier stellte sich mir die Frage: Wo genau werden die Daten verarbeitet?

So prüfen Sie, ob Ihre Daten bereits kompromittiert wurden

Nach all diesen beunruhigenden Erkenntnissen wollte ich wissen: Wie kann man überhaupt feststellen, ob die eigenen Daten bereits in einem Datenleck aufgetaucht sind?

Mein Test mit verschiedenen Prüftools

Ich testete mehrere Dienste, beginnend mit haveibeenpwned.com. Dieses Tool, entwickelt von einem Sicherheitsexperten, durchsucht bekannte Datenlecks nach E-Mail-Adressen. Tatsächlich fand ich heraus, dass eine meiner Adressen in zwei Datenlecks auftauchte – allerdings nicht von Scan-Diensten.

Das Hasso-Plattner-Institut bietet einen ähnlichen Datenleck-Check an. Auch NordPass hat ein entsprechendes Tool. Was mich überraschte: Keines dieser Tools kann speziell nach gescannten Dokumenten suchen. Die meisten Datenlecks betreffen Anmeldedaten, nicht die Dokumente selbst.

„Das ist das Heimtückische“, erklärte mir ein IT-Forensiker. „Wenn Ihre gescannten Dokumente in einem Datenleck landen, erfahren Sie es meist gar nicht. Sie tauchen in keiner Datenbank auf, die Sie selbst prüfen können.“

Was tun, wenn das Kind bereits in den Brunnen gefallen ist?

Diese Frage stellte ich einem Experten für Incident Response. Seine Antwort war ernüchternd: Ein Datenleck zu beheben ist weitaus schwieriger, als es zu verhindern.

Die ersten Schritte nach einem Datenleck

„Wenn Sie vermuten, dass Ihre gescannten Dokumente kompromittiert wurden“, so der Experte, „müssen Sie schnell handeln. Kontaktieren Sie den Anbieter, dokumentieren Sie alles, und je nach Art der Dokumente müssen Sie möglicherweise das BSI oder Ihre Datenschutzbehörde informieren.“

Er zeigte mir Fallbeispiele, bei denen Unternehmen Wochen brauchten, um den Umfang eines Datenlecks zu verstehen. „Bei Cloud-Diensten ist die Nachverfolgung besonders schwierig. Ihre Daten können auf Servern in verschiedenen Ländern gelegen haben.“

Die datenschutzkonforme Alternative: Lokale Verarbeitung

Nach all diesen beunruhigenden Erkenntnissen suchte ich nach Alternativen. Gibt es Möglichkeiten, Dokumente zu scannen und per OCR zu verarbeiten, ohne sie in die Cloud zu schicken?

Mein Experiment mit verschiedenen Lösungen

Ich testete scansio.de, einen Dienst, der sich auf datenschutzkonforme Dokumentenverarbeitung spezialisiert hat. Das Besondere: Die OCR-Verarbeitung erfolgt nach eigenen Angaben auf deutschen Servern, und die Daten werden nach der Verarbeitung gelöscht.

Auch Dropbox bietet verschiedene Pläne an – Dropbox Professional, Dropbox Standard und Dropbox Advanced – mit unterschiedlichen Datenschutzstufen. Bei meinem Test stellte ich fest: Je nach Plan werden die Daten unterschiedlich verarbeitet.

Ein besonders interessanter Ansatz kam von einem Entwickler, mit dem ich sprach. Er hatte einen normalen Scanner mit lokaler OCR-Verarbeitung nachgerüstet. „So bleiben meine Daten wirklich bei mir“, erklärte er stolz.

Cloud-basierte OCR im direkten Vergleich

Um eine fundierte Übersicht zu bekommen, analysierte ich verschiedene Cloud-basierte OCR-Lösungen im Detail. Die Unterschiede waren gravierend.

Die Bundesdruckerei als deutscher Hoffnungsträger

Besonders interessant wurde mein Gespräch mit einem Vertreter der Bundesdruckerei. Sie bieten mit ReSiScan einen Service an, der explizit für hochsensible Dokumente konzipiert ist. „Wir verarbeiten alles in Deutschland, nach höchsten Sicherheitsstandards“, versicherte man mir.

Doch auch hier blieb eine Frage offen: Selbst wenn die Server in Deutschland stehen – wie wird sichergestellt, dass keine Kopien der Daten zurückbleiben?

KI-gestützte Dokumentenverarbeitung: Fluch oder Segen?

Ein Thema, das mich während meiner gesamten Recherche beschäftigte, war die zunehmende Integration von künstlicher Intelligenz in OCR-Prozesse. Ich sprach mit einem KI-Forscher über die Implikationen.

Wenn Ihre Dokumente zum Trainingsmaterial werden

„Das größte Problem“, erklärte er mir, „ist die Intransparenz. Viele Anbieter nutzen die verarbeiteten Dokumente, um ihre KI-Modelle zu verbessern. Theoretisch könnte Ihre Steuererklärung also dazu beitragen, dass die KI besser wird – aber zu welchem Preis?“

Ich recherchierte zu DSGVO-konformen KI-Lösungen und fand heraus: Die rechtliche Lage ist nach wie vor unklar. Viele Anbieter bewegen sich in einer Grauzone.

Praktische Tipps: So scannen Sie sicherer

Nach Wochen intensiver Recherche und zahlreichen Gesprächen entwickelte ich eine Liste praktischer Empfehlungen, die ich selbst umsetze und die ich jedem ans Herz legen möchte.

Die Schritt-für-Schritt-Anleitung zum sicheren Scannen

Ein Tech-Journalist teilte mit mir seine Methode zum sicheren Scannen per Smartphone. Der Kernpunkt: Bewusste Entscheidungen treffen. Nicht jedes Dokument muss in

Steueroptimierung in Ungarn: Nur 2 Prozent lokale Abgaben

Steueroptimierung in Ungarn: Nur 2 Prozent lokale Abgaben Ungarn ist für viele Unternehmer längst kein Geheimtipp mehr. Die niedrige Körperschaftsteuer von 9 Prozent...

Wofür brauchen Ausländer eine Steuernummer in Ungarn?

Wofür brauchen Ausländer eine Steuernummer in Ungarn? Wer als Ausländer in Ungarn mehr vorhat als eine Woche Urlaub am Balaton, begegnet früher oder später einer...

EWIV auflösen wegen Fehlern bei der Gründung

EWIV auflösen wegen Fehlern bei der Gründung Eine EWIV, die mit Fehlern gegründet wurde, ist kein Fundament – sie ist ein Zeitproblem. Wer bei der Gründung einer...
Datenschutz
Ich, NORBERT PETER (Wohnort: Deutschland), verarbeite zum Betrieb dieser Website personenbezogene Daten nur im technisch unbedingt notwendigen Umfang. Alle Details dazu in meiner Datenschutzerklärung.
Datenschutz
Ich, NORBERT PETER (Wohnort: Deutschland), verarbeite zum Betrieb dieser Website personenbezogene Daten nur im technisch unbedingt notwendigen Umfang. Alle Details dazu in meiner Datenschutzerklärung.