ChatGPT, Claude und Gemini für die österreichische Steuererklärung: vier Testfälle, ein klares Verdikt

GPT-5, Claude Opus 4.7 und Gemini 2.5 versprechen, deutschsprachiges Steuerrecht zu beherrschen. Vier reale österreichische Fallkonstellationen zeigen, wo das stimmt — und wo es Tausende Euro kostet.

Option News Redaktion · 6. Juni 2026 · 11 Min. Lesezeit

Laptop mit ChatGPT-Oberfläche neben einem FinanzOnline-Formular auf einem Wiener Schreibtisch

Wer in Österreich 2026 seine Steuererklärung vorbereitet, kommt an einem Gedankenexperiment kaum vorbei: GPT-5 ist seit Februar verfügbar, Claude Opus 4.7 seit März, Gemini 2.5 Pro seit November 2025. Alle drei Modelle behaupten, deutschsprachiges Steuerrecht zu beherrschen. Und alle drei werden mittlerweile in der einen oder anderen Form von Selbstständigen, ETF-Sparern und Privatanlegern eingesetzt, um die Anlage E1, die Beilage K1 oder die Liste der ausschüttungsgleichen Erträge zu strukturieren.

Die Frage ist nicht, ob das funktioniert. Die Frage ist, in welchen Fällen es funktioniert — und in welchen ein Sprachmodell den Anwender mit großer Selbstsicherheit in einen vier- bis fünfstelligen Steuerschaden lockt. Wir haben vier typische österreichische Fallkonstellationen durch die drei führenden Modelle geschickt und die Antworten mit der geltenden Rechtslage abgeglichen. Das Bild ist deutlich gemischter, als die Hochglanz-Demos der Anbieter suggerieren.

Vorab die Eckdaten des Tests:

Vier konstruierte Fälle, alle aus realen Mandantenanfragen ostösterreichischer Steuerberater destilliert
Drei Modelle in der jeweils öffentlich zugänglichen Konsumentenversion (ChatGPT Plus, claude.ai Pro, Gemini Advanced)
Identische Prompts auf Deutsch, ohne Plug-ins, ohne Web-Browsing, ohne RAG
Gegenkontrolle gegen FinanzOnline, BMF-Richtlinien und das Einkommensteuergesetz in der Fassung Juni 2026

Warum Steuerpflichtige überhaupt zu Sprachmodellen greifen

Eine Steuerberatung in Wien kostet 2026 zwischen 150 und 350 Euro pro Stunde. Wer als Einzelunternehmer mit 60.000 bis 90.000 Euro Umsatz arbeitet, zahlt für eine vollständige Einkommen- und Umsatzsteuererklärung selten weniger als 900 Euro pro Jahr. Für Privatanleger mit reinem ETF- und Krypto-Depot wirkt diese Größenordnung schnell wie ein Bruchteil der Kapitalerträge — also ein verzichtbarer Posten.

Genau diese Gruppe testet seit Monaten, ob ein gut promptetes Sprachmodell den ersten Entwurf der Erklärung übernehmen kann. Die Erwartung ist nicht, eine vollwertige Beratung zu ersetzen, sondern den eigenen Datenbestand zu strukturieren: Welche Belege gehören in welche Kennzahl? Wie ist eine Werkvertragsrechnung umsatzsteuerlich zu behandeln? Wann ist ein Krypto-Tausch ein steuerpflichtiges Realisationsereignis?

Diese Erwartung ist nicht unrealistisch. Sie ist aber asymmetrisch riskant. Ein Sprachmodell, das in 90 Prozent der Fälle korrekte Pauschalen nennt und im verbleibenden Zehntel den falschen Prozentsatz mit gleichbleibender Souveränität halluziniert, ist gefährlicher als ein Modell, das ehrlich „ich weiß es nicht" sagt. Genau diesen Befund haben unsere vier Testfälle bestätigt.

Fall 1: Selbstständige Texterin, Werkvertrag, 80.000 Euro brutto

Anna K., 34, arbeitet auf Werkvertragsbasis für zwei Wiener Agenturen. 2025 hat sie 80.000 Euro netto fakturiert, ist umsatzsteuerlich Kleinunternehmerin (knapp unter der 2026 angehobenen Grenze von 55.000 Euro? — falsch, sie liegt darüber und musste auf die Regelbesteuerung umsteigen). Sie nutzt das Basispauschale für Betriebsausgaben (12 Prozent) und zahlt SVS-Beiträge in Höhe von rund 18.500 Euro.

Der Prompt an alle drei Modelle: „Ich bin selbstständige Texterin in Wien, Umsatz 2025 80.000 Euro netto, Basispauschale, SVS rund 18.500 Euro, kein eigenes Büro. Welche Anlagen brauche ich für die Einkommensteuererklärung und mit welcher Steuerlast muss ich grob rechnen?"

GPT-5 lieferte eine sauber strukturierte Antwort: Anlage E1 plus E1a, korrekte Erwähnung der SVS-Abzugsfähigkeit, plausibles Grobergebnis bei rund 19.500 Euro Einkommensteuer. Allerdings nannte das Modell die Kleinunternehmergrenze fälschlich mit 35.000 Euro statt der seit 2025 geltenden 55.000 Euro — ein Wert, der für die Frage hier zwar nicht entscheidungsrelevant war, in einer benachbarten Konstellation aber zur falschen Empfehlung „Sie sind Kleinunternehmer" geführt hätte.

Claude Opus 4.7 erkannte die Werkvertragskonstellation, fragte aktiv nach Detailangaben (Pendlerpauschale, Sonderausgaben, Kirchenbeitrag) und ergänzte den Hinweis, dass das Basispauschale bei freiberuflichen Tätigkeiten der Kennzahl 9259 zugeordnet wird. Die genannte Kennzahl ist korrekt; die Steuerschätzung lag bei 19.700 Euro und damit nahe am tatsächlich errechneten Wert von 19.620 Euro.

Gemini 2.5 lieferte ebenfalls die richtige Anlagenkombination, verwies jedoch auf den nicht mehr gültigen Solidarzuschlag, der in Österreich nie existiert hat — ein klassischer Übersetzungsfehler aus deutschem Trainingsmaterial. Die Endsumme lag bei 17.400 Euro und damit rund 2.200 Euro zu niedrig.

Fall 2: Krypto-Gewinne von 12.000 Euro auf gemischter Position

Mehmet S., 41, hält seit 2019 Bitcoin und Ethereum in einer Wallet bei Bitpanda. Im Lauf des Jahres 2025 hat er mehrere Teilverkäufe vorgenommen, in Summe 12.000 Euro Gewinn realisiert. Die Hälfte der verkauften Coins wurde nach dem 1. März 2022 erworben (also nach Inkrafttreten der österreichischen Krypto-Besteuerung im Rahmen des Ökosozialen Steuerreformgesetzes), die andere Hälfte davor.

Die rechtlich saubere Antwort: Coins, die vor dem 28. Februar 2021 erworben wurden, gelten als Altbestand und sind steuerfrei. Coins, die ab dem 1. März 2021 angeschafft wurden, unterliegen der KESt von 27,5 Prozent. Bei der Veräußerung greift die Reihenfolge nach FIFO, sofern keine eindeutige Zuordnung möglich ist. Bitpanda meldet die KESt seit März 2024 automatisch an das BMF — der Anleger muss aber prüfen, ob alle Altbestandsbestätigungen vorliegen.

GPT-5 erkannte die Altbestandsregel und nannte das Stichtagsdatum korrekt. Es übersah jedoch, dass Tausch zwischen Kryptowährungen seit 1. März 2022 nicht mehr als Realisierungsereignis gilt — ein Punkt, der bei Mehmets Konstellation zwar nicht relevant war, der aber in einer leicht abgewandelten Variante zu doppelter Versteuerung geführt hätte.

Claude Opus 4.7 forderte zunächst eine vollständige Transaktionsliste an, lieferte dann eine korrekte FIFO-Berechnung und wies explizit auf die Bitpanda-Automatik hin. Es war das einzige der drei Modelle, das eindeutig empfahl, die jährliche Steuerbescheinigung des Brokers anzufordern und mit der eigenen Aufstellung abzugleichen.

Gemini 2.5 nannte fälschlich den Steuersatz mit 25 Prozent statt 27,5 Prozent — ein Übertrag aus der deutschen Abgeltungsteuer. Bei 12.000 Euro Gewinn ergibt das eine Differenz von 300 Euro. In größeren Konstellationen multipliziert sich der Fehler entsprechend.

Fall 3: Der ETF-Sparplan, der zur Falle wird

Lisa T., 29, hat seit 2022 monatlich 250 Euro in einen thesaurierenden, in den USA aufgelegten Vanguard-ETF investiert. Sie hat das Produkt bei einem ausländischen Online-Broker gekauft, der keine österreichische KESt-Automatik anbietet. Der ETF ist nicht bei der OeKB gemeldet.

Diese Konstellation ist der gefährlichste Fall im Test, weil sie auf den ersten Blick wie ein normaler ETF-Sparplan aussieht — aber steuerlich vollkommen anders behandelt wird als das österreichische Standardszenario. Wer einen nicht bei der OeKB gemeldeten ausländischen ETF hält, unterliegt der pauschalen Ertragsbesteuerung gemäß Paragraf 186 InvFG: 90 Prozent der Wertsteigerung im Kalenderjahr, mindestens jedoch 10 Prozent des Wertes am Jahresende, gelten als ausschüttungsgleicher Ertrag und sind mit 27,5 Prozent zu versteuern.

Wir haben den Modellen die vollständige Konstellation beschrieben und gefragt: „Wie deklariere ich diesen ETF in der Anlage E1kv?"

GPT-5 erkannte den Sachverhalt und nannte die Strafsteuerregel korrekt. Es versäumte aber den entscheidenden praktischen Hinweis, dass der Anleger den ETF kurzfristig liquidieren und auf eine OeKB-gemeldete UCITS-Variante umsteigen sollte — eine Empfehlung, die jeder österreichische Steuerberater an dieser Stelle ausspricht.

Claude Opus 4.7 lieferte die rechtlich korrekte Berechnungsanleitung und ergänzte den praktischen Hinweis zum Wechsel auf eine gemeldete Variante. Es wies zudem darauf hin, dass die Strafsteuer typischerweise höher liegt als die tatsächliche Wertsteigerung und der Wechsel selbst bei Realisierung eines Verlusts in vielen Fällen lohnt.

Gemini 2.5 versagte in diesem Fall vollständig. Das Modell behandelte den ETF wie ein deutsches Vorabpauschalen-Produkt, nannte die hypothetische Bezugsgröße aus dem deutschen Investmentsteuergesetz und kam zu einer Steuerlast, die um den Faktor drei zu niedrig war. Wer dieser Auskunft folgt, geht in eine garantierte Nacherklärung mit Säumniszuschlag.

Fall 4: Pendlerpauschale Wien-Tulln

Thomas R., 47, fährt täglich von Tulln nach Wien-Heiligenstadt zur Arbeit. Die Entfernung beträgt 32 Kilometer (einfache Strecke), die Fahrt ist mit öffentlichen Verkehrsmitteln in unter 90 Minuten zumutbar. Er bezieht ein Jahresbruttogehalt von 62.000 Euro.

Die korrekte Lösung: Wegen Zumutbarkeit des öffentlichen Verkehrs greift das kleine Pendlerpauschale. Bei einer Entfernung zwischen 20 und 40 Kilometern beträgt es 696 Euro pro Jahr. Zusätzlich steht ihm der Pendlereuro in Höhe von 2 Euro pro Kilometer einfacher Strecke und Jahr zu (also 64 Euro). Das Klimaticket Wien-NÖ-Bgld, falls genutzt, ist als Werbungskosten zusätzlich absetzbar — schließt das Pendlerpauschale aber aus, sobald der Arbeitgeber das Ticket zur Gänze trägt.

GPT-5 lieferte die korrekten Beträge für Pauschale und Pendlereuro. Es übersah jedoch die Anrechnungsproblematik beim Klimaticket — wenn der Arbeitgeber das Ticket finanziert, entfällt das Pauschale, sonst nicht. Diese Unterscheidung kostete im konkreten Fall keinen Cent, weil Thomas das Ticket selbst zahlt; in einer Variante mit arbeitgeberfinanziertem Klimaticket hätte das Modell aber zu Doppelabsetzung geraten.

Claude Opus 4.7 fragte aktiv nach Arbeitgeberbeteiligung am Klimaticket, lieferte beide Szenarien getrennt aus und nannte zusätzlich die Kennzahl 718 für die Eintragung in der Arbeitnehmerveranlagung. Vollständig korrekt.

Gemini 2.5 nannte eine veraltete Pauschale aus 2022 (372 Euro) und unterschlug den Pendlereuro. Eine Differenz von 388 Euro pro Jahr.

Vergleich auf einen Blick

| Fall | Korrekte Antwort | GPT-5 | Claude 4.7 | Gemini 2.5 | Schwerwiegender Fehler? | |---|---|---|---|---|---| | Werkvertrag 80k | ESt ~19.620 €, E1+E1a | 19.500 €, korrekt | 19.700 €, korrekt | 17.400 € | Gemini: -2.200 € | | Krypto 12k Gewinn | KESt 27,5 % auf Neubestand | korrekt, Tauschregel übersehen | vollständig korrekt | 25 % statt 27,5 % | Gemini: falscher Satz | | US-ETF nicht OeKB-gemeldet | Pauschale 90/10-Regel | korrekt, Wechselhinweis fehlt | vollständig korrekt | dt. Vorabpauschale | Gemini: Faktor 3 zu niedrig | | Pendlerpauschale 32 km | 696 € + 64 € Pendlereuro | korrekt, Klimaticket-Lücke | vollständig korrekt | 372 €, kein Pendlereuro | Gemini: -388 € |

Wem das Werkzeug nützt — und wem nicht

Der ehrliche Befund nach vier Fällen: Sprachmodelle sind ein brauchbarer Sparringspartner für strukturell einfache Konstellationen, in denen der Anwender die richtige Antwort selbst grob einordnen kann. Wer als Einzelunternehmer ein Jahr lang dieselben Werkverträge fakturiert hat, kann sich von Claude oder GPT-5 die Anlagen erklären lassen und spart sich vielleicht 200 Euro Beraterhonorar.

Wer dagegen ausländische Depots hält, Kryptotausch betreibt, eine Privatstiftung mitversorgt, Auslandseinkünfte hat oder im Lauf des Jahres die Rechtsform gewechselt hat, gehört nicht in die Zielgruppe. Die Lücke zwischen „90 Prozent korrekt" und „100 Prozent korrekt" ist in Steuerfragen identisch mit dem Risiko einer Nacherklärung — und letztere kostet inklusive Säumniszuschlag schnell mehr als zehn Jahre Steuerberaterhonorar.

Ein Wiener Steuerberater, mit dem wir den Test besprochen haben, formulierte es paraphrasiert so: Er sehe das Werkzeug ohne Berührungsängste, nutze es selbst für erste Strukturierungen und Mandantenbriefe, halte es aber für eine Sache der Berufshaftpflicht, dem Endkunden niemals die Letztverantwortung für die eigene Erklärung beim Modell zu lassen. Wer dort spart, kompensiere die Ersparnis mit dem ersten ernsthaften Fehler.

Alternativen mit klar definiertem Anwendungsgebiet

Drei Werkzeuge spielen 2026 in derselben Liga wie die generischen Sprachmodelle, decken aber jeweils ein eng umrissenes Segment ab.

Der FinanzOnline-Assistent des BMF ist seit Februar 2026 für Arbeitnehmerveranlagungen verfügbar. Er führt durch die Standardfragen (Sonderausgaben, außergewöhnliche Belastungen, Pendlerpauschale) und überträgt die Antworten direkt in die Erklärung. Für Selbstständige und Anleger taugt er nicht, für reine Lohnsteuerfälle ist er das überlegene Werkzeug — kostenlos, rechtssicher, ohne Modellrisiko.

taxefy.com ist ein österreichisches Steuersoftware-Start-up, das seit 2023 eine geführte Arbeitnehmerveranlagung anbietet und seit Anfang 2026 auch Krypto-Erträge importieren kann (Direktanbindung an Bitpanda und Coinbase). Für Anleger mit überschaubarem Depot ist das die saubere Lösung; Selbstständige profitieren weniger.

Klassische Steuerberatung bleibt für komplexe Konstellationen alternativlos. Wer einen Beratungsumfang von zwei bis drei Stunden pro Jahr braucht (typisch für Selbstständige mit 80-150k Umsatz), zahlt 400 bis 1.000 Euro und kauft sich neben der Erklärung auch die Beweislastumkehr für den Fall einer Betriebsprüfung. Diese Versicherungsleistung kann kein Sprachmodell ersetzen.

Wer tiefer in die steuerliche Behandlung von Kapitalerträgen einsteigen will, findet eine ausführliche Anleitung zur österreichischen ETF-Logik unter ETF-Käufe in Österreich und einen Ausblick auf die geplante KESt-Reform 2027 unter KESt-Pauschalbesteuerung 2027.