BrowserTools
Werbung
Startseite / Konverter / CSV ↔ JSON Konverter

CSV ↔ JSON Konverter

Konvertiere lokal zwischen CSV und JSON mit benutzerdefinierten Trennzeichen und Anführungszeichen, ohne Upload, ohne Grenzen.

CSV ↔ JSON Konverter wird geladen… Wenn nichts passiert, aktiviere JavaScript.

CSV (durch Kommas getrennte Werte) und JSON (JavaScript Object Notation) sind die beiden am weitesten verbreiteten Klartextformate für strukturierte Daten. CSV hat seine Ursprünge in den frühesten Tagen der Datenverarbeitung; Mainframe-Programme tauschten bereits in den 1960er-Jahren tabellarische Daten in kommagetrennter Form aus, doch dem Format fehlte bis zur Veröffentlichung des RFC 4180 im Oktober 2005 eine formale Spezifikation. Dieses Fehlen eines Standards führte zu jahrzehntelang inkompatiblen Dialekten: Manche Implementierungen verwenden Semikolons als Trennzeichen, andere Tabulatoren; manche setzen alle Felder in Anführungszeichen, andere nur jene mit Sonderzeichen; die Zeilenenden unterscheiden sich von System zu System. Trotz dieser Eigenheiten bleibt CSV das universelle Exportformat für Tabellenkalkulationen, Datenbanken und Datenanalysewerkzeuge, dank seiner Einfachheit und seiner Lesbarkeit für Menschen.

Beispiele

Eingabe name,age Ada,36 Bob,40
Ausgabe [{"name":"Ada","age":"36"},{"name":"Bob","age":"40"}]

Die Kopfzeile wird zu den Objektschlüsseln; jede folgende Zeile wird zu einem Objekt.

Häufig gestellte Fragen

Werden meine Dateien auf einen Server hochgeladen?
Nein. Die Umwandlung läuft vollständig in deinem Browser mit JavaScript. Deine Daten werden niemals über das Netzwerk übertragen, was dieses Werkzeug sicher macht für sensible Geschäftsdaten, personenbezogene Informationen oder vertrauliche Datensätze.
Was ist der RFC 4180 und warum ist er wichtig?
Der RFC 4180, veröffentlicht 2005, kommt einem offiziellen Standard für CSV am nächsten. Er definiert Regeln für das Setzen von Anführungszeichen bei Feldern, die Kommas, Zeilenumbrüche oder Anführungszeichen enthalten, und legt fest, dass ein Anführungszeichen innerhalb eines Feldes in Anführungszeichen durch Verdoppelung escaped wird. Der Parser dieses Werkzeugs setzt den RFC 4180 um, das heißt, er verarbeitet Dateien von Excel, Google Sheets und den meisten Datenbank-Exportwerkzeugen korrekt.
Welche Trennzeichen werden unterstützt?
Das Werkzeug unterstützt Komma, Semikolon, Tabulator und senkrechten Strich als Trennzeichen. Mit Semikolon getrennte Dateien sind in europäischen Gebietsschemata üblich, wo das Komma als Dezimaltrennzeichen verwendet wird. Mit Tabulatoren getrennte Dateien (TSV) werden häufig von Datenbankwerkzeugen erzeugt und sind weniger mehrdeutig als CSV, weil Feldwerte selten Tabulatoren enthalten.
Wie werden Felder in Anführungszeichen und eingebettete Kommas behandelt?
Felder, die das Trennzeichen, ein Anführungszeichen oder einen Zeilenumbruch enthalten, müssen gemäß RFC 4180 in Anführungszeichen gesetzt werden. Ein wörtliches Anführungszeichen innerhalb eines solchen Feldes wird durch zwei aufeinanderfolgende Anführungszeichen dargestellt. Der Parser behandelt all diese Fälle korrekt, sodass ein Feldwert wie She said, "hello" beim Hin- und Zurückwandeln ohne Beschädigung erhalten bleibt.
Was geschieht mit den Datentypen beim Konvertieren von CSV zu JSON?
CSV hat kein Typsystem, jeder Wert ist eine Zeichenkette. Standardmäßig behält der Konverter die Werte als Zeichenketten in der JSON-Ausgabe bei. Wenn du brauchst, dass Zahlen oder Boolesche Werte korrekt typisiert sind, musst du das JSON nachbearbeiten, zum Beispiel mit einem kleinen Skript, das das Array durchläuft und bestimmte Felder umwandelt.
Kann ich JSON wieder in CSV umwandeln?
Ja. Das Werkzeug funktioniert in beide Richtungen. Für die Umwandlung von JSON zu CSV muss der JSON-Wert der obersten Ebene ein Array von Objekten mit einheitlichen Schlüsseln sein. Die Schlüssel des ersten Objekts werden zur Kopfzeile des CSV. Verschachtelte Objekte und Arrays werden als JSON-Zeichenketten in die entsprechende CSV-Zelle serialisiert.
Gibt es eine Begrenzung der Dateigröße?
Es gibt keine erzwungene Grenze; die Umwandlung ist nur durch den verfügbaren Speicher deines Browsers begrenzt. Dateien bis etwa 50 MB werden in der Regel in Sekunden verarbeitet. Sehr große Dateien (100 MB oder mehr) können dazu führen, dass der Browser-Tab langsam wird oder nicht mehr reagiert. Für die Massenverarbeitung großer Dateien sind Kommandozeilenwerkzeuge wie jq, csvkit oder Miller besser geeignet.
Warum verwendet Excel in CSV-Dateien Semikolons statt Kommas?
In Gebietsschemata, in denen das Komma als Dezimaltrennzeichen dient (der größte Teil Kontinentaleuropas), verwendet Excel das Semikolon als Listentrennzeichen, um Mehrdeutigkeiten zu vermeiden. Eine Zahl wie 1,234 würde sonst als zwei getrennte Felder interpretiert. Wenn du eine Datei öffnest, die aus einer auf ein europäisches Gebietsschema eingestellten Excel-Installation exportiert wurde, stelle das Trennzeichen in diesem Werkzeug auf Semikolon um.
Wann sollte ich JSON statt CSV verwenden?
JSON ist die bessere Wahl, wenn deine Daten eine hierarchische oder verschachtelte Struktur haben, wenn du Datentypen (Zahlen, Boolesche Werte, Nullwerte) bewahren musst oder wenn die Ausgabe direkt von einer JavaScript-Anwendung oder einer REST-API verarbeitet wird. CSV ist vorzuziehen, wenn die Daten rein tabellarisch sind, wenn die Dateigröße entscheidend ist oder wenn die empfangende Person die Datei in einer Tabellenkalkulation öffnen wird.
Wie gehe ich mit CSV-Dateien mit Kodierungsproblemen um?
CSV-Dateien tragen keine Kodierungs-Metadaten, sodass eine in Windows-1252 (eine verbreitete Kodierung älterer Windows-Anwendungen) gespeicherte Datei beim Öffnen als UTF-8 verstümmelte Zeichen anzeigen kann. Wenn du seltsame Symbole siehst, versuche, die Datei in einem Texteditor zu öffnen, sie ausdrücklich als UTF-8 zu speichern und dann den Inhalt in dieses Werkzeug einzufügen. Moderne Exporte aus Excel und Google Sheets verwenden standardmäßig UTF-8, mit oder ohne BOM (Byte-Order-Mark).

Über CSV ↔ JSON Konverter

JSON entstand in den frühen 2000er-Jahren, wurde von Douglas Crockford standardisiert und wurde rasch zum dominierenden Format für Web-APIs, weil es sich natürlich auf die Objekte und Arrays abbildet, die jede Programmiersprache versteht. Wenn eine entwickelnde Person Daten aus einer REST-API abruft, kommen sie fast immer als JSON an. Wenn eine datenanalysierende Person eine Tabelle aus Excel oder PostgreSQL exportiert, kommt sie fast immer als CSV heraus. Die Umwandlung zwischen beiden ist daher eine der häufigsten Aufgaben der Datenaufbereitung in der Softwareentwicklung, im Data Engineering und in der Business Intelligence. Typische Szenarien aus der Praxis sind das Laden eines CSV-Exports aus einem CRM in eine JavaScript-Anwendung, das Abflachen einer JSON-API-Antwort in eine Tabelle zur Durchsicht oder das Aufbereiten von Daten für den Import in ein Werkzeug, das nur eines der beiden Formate akzeptiert.

Dieser Konverter läuft vollständig in deinem Browser, es werden keine Daten an einen Server gesendet. Du kannst Text direkt einfügen oder eine Datei laden, die Richtung der Umwandlung wählen (CSV zu JSON oder JSON zu CSV), das Trennzeichen festlegen und einstellen, ob die erste Zeile als Kopfzeile behandelt werden soll. Die JSON-Ausgabe wird zur besseren Lesbarkeit formatiert. Sonderfälle wie Felder, die das Trennzeichen enthalten, eingebettete Zeilenumbrüche innerhalb von Feldern in Anführungszeichen und verdoppelte Anführungszeichen als Escapezeichen werden allesamt nach den Regeln des RFC 4180 behandelt.

Einige praktische Stolpersteine, die du kennen solltest: CSV hat kein natives Konzept von Datentypen, sodass Zahlen, Datumsangaben und Boolesche Werte alle als Zeichenketten im analysierten JSON ankommen; möglicherweise musst du die Ausgabe nachbearbeiten, um Felder in die richtigen Typen umzuwandeln. Aus Excel in europäischen Gebietsschemata exportierte Dateien verwenden oft Semikolons als Trennzeichen statt Kommas; ändere die Trennzeicheneinstellung, wenn sich deine Spalten nicht korrekt aufteilen. Große Dateien über 50 MB werden im Browser möglicherweise langsam verarbeitet; dafür ist ein Kommandozeilenwerkzeug wie jq oder csvkit schneller. Beim Konvertieren von JSON zu CSV werden verschachtelte Objekte und Arrays abgeflacht oder als Zeichenketten serialisiert, sodass tief verschachtelte Strukturen eine manuelle Nacharbeit erfordern können.

Von Lochkarten zu REST-APIs: die unwahrscheinlichen Parallelleben von CSV und JSON

Das Format der durch Kommas getrennten Werte ist eines der ältesten noch erhaltenen Datenaustauschformate der Informatik. IBM-Mainframe-Programme tauschten bereits in den 1960er-Jahren Daten in kommagetrennten Textdateien aus, mehr als ein Jahrzehnt vor dem Personal Computer. Das Format war so simpel, ein Datensatz pro Zeile, Felder durch ein bekanntes Zeichen getrennt, dass es keiner formalen Dokumentation bedurfte; alle einigten sich einfach per Konvention. Als die ersten Tabellenkalkulationsprogramme Ende der 1970er-Jahre erschienen (VisiCalc 1979, Lotus 1-2-3 1983), wurde CSV zur natürlichen Brücke zwischen ihnen und den umgebenden Datenbanken und Programmen. Es überstand den Übergang von Mainframes zu Minicomputern zu PCs zum Web nahezu unverändert, weshalb eine 1985 von einem COBOL-Programm erzeugte CSV-Datei heute noch in Microsoft Excel geöffnet werden kann.

JSON hat eine viel kürzere, aber ebenso interessante Geschichte. Douglas Crockford, der Schöpfer des Formats, hat gesagt, er habe JSON eher "entdeckt" als erfunden; die Syntax war in JavaScript bereits als Möglichkeit vorhanden, Objektliterale zu schreiben, und Crockford erkannte sie einfach um 2001 als nützliches eigenständiges Datenformat. Der erste JSON-Parser wurde in etwa 30 Codezeilen geschrieben. Bis 2006 war JSON als ECMA-404 formalisiert und verdrängte rasch XML aus den Web-APIs, weil es leichter, leichter lesbar war und sich direkt auf die nativen Datenstrukturen jeder großen Programmiersprache abbildete. Heute ist JSON so allgegenwärtig, dass es für Konfigurationsdateien (package.json, tsconfig.json), Datenbankspeicherung (PostgreSQLs jsonb-Typ, MongoDBs Dokumentenmodell), Protokollformate und unzählige andere Zwecke verwendet wird, die sein Schöpfer nie vorhergesehen hat.

Die Spannung zwischen CSV und JSON spiegelt eine umfassendere Spannung in der Softwaretechnik wider, jene zwischen Einfachheit und Ausdruckskraft. CSV gewinnt bei der Einfachheit: Jeder kann eine CSV-Datei in einem Texteditor oder einer Tabellenkalkulation lesen und bearbeiten, ohne etwas über Programmierung zu wissen. JSON gewinnt bei der Ausdruckskraft: Es kann verschachtelte Strukturen, typisierte Werte und gemischte Schemata darstellen, die CSV nicht abbilden kann. Eine Umfrage unter Data Engineers aus dem Jahr 2023 ergab, dass CSV und JSON zusammen über 70 % aller Datenaustausche zwischen Organisationen ausmachen, eine bemerkenswerte Statistik für zwei Formate, deren Kerndesigns Jahrzehnte alt sind, in einem Feld, das sich alle paar Jahre neu erfindet.

Werbung
Werbung
Werbung