CSV-Format

CSV (Comma-Separated Values bzw. Chacter Separated Values) ist ein Plain-Text-Dateiformat für das Erstellen einfacher Tabellen für die Speicherung und den Austausch von Massendaten mithilfe durchgängig verwendeter Datensatz- und Datenfeldtrennzeichen als einzigen Strukturierungselementen. CSV-Dateien können zur Speicherung und Bearbeitung in Datenbanksysteme sowie Tabellenkalkulations-Programme wie Microsoft Excel® und OpenOffice CalculatorLGPL importiert werden. Ebenso lassen sich aus allen genannten Programmen bearbeitete Daten als CSV-Datei exportieren.

Aufgrund ihrer programmunabhängigen Eigenschaft nutzen auch zahlreiche andere Programme wie CAD-Programme oder Software-Entwicklungsumgebungen, aber auch beispielsweise die Terminologie-Management-Komponenten der marktüblichen CAT-Werkzeuge CSV-Dateien für den Austausch von Datentabellen.

Zur Strukturierung von CSV-Tabellen werden folgende Zeichen verwendet:

  • Datensatztrenner: meist Zeilenumbruch des dateierzeugenden Betriebssystems
  • Datenfeldtrenner: meist Komma, Semikolon, Doppelpunkt, Tabulator oder Leerzeichen
  • Textbegrenzer: meist doppelte, bisweilen einfache Hochkommas

Der erste Datensatz einer CSV-Tabelle kann ein Kopfdatensatz sein, der die Feldnamen definiert.

Der in CSV-Dateien zu verwendende Zeichensatz ist nicht festgelegt. Für den Austausch von Sprachdateien ist allerdings das Unicodeformat UTF-8 üblich. Die Dateikennung ist standardmäßig *.csv.