Spesso, quando si utilizza un linguaggio di programmazione, potrebbe rendersi necessario importare interi dataset di dati su cui poter eseguire delle analisi statistiche e non solo. Oggi esistono molte estensione di file diverse che permettono di contenere questi grandi insieme di dati, alcune di queste risultano essere più potenti altre meno. La maggior parte di file hanno però estensione .csv. tale formato è uno dei primi ad essersi diffuso per l’interscambio di dati, e nonostante la presenza di altri formati è ancora oggi diffuso in molte applicazioni. In un file .csv, letteralmente Comma Separated Values, ogni riga di testo corrisponde a una riga/record del database, mentre le colonne dei differenti campi dei contatti vengono identificate all’interno del file di testo tramite i “separatori” ovvero degli elementi che indicano l’inizio e la fine di una determinata colonna e ne delimitano il contenuto. L’esempio più semplice è il seguente:
Nome,Cognome,Età
Mario,Rossi,20
Luigi,Bianchi,51
Clara,Esposito,18
Gennaro,Fumagalli,35
In questo caso possiamo vedere che il dataset è formato da 4 unità e tre variabili. Le colonne sono suddivisi dal separatore ” , “. Spesso è possibile anche trovare il separatore ” ; “. ; addirittura altri file sfruttano semplicemente spazi o tabulazioni. E’ anche comune, inoltre, trovare file che sfruttano le doppie virgolette o gli apici per identificare stringhe di carattere, ad esempio
"Nome","Cognome","Età"
"Mario","Rossi",20
"Luigi","Bianchi",51
"Clara","Esposito",18
"Gennaro","Fumagalli",35
"Francesco, Maria","Cossu",37
Questo formato, anche se molto utile e molto utilizzatori, presenta questo grande problema, l’assenza di uno standard vero e proprio. Esistono però una prassi comune, più o meno consolidata, che comprende ad esempio l’uso dei doppi apici per le stringhe. Creare un file .csv è molto semplice, poiché è sufficiente il blocco note presente di default su tutti i computer o dispositivi mobili in generale; è consigliato però scaricare editor di testo più specifici (come Notepad++ in Windows o BBEdit in IOS) per semplificare la creazione del file.
