Vai al contenuto

Ricette frictionless

Validare

Impostare i valori da considerare come nulli

Ad esempio, per dire di considerare come valori nulli, le celle che contengono NULL o N:

frictionless validate --field-missing-values "NULL,N" input.csv

Non validare una o più colonne

È possibile farlo sia tramite nome colonna, che numero di colonna.

frictionless validate --skip-fields "fieldA,fieldB" input.csv
frictionless validate --skip-fields "22,46" input.csv

Eseguire soltanto certi tipi di test

frictionless validate --pick-errors "type-error,missing-cell" input.csv

Non eseguire uno specifico test di validazione

Ad esempio non eseguire il controllo (missing-label) che verifica che tutte le colonne abbiano un'etichetta:

frictionless validate --skip-errors missing-label input.csv

Definire il separatore di campo, senza inferencing

frictionless, quando legge un file in formato CSV, prova a estrarne automaticamente il separatore di campo. Se si vuole forzarne la definizione:

frictionless validate --dialect '{"delimiter": ";"}' input.csv

Aumentare l'ampiezza di informazioni da usare per fare inferencing su un file

frictionless per dedurre ad esempio l'encoding di un file CSV (e tante altre informazioni) usa un byte sample di 10.000. Se si vuole ampliare, c'è l'opzione --buffer-size.

frictionless validate --buffer-size 250000 input.csv

Validare un file JSON

Per validare un file JSON si deve usare l'opzione path:

frictionless validate --path input.json

Estrarre

Come estrarre uno specifico foglio, di un foglio elettronico

frictionless extract input.ods --dialect '{"sheet": "Sheet2"}'

Oppure utilizzando l'opzione --sheet

frictionless extract input.ods --sheet "sheetName"

Estrarre soltanto le righe che passano la validazione

frictionless extract --valid  input.csv --csv

Note

Da un'idea di aborruso, proposta tramite le issue #963 e #1004.

Estrarre soltanto le righe che non passano la validazione

frictionless extract --invalid  input.csv --csv