“Komma-separerte verdier (CSV) er et av de mest allsidige og brukervennlige dataformatene. Det er et lett dataformat som lar utviklere og applikasjoner overføre og analysere data fra en kilde til en annen.
CSV -data lagrer data i et tabellformat der hver kolonne er atskilt med komma, og en ny post tildeles en ny linje. Dette gjør det til et veldig godt valg å eksportere databaser som SQL -databaser, Cassandra -data og mer.
Det er derfor ingen overraskelse at du vil møte et scenario der du trenger å importere en CSV -fil til databasen din.
Målet med denne opplæringen er å vise deg en rask og enkel metode for å importere en CSV -fil til Elasticsearch -klyngen din ved hjelp av Kibana -dashbordet.”
La oss hoppe inn.
Krav
Før du dykker inn, må du forsikre deg om at du har følgende krav:
Eksempel på CSV -fil
Som vanlig er det første kravet din kilde CSV -fil. Det er bra å sikre at dataene i CSV-filen din er godt formatert og at de ikke inneholder noen feil.
For illustrasjonsformål vil vi bruke et gratis datasett som inneholder filmer og TV -serier fra Amazon Prime.
Åpne nettleseren din og naviger til ressursen nedenfor:
https: // www.Kaggle.com/datasett/shivamb/amazon-prime-film-og-TV-show
Følg prosedyren for å laste ned datasettet til din lokale maskin. Du kan trekke ut det nedlastede arkivet med kommandoen:
$ Unzip a ~/nedlastinger/rchive.glidelås
Importer CSV -fil
Når du har kildefilen klar, kan vi fortsette og diskutere hvordan du importerer den.
Begynn med å gå over til Kibana Home Dashboard og velge alternativet "Last opp en fil".
Finn målet CSV -filen du ønsker å importere i Launcher -vinduet.
Velg kildefilen og klikk Last opp.
Tillat Elasticsearch og Kibana å analysere den opplastede filen. Dette vil analysere CSV -filen og bestemme dataformatet, felt, datatyper osv.
Merk: Avhengig av klyngekonfigurasjonen og datastørrelsen, kan denne prosessen ta en stund. Forsikre deg om at masternoden svarer for å unngå timeouts.
Når prosessen er fullført, bør du få et utvalg av filinnholdet og filstatistikken som analysert av elastisk.
Du kan skreddersy mange parametere, for eksempel avgrenseren, overskriften, osv. For eksempel kan vi tilpasse utdataene ovenfor for å fortelle Elastic at CSV -filen vår inneholder toppfiler.
Vi kan deretter klikke på Bruk og analysere dataene på nytt. Dette skal formatere dataene i riktig format, inkludert feltene.
Deretter kan vi klikke på import for å fortsette til det importerte dashbordet.
Her må vi lage en indeks der CSV -dataene er lagret. Du kan tildele ethvert støttet navn til indeksen din.
Hvis du ønsker å tilpasse indeksegenskapene dine, for eksempel antall skjær, kopier, kartlegginger osv. Velg det avanserte alternativet og finjuster innstillingene dine når hjertet ønsker.
Til slutt, klikk på import og se på mens Kibana gjør sin "magi". Når du er fullført, kan du få tilgang til indeksen din enten via Elasticsearch API eller bruke Kibana -dashbordet.
Og du er ferdig!!
Konklusjon
I dette innlegget dekket vi prosessen med å hente og importere CSV -datasettet ditt til Elasticsearch -klyngen din ved hjelp av Kibana -dashbordet.
Takk for at du leser og lykkelig koding!!