Pandas leste TSV

Pandas leste TSV

I "Pandas" kan vi enkelt lese filer som vi kan lese CSV -filer, vi kan lese TSV -filer, vi kan lese tekstfiler, og vi kan også lese SQL. Vi forklarer TSV -filen her. Det er en tekstformatfil der tabelldataene lagres i tekstformatet. Vi kan enkelt opprette eller lese "Tab-Separated Value" -filen i "Pandas" fordi "Pandas" inneholder en innebygd funksjon som hjelper til med å opprette og lese TSV-filene. Vi vil diskutere i denne opplæringen metodene som "Pandas" gir oss for å lese TSV -filen. Vi vil opprette og lese TSV -filen og også konvertere dataene etter å ha lest TSV -filen til DataFrame.

Metoder for å lese TSV -filen i “Pandas”

Vi kan lese TSV -filen ved å bruke to metoder for "pandaer", og vi vil bruke disse to metodene i denne opplæringen. Metodene er gitt nedenfor:

  • read_table () metode.
  • read_csv () metode.

Eksempel # 01: Bruke “read_table ()” -metode

Vi bruker “Spyder” -verktøyet for å hjelpe til med å generere “Pandas” -kodene. Før vi beskriver konseptet med å lese TSV -filen, har vi forklart hvordan vi kan opprette TSV -filen i "Pandas". Vi importerer “Pandas” -biblioteket og oppretter deretter en "new_df" dataaframe der vi har skrevet inn noen kolonner. Dataene legges også inn i hver kolonne. Vi har skrevet inn "new_name, new_1, new_2, new_3, new_4 og new_5" som er kolonnene til "new_df" dataaframe.

Deretter la vi til "to_csv ()" -metoden der vi legger til navnet på filen. Vi setter inn “Newfile.TSV ”som vil konvertere DataFrame som vi har opprettet i denne koden til TSV -filen og navngi denne filen“ NewFile.TSV ”. Vi har også justert "SEP" -parameteren der vi har lagt til "\ t" som verdien. Nå, “Newfile.TSV ”er opprettet. Vi vil også vise denne TSV -filen.

Vi trykker på “Shift+Enter” som utfører kodene og “Newfile.TSV ”genereres deretter. Denne TSV -filen vises nedenfor. Her lagres dataene fra DataFrame i tekstform. Nå vil vi lese denne TSV -filen også.

Vi har importert "pandaene" igjen i den nye filen. Vi skal lese TSV -filen som vi har laget ovenfor. Vi plasserer “my_dataframe” som lagrer dataene fra TSV -filen etter å ha lest den. Vi bruker “PD.read_table () ”-metode og passere navnet på filen som vi må lese som er“ newfile.TSV ”. Denne metoden vil lese dataene som er til stede i TSV -filen og generere DataFrame for TSV -filens data og lagre dem i “My_DataFrame”. Etter dette legges "my_dataframe" inn i "print ()". Så det vil bli skrevet ut på terminalen ved utførelse.

Når vi kjører denne "Pandas" -koden, vises dataene fra TSV -filen som DataFrame på terminalen. TSV -filens data vises nedenfor som vi får etter å ha lest TSV -filen.

Eksempel nr. 02: Bruke “read_csv ()” -metode

Vi kan også lese TSV -filen ved å bruke metoden “read_csv ()”. Her bruker vi metoden “read_csv ()” for å lese “newfile.TSV ”. Vi initialiserer "data" -variabelen med "read_csv ()" -metoden, og vi har også lagt til to parametere. Først har vi lagt til filnavnet, og deretter angir vi "SEP" -parameteren. Verdien justeres som "\ t". Vi skriver også ut "data" ved å bruke "print ()" her.

Den viser også dataene fra TSV -filen i DataFrame -format, eller vi kan si det i tabellform. Begge metodene fungerer de samme og returnerer samme resultat.

Eksempel # 03:

Den nye TSV -filen er gjengitt nedenfor. Nå må vi lese dataene fra denne TSV -filen ved å bruke "Pandas" -metoden.

Vi har lagt til "read_table ()" -metoden for å lese TSV -filen, men vi har lagt til en parameter til denne gangen denne gangen. Etter å ha lagt til navnet på TSV -filen som er “Education.TSV ”, har vi også lagt til" Index_col "-parameteren som hjelper til med å justere indekskolonnen til DataFrame som opprettes etter å ha lest TSV -filen. Vi justerer "RandomName" -kolonnen som indeksen for DataFrame. Så når koden blir utført, vil filen bli lest, så vil DataFrame vi får ha "RandomName" som indekskolonne. Vi viser også dataene fra TSV -filen etter å ha lest her ved å bruke "print ()".

Her ser du at dataene ovenfor til TSV -filen vises i tabellform. Vi får denne DataFrame ved å lese TSV -filen ved hjelp av “read_table ()” -metoden. Legg også merke til at kolonnen “RandomName” er satt her som indekskolonnen.

Eksempel # 04:

Nå har vi en annen TSV -fil som vises nedenfor. Filen inneholder dataene i tekstformat. Vi vil også lese denne filen.

Vi har opprettet variabelen “New_Columns”. Vi legger til noen navn fordi vi ønsker å justere disse navnene som kolonnenavnene på DataFrame som vi får etter å ha lest TSV -filen som vises ovenfor. Navnene vi la til er “class_mammals, class_fish, class_repatiles, class_amphibians og class_birds”. Etter dette benyttet vi oss av "read_table" -metoden der vi la til tre parametere. Først har vi satt inn “dyr_data.TSV ”som er TSV -filens navn, og deretter justert“ Ingen ”til“ Header ”-parameteren. Vi la også til “New_columns” som vi har initialisert i denne koden til parameteren “Navn”. Så navnene vi har lagt til ovenfor er justert som kolonnenavnene på DataFrame. Deretter gjengir vi dataene ved å bruke “print ()”.

Dataene som vises i tekstformatet i TSV -filen ovenfor, konverteres til DataFrame. De nye kolonnenavnene vi har lagt til i koden er gjengitt, og de forrige kolonnenavnene blir omgjort til raden eller verdiene til disse kolonnene.

Eksempel nr. 05:

Vi leser den samme filen som vi har vist i eksempel 4, men denne gangen hopper vi over noen rader etter å ha lest “Animals_data.TSV ”-fil. Vi har nettopp lagt den fjerde parameteren til "read_table ()" -metoden som er "skiprows" -parameteren. Sett den til “4” fordi vi ønsker å hoppe over de fire første radene av DataFrame som genereres etter å ha lest “Animals_data.TSV ”.

DataFrame er igjen gjengitt, men de fire første radene er ikke til stede i denne DataFrame fordi vi har hoppet over “4” rader med DataFrame.

Eksempel # 06:

Vi leser igjen “dyret_data.TSV ”-filen, men med“ read_csv () ”-metoden. Vi har kommet inn i “dyret_data.TSV ”og sett deretter“ SEP ”til“ \ T ”. Vi har også justert "ingen" -verdien for "headeren", og navnene vi legger til her vil bli satt som kolonnenavn. Vi har bare hoppet over en rad ved hjelp av "Skiprows" -parameteren.

DataFrame vi får vises og kolonnenavnene blir justert tilsvarende, da vi har lagt inn i koden. Den første raden fjernes også fra DataFrame her.

Eksempel # 07:

En TSV -fil til vises. Nå vil vi vise hvordan du får den valgte kolonnen etter å ha lest TSV -filen.

Vi har brukt metoden “read_table ()” og lagt til en ny parameter som er "usecols" -parametrene og lagt til navnet på kolonnen som vi ønsker å få fra "bilene.TSV ”-fil. Vi har lagt til "pris" som er kolonnenavnet. Nå vil den bare få tilgang til "Price" -kolonnedataene og lagre dem i "Carsdf". Deretter gjengir vi dataene fra "pris" -kolonnen her.

Bare en kolonne vises fordi vi har justert "usecols" -parameteren i "read_table ()" -metoden. Så det viste ikke hele dataene fra TSV -filen her.

Konklusjon

Vi kan lese forskjellige filer i “Pandas” ved hjelp av “Pandas” -metoden. Så vi har skrevet denne opplæringen der vi har forklart hvordan vi kan lese TSV -filen i "Pandas". Vi har først forklart opprettelsen av TSV -filen, og så har vi diskutert to metoder i denne opplæringen som hjelper til med å lese TSV -filens data. Vi har forklart “read_table ()” så vel som “read_csv ()” -metoden her og har forklart hvordan disse metodene er med på å lese TSV -filen i “Pandas”. Vi har brukt disse metodene i denne opplæringen ved å legge til forskjellige parametere hver gang i hver kode for å få forskjellige resultater.