"" Python "inneholder mange biblioteker, og når vi ønsker å analysere eller manipulere data, bruker vi disse" Pythons "biblioteker, og" Pandas "er også biblioteket i det. "Pandas" -biblioteket brukes i feltet Data Sciences, og det brukes også i maskinlæringsaktiviteter. "Pandas" DataFrame hjelper oss med å lagre dataene. I "Pandas", når vi vil ha databining, bruker vi “QCUT ()” -metoden. "QCUT ()" -metoden brukes til å konvertere kontinuerlige funksjoner til kategoriske. Vi kan legge til forskjellige typer parametere i denne "QCUT ()" -metoden for å få forskjellige typer resultater. Denne opplæringen handler om “QCUT ()” -metoden, og vi vil i full detalj forklare “QCUT ()” -metoden her. Vi vil forklare deg hvordan vi gjør dataginnen ved hjelp av "QCUT ()" -funksjonen i "Pandas" i denne opplæringen.”
Eksempel nr. 01
Vi vil bruke "QCUT ()" -metoden i disse kodene, og vi vil gjøre disse kodene i "Spyder" -appen. Når vi må jobbe med "pandaene", kan vi bare få tilgang til funksjonene når vi importerer "Pandas" -biblioteket til kodene våre. Først legger vi "import", og deretter skriver vi "Pandas som PD". Nå må vi bruke “QCUT ()” -metoden, så for dette lager vi DataFrame her. Vi konstruerer “random_df” som inneholder “r_id, r_name og r_age” som kolonnene, og også i “r_id”, plasserer vi “R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_34, R_44, R_46, R_50, R_31, R_34, R_44, R_46, R_5 R_61, R_73 og R_81 ”. Så legger vi til "Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob og Harper" i "R_Name" -kolonnen. Etter dette setter vi inn “21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 og 40” i “R_age” -kolonnen. Nå bruker vi "print ()", som inneholder "random_df", og det vil hjelpe deg med å gjengi "random_df" DataFrame. Vi har nettopp opprettet DataFrame og ikke bruker "QCUT ()" -metoden ennå.
"Run" -ikonet hjelper oss med å utføre kodene. Når vi trykker på dette "Kjør" -ikonet, vises resultatet av denne koden på terminalen til "Spyder" -appen. "Random_df" DataFarme vises som et resultat av koden som vi har skrevet i dette eksemplet. Nå vil vi bruke “QCUT ()” -metoden og vil også vise resultatet.
Vi legger dataene her. Vi vinner "r_age" -kolonnen og plasserer "PD.QCUT () ”-metode, som er metoden for" pandaer "som hjelper til med dataginning. I denne metoden setter vi inn navnet på DataFrame og også kolonnenavnet som vi ønsker å bruke denne "QCUT ()" -metoden. Vi setter også verdien av "Q" til "5", og den brukes til å kutte dataene fra "r_age" -kolonnen i fem like kvantiler. Vi legger til “QCUT ()” -metoden i “Print ()”, så den vil også vise binnedataene på terminalen.
Her vises dataene etter binning, og det kutter "r_age" i fem kvantiler. Den viser også kategoriene der "r_age" kolonnedataene er bedt. Den kategoriske serien representerer “r_age” -kassene.
Vi kan også justere etiketten for disse søppelkassene. Vi legger til disse søppeletikettene for å gjøre dem enkle å tolke. Vi legger til en "r_age_qcut" -kolonne til "random_df" der vi legger til etikettene til disse søppelkassene. Vi bruker igjen “PD.QCut () ”-metode for å merke dem. Vi legger til etikettene som er "lite, ikke så lite, middelmådig, høy og høyest" i det. Så legger vi igjen “Random_df” i “Print ()”.
Alle søppelkasser er merket og presentert i dette utfallet. Kolonnen "r_age_qcut" vises i denne dataaframe der merkede søppelkasser vises.
Eksempel # 02
For å lage DataFrame legger vi først til "karakterer", som er "3, 6, 8, 7, 2, 5, 1, 9, 4, 7 og 8". Deretter legger vi til navn på studenter i "Studenter", som er "Peter, Bromley, James, David, Allies, John, James, Samuel, William, Howard og Alexander". Så genererer vi “graderes_df” der vi har lagt til “PD.DataFrame () ”-metode, og i denne metoden legger vi“ std_name ”, som vil vises som kolonnens navn, og tilordne verdier av" studenter "til dette. Så setter vi “Students_grades” som kolonnenavnet til DataFrame og tildeler også “karakterer” her, som vi har opprettet ovenfor. Etter dette har vi "trykket ()" der vi legger til "graders_df" for utskrift.
DataFrame som inneholder to kolonner vises i resultatet av denne koden. Nå vil vi bruke "QCUT ()" -metoden på kolonnen "Students_grades" for å binde dataene til denne kolonnens verdier.
Vi legger til en ny kolonne "karakter" her der vi har brukt “PD.QCut () "til" Students_grades "-kolonnen, og også har vi brukt" 4 "for verdien av" Q ", så den vil kutte dataene i fire like kvantiler. Etter dette spesifiserer vi disse kvantilene her ved å plassere verdier i “Q”, som er “0, .4, .8, og 1 ”. Deretter viser vi også dette. Nå merker vi disse innkoblede dataene, og etikettene vi legger til her er "D, C, A og B" og lagres også i "karakter" -kolonnen.
Her vises dataene etter binning her i kolonnen "karakter", og den kutter "Students_grades" -kolonnenes data i fire like kvantiler.
DataFrame som vi får etter å ha brukt “QCUT ()” -metoden og spesifiserer kvantilene vises i dette utfallet.
Nå, etter å ha lagt til etikettene til disse søppelkassene, blir også gjengitt i dette utfallet i "karakter" -kolonnen, og du kan se at den tildeler etikettene i henhold til søppelverdiene.
Eksempel # 03
Vi kan også bruke “QCUT ()” -metoden på dataene fra CSV -filen. For dette leste vi først CSV -filens data ved hjelp av "read_csv ()" -metoden. Vi leser dataene til “Office2.CSV ”-fil, og deretter plasseres dataene til denne filen i“ Office_df ”. Denne metoden vil konvertere “Office2” -filens data til DataFrame og lagre dem i “Office_df”. Deretter viser vi også disse dataene ved å sette "office_df" i "print ()". Etter dette legger vi til en ny kolonne som heter “Units_qcut”, som vi bruker funksjonen “PD.QCut () "til" enhetene "-kolonnen.
I tillegg setter vi verdien av "Q" -variabelen til "5", som vil dele opp dataene i fem like kvantiler. Dataene, etter å ha kuttet i 5 like kvantiler, lagres i kolonnen "Units_qcut", og denne kolonnen blir også lagt til "Office_df" og "Office_df" gjengitt her igjen ved å bruke "print ()". Vi merker nå disse innkoblede dataene, og legger til etikettene i "QCUT ()" -metoden, som er "Enhet 1, enhet 2, enhet 3, enhet 4 og enhet 5" og lagrer dem i "etikettene" -kolonnen også. Vi gjengir også denne DataFrame der "etikettene" -kolonnen er lagt til.
Dataene vi får etter å ha lest “Office2.CSV ”-filen er her gjengitt i form av DataFrame. Deretter blir kolonnen "Units_qcut" lagt. Etter dette legges også "etikettene" -kolonnen lagt til, som tildeler etikettene til disse finnede verdiene. Dette gjøres alt ved å bruke “QCUT ()” -metoden i “Pandas”.
Konklusjon
Vi har forklart metoden “QCUT ()” i detalj i denne opplæringen som hjelper til med å binde dataene i “Pandas”. Vi har diskutert at dataene er bedt i henhold til kvantilet "Q" -verdien som vi har lagt til i "QCUT ()" -metoden, og også har vi justert etikettene til disse innkoblede dataene. Vi har undersøkt metoden “QCUT ()” og har brukt denne metoden på kolonnene i DataFrame, og også har vi brukt denne "QCUT ()" -metoden på dataene til CSV -filen etter å ha lest CSV -filene. Vi har presentert resultatet av alle koder i denne opplæringen for å tydelig forklare og vise resultatet av “QCUT ()” -metoden.