Hva er klassifisering?
For det første, for å implementere noe i Python eller noe annet programmeringsspråk, må du forstå dens grunnleggende funksjonalitet, slik at du effektivt kan skrive koden for den. Så la oss først forklare klassifiseringsbegrepet og gå videre til å implementere den logistiske regresjonen ved hjelp av Scipy Library -funksjonene.
I datavitenskap og maskinlæring er klassifisering et underfelt av overvåket maskinlæring som gir spådommer om kategorien eller klassen som en enhet vil høre til basert på attributtene. Den analyserer samlingen av observasjoner ved matematisk å beskrive avhengigheten mellom input og utgangsdata. Det skaper en tilkobling eller kobling mellom avhengige og uavhengige variabler, og det gjør det ved å jobbe med begge. Det kan brukes innen forskjellige felt av teknologi og vitenskap til forskjellige formål som bildegjenkjenning, tekstklassifisering osv.
Hva er logistisk regresjon?
Logistisk regresjon er en overvåket maskinlæringsteknikk for klassifisering som er sammenlignbar med lineær regresjon og er medlem av Class of Linear Classifiers. Det er en veldig praktisk, ukomplisert og rask metode for å tolke resultatene. Det kan ikke bare brukes til binær klassifisering, men også multiklasseproblemer. I matematikk fungerer logistisk regresjon med naturlig logaritme og sigmoidfunksjoner. Sigmoid-funksjonen er den S-formede kurven til en variabel som har enten 0 eller 1 på nesten alle domener. Mens den naturlige logaritmen er logaritmen til et tall til basen.
Hva er logistisk regresjon i Scipy Python?
Ideen bak logistisk regresjon er den samme i Scipy Python som vi diskuterte tidligere. Scipy -biblioteket gir logistikk () -funksjonen for å beregne den logistiske regresjonen i Python -programmet. Vi vil forklare noen vanlige tilfeller av logistisk regresjon ved hjelp av eksempler. Men før det, la oss lære og forstå syntaksen til den logistiske funksjonen levert av Scipy -biblioteket.
Syntaks av Scipy Logistic () -funksjon i Python
Logistic () -funksjonen til Scipy -biblioteket brukes til å generere de kontinuerlige tilfeldige variablene, og det fungerer med metodene til RV_Continuous -klassen. Den arver alle metodene, funksjonene og funksjonalitetene til RV_Continuous -klassen for å fullføre de spesifikke detaljene i den logistiske regresjonen. Logistic () -funksjonen bruker følgende sannsynlighetstetthetsfunksjon:
Som er et spesielt tilfelle av genlogistisk med C = 1. Se syntaks for den logistiske funksjonen med metodene i RV_Continuous -klassen nedenfor:
Her refererer objektet 'Logistic_gen' til en av metodene i RV_Continuous -klassen. Noen av metodene for RV_Continuous -klassen er PPF, PDF, CDF, Logpdf, RVS, SF, ISF, etc. La oss nå gå videre til eksempleseksjonen for å lære å implementere logistikk () -funksjonen i et Python -program.
Eksempel 1:
Tenk på prøvekoden nedenfor for å forstå arbeidet med Logistic () -funksjonen til Scipy Library. Her implementerer vi logistikk () -funksjonen med PPF- og PDF -metoder. PPF står for prosentpoengfunksjon som brukes til å få persentilen av dataene og PDF -står for sannsynlighetstetthetsfunksjon og brukes til å få sannsynlighetstettheten til dataene. Se prøvekoden gitt nedenfor, så forklarer vi hver del trinn for trinn:
Importer numpy som NPLa oss snakke om bibliotekene først og deretter resten av programmet. Vi trenger det numpy biblioteket for å generere og lagre dataene i et numpy objekt. Vi trenger Scipy -biblioteket for å bruke funksjonen til statistikkpakken. Vi trenger matplotlib -biblioteket for å plotte dataene i en graf. Derfor importerte vi alle tre bibliotekene sammen med tilhørende pakker og funksjoner som vi vil kreve videre. Etter det er 1 x1 -størrelsen for å plotte grafen definert av Subplot (1, 1). Variabelen X inneholder dataene for sannsynlighetstetthetsfunksjonen som vil gi den logistiske PDF. Den logistiske PDF har blitt frosset i variabelen RV, og begge resultatene har blitt gitt til plottet () -funksjonen, så vis dem i grafen. La oss nå se grafen generert nedenfor:
Eksempel 2:
Tidligere implementerte vi PDF -funksjonen for å generere logistisk regresjon og deretter frøs den. La oss nå sammenligne resultatet av CDF -metoden med PDF -metoden i dette eksemplet. Vurder prøvekoden gitt i kodebiten nedenfor:
Importer numpy som NPDen første delen av programmet er den samme som vi definert i forrige eksempel. Implementeringen av CDF -metoden er lagt til dette programmet. For å sammenligne linjen til den logistiske PDF, genererte vi histogrammet til CDF -metoden. La oss se grafen gitt på skjermdumpen nedenfor:
Eksempel 3:
La oss implementere en annen metode i RV_Continuous -klassen for å forstå arbeidet med logistikken () -funksjonen. Vurder prøvekoden gitt i kodebiten nedenfor:
Importer numpy som NPVi brukte det samme programmet som vi gjorde i de foregående eksemplene, vi erstattet nettopp CDF -metoden med LogCDF -metoden. La oss nå sammenligne resultatene fra CDF -metoden og LOGCDF -metoden ved å sammenligne utgangene fra begge programmene. Se resultatet gitt nedenfor:
Konklusjon
Denne guiden ga en rask oversikt over den logistiske regresjonsfunksjonen levert av Scipy Library. En overvåket maskinlæringsmetode som tilbys i klassifiseringsgruppen er logistisk regresjon. Logistisk regresjon er en av dens viktige teknikker, og klassifisering er også en viktig anvendelse av maskinlæring. Vi demonstrerte noen eksempler for å vise hvordan vi implementerer logistikk () -funksjonen til Scipy Library.