Lineær regresjon i r

Lineær regresjon i r
En av de mest brukte dataanalysemetodene er regresjon. Maskinlæring går videre, og med det kommer en kjent algoritme: den lineære regresjonen. Denne artikkelen vil gjøre deg kjent med hvordan du bruker Rs lineære regresjonsfunksjon. Regresjonsmodeller passer til linjer til de observerbare dataene for å tolke assosiasjoner med variablene. Du kan bruke teknikken for å bestemme hvordan en avhengig variabel endres som de uavhengige variablene.

Regresjonsutforskning er en populær statistisk teknikk for å etablere en modell av forholdet mellom to variabler. En av disse variablene blir referert til som en prediktorvariabel, og verdien bestemmes gjennom studier. Responsvariabelen er den andre variabelen, og prediktorvariabelen tillater den å få en verdi.

Hva er den lineære regresjonen på R -programmeringsspråket i Ubuntu 20.04?

De to variablene er koblet sammen med en ligning i lineær regresjon, der den eksponentielle kraften til begge variablene er en. Når den er avbildet som en graf, indikerer en lineær forbindelse en rett linje i matematikk. En kurve dannes av en ikke-lineær forbindelse der eksponentiell verdi av noen variabel ikke tilsvarer en.

Syntaks av lineær regresjon i den matematiske ligningen:
Lineær regresjon har den påfølgende matematiske ligningen rundt hele tiden:

y = øks+b

Syntaks av den lineære regresjonen i R -programmeringsspråk:
I R er den grunnleggende syntaks for å utføre en regresjonsanalyse som følger:

lm (y ~ x)

Hvor y er varen som inneholder variabelen som skal forutses som er avhengig, og x er den matematiske modellens formel. LM () -kommandoen returnerer X -koeffisientene, men har ingen andre statistiske data. Vi kan bruke LM () -funksjonen til å lage en relasjonsmodell mellom prediktoren og responsvariabelen.

Hvordan lineær regresjon brukes i R i Ubuntu 20.04

Følgende er de fire trinnene for å etablere et forhold:

  • Bruke LM () -metodene i R, bygg en relasjonsmodell.
  • Samle koeffisientene først fra modellen du konstruerte og bruk dem til å lage den matematiske ligningen.
  • For å finne ut den gjennomsnittlige unøyaktigheten i prediksjon, må du få et sammendrag av forholdsmodellen også kjent som rester.
  • Bruk prediction () -funksjonen i R for å forutsi den nye verdien for X-avskjæringen.

Eksempel 1: Få regresjonskoeffisientene ved å lage en relasjonsmodell

Her opprettet vi den enkle forholdsmodellen til de to variablene for å utføre regresjonen ved å bruke LM () -funksjonen. Dette får oss koeffisientene til forholdsmodellen. La oss demonstrere dette ved å bruke følgende skript:

Som vist i forrige eksempel, erklærte vi en variabel “A” som initialiseres med noe tilfeldig tall som vektorrepresentasjon. Deretter opprettet vi en annen variabel som vi også tildelte samlingen av tilfeldige tall. LM () -funksjonen kalles inne i den nye variable relasjonen. Til denne LM () -funksjonen passerte vi “A” og “B” -variablene for å generere sammenhengene mellom dem. Til utskriftsfunksjonen sendes forholdsvariabelen for å vise utgangen.

Når den forrige regresjonskoden blir utført, viser den regresjonen av koeffisientresultater av variabelen “A”.

Eksempel 2: Få et sammendrag av forhold

Sammendrag () -metoden i R kan brukes til å se modellens resultater. Denne funksjonen oppretter en tabell med de mest essensielle inngangene fra den lineære modellen.

Her opprettet vi variabelen “A” som vi tildelte samlingen av noen tall. Det er en annen variabel “B” som også har noe tilfeldig tall. Disse variablene kalles nå inne i LM () -funksjonen som er lagret i den variable relasjonen. Her er variabelen “B” den avhengige variabelen som skal forutses. I utskriftsfunksjonen har vi en sammendragsfunksjon for regresjonsforholdet. Vi passerte forholdsvariabelen i sammendragsfunksjonen som en inngang.

Denne utgangstabellen oppsummerer formelen som genererte resultatene (“Ring”) og beskriver modellrestene (“Residuals”), som representerer hvordan hele modellen passer til de faktiske dataene. "Koeffisienter" -tabellen kommer neste. Den første raden viser estimeringene i Y-avskjæringen, mens den andre raden viser modellens regresjonskoeffisient.

Eksempel nr. 3: Bruke prediktfunksjonen for nye verdier

Vi bruker prediktfunksjonen i lineær regresjon for de nye verdiene. Denne funksjonen tar to parametere til objektet og de nyopprettede dataene som er vektoren. Formelen som allerede er produsert med LM () -funksjonen, kalles objekt. Vektoren nye data omfatter den nye verdien for prediktorvariabelen.

Som reflektert i det forrige bildet, opprettet vi først to vektorer, “V1” og “V2”. Deretter kalte vi disse vektorene i LM () -funksjonen. Vektoren “V1” er den forutsagte variabelen og “V2” er responsvariabelen. Deretter, med den nye variabelen “X”, finner vi den nye verdien med “V1” tilsvarer 150. Predict -funksjonen tar “X” -objektet og LM () -funksjonsresultatene.

Når det forrige R -skriptet blir utført, genererer det følgende resultater:

Eksempel 4: gjengi den lineære regresjonsplottet

Vi kan også opprette foringens regresjonsplott i r. Vi visualiserte den lineære regresjonsgrafen fra følgende skript:

Vi opprettet prediktor og responsvariabel som "x" og "y". Deretter ringte vi dem inne i LM () -funksjonen. Plott PNG -filen opprettes der plottet blir visualisert. Deretter stylet vi vår lineære regresjonsplott med noen innganger i plottfunksjonen.

Du kan se den lineære regresjonsplottet som følger:

Konklusjon

Artikkelen lineær regresjon i R havner her. Lineær regresjon er et veldig stort tema, men vi leverte alle mulige forklaringer som kreves for dette emnet. Koblingen mellom to variabler kan estimeres ved bruk av lineær regresjon. Her dekket vi noen eksempler på lineær regresjon. Vi har LM () -funksjonen som brukes i den lineære regresjonen. Deretter forsto vi den lineære regresjonssammendragsfunksjonen. Forutsetningsfunksjonen er også demonstrert, og vi representerte også den lineære regresjonen grafisk.