En database er en samling av data som er lagret i et datasystem. SQL er et av de mest universelle programmeringsspråket som kan utføre tusenvis av funksjoner, inkludert lesing, skriving og manipulering av data.
Det er standard programmeringsspråk for styring av relasjonsdatabaser og brukes av informatikere, dataanalytikere og dataforskere over hele verden.
I denne guiden vil vi gå over SQL -uttalelser eller spørsmål som brukes mye i datavitenskap.
Denne guiden bruker PostgreSQL -programvare for å kjøre spørsmålene. Du kan laste den ned fra det offisielle nettstedet ved å klikke her.
Når det er sagt, la oss begynne!1
1. Velge alle kolonnene
Select -setningen er en av de mest grunnleggende SQL -spørringene. Denne uttalelsen hjelper deg å velge noen eller alle kolonnene fra databasen. Du vil bruke denne funksjonen gjennom dine datavitenskapelige prosjekter.
For å velge alle kolonnene, bruk '*' som vist i følgende eksempel:
“Produkt” er en tabell som består av 3 kolonner. Etter å ha kjørt forrige spørring, kan vi se på kolonnene som er til stede inne i produkttabellen.
2. Fra klausul
Fra klausulen kommer etter valg og hjelper til med å identifisere hvor kolonnen er plassert i tabellen ved navn.
Når du spesifiserer flere tabeller, bruk komma og plass mellom tabellnavnene. Dette vises i følgende eksempel:
Utgangen er mer spesifikk med bare en kolonne. Dette vises i det følgende:
3. Hvor klausul
Neste uttalelse etter fra er hvor. Det hjelper oss å filtrere dataene fra databasen basert på visse betingelser.
Produksjon:
4. Gruppe etter uttalelse
Denne klausulen brukes til å velge og gruppere radene som har de samme verdiene.
I den gitte SQL -spørringen vil vi gruppere to rader der Product_Price er lik 6.
Utgangen vil ha en ny kolonne som heter Count. Det blir fulgt av produktnavn -kolonnen som vist i følgende:
5. Har uttalelse
Aggregeringsfunksjoner som sum, AVG, Max, Min, etc. Kan ikke brukes i hvor leddet. For å bruke dem, må du bruke uttalelsen. Dette demonstreres ved hjelp av følgende kode:
Produksjon:
6. Bestill etter uttalelse
Fra navnet brukes ordre etter kommando til å liste opp postene i stigende eller synkende rekkefølge. For stigende, bruk bestilling av alene eller legg til nøkkelordet “ASC” langs det. Tilsvarende, for å sortere verdiene i synkende rekkefølge, bruk nøkkelordet “Desc” sammen med orden av.
For synkende orden:
Produksjon:
Tilsvarende for stigende rekkefølge:
Produksjon:
7. Begrensningsuttalelse
Limit er en viktig SQL -setning som hjelper deg å spesifisere antall poster som skal returneres fra databasen. For eksempel, for å returnere bare to rader fra databasen vår, bruker du Limit -kommandoen som følger:
Produksjon:
8. Forhåndsdefinerte datafunksjoner
Forhåndsdefinerte funksjoner er veldig viktige i SQL, da de hjelper dataforskerne med å spare tid. Disse funksjonene kalles også samlede funksjoner som fungerer på et sett med rader i stedet for en enkelt rad og returnerer en enkelt verdi. Det er mange forskjellige aggregatfunksjoner. Noen viktige er oppført i følgende:
Count (*) -> Returnerer antall rader.
Min () -> finner minimumsverdien i kolonnen.
Max () -> finner maksimal verdi i kolonnen.
Sum () -> Summen av alle verdiene i kolonnenavnet.
Hva er den maksimale prisen i datatabellen vår?
Produksjon:
9. Indre, venstre og høyre blir med
Det er mange typer sammenføyninger, men de tre viktigste blir diskutert her.
Inner Join er den enkleste og vanligste sammenføyningen som brukes til å lage en ny tabell som har matchende rader i både venstre og høyre kolonner.
Produksjon:
Venstre -sammenføyningen returnerer alle radene i venstre kolonne og de matchende radene i høyre kolonne.
Produksjon:
Her ble vi med i Product_Profit -kolonnen fra tabell2 med produktnavn -kolonnen i tabell 1.
Høyre sammenføyning er det motsatte av venstre sammenføyning. Den returnerer alle radene som er til stede i høyre kolonne og de matchende radene i venstre kolonne.
10. Underlag
Sist, men ikke minst, har vi subquery som også er kjent som et indre spørring. Det er nestet inne i et større spørsmål som kan oppstå i enten Select, fra eller hvor leddet.
En subquery er ikke begrenset til disse klausulene. Det kan også forekomme i andre klausuler som sletting, innsats eller oppdatering.
Et annet viktig trekk ved subquery er at du kan bruke de logiske operatørene som>, <, or =. A subquery is also executed first before its parent query.
For eksempel:
Produksjon:
Konklusjon
I denne artikkelen gikk vi over de viktige SQL -spørsmålene for dataforskere. Disse spørsmålene er veldig vanlige og kan brukes av fagpersoner som dataingeniører, dataanalytikere osv. Den beste måten å lære alle disse spørsmålene er å lage din egen database og deretter øve så mye du kan. Med denne guiden som grunnlaget, kan du nå lære om mer avanserte spørsmål for datavitenskap.