PostgreSql Opprett histogram ved hjelp av data

PostgreSql Opprett histogram ved hjelp av data

Gjennom databehandling og analyse støtter histogrammer deg for å representere frekvensfordeling og få innsikt lett. Vi ser på noen få forskjellige metoder for å oppnå frekvensfordeling i PostgreSQL. For å bygge et histogram i PostgreSQL, kan du bruke en rekke PostgreSQL -histogramkommandoer. Vi vil forklare hver og en hver for seg.

Til å begynne med, sørg for at du har PostgreSQL-kommandolinjeskall og PGADMIN4 installert i datasystemet ditt. Nå, åpne PostgreSQL-kommandolinjeskallet for å begynne å jobbe med histogrammer. Det vil umiddelbart be deg om å oppgi servernavnet du vil jobbe med. Som standard er "localhost" -serveren blitt valgt. Hvis du ikke skriver inn en mens du hopper til neste alternativ, vil det fortsette med standard. Etter det vil det be deg om å oppgi databasenavn, portnummer og brukernavn for å jobbe med. Hvis du ikke gir en, vil den fortsette med standard en. Som du kan se fra bildet vedlagt nedenfor, vil vi jobbe med "Test" -databasen. Til slutt, skriv inn passordet ditt for den aktuelle brukeren og gjør deg klar.

Eksempel 01:

Vi må ha noen tabeller og data i databasen vår for å jobbe med. Så vi har opprettet et tabell 'produkt' i databasen 'Test' for å lagre postene til forskjellige produktsalg. Denne tabellen opptar to kolonner. Den ene er 'ordre_date' for å lagre datoen når ordren er gjort, og den andre er 'p_sold' for å spare det totale antallet salg på en bestemt dato. Prøv spørringen nedenfor i kommando-skallet for å opprette denne tabellen.

>> Opprett tabellprodukt (ordre_dato dato, p_sold int);

Akkurat nå er bordet tomt, så vi må legge til noen poster til det. Så prøv kommandoen nedenfor i skallet for å gjøre det.

>> Sett inn produktverdier ('2021-03-01', 1250), ('2021-04-02', 555), ('2021-06-03', 500), ('2021-05-04' , 1000), ('2021-10-05', 890), ('2021-12-10', 1000), ('2021-01-06', 345), ('2021-11-07', 467 ), ('2021-02-08', 1250), ('2021-07-09', 789);

Nå kan du sjekke at tabellen har fått data i den ved hjelp av SELECT -kommandoen som sitert nedenfor.

>> Velg * fra produktet;

Bruk av gulv og søppel:

Hvis du liker PostgreSQL-histogramkasser for å gi lignende perioder (10-20, 20-30, 30-40 osv.), kjør SQL -kommandoen nedenfor. Vi estimerer søppelnummeret fra uttalelsen nedenfor ved å dele opp salgsverdien med en histogram bin størrelse, 10.

Denne tilnærmingen har fordelen av å dynamisk endre søppelkassene når data blir lagt til, slettet eller endret. Den legger også til flere binger for nye data og/eller sletter binger hvis antallet når null. Som et resultat kan du generere histogrammer effektivt i PostgreSQL.

Byttergulv (p_sold/10)*10 med gulv (p_sold/100)*100 for å øke søppelstørrelsen opp til 100.

Bruker hvor leddet:

Du vil konstruere en frekvensfordeling ved bruk. For PostgreSQL, nedenfor er en annen histogramuttalelse:

>> Velg '100-300' som Price_Between, Count (P_SOLD) som telling fra produktet der P_Sold mellom 100 og 300 Union (velg '300-600' som Price_Between, Count (P_SOLD) som telling fra produktet der P_Sold mellom 300 og 600 ) Union (velg '600-900' som Price_Between, Count (P_SOLD) som telling fra produktet der P_Sold mellom 600 og 900) Union (Select '900-1300' som Price_Between, Count (P_SOLD) som Count fra produkt der P_Sold mellom 900 Og 1300);

Og utgangen viser histogramfrekvensfordelingen for totalområdet verdiene for kolonnen 'p_sold' og telletallet. Prisene varierer fra 300-600 og 900-1300 har en total telling på 4 hver for seg. Salgsområdet 600-900 fikk 2 tellinger mens rekkevidde 100-300 fikk 0 tellinger av salg.

Eksempel 02:

La oss vurdere et annet eksempel for å illustrere histogrammer i PostgreSQL. Vi har opprettet en tabell 'student' ved å bruke den siterte kommandoen nedenfor i skallet. Denne tabellen vil lagre informasjonen om studenter og antallet mislykkede tall de har.

>> Opprett tabellstudent (std_id int, fail_count int);

Tabellen må ha noen data i den. Så vi har utført innlegget i kommandoen for å legge til data i tabellen 'Student' som:

>> Sett inn studentverdier (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118 , 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50 ), (127, 40), (128, 8);

Nå har tabellen blitt fylt med en enorm mengde data i henhold til utdataene som vises. Den har tilfeldige verdier for std_id og studentenes fail_count.

>> velg * fra student;

Når du prøver å kjøre en enkel spørring for å samle inn de totale tellingene av feil en student har, vil du ha den under-uttalte produksjonen. Utgangen viser bare det separate antallet mislykkede tellinger for hver student en gang fra 'Count' -metoden som brukes på kolonnen 'std_id'. Dette ser ikke veldig tilfredsstillende ut.

>> Velg Fail_Count, Count (STD_ID) fra Student Group med 1 ordre med 1;

Vi vil bruke gulvmetoden igjen i dette tilfellet i lignende perioder eller områder. Så utfør den under-uttalte spørringen i kommandoskallet. Spørringen deler studentenes fail_count 'med 100.00 og bruker deretter gulvfunksjonen for å lage en søppel på størrelse 100. Deretter oppsummerer det det totale antallet studenter som er bosatt i akkurat dette området.

Konklusjon:

Vi kan generere et histogram med PostgreSQL ved å bruke noen av teknikkene som er nevnt tidligere, avhengig av kravene. Du kan endre histogrambøttene til alle områder du ønsker; Ensartede intervaller er ikke påkrevd. Gjennom denne opplæringen prøvde vi å forklare de beste eksemplene for å fjerne konseptet ditt angående histogramoppretting i PostgreSQL. Jeg håper, ved å følge noen av disse eksemplene, kan du enkelt lage et histogram for dataene dine i PostgreSQL.