Svermplottet er identisk med stripplottet, bortsett fra at kantene er modifisert på en slik måte at de ikke krysser hverandre, noe som hjelper til med å illustrere visualiseringen av dataene. En svermgraf er opprettet alene. Men det er foretrukket å bruke den i forbindelse med en boks siden de tilsvarende titlene brukes til å merke dimensjonene. La oss tegne svermkartene ved hjelp av SwarmPlot () -funksjonen.
Eksempel nr.1:
Her lager vi et kategorisert sannsynlighetsplott med prikker som ikke overlapper hverandre. Så vi bruker SwarmPlot () -metoden for å lage et plott som inneholder de diskrete verdiene.
1 2 3 4 5 6 7 8 9 10 11 12 1. 3 14 15 16 17 18 | Importer pandaer som PD Importer matplotlib.Pyplot som Plt Importer sjøborn som SNS df = pd.DataFrame ("Quantity": [15,26,17,18,15,36,27,18,25,16,17,28,15,16,17,28], "Pris": [1900.1000.1500.1600.1300.1400.1500.1800.1100.1200.1400.1500.1600.1700.1800.1900]], "Måned": [2,3,2,3,2,3,2,3,4,4,4,5,5,5,4,3], "Merchandise": ['x', 'x', 'x', 'x', 'z', 'z', 'z', 'z', 'Y', 'y', 'y', 'y', 'x', 'x', 'z', 'z']) sns.SwarmPlot (data = df, y = "pris", x = "kvantitet") plt.forestilling() |
I begynnelsen av koden integrerer vi pakkene Pandas som PD, matplotlib.Pyplot som PLT, og Seaborn som SNS. Deretter spesifiserer vi datasettet ved hjelp av DataFrame () -metoden. Denne funksjonen er assosiert med Pandas -modulen. Vi lager fire forskjellige matriser. Den første matrisen inneholder mengden av produktene som er utsolgt. Den andre matrisen viser prisene på produktene. Den tredje matrisen har rekorden for månedene. Den siste matrisen har data om produktnavnene.
I neste trinn ønsker vi å tegne svermgrafen, så vi kaller SwarmPlot () -funksjonen. Til slutt bruker vi showet () funksjonen til matplotlib.Pyplot Library.
Eksempel nr.2:
Vi bruker Hue -argumentet innen SwarmPlot () -metoden og deler segmentene for flere produkter i dette tilfellet. Ved å spesifisere verdien av "Dodge" -parameteren til True, segregerer vi elementene. Vi kan også passere noen tilleggsparametere ved å bruke SwarmPlot () -metoden. Størrelsesparameteren brukes til å justere "størrelsen" på elementene.
Ved hjelp av "palett" -attributtet endrer vi fargevalget for forskjellige grupper. Alternativet "LineWidth" gir en grense til den definerte bredden på prikker. La oss bruke alle tidligere parametere i koden.
1 2 3 4 5 6 7 8 9 10 11 12 1. 3 14 15 16 17 18 19 | Importer pandaer som PD Importer matplotlib.Pyplot som Plt Importer sjøborn som SNS df = pd.DataFrame ("Quantity": [15,26,17,18,15,36,27,18,25,16,17,28,15,16,17,28], "Pris": [1900.1000.1500.1600.1300.1400.1500.1800.1100.1200.1400.1500.1600.1700.1800.1900]], "Måned": [2,3,2,3,2,3,2,3,4,4,4,5,5,5,4,3], "Produkt": ['x', 'x', 'x', 'x', 'z', 'z', 'z', 'z', 'Y', 'y', 'y', 'y', 'x', 'x', 'z', 'z']) sns.SwarmPlot (data = df, y = "pris", x = "mengde", fargetone = 'produkt', dodge = true, LineWidth = 3.5, palett = 'set2', størrelse = 14) plt.forestilling() |
Først av alt integrerer vi de nødvendige overskriftsfilene. Pandas -biblioteket er integrert som PD, matplotlib.Pyplot er integrert som PLT, og Seaborn er integrert som SNS. DataFrame () -funksjonen brukes til å oppgi datasettet. Pandas -pakken er koblet til denne metoden. Vi lager fire unike matriser. Antall utsolgte varer er representert i den første matrisen. Prisingen av varene vises i den andre matrisen. Månedens data holdes i den tredje matrisen. Titlene på varene lagres i forrige matrise.
Nå er svermfiguren tegnet, og dermed bruker vi SwarmPlot () -metoden. Datasettet, X- og Y-Axis-etikettene, fargetone, dodge, linjebredde, palett og størrelse er alle argumenter for denne metoden. Verdien av "fargen" er produktet. "LineWidth" er 3.5. "Paletten" er Set2. Og "størrelsen" er 14. Vi avslutter koden ved å illustrere den resulterende plottet, så vi bruker Show () -metoden.
Eksempel nr.3:
Hver dimensjon av "fargetone" -parameteren er representert av et utpekt område på det statistiske kategoriplanet. Vi konfigurerer "Dodge" til True mens vi bruker "fargetone" -parameteren, og det isolerer elementene for flere fargetoneriasjoner. "Palett" -parameteren brukes til å skildre de forskjellige nyanser av Hue -attributtet.
1 2 3 4 5 6 7 8 9 10 11 12 | Importer sjøborn Importer matplotlib.Pyplot som Plt Seaborn.set (style = "whiteGrid") Tips = Seaborn.LOAD_DATASET ("TIPS") Seaborn.SwarmPlot (x = "Day", y = "total_bill", Hue = "røyker", data = tips, palette = "set2", dodge = true) plt.forestilling() |
Etter å ha inkludert sjøborn og matplotlib.Pyplot -biblioteker, vi kaller SET () -funksjonen til Seaborn -pakken. Vi passerer stilen som parameter til denne funksjonen. Vi gir "WhiteGrid" -verdien til stilparameteren. Det viser bakgrunnsfargen på grafen.
Nå får vi den innebygde datarammen, så vi bruker Load_Dataset () -funksjonen. Denne funksjonen er hentet fra Seaborn Header -filen, og den inneholder "tips" som argument. Deretter bruker vi SwarmPlot () -metoden for å lage Swarm -diagrammet. Her spesifiserer vi tittelen på begge aksene, verdien av fargetone, data, palett og Dodge som parametrene til funksjonen. X-aksen viser dagens rekord, mens y-aksen viser posten til total_bill. For å representere den endelige grafen, kaller vi Show () -metoden. Matplotlib.Pyplot -modulen inneholder denne funksjonaliteten.
Eksempel nr.4:
Ved hjelp av "markør" -attributtet så vel som "alfa" -argumentet, tegner vi de enorme punktene og forskjellige stiler. Vi bruker "alfa" -attributtet for å kontrollere datoverdiens synlighet. Og bruk "markør" -argumentet for indikatoren for å endre datasettet.
1 2 3 4 5 6 7 8 9 10 11 12 1. 3 14 15 16 17 18 19 | Importer sjøborn Importer matplotlib.Pyplot som Plt Seaborn.set (style = "whiteGrid") Tips = Seaborn.LOAD_DATASET ("TIPS") Seaborn.SwarmPlot (x = "Day", y = "total_bill", Hue = "røyker", data = tips, palette = "set2", størrelse = 30, markør = "*", edgecolor = "svart", alfa =.35) plt.forestilling() |
Her introduserer vi Seaborn og Matplotlib.Pyplot -rammer. Set () -metoden til den sjøbornede komponenten brukes. Stilen leveres som et argument for denne metoden. Vi gir stilvariabelen "WhiteGrid" -verdien. Det viser det visuelle utseendet til diagrammet.
Vi har tenkt å få den innebygde datarammen, så vi kaller Load Dataset () -metoden. Denne metoden er oppnådd fra Seaborn -malen og har parameteren "TIPS". Svermfiguren er deretter opprettet ved hjelp av SwarmPlot () -teknikken. Funksjonens inngang.
X-aksen demonstrerer dagens data, mens y-aksen indikerer den totale regningens post. Markørene for formen '*' med størrelsen 20 finnes i dette svermkartet. Showet () funksjonen til matplotlib.Pyplot brukes til å skildre den ultimate grafen.
Konklusjon
Vi diskuterte de forskjellige teknikkene for å plotte svermplottet i denne artikkelen. Svermkart er en form for spredningsgraf som brukes for å vise kategoriske data. Det forhindrer at elementene overlapper. Vi kan bruke SwarmPlot () -metoden for å tegne disse tomtene. Hver gang prøvestammen er enorm, kan vi ikke bruke denne typen graf.