Hva er SVM?
SVM eller Support Vector Machine er en overvåket maskinlæringsteknikk for å analysere data for regresjon og klassifisering. Målet med SVM-algoritmen er å definere den optimale beslutningsgrensen eller linjen som kan kategorisere det n-dimensjonale rommet, slik at vi kan klassifisere ferske datapunkter i fremtiden raskt. Denne beslutningsgrensen er kjent som et hyperplan. Dette gjør at modellen din kan sortere et merket datasett og kategorisere umerket inngang. Det er en av de mest populære overvåkede læringsalgoritmene og brukes ofte til å klassifisere bilder ved å bruke funksjonene som er utvunnet av et dypt konvolusjonelt nevralt nettverk.
Anta at du har noen lineært separerbare punkter i papiret ditt som er av forskjellige slag. SVM vil lokalisere en rett linje som så langt det er rimelig mulig deler disse punktene i to kategorier. Se for deg to par punkter som ligger på et fly. De første er røde, mens resten er blå. For å optimalisere avstanden fra begge punkter, søker en støttevektormaskin ut en linje som deler de røde punktene fra de blå. Dette er kjent som Største forskjellsmargin. Det er viktig å måle avstanden fra linjen til punktene ved grensene til de to punktene for å bestemme margen med den største forskjellen. De omtaler dem som Støtte vektorer. Punktene må skilles med en linje siden de må skilles med en. Begrepet for dette er lineær separabilitet. Kjernetrikset er et avgjørende tillegg til supportvektormaskinalgoritmen for å overvinne denne begrensningen. Dette flytter dataene til et høyere dimensjonalt rom og bruker en lineær funksjon for å skille dem der der. Gjennom en såkalt kjerne blir transformasjonen utført. Dette kan bare tenkes fordi den lineære funksjonens beregning for å skille dataene avhenger av støttevektorenes/punkter 'DOT -produkt. Enkelt sagt: For å forhindre bruk av en linje for å dele de røde fra de blå punktene, må du blande dem på flyet.
Løft de røde, og la de blå nede. Det er nå åpenbart at du kan skille punktene ved hjelp av et fly. Kjerneteknikken oppnår dette. Det endrer dataene i en høyere dimensjon for antagelig lineært separerbare. Å løfte den la til en tredje dimensjon (tre dimensjoner), som skilte punktene med en linje i tre dimensjoner, et fly, mens punktene på gulvet (to dimensjoner) ikke var.
Fordeler med SVM
Ulemper ved SVM
Implementering av SVM i Sklearn
Importere bibliotekerProduksjon
Togdata er [[-2.02514259 0.0291022 -0.47494531… -0.33450124 0.86575519Produksjon
Støttevektorer er [[-2.02514259 0.0291022 -0.47494531… -0.33450124 0.86575519Konklusjon
Vi gikk gjennom forklaringen av Support Vector Machines (SVM) sammen med deres fordeler, ulemper og implementering. SVM trekker hyperplaner mellom punkter med den største marginen og kan brukes til klassifisering og regresjonssaker. Vi så hvordan Sklearn gir oss en enkel måte å implementere SVM og få detaljer om støttevektorene.