BNN INNLEDNING

BNN INNLEDNING
Dyp læring og nevrale nettverk har forvandlet måten vi lever. Siden introduksjonen har forskere brukt dem til å ta opp tusenvis av problemer, og inkorporere dem i praktisk talt alle omgivelser. De mest populære selvkjørende bilene har anerkjennelse, overvåking, virksomhet og andre teknologier. Det er forskjellige nevrale nettverk basert på forskjellige brukssaker, som hver passer til en viss applikasjon. Vi vil gå gjennom det Bayesiske nevrale nettverket, dets arkitektur og fordeler og ulemper i denne artikkelen.

Hva er et nevralt nettverk?

Den kunstige menneskelige hjernen er konstruert og programmert for å løse forskjellige kompliserte problemer i en brøkdel av sekunder, muligens på grunn av nevroner som er til stede inne i hjernen. Mens vi bygger et nevralt nettverk, prøver vi å implementere funksjonaliteten til hjerneneuronene kunstig gjennom matematikk. Nettverket av kunstige nevroner blir referert til som et nevralt nettverk.

Det primære målet er å etterligne funksjonene til den menneskelige hjernen. I likhet med hvordan nevroner i menneskets hjerneoverføringssignaler som hjelper en person med å reagere på en gitt inngangssituasjon, bygges nevrale nettverk ved å bruke flere Perceptron -lag som kommuniserer et faktisk antall eller en kontinuerlig verdi (signal) som viser utgangen. Figuren nedenfor viser den grafiske representasjonen av et nevralt nettverk med forskjellige lag.

Det er tre typer lag til et nevralt nettverk:

  • Inngangslag: Dette er laget som mottar brukerinngang. Disse kalles populært funksjonene i utdataene.
  • Skjult lag: Dette laget sitter mellom inngangs- og utgangslagene. Alle de nødvendige beregningene av matematisk kompleks utføres her. Det er her nevrale nettverk lærer å løse det gitte problemet.
  • Utgangslag: Dette laget leveres etter flere transformasjoner og optimaliseringer.

Hvert tette lag har noder som er koblet til andre lag med kanter. Vekter Betydning av verdien av informasjon tildelt hver node er tilordnet disse kantene. En positiv vekt indikerer at noden er involvert i en eksitatorisk forbindelse, mens en negativ vekt indikerer at noden er involvert i en hemmende tilkobling.

Bayes teorem

Bayes -teoremet er et sannsynlighetsuttrykk eller en formel for å finne ut en betinget sannsynlighet for en bestemt (til og med en) hendelse gitt forekomsten av en annen (hendelse b) andre hendelse ved hjelp av oppdatert informasjon fra (i) dens omvendte betingede sannsynlighet, (ii) Den ubetingede (tidligere) sannsynligheten for den første påståtte hendelsen, og (iii) den ubetingede sannsynligheten for den andre bevisarrangementet.

Tekstklassifiseringen er den mest populære. I forskjellige maskinlæringssituasjoner er Bayes -teoremet ofte ansatt. Bayes -teoremet har følgende formel:

Hva er et bayesisk nevralt nettverk?

Et Bayesian -nettverk er en statistisk modell som brukes til forskjellige felt og data mining tilnærminger. Bayesiske nettverk illustrerer gjensidig avhengighet mellom variabler ved bruk av sannsynlige modeller, der hver variabel tar sin verdi fra sin diskrete distribusjon med kjent tidligere sannsynlighet. Dette nettverkets tidligere og bakre noder inkluderer sannsynlighetsfordelingene for skjulte variabler. I kontrast inneholder den bakre noden den betingede sannsynlighetsfordelingen av skjulte variabler gitt observerte verdier av synlige variabler. Fordelen med Bayes Net over andre algoritmer er at det ikke krever et treningssett med Ground Truth Label -klassifiseringer for å gjennomføre klassifisering i stedet for å stole på strukturlæring eller parameterestimering.

Kunstig nevralt nettverk (ANN) vs. Bayesian nevrale nettverk

Anns Modell er hvordan en biologisk hjerne løser problemer med enorme klynger av biologiske nevroner koblet for å danne et nettverk. ANN er basert på en omfattende samling av nevrale enheter. Nevrale nettverk er svært strukturerte nettverk med tre lag: inngang, utgang og skjulte lag, som er alle nivåer mellom inngangs- og utgangslagene og utfør stort sett lineære algebraiske beregninger for å få resultatet.

Bayesiske nettverk er en sannsynlighetsrettet acyklisk grafisk modell (en slags statistisk modell) som bruker en rettet acyklisk graf for å beskrive en samling av tilfeldige variabler og deres betingede avhengigheter.

Fordeler med Bayesiske nevrale nettverk

  1. Bayesiske nettverk er universelt nyttige fordi deres fungerende algoritme er tett knyttet til den faktiske verden.
  2. Bayesiske nevrale nettverk beregner prediksjonsusikkerheter automatisk.
  3. De tar for seg overmonteringsproblemene ved å ta vektfordelingene i betraktning.

Ulemper ved Bayesiske nevrale nettverk

  1. De krever ganske godt kjent forståelse av statistikk og matematikk.
  2. De er utfordrende å trene og ta lang tid å trene.

Hvorfor bruke BNN -er?

  1. BNN -er bruker ikke direkte vektene til treningen. I stedet bruker de fordelinger av vekter for trening og unngår til slutt det overmonteringsproblemet.
  2. De gir en naturlig tilnærming for beregning av usikkerheten automatisk.

Konklusjon

Vi vet nå at et nevralt nettverk bare er et nettverk av kunstige nevroner som samarbeider for å løse forskjellige problemer i den virkelige verden. Det kunstige nevrale nettverket er den enkleste typen nevrale nettverk. Det Bayesiske nettverket er et annet slags nevralt nettverk som fungerer med sannsynlighet og er nært knyttet til utfordringer i den virkelige verden. Det er imidlertid noen ganger tøft å trene og krever en god kommando av matematikk.