MongoDB finner duplikater

MongoDB finner duplikater
“Har du noen gang hørt om datamaskularen mens du jobber i databaser? Når en plate, ting, person eller sted har sin eksakte kopi, sies den kopien å være duplikatet av originalen. Mens vi jobber i tradisjonelle databaser, bruker vi WHERE -leddet for å finne ut duplikatene i tabellpostene, i.e., SQL, PostgreSql. På den annen side tillater ikke MongoDB deg å bruke WHERE -leddet for å finne ut duplikatene som er satt inn i samlingene til en spesifikk database.

Det kom med den samlede funksjonen for å finne ut duplikatverdiene fra samlingen. Innenfor denne artikkelen i dag vil vi diskutere innsetting av dupliserte poster i Mongo DB -samlingene og vise dem på MongoDB -skallet ved å bruke den samlede kommandoen for samlinger. La oss starte med vår dagens artikkel ved bruk av APT -oppdatering og oppgraderingsinstruksjoner i terminalskallet til Ubuntu 20.04 System. For det må du først logge inn og åpne skallet ved bruk av “Ctrl+Alt+T.”Etter det kan du prøve den vist-below-instruksjonen på skallet ditt og legge til passordet for brukeren å fortsette oppdateringsprosessen.”

Det kan kreve din bekreftelse for å fortsette denne prosessen. Trykk på “Y” når du spør: “Vil du fortsette?”. Etter det, treff Enter -tasten.

Det kan ta mer eller mindre tid å behandle i henhold til situasjonen til systemet ditt.

Etter den komplette oppdateringen, vil du få den vist-below siste behandlingslinjene.

Etter den vellykkede systemoppdateringen og oppgraderingen, må vi åpne MongoDB -skallet for å sette inn noen samlinger og poster i databasen. Så vi har brukt "Mongo" -spørsmålet for å gjøre det, som vist på bildet. Skallet er utarbeidet med hell.

Mens vi bruker "DB" -instruksjonen på MongoDB -skallet, har vi funnet ut at "test" -databasen er tilgjengelig for vår bruk.

Derfor har vi brukt "test" -databasen for ytterligere spørsmål og opprette samling i den. For det, prøv "bruk" -instruksjonen etterfulgt av navnet på en database, i.e., "test.”

For å legge til poster, trenger vi en samling i testdatabasen. Dermed må vi lage en ny samling. For det må vi prøve ut "DB" -instruksjonen sammen med "CreateCollection ()" -funksjonen til MongoDB, etterfulgt av navnet på en ny samling i parentesen, i.e., Data. Spørringen var vellykket, og samlingen ble opprettet med suksess i henhold til statusen “OK: 1”. Dessuten mongoDB, har vi en tendens til å bruke Find () -funksjonen foran med samlingsnavnet for å vise postene til en spesifikk samling. Derfor har vi prøvd “DB” -instruksjonen etterfulgt av samlingsnavnet, jeg.e., Data, og funksjonen finner () å gjøre det. Samlingen "data" er tom akkurat nå. Dermed må vi legge til noen poster i samlingen.

For å sette inn postene i datainnsamlingen til MongoDB, må vi prøve ut innsatsen () -funksjonen i "DB" -instruksjonen sammen med dataene i form av dokumenter, i.e., Listeformat. Vi har brukt totalt 4 kolonner for dokumentdata for samlinger, i.e., _id, tittel, alder og pris. Vi har lagt til totalt 5 poster for alle disse 4 kolonnene med datainnsamling.

Posten ble lagt til med suksess i henhold til utdataene ovenfor viser antall poster 5 for alternativet “NinSerted”. Etter dette vil vi bruke Find () -funksjonen med "Data" -samlingen for å finne og vise alle postene til denne samlingen. Vi overfører ingen argumenter til parentes av en Find () -funksjon for ikke å begrense innsamlingsregistrene. Alle de 5 postene for datainnsamling er presentert i Mongo DB -skallet.

Siden vi har taklet temaet å finne duplikatene i samlingene til MongoDB, må vi også ha noen dupliserte poster i samlingene. Derfor har vi satt inn tre flere poster i datainnsamlingen som skal brukes som duplikater av noen av de allerede innsatte postene. Vi må oppdatere "_id" -kolonnen bare som ID for en hvilken som helst kolonne må være unik i MongoDB som vi pleide å gjøre i tradisjonelle databaser. Den samme innsatsfunksjonen har blitt brukt så langt med "data" -samlingsnavnet. Alle tre postene er lagt til.

Når du kjører “DB” -instruksjonen med innsamlingsnavnet “Data” etterfulgt av Find () -funksjonen igjen på MongoDB -skallet, vises totalt 8 poster på skjermen på skjermen din på skjermen. Vi kan se duplikatverdiene for andre kolonner enn "_id" i denne innsamlingsdata.

Det er på tide å prøve ut Aggregate () -metoden for "data" -samlingen for å liste opp de spesifikke kolonneverdiene som er duplisert i den. Du må bruke den vistede syntaksen til en samlet kommando i MongoDB. Alternativet “$ Group” brukes til å legge til alle dupliserte verdier av en spesifikk kolonne i en, mens alternativet $ Match vil bli brukt til å finne ut gruppene som har mer enn 1 dokument. På den annen side vil alternativet “$ prosjekt” bli brukt til å spesifisere formatet for å vise duplikatpostene. Det første feltet i alternativet "$ gruppe" vil spesifisere kolonnenavnet vi vil søke etter duplikater. Totalt 3 poster er funnet duplisert for kolonnen "Tittel" i en datainnsamling. Etter dette ble den samme spørringen prøvd for "alder" -kolonnen og fikk de tre resultatene igjen.

Konklusjon

Forklaringen på dupliserte poster er gitt i det innledende avsnittet, og vi har diskutert forskjellen mellom å finne ut duplikatene fra tradisjonelle databaser og mongoDB. For dette formålet har vi prøvd å gi en illustrasjon om å lage en ny samling innen MongoDB og sette inn poster i den. Videre har vi diskutert bruken av den samlede funksjonen for å finne ut den spesifikke kolonnen som inneholder duplikatverdien i samlingene. Denne artikkelen har vist den klare forskjellen i å finne ut duplikatene for MongoDB som en sammenligning med noen annen database.