Beste selvhostede søkemotorer

Beste selvhostede søkemotorer
Vet sjefen din at du leter etter en annen jobb? Har du fortalt din betydningsfulle annen om manglende evne til å bestemme om du vil få barn eller ikke? Vet dere foreldre om din seksuelle legning? Vel, Google og andre store søkemotorer gjør det.

"De fleste brukere søker Google mens de er logget på, så all informasjon om deres online liv er tilgjengelig: YouTube-søk, e-post og tidligere søkehistorikk," sier Adam Tauber, hovedutvikleren for personvern-respekterende Metasearch Engine Searx.

Selvfølgelig kan du bruke TOR til anonymitet og alltid slette alle spor etter aktiviteten din etter hvert søk, men å gjøre det etter hvert søk vil mest sannsynlig bli gammelt ganske raskt. I stedet bør du vurdere å installere en selvtett søkemotor som er i stand til å hente informasjon for deg uten å avsløre noe følsomt om deg.

Vi har valgt to slike søkemotorer, og vi introduserer også tre ekstra søkemotorer for å vise deg at utmerkede alternativer til proprietære søkemotorer som Google eller Bing allerede eksisterer og er enklere å installere og bruke enn du kanskje tror.

Yacy

Yacy er en gratis distribuert peer-to-peer søkemotor hvis kjernekomponent er skrevet i Java. Fordi alle Yacy -brukere er like, og fordi søkemotoren ikke lagrer forespørsler om brukersøk, er sensur rett og slett ikke mulig.

For øyeblikket indekserer Yacy ca 1.4 milliarder dokumenter i sin indeks takket være aktiviteten til mer enn 600 fagfelleoperatører som bidrar til den hver måned. Til sammenligning inneholder Google Search -indeksen hundrevis av milliarder av websider og er godt over 100.000.000 gigabyte i størrelse.

Mens Yacy fremdeles har en lang vei å gå før den kan konkurrere kolleger.

Yacy kan enkelt integreres på hvilken som helst webside takket være de enkle kodebitene som uanstrengt kan kopieres og limes inn uten endring.

Searx

Searx beskrives som en personvern-respekterende, hackbar metasearch-motor. Det er tilgjengelig under GNU Affero General Public License versjon 3, og hovedmålet er å beskytte personvernet til brukerne ved å aldri dele brukernes IP -adresser eller søkehistorikk med søkemotorene som den samler resultater.

"Når du bruker Searx, blir IP-adressen til Searx, en tilfeldig bruker-agent og et søkesøk sendt til Google som standard," forklarer Adam Tauber, aka Asciimoo, hvordan Metasearch-motoren hans fungerer. “Selvfølgelig kan du tilpasse Searx for å videresende andre ekstra parametere som søkespråk eller sidenummeret til den forespurte resultatsiden.”

Searx blokkerer automatisk alle sporing av informasjonskapsler som serveres av søkemotorene for å forhindre bruker-profileringsbaserte resultatmodifisering, som kan være et resultat av en søkemotor som prøver å implementere søk som er individualisert basert på hva motoren vet om brukeren. Searx er 100 prosent gratis, og alle kan endre den etter behov. Du kan til og med ta Searx -koden og kjøre Metasearch -motoren på din egen server, som absolutt bør adressere eventuelle bekymringer du måtte ha angående logger.

Elasticsearch

Elasticsearch er en søkemotor basert på Lucene, et gratis og åpen kildekodeinformasjonsinnhentingsprogramvarebibliotek støttet av Apache Software Foundation og slippes under Apache Software-lisensen.

Elasticsearch gir en fulltekstsøkemotor med et HTTP-nettgrensesnitt. Søkemotoren kan brukes til å søke i alle slags dokumenter, og den kan enkelt distribueres over flere noder.

Det er mulig å bygge en selvhostet søkemotor ved hjelp av Elasticsearch og Docker, og du kan finne en tutorial som beskriver prosessen her.

Ambar

Ambar er en åpen kildekode-søkemotor med mange nyttige funksjoner. Den støtter automatisert kryping, tagging og øyeblikkelig fulltekstsøk, bare for å gi noen få eksempler. En av de mest spennende funksjonene i Ambar er dens evne til å utføre OCR på bilder og PDF -filer. De støttede språkene inkluderer engelsk, tysk, russisk, italiensk, fransk, spansk, polsk og nederlandsk.

Ambar kan enkelt distribueres med en enkelt Docker-Compose-fil, og du kan lære hvordan du gjør det her.

Apache Solr

Apache Solr er skrevet i Java, og er en bedriftssøkplattform som inkluderer fulltekstsøk, hit fremheving, fasettert søk, indeksering i sanntid, dynamisk klynging og mange andre viktige funksjoner. Det ble opprettet i 2004 for et eget prosjekt på CNET Networks. CNET Networks donerte det til Apache Software Foundation i 2006, hvor det ble uteksaminert fra inkubasjonsstatus til et frittstående toppnivåprosjekt i 2007.

I dag er Solr en svært pålitelig, skalerbar og feiltolerant, bedriftssøkplattform som driver søk- og navigasjonsfunksjonene til mange av verdens største nettsteder, inkludert DuckDuckGo, Eharmony og Bestbuy. Du kan

Hvordan installere og konfigurere Yacy

Installasjonen av Yacy er veldig enkel, og det tar bare et par minutter fordi du ikke trenger å installere en ekstern database eller webserver-yacy kommer med alt som trengs.

  1. Gå til det offisielle nettstedet til Yacy og last ned den siste pakken for Linux.
  2. Installer OpenJDK 8 -runtime -miljøet.
    • Hvis du bruker en Debian-basert distribusjon, bruk følgende kommando: $ sudo apt-get install openjdk-8-jre
    • Hvis ikke, følg instruksjonene som er spesifikke for distribusjonen din.
  3. Pakk ut den nedlastede pakken til det foretrukne stedet ditt.
  4. Gå til den nye mappen og start “Startyacy.SH ”-skriptet i terminal.
  5. Du bør se en bekreftelsesmelding som informerer deg om at Yacy startet som en demon

Konklusjon

Søkemotorer vet mer om oss enn de fleste vil innrømme. Hvis du ønsker å slutte å mate store selskaper med saftige data, kan du ta ting i egne hender og sette opp en selvtett søkemotor for å beskytte personvernet ditt. Selv om selvhostede søkemotorer fremdeles har en lang vei å gå for å bli fullt brukbart, er potensialet for dem å overgå slike som Google er der, og å fange det er bare et spørsmål om å tiltrekke flere brukere.