Apache Solr

Bedste selvhostede søgemaskiner

Bedste selvhostede søgemaskiner
Ved din chef, at du leder efter et andet job? Har du fortalt din væsentlige anden om manglende evne til at beslutte, om du vil have børn eller ej? Kender I forældre til jeres seksuelle orientering? Nå, det gør Google og andre store søgemaskiner.

"De fleste brugere søger på Google, mens de er logget ind, så al information om deres online liv er tilgængelig: YouTube-søgninger, e-mails og tidligere søgehistorik," siger Adam Tauber, den ledende udvikler af privatlivets respekterende metasøgemaskine Searx.

Selvfølgelig kan du bruge Tor til anonymitet og altid slette alle spor af din aktivitet efter hver søgning, men at gøre det efter hver eneste søgning vil sandsynligvis blive gammel temmelig hurtigt. I stedet bør du overveje at installere en selvhostet søgemaskine, der er i stand til at hente oplysninger til dig uden at afsløre noget følsomt om dig.

Vi har valgt to sådanne søgemaskiner, og vi introducerer også tre yderligere søgemaskiner for at vise dig, at fremragende alternativer til proprietære søgemaskiner som Google eller Bing allerede findes og er lettere at installere og bruge, end du måske tror.

1. YaCy

YaCy er en gratis distribueret peer-to-peer-søgemaskine, hvis kernekomponent er skrevet i Java. Da alle YaCy-brugere er ens, og fordi søgemaskinen ikke gemmer brugersøgeanmodninger, er censur simpelthen ikke mulig.

I øjeblikket indekserer YaCy ca. 1.4 milliarder dokumenter i dets indeks takket være aktiviteten hos mere end 600 peer-operatører, der bidrager til det hver måned. Til sammenligning indeholder Google Search-indekset hundreder af milliarder websider og er langt over 100.000.000 gigabyte i størrelse.

Mens YaCy stadig har en lang vej at gå, før den kan konkurrere med de største centraliserede søgemaskiner i verden, er den allerede anvendelig som en søgeportal til private intranet og projektspecifikke applikationer, fordi YaCy kan fungere som et enkelt søgemaskine uden netværk med andre jævnaldrende.

YaCy kan nemt integreres på enhver webside takket være dens enkle kodestykker, der nemt kan kopieres og indsættes uden nogen ændring.

2. Searx

Searx beskrives som en privatlivsretlig, hackbar metasøgemaskine. Den er tilgængelig under GNU Affero General Public License version 3, og dens hovedmål er at beskytte brugernes privatliv ved aldrig at dele brugernes IP-adresser eller søgehistorik med de søgemaskiner, hvorfra den samler resultater.

"Når du bruger Searx, sendes IP-adressen til Searx, en tilfældig brugeragent og en søgeforespørgsel til Google som standard," forklarer Adam Tauber, aka asciimoo, hvordan hans metasøgemaskine fungerer. ”Selvfølgelig kan du tilpasse Searx til at videresende andre ekstra parametre som søgesprog eller sidenummeret på den ønskede resultatside.”

Searx blokerer automatisk alle sporingscookies, der serveres af søgemaskinerne for at forhindre brugerprofilering-baseret resultatændring, hvilket kan skyldes, at en søgemaskine forsøger at implementere søgning, som er individualiseret ud fra, hvad motoren ved om brugeren. Searx er 100 procent gratis, og alle kan ændre det efter behov. Du kan endda tage Searx-koden og køre metasøgemotoren på din egen server, som helt sikkert skulle løse eventuelle problemer, du måtte have med hensyn til logfiler.

3. Elastisk søgning

ElasticSearch er en søgemaskine baseret på Lucene, et gratis og open source-informationssøgningssoftwarebibliotek understøttet af Apache Software Foundation og frigives under Apache Software License.

ElasticSearch tilbyder en fuldtekst-søgemaskine med en HTTP-webgrænseflade. Søgemaskinen kan bruges til at søge i alle slags dokumenter, og den kan let distribueres over flere noder.

Det er muligt at oprette en selvhostet søgemaskine ved hjælp af ElasticSearch og Docker, og du kan finde en tutorial, der beskriver processen her.

4. Ambar

Ambar er en open source-dokumentsøgemaskine med mange nyttige funktioner. Det understøtter automatisk gennemsøgning, tagging og øjeblikkelig fuldtekstsøgning, bare for at give et par eksempler. En af de mest spændende funktioner i Ambar er dens evne til at udføre OCR på billeder og PDF-filer. De understøttede sprog inkluderer engelsk, tysk, russisk, italiensk, fransk, spansk, polsk og hollandsk.

Ambar kan let implementeres med en enkelt docker-compose-fil, og du kan lære at gøre det her.

5. Apache Solr

Apache Solr er skrevet i Java og er en virksomheds-søgeplatform, der inkluderer søgning i fuld tekst, fremhævning af hit, facetteret søgning, realtidsindeksering, dynamisk klyngedannelse og mange andre vigtige funktioner. Det blev oprettet i 2004 til et internt projekt hos CNET Networks. CNET Networks donerede det venligt til Apache Software Foundation i 2006, hvor det dimitterede fra inkubationsstatus til et enkeltstående topniveau-projekt i 2007.

I dag er Solr en yderst pålidelig, skalerbar og fejltolerant virksomheds søgeplatform, der styrer søge- og navigationsfunktionerne på mange af verdens største internetsider, herunder DuckDuckGo, eHarmony og BestBuy. Du kan

Sådan installeres og konfigureres YaCy

Installationen af ​​YaCy er meget enkel, og det tager kun et par minutter, fordi du ikke behøver at installere en ekstern database eller webserver-YaCy leveres med alt det nødvendige.

  1. Gå til det officielle websted for YaCy, og download den nyeste pakke til Linux.
  2. Installer OpenJDK 8-runtime-miljøet.
    • Hvis du bruger en Debian-baseret distribution, skal du bruge følgende kommando: $ sudo apt-get install openjdk-8-jre
    • Hvis ikke, skal du følge de specifikke instruktioner for din distribution.
  3. Uddrag den downloadede pakke til din foretrukne placering.
  4. Gå til den nye mappe og start “startYACY.sh ”script i Terminal.
  5. Du skal se en bekræftelsesmeddelelse, der informerer dig om, at YaCy startede som en dæmon

Konklusion

Søgemaskiner ved mere om os, end de fleste mennesker gerne vil indrømme. Hvis du gerne vil stoppe med at fodre store virksomheder med saftige data, kan du tage tingene i dine egne hænder og oprette en selvhostet søgemaskine for at beskytte dit privatliv. Selvom selvhostede søgemaskiner stadig har en lang vej at gå for at blive fuldt anvendelige, er potentialet for dem til at overgå Google ligesom der, og det at fange det er bare et spørgsmål om at tiltrække flere brugere.

Mus Sådan ændres venstre og højre museknap på Windows 10-pc
Sådan ændres venstre og højre museknap på Windows 10-pc
Det er en ganske normal, at alle computermusenheder er ergonomisk designet til højrehåndede brugere. Men der er musenheder til rådighed, der er specie...
Mus Efterlig museklik ved at svæve ved hjælp af Clickless Mouse i Windows 10
Efterlig museklik ved at svæve ved hjælp af Clickless Mouse i Windows 10
Brug af en mus eller et tastatur i den forkerte kropsholdning af overdreven brug kan resultere i mange sundhedsmæssige problemer, herunder stamme, kar...
Mus Føj musbevægelser til Windows 10 ved hjælp af disse gratis værktøjer
Føj musbevægelser til Windows 10 ved hjælp af disse gratis værktøjer
I de senere år har computere og operativsystemer udviklet sig meget. Der var et tidspunkt, hvor brugerne skulle bruge kommandoer til at navigere genne...