E-Book-Suchmaschine i-book.in

2019-08-31 · 1408 · 23 min

Wenn Sie meine vorherigen Artikel gelesen haben, müssen Sie wissen, dass ich einmal eine E-Book-Suchmaschine mit 10.000 kleinen Büchern gebaut habe, die aber nie veröffentlicht wurde. Der Hauptgrund sind Urheberrechtsprobleme. Es ist nicht illegal für mich, diese Dokumente persönlich privat zu besitzen, solange ich nicht schreie, dass niemand weiß, dass ich diese Dokumente habe, aber es ist illegal, sie öffentlich zu verbreiten und öffentlich zu teilen. Und ich wollte dieses Material nicht im Internet vergraben, ich wollte, dass es weiterhin glänzt, also beschloss ich, die Suchmaschine öffentlich zu machen. Aber davor habe ich einige kleine Arbeiten durchgeführt, um zu verhindern, dass mein zukünftiges Ich wegen dieser Entscheidung jetzt in Schwierigkeiten gerät.

Bücher sind die Leiter des menschlichen Fortschritts. -Gorki

Dann sind E-Books Aufzüge. ——SaltyLeo

Update vom 23.9.2019: Algolia-UI-Demo hinzugefügt, es scheint, dass meine Hauptseite außer Betrieb sein kann, wenn die Hauptseite aufgehängt ist, können Sie diesen Link verwenden, um darauf zuzugreifen: i-Book.in Algolia-UI-Demo

Update vom 21.9.2019: Die reCAPTCHA-Herausforderung von CloudFlare wurde hinzugefügt, und alle Download-Links müssen vor dem Herunterladen überprüft werden.

Update vom 10.9.2019: Google speichert diese Suchmaschine im Cache, was bedeutet, dass, wenn die Hauptseite hängen bleibt, auch über den Cache darauf zugegriffen werden kann, und auch https "Googles Zertifikat" für die gesamte Website, was wahrscheinlich der Vorteil von rein dynamischen Seiten ist. Link: [Google-Cache-i-Book.in] (https://webcache.googleusercontent.com/search?q=cache:-ZIMtDAquWMJ:https://i-book.in/+&cd=1&hl=zh-CN&ct=clnk&gl=ru), doppelklicken Sie auf "Zurück", um es zu verwenden.

# Urheberrecht

Seit das britische Parlament 1709 das weltweit erste Urheberrechtsgesetz "Queen Anna Act" verabschiedet hat, ist der Kern des Rechts auf Urheberrechtsschutz in der Druckzeit seit 300 Jahren das Recht zu kopieren, aber im Internetzeitalter hat sich das Konzept des Kopierens subversiv verändert, und die Netzwerkverbreitung ist die Vollendung der Vervielfältigung, und das Recht auf Vervielfältigung und das Recht auf Verbreitung sind zu einer Kombination geworden. Im Gegensatz zu Papierbüchern können die meisten E-Books nicht weiterverkauft, übertragen oder ausgeliehen werden.

👇 Screenshot von [Kindle Store-Nutzungsbedingungen] (https://www.amazon.cn/gp/help/customer/display.html?nodeId=201014950).

! [Nutzungsbedingungen des Kindle-Shops] (https://pic.saltyleo.com/i/171082894223.webp)

Ich persönlich respektiere das Urheberrecht, und ich habe viele Papierbücher zu Hause gekauft, aber es gibt keinen Platz, um sie zu verstauen. Der Vorteil von E-Books besteht darin, dass kein Speicherplatz für die Aufbewahrung großer Bücher belegt werden muss, aber der aktuelle E-Book-Modus entspricht dem Ausleihen, dem Ausgeben von Geld, um eine Kopie zu kaufen, sich nicht bewegen zu können und kann nur auf einem einzigen Gerät oder einer App angezeigt werden. Wenn Sie es mit so und so teilen möchten, wäre es gut, es in der Ära der Papierbücher an andere auszuleihen, was ist mit E-Books? Sie müssen Ihr Konto an andere weitergeben, bevor Sie es mit anderen teilen können, und damit bin ich nicht einverstanden.

Daher ist es natürlich, raubkopierte E-Books, die Verwendung illegaler Mittel oder direkt OCR das ursprüngliche Papierbuch, die Produktion von E-Books im öffentlichen Format, das EPUB-, MOBI- und AZW3-Format zu gebären, da der Mainstream der Raubkopien nach und nach den Markt überschwemmt hat, weil es leicht zu teilen und zu verbreiten ist, so dass es dem Verlag enorme wirtschaftliche Verluste zugefügt hat, so dass der Verlag für solche raubkopierten E-Book-Websites eine Hochdruckpolitik umsetzt, solange Sie einige Hinweise finden, wird es verrückt sein, sie zu treffen. Die E-Book-Websites, die wir kennen, verschwinden also nach und nach. Zum Beispiel: booksetme, kleines Buchhaus, etc.

Der Grund dafür ist, dass der Webmaster der Website nicht stark genug in Bezug auf das Bewusstsein für Netzwerksicherheit ist und keine gute Arbeit bei den Anonymitätsmaßnahmen geleistet hat, gefolgt von einem schwachen Rechtsbewusstsein, ich möchte nicht ihrem alten Weg folgen > "eine Website erstellen" > "Daten teilen", was zweifellos ihr eigenes Grab schaufelt. Erstens verletzt der Aufbau einer Website zur Bereitstellung von Daten das Recht des Rechteinhabers auf Kopieren, und zweitens muss der vom Server in China aufgelöste Domainname aufgezeichnet werden, und der Domainname nach der Einreichung ist wie ein Personalausweis, und Sie können Ihre persönlichen Daten und sogar ein Büstenfoto finden, indem Sie es in das System eingeben.

Die Lösung, für die ich mich entschieden habe, war also eine Suchmaschine, die anhand der Eingabe nach den passenden Daten suchte und die entsprechenden Offsite-Links bereitstellte, die nicht auf meinem Server gespeichert waren, einschließlich der Suchmaschinenindexdaten.

Gemäß Artikel 14 der chinesischen [Verordnung zum Schutz des Rechts auf Übertragung von Informationen über das Informationsnetz] (http://www.gov.cn/zwgk/2006-05/29/content_294000.htm)" (Auszug):

Ist ein Rechteinhaber der Ansicht, dass die Werke, Darbietungen, Ton- oder Videoaufzeichnungen, die Gegenstand seiner Dienste sind, sein Recht auf Verbreitung des Informationsnetzes verletzen oder seine elektronischen Informationen für die Rechtewahrnehmung löschen oder ändern, kann er eine schriftliche Mitteilung an den Netzdiensteanbieter richten, in der er den Netzdiensteanbieter auffordert, das Werk, die Darbietung, die Ton- oder Videoaufzeichnung zu löschen oder die Verbindung mit dem Werk, der Darbietung, der Ton- oder Videoaufzeichnung zu trennen. Die Bekanntmachung muss Folgendes enthalten: (1) Name (Titel), Kontaktdaten und Anschrift des Rechteinhabers; (2) Name und Netzwerkadresse des rechtsverletzenden Werkes, der Aufführung, der Tonaufnahme oder der Videoaufzeichnung, deren Löschung oder Trennung beantragt wird; (3) Vorläufige Beweise für eine Zuwiderhandlung. Der Rechteinhaber ist für die Echtheit des Hinweises verantwortlich.

Unter der Annahme, dass der Inhalt des von mir bereitgestellten Links das "Recht auf Verbreitung des Informationsnetzes" des Rechteinhabers verletzt, senden Sie bitte eine DMCA-Mitteilung an die saltyleo@tstrs.me, füllen Sie den entsprechenden Inhalt gemäß dem Standardformat aus und er muss im schlimmsten Fall die drei in 14 genannten Elemente enthalten.

Artikel 15 (Auszüge):

Nach Erhalt der Mitteilung des Rechteinhabers löscht der Netzdiensteanbieter unverzüglich das mutmaßlich rechtsverletzende Werk, die Darbietung, die Ton- oder Videoaufzeichnung oder trennt die Verknüpfung mit dem mutmaßlich rechtsverletzenden Werk, der Darbietung, der Tonaufnahme oder der Videoaufzeichnung und leitet die Mitteilung gleichzeitig an den Dienstempfänger weiter, der das Werk, die Darbietung, die Tonaufnahme oder die Videoaufzeichnung bereitgestellt hat. Ist die Netzadresse des Dienstziels unbekannt und kann sie nicht übermittelt werden, so wird der Inhalt der Bekanntmachung gleichzeitig im Informationsnetz bekannt gegeben.

Artikel 23 (Auszüge):

... Wenn Netzdiensteanbieter Such- oder Verknüpfungsdienste für Diensteempfänger bereitstellen und nach Erhalt einer Mitteilung des Rechteinhabers die Verknüpfung mit dem rechtsverletzenden Werk, der Darbietung, der Tonaufzeichnung oder der Videoaufzeichnung gemäß den Bestimmungen dieser Bestimmungen trennen, sind sie nicht schadensersatzpflichtig; ...

Daher führe ich in Übereinstimmung mit dem oben Gesagten legal das Notice-Takedown-Verfahren durch. Es besteht keine Haftung.

# Interplanetares IPFS-Dateisystem

Das Interplanetary File System ist ein Netzwerkübertragungsprotokoll, das entwickelt wurde, um persistente und verteilte Speicher und gemeinsam genutzte Dateien zu erstellen. Es handelt sich um ein inhalsadressierbares Peer-to-Peer-Hypermedia-Verteilungsprotokoll. Die Knoten im IPFS-Netzwerk bilden ein verteiltes Dateisystem.

Um sicherzustellen, dass ich nicht als Gegenstand der Klage aufgeführt bin, also nicht beabsichtige, die Datei auf meinem eigenen Server abzulegen, habe ich das IPFS Interstellar File System ** als Speicherdienst gewählt, die Zuverlässigkeit ist nicht hoch, aber die Robustheit ist sehr stark, solange es Knoten auf der Welt gibt, kann die Datei gefunden werden.

Gewöhnliche HTTP-Links, wie z. B. das Logo von Douban:

https://img3.doubanio.com/f/frodo/144e6fb7d96701944e7dbb1a9bad51bdb1debe29/pics/app/logo.png

Auf diese Weise 👆 verweist jede Zeichenänderung an sich auf eine Datei, die sich ändert, da HTTP ein "pfadorientiertes" Protokoll ist.

IPFS ist ein "dateiorientiertes" Protokoll, es muss den Pfad nicht kennen, sondern nur den Hash der Datei kennen und sucht automatisch nach diesem Hash im IPFS-Netzwerk, findet ihn und rendert ihn.

Der IPFS-Link sieht folgendermaßen aus:

https://gateway.i-book.in/ipfs/QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB

Es öffnet sich wie folgt:

Unter ihnen ist der "gateway.i-book.in"-Teil das Gateway, da dieses Protokoll noch nicht entwickelt wurde, Sie über das Gateway auf dieses spezielle Peer-to-Peer-Netzwerk zugreifen müssen, und der Link wird nach der zukünftigen Browser- und Service-Provider-Unterstützung auf Folgendes vereinfacht:

ipfs://QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
oder
fs://QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB

Und das Erstaunlichste daran ist, dass Sie verschiedene Gateways ändern können, um diese Datei 👇 zu erhalten:

Sie können das offizielle IPFS-Gateway verwenden: (Umgehung erforderlich)
https://ipfs.io/ipfs/QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
oder das Gateway von Cloudflare: (erfordert Umgehung)
https://cloudflare-ipfs.com/ipfs/QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB

Die Dateien, auf die am Ende zugegriffen wird, sind alle gleich "Schauen Sie sich den Link genau an":

Das ist es, was mich an diesem Protokoll am meisten anzieht, * Knoten * als unterste Schicht der Existenz, * Cluster * basierend auf Knoten, * Gateway * ist das Ergebnis des aktuellen Protokolls wurde nicht entwickelt und einige Details kompromittiert, Hash ist die Seele dieses verteilten Netzwerks, solange das gesamte Netzwerk einen Knoten hat, der die durch diesen Hash dargestellte Datei speichert, dann können die Knoten des gesamten Netzwerks auf diese Datei zugreifen, der Unterschied ist nur die Zugriffsgeschwindigkeit.

Natürlich verschwinden einige Dateien aus dem Netzwerk, ohne den Quellknoten zu verlassen, aber Sie können die Pin-Funktion verwenden, um die Datei des Remote-Knotens lokal anzuheften, selbst wenn der Quellknoten ausgefallen ist, kann die Datei immer noch im Netzwerk weitergegeben werden.

Hier werde ich nicht zu sehr ins Detail gehen, und diejenigen, die die Möglichkeit haben, können direkt auf die [offizielle IPFS-Website] (https://ipfs.io/#how) gehen, um das Weißbuch zu lesen.

Anmerkung!!! Alle inoffiziellen IPFS-Communities sind Betrüger, das gesamte IPFS-Mining sind Betrüger (außer Filecoin), da dies eine völlig gefälschte Forderung ist, werden Sie Knoten bezahlen, um einige unwichtige Dateien zu speichern? Ich werde es nicht tun, selbst wenn ich selbst für den Knoten bezahle, ich bin nicht bereit zu zahlen, um die Daten an andere weiterzugeben, genau wie die PT-Station produziert, um die Verfügbarkeit von bt-Seeds aufrechtzuerhalten, als das bt-Protokoll populär war, wie viele gibt es jetzt? IPFS ist jetzt in einem sehr guten Zustand, Sie können ein öffentliches IPFS-Netzwerk verwenden, um Daten zu verbreiten, oder Sie können ein privates IPFS-Netzwerk aufbauen, Sie können es so lange tun, wie Sie möchten.

Da 'i-book.in' selbst keine Daten speichert, sondern nur auf Weiterleitungen reagiert, denke ich, dass dies die derzeit relativ perfekte * ist, um eine Hündin zu sein und ein Torii-* Schema zu erstellen.

Ich habe einige kleine Arbeiten für dieses Schema durchgeführt:

Die Seite "i-book.in" verwendet den von Algolia bereitgestellten Suchdienst, das Gateway "gateway.i-book.in" verwendet das interplanetare IPFS-Dateisystem, das Frontend verwendet den CDN-Dienst von CloudFlare und der gesamte Dateispeicher verwendet das interplanetare IPFS-Dateisystem einschließlich Bilder.

Der Endeffekt ist völlig unberührt, ich habe nichts mit Daten zu tun, alle Daten von Suchmaschinen stammen von anderen Websites, verwenden Crawler-Scraping, um Informationen zu integrieren, um die Suche zu ermöglichen, ich bin nur ein Porter des Internets.

# Nachtrag

Zuallererst möchte ich mich bei [LoreFree] (https://ebook.lorefree.com/) bedanken, es hat mich inspiriert, ihr Back-End-Dateispeichersystem basiert auf der IPFS-Technologie, aber die Kombination mit EOS ist eine falsche Entscheidung, jede kostenlose Freigabe, solange sie mit Geld zu tun hat, ist nicht klar, in letzter Zeit ist ihre DAU im Begriff, zweistellig zu fallen, ich weiß nicht, wie lange sie halten können. Der technische Stack ist ziemlich perfekt, der Anti-Climb ist sehr streng, und selbst um das Crawlen umzukehren, können Sie den Verifizierungscode * für immer Fehler * Modus '(soweit Sie den Verifizierungscode eingeben, ist falsch, das ist meine persönliche Vermutung, es kann auch ein interner Systemfehler sein)', aber es spielt keine Rolle, der nächste ist es, die Datenbank von LoreFree beläuft sich auf 66511 Bücher '(2019-08-30 Daten)', nach den durchschnittlich drei Versionen eines Buches mit einer Gesamtgröße von etwa '10M' wird geschätzt, dass es auch etwa '700G' gibt Die Daten, na ja, was für ein Duft.

Obwohl ich hier so viel "listig" und "streite" schreibe, denke ich, dass mich jemand engagieren oder sich darauf vorbereiten wird, DMCA zu schreiben, oder sich darauf vorbereiten, den Verlag zu kontaktieren, um zusätzliches Geld zu verdienen, weil SaltyLeo ID nicht vollständig anonym ist und sogar ein wenig mit Tencent Cloud verwandt ist, um die Registrierungsinformationen tstrs.me Domainnamens zu überprüfen, kann mich auch finden, oder ein Sozialarbeiter? Ich bin also ein gesetzestreuer und patriotischer Drei-Gute-Junge, sobald ich eine Benachrichtigung erhalte, werde ich sie sofort löschen und nach dem Gesetz handeln.

Das korrekte Einstellen der nginx-Weiterleitung ist wirklich ermüdend, und das Debuggen von iptables ist auch ärgerlich. Wenn ich aussortiert bin, gehe ich zu GitHub~~Open Source~~' (Freunde haben mir geraten, dies nicht zu tun, also öffne ich es nicht, 23333)' Indexdatenbank.

In Bezug auf das Einrichten von IPFS-Knoten und das Erstellen von Clustern usw. werde ich sie aktualisieren, wenn ich Zeit habe. Ach ja, die Bibliothek der University of Adelaide hat auch ein E-Book-Sharing-Projekt, aber es ist alles öffentlich urheberrechtlich geschützt, alles sehr alte Bücher, die sich hier befinden: [https://ebooks.adelaide.edu.au/] (https://ebooks.adelaide.edu.au/), das nächste Crawling-Ziel ist es.

Die Suchmaschine steht kurz vor der Vollversion und crawlt fast Indexdaten und Algolia-Skalierung.

Ich werde damit keinen Gewinn machen, ich bin nur neugierig auf die technische Umsetzung, und wenn es irgendwelche schlechten Anzeichen gibt, werde ich es einfach offline nehmen.

Manchmal ist es ein ziemliches Gefühl, sich alte Nachrichten anzusehen, und im Vergleich zum aktuellen Schreibstil ist diese Art des Schreibens, die sich auf das Ereignis selbst konzentriert und nicht auf die Verwendung übertriebener Metaphern und anderer aufmerksamkeitsstarker Techniken, prägnanter und kraftvoller. [E-Books als "Aufzug" des menschlichen Fortschritts? Print ist schneller zu lesen] (http://www.chinanews.com/cul/2010/07-22/2419308.shtml)

-EOF-

Tags :

# Computer # Software # Zappeln # Python # Linux # IPFS

Urheberrechtshinweis :

Dieser Artikel wurde von SaltyLeo verfasst. Bei Fehlern bitte eine Nachricht hinterlassen. Bei der Reproduktion oder Zitierung dieses Artikels beachten Sie bitte die CC BY-NC-SA Lizenz, die Namensnennung, nichtkommerzielle Nutzung und die gleiche Weitergabe erfordert!