motor de búsqueda de libros electrónicos i-book.in
2019-08-31 · 1408 · 25 minSi ha leído mis artículos anteriores, debe saber que una vez construí un motor de búsqueda de libros electrónicos con 10,000 libros pequeños, pero nunca se ha publicado. La razón principal son los problemas de derechos de autor. No es ilegal para mí poseer personalmente estos documentos en privado, siempre y cuando no grite que nadie sabe que tengo estos documentos, pero es ilegal * difundir públicamente * y * compartirlos públicamente *. Y no quería enterrar este material en Internet, quería que siguiera brillando, así que decidí hacer público el motor de búsqueda. Pero antes de eso, hice un trabajo pequeño para evitar que mi yo futuro se metiera en problemas debido a esta decisión ahora.
Los libros son la escalera del progreso humano. -Gorky
Entonces los libros electrónicos son ascensores. ——SaltyLeo
* Actualización 2019-9-23 *: Se agregó una demostración de interfaz de usuario de algolia, parece que mi sitio principal puede estar fuera del trabajo, si el sitio principal está colgado, puede usar este enlace para acceder: i-Book.in demostración de la interfaz de usuario de algolia
Actualización 2019-9-21: Se ha agregado el desafío reCAPTCHA de CloudFlare y todos los enlaces de descarga deben verificarse antes de descargarlos.
Actualización 2019-9-10: Google almacena en caché este motor de búsqueda, lo que significa que si el sitio principal se cuelga, también se puede acceder a través del caché, y también https 'certificado de Google' para todo el sitio, que probablemente sea el beneficio de las páginas dinámicas puras. Enlace: [Google cached i-Book.in] (https://webcache.googleusercontent.com/search?q=cache:-ZIMtDAquWMJ:https://i-book.in/+&cd=1&hl=zh-CN&ct=clnk&gl=ru), haga doble clic en 'atrás' para usar.
# Ley de Derechos de Autor
Desde que el Parlamento británico aprobó la primera ley de derechos de autor del mundo "Ley Queen Anna" en 1709, el núcleo del derecho a la protección de los derechos de autor en la era de la impresión durante 300 años es el derecho a copiar, pero en la era de Internet, el concepto de copia ha sufrido cambios subversivos, y la difusión en red es la finalización de la reproducción, y el derecho de reproducción y el derecho de difusión se han convertido en una combinación. A diferencia de los libros en papel, la mayoría de los libros electrónicos no se pueden revender, transferir o prestar.
👇 Captura de pantalla de [Condiciones de uso de la Tienda Kindle] (https://www.amazon.cn/gp/help/customer/display.html?nodeId=201014950).
! [Condiciones de uso de la tienda Kindle] (https://pic.saltyleo.com/i/171082894223.webp)
Personalmente respeto la ley de derechos de autor, y he comprado muchos libros de papel en casa, pero no hay lugar para ponerlos. La ventaja de los libros electrónicos es que no hay necesidad de ocupar espacio para almacenar libros masivos, pero el modo actual de libro electrónico es equivalente a pedir prestado, gastar dinero para comprar una copia, no poder moverse, y solo se puede ver en un dispositivo o aplicación únicos. Si quieres compartirlo con fulano de tal, sería bueno prestarlo a otros en la era de los libros de papel, ¿qué pasa con los libros electrónicos? Tienes que dar tu cuenta a otros antes de poder compartirla con otros, y no estoy de acuerdo con eso.
Por lo tanto, es natural dar a luz a libros electrónicos pirateados, el uso de medios ilegales, o directamente OCR el libro original en papel, la producción de libros electrónicos de formato público, al formato EPUB, MOBI, AZW3 como la corriente principal de libros electrónicos pirateados inundó gradualmente el mercado, porque es fácil de compartir y difundir, por lo que ha causado enormes pérdidas económicas a la editorial, por lo que la editorial de dichos sitios web de libros electrónicos pirateados está implementando una política de alta presión, siempre y cuando encuentre algunas pistas será una locura para golpear, Así que los sitios web de libros electrónicos que conocemos están desapareciendo poco a poco. Por ejemplo: booksetme, librería pequeña, etc.
La razón de esto es que el webmaster del sitio web no es lo suficientemente fuerte en la conciencia de seguridad de la red y no ha hecho un buen trabajo de medidas de anonimato, seguido de una conciencia legal débil, no quiero seguir su viejo camino > 'construir un sitio web' > 'compartir datos', que sin duda es cavar su propia tumba. En primer lugar, el acto de construir un sitio web para proporcionar datos viola el * derecho de copia * del titular del derecho **, y en segundo lugar, el nombre de dominio resuelto por el servidor en China debe registrarse, y el nombre de dominio después de la presentación es como una tarjeta de identificación, y puede encontrar su información personal e incluso una foto de busto ingresándola en el sistema.
Así que la solución que elegí fue un motor de búsqueda, que buscaba los datos apropiados en función de la entrada y proporcionaba los enlaces externos correspondientes, que no estaban almacenados en mi servidor, incluidos los datos de índice del motor de búsqueda.
Según el artículo 14 del [Reglamento sobre la protección del derecho de transmisión por la red de información] de China (http://www.gov.cn/zwgk/2006-05/29/content_294000.htm)" (extracto):
Cuando un titular de derechos considere que las obras, interpretaciones o ejecuciones, grabaciones sonoras o grabaciones de vídeo que intervienen en sus servicios infringen su derecho de difusión de la red de información o suprimen o modifican su información electrónica para la gestión de derechos, podrá presentar una notificación por escrito al proveedor de servicios de red, solicitando al proveedor de servicios de red que suprima la obra, interpretación o ejecución, grabación sonora o grabación de vídeo, o que desconecte el vínculo con la obra, interpretación o ejecución, sonido o grabación de vídeo. El aviso deberá contener lo siguiente: 1) El nombre (título), la información de contacto y la dirección del titular del derecho; (2) El nombre y la dirección de red de la obra, ejecución, grabación de sonido o grabación de video infractora que solicita su eliminación o desconexión; 3) Pruebas preliminares de la infracción. El titular del derecho será responsable de la autenticidad de la notificación.
Suponiendo que el contenido del enlace que proporciono infringe el "derecho de difusión de la red de información" del titular de los derechos, envíe un aviso de DMCA al saltyleo@tstrs.me, complete el contenido correspondiente de acuerdo con el formato estándar y, en el peor de los casos, debe contener los tres elementos estipulados en 14.
Artículo 15 (Extractos):
Después de recibir la notificación del titular del derecho, el proveedor de servicios de red eliminará inmediatamente la obra, la interpretación o ejecución, la grabación de sonido o la grabación de vídeo presuntamente infractoras, o desconectará el enlace con la obra, la interpretación o ejecución, la grabación de sonido o la grabación de vídeo presuntamente infractoras y, al mismo tiempo, remitirá la notificación al destinatario del servicio que proporcionó la obra, la interpretación o ejecución, la grabación sonora o la grabación de vídeo; Cuando se desconozca la dirección de red del destinatario del servicio y no pueda transferirse, el contenido del anuncio se anunciará al mismo tiempo en la red de información.
Artículo 23 (Extractos):
... Cuando los proveedores de servicios de red presten servicios de búsqueda o enlace a los destinatarios del servicio, y tras recibir una notificación del titular del derecho, desconecten el enlace con la obra, la interpretación o ejecución, la grabación sonora o la grabación de vídeo infractoras de conformidad con las disposiciones del presente Reglamento, no serán responsables de indemnización; ...
Por lo tanto, de acuerdo con lo anterior, estoy llevando a cabo legalmente el procedimiento de notificación-eliminación. No habrá responsabilidad.
# Sistema de archivos interplanetario IPFS
El Sistema de Archivos Interplanetario es un protocolo de transferencia de red diseñado para crear almacenamiento persistente y distribuido y archivos compartidos. Es un protocolo de distribución hipermedia peer-to-peer direccionable por contenido. Los nodos de la red IPFS formarán un sistema de archivos distribuido.
Para asegurarme de que no figuro como sujeto de la demanda, por lo que no tengo la intención de poner el archivo en mi propio servidor, elegí el Sistema de archivos Interstellar IPFS ** como servicio de almacenamiento, la confiabilidad no es alta, pero la robustez es muy fuerte, siempre que haya nodos en el mundo, entonces se puede encontrar el archivo.
Enlaces HTTP ordinarios, como el logotipo de Douban:
https://img3.doubanio.com/f/frodo/144e6fb7d96701944e7dbb1a9bad51bdb1debe29/pics/app/logo.png
De esta manera 👆, cualquier cambio de carácter en sí mismo apunta a un archivo que cambia, porque HTTP es un protocolo 'orientado a rutas'.
IPFS es un protocolo 'orientado a archivos', no necesita conocer la ruta, solo necesita conocer el hash del archivo y buscará automáticamente este hash en la red IPFS, lo encontrará y lo renderizará.
El enlace IPFS se ve así:
https://gateway.i-book.in/ipfs/QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
Se abre así:
Entre ellos, la parte 'gateway.i-book.in' es la puerta de enlace, debido a que este protocolo aún no se ha desarrollado, debe acceder a esta red especial de igual a igual a través de la puerta de enlace, y el enlace se simplificará a lo siguiente después del futuro soporte del navegador y del proveedor de servicios:
ipfs://QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
o
fs://QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
Y lo más sorprendente de esto es que puede cambiar diferentes puertas de enlace para obtener este archivo 👇:
Puede utilizar la puerta de enlace oficial de IPFS: (requiere elusión)
https://ipfs.io/ipfs/QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
o la puerta de enlace de Cloudflare: (requiere elusión)
https://cloudflare-ipfs.com/ipfs/QmNY7V1MFgvo1ihdDdFYT4UUGm4dz8HVwqXXL1DdxYePLB
Los archivos a los que se acaba accediendo son todos iguales 'Fíjate bien en el enlace':
Esto es lo que más me atrae de este protocolo, * nodo * como la capa más baja de existencia, * clúster * basado en nodos, * gateway * es el resultado del protocolo actual no se ha desarrollado y algunos detalles comprometidos, * Hash * es el alma de esta red distribuida, siempre que toda la red tenga un nodo que almacene el archivo representado por este Hash, entonces los nodos de toda la red pueden acceder a este archivo, la diferencia es solo la velocidad de acceso.
Por supuesto, algunos archivos desaparecen de la red sin siquiera salir del nodo de origen, pero puede usar la función pin para anclar el archivo del nodo remoto localmente, incluso si el nodo de origen está inactivo, el archivo aún se puede propagar en la red.
Aquí no entraré en demasiados detalles sobre este acuerdo, y aquellos que tienen la capacidad pueden ir directamente a [sitio web oficial de IPFS] (https://ipfs.io/#how) para leer el libro blanco.
¡¡¡Nota!!! Todas las comunidades no oficiales de IPFS son estafadores, toda la minería de IPFS es estafadores (excepto Filecoin), porque esta es una demanda completamente falsa, ¿pagará a los nodos para almacenar algunos archivos sin importancia? No lo haré, incluso si pago por el nodo yo mismo, no estoy dispuesto a pagar para entregar los datos a otros, al igual que la *estación PT * producida para mantener la disponibilidad de semillas bt cuando el protocolo bt era popular, ¿cuántas hay ahora? IPFS está en muy buen estado ahora, puede usar una red IPFS pública para difundir datos, o puede construir una red IPFS privada, puede hacerlo todo el tiempo que desee.
Debido a que 'i-book.in' en sí mismo no almacena ningún dato, sino que solo responde al reenvío, creo que este debería ser el actual esquema relativamente perfecto * para ser una perra y construir un esquema torii *.
Hice un pequeño trabajo para este esquema:
La página 'i-book.in' utiliza el servicio de búsqueda proporcionado por Algolia, la puerta de enlace 'gateway.i-book.in' utiliza el sistema de archivos interplanetario IPFS, el front-end utiliza el servicio CDN de CloudFlare y todo el almacenamiento de archivos utiliza el sistema de archivos interplanetario IPFS incluidas las imágenes.
El efecto final está completamente intacto, no tengo nada que ver con los datos, todos los datos de los motores de búsqueda provienen de otros sitios web, utilizando el rastreador raspado para integrar información para proporcionar búsqueda, solo soy un portero de Internet.
# Posdata
En primer lugar, me gustaría agradecer a [LoreFree] (https://ebook.lorefree.com/), me inspiró, su sistema de almacenamiento de archivos back-end se basa en la tecnología IPFS, pero combinarse con EOS es una decisión equivocada, cualquier intercambio gratuito siempre que esté relacionado con el dinero no está claro, recientemente viendo su DAU está a punto de caer a dos dígitos, no sé cuánto tiempo pueden durar. La pila técnica es bastante perfecta, el anti-escalada es muy estricto, e incluso para revertir el rastreo, puede abrir el código de verificación * error para siempre * modo '(por lo que ingresa el código de verificación es incorrecto, esta es mi suposición personal, también puede ser un error interno del sistema)', pero no importa, el siguiente es eso, la base de datos de LoreFree totaliza 66511 libros '(2019-08-30 datos)', según el promedio de tres versiones de un libro con un tamaño total de aproximadamente '10M', se estima que también hay alrededor de '700G' Los datos, bueno, qué fragancia.
Aunque escribo "astuto" y "discuto" tanto aquí, supongo que alguien me involucrará, o se preparará para escribir DMCA, o se preparará para contactar a la editorial para ganar dinero extra, porque SaltyLeo ID no es completamente anónimo, e incluso un poco relacionado con Tencent Cloud para verificar la información de registro de tstrs.me nombre de dominio también puede encontrarme, o un trabajador social? Así que soy un joven patriótico respetuoso de la ley y de tres buenos hombres, tan pronto como reciba un aviso, lo eliminaré inmediatamente y actuaré de acuerdo con la ley.
Configurar el reenvío de nginx correctamente es realmente agotador, y depurar iptables también es molesto. Cuando esté ordenado, iré a la base de datos de índice GitHub~~Open Source~~' (mis amigos me aconsejaron que no hiciera esto, así que no hago código abierto, 23333)' base de datos.
En cuanto a cómo configurar nodos IPFS y cómo construir clústeres, etc., los actualizaré cuando tenga tiempo. Oh sí, la biblioteca de la Universidad de Adelaida también tiene un proyecto para compartir libros electrónicos, pero todos tienen derechos de autor públicos, todos libros muy antiguos, ubicados aquí: [https://ebooks.adelaide.edu.au/] (https://ebooks.adelaide.edu.au/), el próximo objetivo de rastreo es él.
El motor de búsqueda está cerca de la versión completa, y casi está rastreando datos de índice y escalando Algolia.
No voy a obtener ganancias de esto, solo tengo curiosidad por la implementación técnica, y si hay alguna mala señal, simplemente la desconectaré.
A veces es bastante sensato mirar noticias antiguas, y en comparación con el estilo de escritura actual, este tipo de escritura que se centra en el evento en sí en lugar del uso de metáforas exageradas y otras técnicas que llaman la atención es más conciso y poderoso. [¿Los libros electrónicos como el "elevador" del progreso humano? La impresión es más rápida de leer] (http://www.chinanews.com/cul/2010/07-22/2419308.shtml)
-EF-
Aviso de derechos de autor :
Este artículo está escrito por SaltyLeo. Si hay algún error en el contenido, por favor, deje un comentario. Al copiar o citar este artículo, por favor, cumpla con la licencia CC BY-NC-SA que requiere atribución, uso no comercial y compartir bajo la misma licencia.Comentario :
Leer más :
Resolver dependencias no satisfechas
Entre los visitantes cuyo idioma es en-us, mi sitio web básicamente solo permanece durante 4 segundos y la tasa de rebote es de 95,4, pero también representa el 16,5 del total de visitantes. Soy una persona a la que le gusta mucho criticar, ya que GA me ha recordado tanto, entonces optimizaré el soporte multilenguaje.
Resuelva y actualice la actualización de red de Home-Dev en casa.
¡No podía soportarlo más, así que decidí ser un bot yo mismo para controlar la violencia con violencia!
Este enrutador es mi falla de compra más reciente.
Tabla de contenidos
Populares
Información del sitio
Etiquetas: 217
Vistas totales de página: 12,888,908
tiempo de carga: 12.97 ms
Ver : 3.0.1