Cómo buscar y descargar archivos impopulares y antiguos en Internet

Principalmente archivos multimedia. Totalmente legítimo, no es broma.

Como a veces sucede, desea descargar el álbum de música de 2007, del artista conocido por 3.5 personas, como un Ska-punk español o un speedcore europeo menos conocido. Tengo un archivo torrent, impórtalo al cliente, descarga rápidamente hasta el 14,7% y ... eso es todo. El día, la semana pasa, pero el porcentaje de datos descargados no aumenta. Está buscando ese álbum en el motor de búsqueda, se encuentra con foros con enlaces solo para usuarios registrados con "mensajes útiles", se registra allí, inunda rápidamente 5 mensajes en temas antiguos y mortales y finalmente obtiene enlaces para sitios de intercambio de archivos como rapidshare y megaupload, que están cien años muertos a partir de ahora.

Desafortunadamente, es una situación muy común cuando intentas descargar algo viejo.

Eso pasa. Últimamente, desafortunadamente, sucede cada vez más a menudo: los titulares de derechos de autor y las autoridades policiales se han tomado en serio el intercambio de archivos; el año pasado vimos KickassTorrents cerrado, BlackCat Games, what.cd, btdigg, torrentzeu, EX.ua, fs.to, torrents.net.ua y todos los demás sitios web. Si bien es probable que no enfrente grandes problemas para encontrar nuevas películas o series de TV / animaciones, incluso a pesar de la eliminación cada vez mayor de contenido de los motores de búsqueda, rastreadores de torrents y el intercambio de archivos, la búsqueda de la fuente de la película (DVD o Blu-Ray) o simplemente Las grabaciones de TV de 7 años no inglesas y no rusas podrían ser un desafío.

¿Por qué necesitarías eso?

  • Falta de lanzamientos de DVD para algunas series
    La película podría haber sido doblada y transmitida por televisión en algún país, pero nunca en DVD. Los cappers lo extraen y cargan en sitios de intercambio de archivos o a través de Bittorrent, luego el DVD se lanza en otro país sin doblaje de audio con límite, por ejemplo, uno francés. Las personas se ven obligadas a descargar DVDRip de alta calidad sin el doblaje en francés o la extracción de TV con una calidad relativamente baja.
    A medida que pasa el tiempo, cada vez menos personas descargan French TVRip, se eliminó de los sitios de intercambio de archivos debido a la inactividad de los archivos. La descarga de esta versión se convierte en una tarea bastante no trivial.
    Uno puede resolver el problema mezclando el audio de la grabación de TV al video de DVD, pero nadie lo hizo y la versión de TV murió.
  • Diferentes contenidos de TV y DVD
    Por ejemplo, Daria perdió casi toda la música de la versión de TV debido a problemas legales con la nueva licencia para DVD. Durante mucho tiempo, la gente tenía que elegir entre ver la versión completa con toda la música y la mala calidad de video o una versión de DVD atractiva, pero sin música.
  • Diferencia regional
    Estos son verdad tanto para el video como para la música. BRUJA. La serie se emitió con 4 aperturas diferentes, solo una de las cuales entró en DVD.
    Las versiones japonesas de álbumes de música son conocidas por pistas adicionales, que faltan en cualquier otra edición.

Como ya puede entender, todos tienen su propia razón. ¿Dónde descargamos archivos impopulares y antiguos?

Usenet

Usenet es una red distribuida de servidores que sincronizan datos entre ellos. La estructura de Usenet se asemeja a algo en el medio entre los foros y el correo electrónico: los llamados "grupos de noticias" (categorías de Usenet) tienen una estructura de árbol. Los usuarios de Usenet pueden unirse a grupos, leer y escribir en él. Al igual que en el correo electrónico, los mensajes de Usenet tienen un asunto que ayuda a organizar el tema de discusión.
Hoy en día, Usenet se usa principalmente para compartir archivos.

Historial de Usenet

Surgido en 1979, la red utilizaba conexiones de módem directo para transferir información utilizando UUCP y generalmente era un instrumento para comunicaciones de texto. Esa vez Usenet era un competidor de BBS; Había puertas de enlace especiales entre Usenet y Fidonet.
Cuando llegó Internet, los mensajes de Usenet cambiaron a la pila TCP / IP, usando NNTP, que todavía se usa incluso fuera de Usenet (por ejemplo, puede leer muchas listas de correo público usando gmane y RSS a través de gwene, y a diferencia de la lista de correo habitual, siempre puede volver al historial antes de suscribirse a esa lista).

Con más velocidad de línea, módems modernos y sus protocolos, a principios de los 90, Usenet se convirtió en un terreno para la transferencia de archivos: warez, música, videos. El algoritmo es similar al de Correo electrónico: el archivo se corta en varias partes (volúmenes), se codifica con caracteres imprimibles en codificación de 7 bytes con Base64 o uuencode, y se envía al grupo de noticias.
La codificación de 7 bits agrega aproximadamente un 30% de sobrecarga de transferencia de archivos. La especificación de Usenet permitió usar la mayoría de los símbolos ASCII, no solo los imprimibles, por lo tanto, el nuevo algoritmo de codificación de archivos yEnc surgió en 2001, agregando solo 1–2% de la sobrecarga. Cita solo símbolos de nueva línea, bytes NULOS y signo igual (=). yEnc sigue siendo el algoritmo principal de las transferencias de archivos de Usenet.

La comprobación de integridad y la recuperación de volumen corrupto se logra con Parchive

Antes de 2008, los grandes proveedores de Usenet almacenaban archivos binarios durante solo 100–150 días (“tiempo de retención”). Desde 2008, los proveedores más importantes dejaron de eliminar cualquier cosa y almacenaron archivos para siempre, por lo que uno puede descargar archivos de 8 años sin ningún problema, mientras que los proveedores medianos almacenan archivos durante más de 1000 días, lo que tampoco es exactamente malo. Hoy en día, la comunicación de texto a través de Usenet es casi inexistente; la red se usa principalmente como almacenamiento de archivos.

Alrededor de mediados de 2001, los titulares de los derechos de autor detectaron la red, lo que obligó a los proveedores de Usenet a eliminar contenido protegido por derechos de autor, lo que influyó en gran medida en la coherencia del lanzamiento. Algunos proveedores crearon sistemas automáticos para eliminar archivos con derechos de autor, lo que permite a los titulares de derechos de autor eliminar información por su cuenta. Para detener o al menos desacelerar la eliminación de archivos, los entusiastas comienzan a cargar archivos con nombres de archivos ofuscados o usan archivos protegidos con contraseña, luego los agregan a sitios web privados de índice de archivos solo por invitación. Estas versiones no se pueden encontrar ni descargar de la forma habitual.

En la Rusia moderna, Usenet es conocida por unas pocas personas, a pesar de estar entre dos vínculos de trabajo con Occidente en el golpe de Estado de 1991 (el segundo es Fido).
Hoy en día, Usenet es más popular en países con estrictas leyes de derechos de autor con multas por descargar o cargar contenido protegido por derechos de autor. Alemania es un ejemplo de ese país.
A diferencia de Bittorrent, no puede determinar la dirección IP de los usuarios en Usenet, a menos que con la cooperación del ISP o el proveedor de Usenet.

Conéctese a Usenet

Lo más probable es que no pueda unirse a la red de forma gratuita: obtendrá un tiempo de retención bajo (10-30 días) o una velocidad baja, o incluso acceso a grupos de noticias de solo texto. Debe comprar el acceso de cualquier proveedor o revendedor de Usenet. La mayoría de los proveedores ofrecen dos tipos de acceso: suscripción mensual con datos no medidos (ilimitado) y plan de datos sin límite de tiempo (bloqueo). Si está interesado en descargar archivos varias veces al mes, bloquee el acceso.
Los proveedores más importantes son: Altopia, Giganews, Eweka, NewsHosting, Astraweb.

Ahora de alguna manera necesita obtener un archivo nzb con metainformación. Esto es algo así como un archivo .torrent para Usenet. Usemos el motor de búsqueda del indexador si no tiene uno.

Indexadores

Los indexadores públicos están llenos de spam y virus, sus capacidades de búsqueda son mediocres, pero, sin embargo, son buenas para archivos viejos cargados hace 5 años o más.

Éstos son algunos de ellos:

  • binsearch.info
  • binzb.com
  • nzbindex.com
  • nzbsearch.net
  • nzbking.com

Los indexadores gratuitos con requisito de registro son más adecuados para archivos nuevos. Su estructura de catálogo es buena, los lanzamientos tienen no solo el nombre sino también la descripción y la imagen.

  • nzbfinder.ws
  • nzbid.org
  • nzbnoob.com
  • nzb.ag
  • nzbfriends.com
  • usenet-crawler.com
  • drunkenslug.com
  • nzbgeek.info

Recomiendo especialmente los dos últimos, son capaces de buscar versiones ofuscadas.
Hay índices centrados en un solo tema, por ejemplo, anizb para anime e álbumes para música.

Descargando desde Usenet

Intentemos descargar The FP, una película impopular y en su mayoría desconocida de 2011, cuyo BDRip de 1080p no se puede encontrar en Internet.
Necesita encontrar el archivo nzb e importarlo al programa de descarga como NZBGet o SABnzbd.

Vaya a nzbking.com, busque "the.fp.2011".

Este archivo tiene solo 1 parte de 3867. No puede descargar dicho archivo, el indexador lo muestra en rojo.

Los archivos protegidos con contraseña suelen ser falsos.

La segunda página nos muestra un signo de DVDRip adecuado: el tamaño del archivo es bueno, no hay contraseña.

La tercera página nos muestra BDRip y varios DVDRips, que se ve bien (según el tamaño del archivo y la fecha de carga).

Elija los archivos que desea descargar, presione "Descargar NZB", importe .nzb a NZBGet o SABnzbd con los datos configurados de la cuenta Usenet.
El archivo se está descargando con la velocidad de enlace completa del ISP.

Cuando el archivo terminaba de descargarse, NZBGet automáticamente descomprimía los archivos y los eliminaba, manteniendo solo los datos desempaquetados. Tienes 6,74 de datos, que se cargaron hace 4,5 años, en solo 15 minutos, ¡hurra!

IRC / DCC / XDCC

Internet Relay Chat es un antiguo protocolo para comunicaciones de texto que sigue siendo popular entre los desarrolladores de software de código abierto, los administradores de rastreadores de torrents, los amantes del anime y los autores de CnC de botnet, debido a su simplicidad. Surgido en 1989, IRC se convirtió rápidamente en el estándar para los chats de texto en Internet durante largos años, y reconoció su popularidad a ICQ y Jabber solo a mediados de la década de 2000. El IRC admite la transferencia de archivos utilizando DCC, que se usó por primera vez para el intercambio automático de archivos por Xabi, en Xabi DCC (de ahí el nombre - XDCC).

Ahora tiene canales IRC e incluso servidores completos solo para transferencias de archivos con XDCC. Casi cualquier grupo de lanzamiento de anime, a veces incluso sin un sitio web, tiene su propio bot, que sirve todos los archivos del grupo. La popularidad de XDCC está impulsada por la facilidad de uso y administración de bots para compartir archivos: el cargador solo necesita cargar el archivo en sí mediante FTP, por ejemplo, y el bot agregará automáticamente ese nuevo archivo para indexarlo y notificarlo a los usuarios del canal (si es un nuevo episodio de una serie de televisión como ejemplo).

Se utilizan redes IRC privadas especiales para warez, películas frescas y no tan películas, música, juegos, botas. XDCC apenas es conocido por las agencias de derechos de autor, por eso puedes encontrar muchas cosas que no puedes encontrar en otros lugares.

Indexadores

La mayoría (pero no todos) los bots XDCC están indexados con scripts especiales, que proporcionan una interfaz web para el motor de búsqueda.

Indizadores de contenido genérico:

  • ixirc.com
  • xdcc.eu
  • sunxdcc.com
  • cr4wl.ga

Indizadores de anime:

  • news.kae.re
  • nibl.co.uk
  • intel.haruhichan.com

Cómo descargar desde IRC

Necesitarás un cliente IRC. Casi cualquier cliente funcionará, la gran mayoría de los clientes admiten DCC. Únase al servidor según el contenido que le interese y descárguelo.
Los servidores más grandes con libros:

  • irc.undernet.org, #bookz room
  • irc.irchighway.net, #ebooks room

Warez:

  • irc.criten.net, sala #elitewarez
  • irc.infatech.net, #elitewarez room
  • irc.scenep2p.net, # the.source room

Películas:

  • irc.abjects.net, #moviegods room
  • irc.abjects.net, # sala bestia-xdcc

Animación occidental y japonesa:

  • irc.rizon.net, #news room
  • irc.xertion.org, # sala de dibujos animados-mundo

Todos los bots aceptan! Find o @findcommands para buscar archivos y enviarle resultados de búsqueda con un mensaje directo. Si busca una consulta popular, recibirá literalmente correo no deseado con resultados de búsqueda, por eso es sensato usar el comando @search donde esté disponible. Este comando activará un bot indexador especial para enviarle resultados de búsqueda en un archivo a través de DCC.

Intentemos descargar "How Music Got Free", un gran libro sobre la industria de la música, las tecnologías para compartir música y una persona que robó casi 2000 álbumes diferentes y lo subió a Internet.

El bot reacciona a la solicitud @search y envía resultados en un archivo de texto comprimido a través de DCC.

Enviemos la consulta de solicitud de descarga al bot.

¡Y acéptalo!

Si encontró un archivo usando el indexador de archivos, no necesita buscarlo en el canal. Simplemente envíe la consulta de descarga al bot de inmediato utilizando el comando del sitio del indexador.

DC ++

La red Direct Connect se basa en la arquitectura cliente-servidor, donde todas las comunicaciones que no comparten archivos se realizan a través del servidor, que se denomina concentrador. DC ++ admite compartir directorios completos, puede buscar tipos de archivos exactos (audio, video, archivos, documentos, imágenes de disco) y tiene un motor de búsqueda que no está vinculado al nombre del archivo. DC ++ es más conocido por el chat integrado, que fue muy útil en las redes locales de los primeros días.
Dichos centros eran populares en Rusia, algunos de ellos fueron mantenidos por los propios ISP. El ISP siberiano "GoodLine" anunció su propio centro DC ++ en vallas publicitarias e incluso tenía un software especial dentro de los decodificadores para entregar a los usuarios nuevas películas directamente al televisor.
Ese fue el centro más grande del mundo, con más de 100000 usuarios.

Debido a la facilidad para compartir archivos (solo necesita marcar el directorio para compartir), puede encontrar basura extraña y exótica, que es, como el usuario piensa, nadie lo recuerda, pero todavía la comparte con otros, solo en caso.

El videotutorial de 11 años es sembrado por 3 personas. Nadie querría verlo, créeme.

Cómo descargar desde DC ++

Necesitará cualquier cliente DC ++. FlylinkDC ++ es bueno para Windows (también es compatible con Bittorrent). Los usuarios de Linux eligen EiskaltDC ++ o AirDC ++ Web.

Únase a algunos centros DC ++, cuanto más mejor. DC ++ hublist está disponible en los propios clientes, pero también puede acceder a él utilizando esta página web especial y copiar la dirección desde allí.

Le recomiendo que configure el "Modo activo" y configure el reenvío de puertos, de lo contrario no podrá descargar archivos de los usuarios en "Modo pasivo" y sus resultados de búsqueda serían limitados.

La búsqueda y la descarga se explican por sí mismas: escriba la consulta de búsqueda, elija el tipo de contenido si lo desea, presione “buscar”, haga doble clic en el resultado de la búsqueda para descargar. También puede ver una lista de todos los archivos compartidos del usuario exacto (y descargar todos los archivos de la carpeta seleccionada) haciendo clic con el botón derecho en el resultado de búsqueda y seleccionando el elemento del menú correspondiente.

Si no se encuentra el archivo que estaba buscando, vale la pena repetir su consulta de búsqueda de vez en cuando. Las personas tienden a iniciar el cliente DC solo cuando necesitan descargar algo, por lo que debe ponerse al día para encontrar archivos de dichos usuarios.

La búsqueda simultánea de múltiples archivos puede ser difícil debido a las limitaciones del protocolo NMDC. Los resultados de búsqueda pueden mezclarse y mostrarse para diferentes consultas de búsqueda, por eso es más seguro realizar solo una búsqueda a la vez. Los centros ADC no tienen esa limitación, pero son terriblemente inexistentes (su URI comienza con adc: //, no dchub: //).

Indexadores

La búsqueda integrada encuentra archivos solo en las listas de usuarios en línea, por eso los indexadores son muy convenientes para buscar archivos raros.

Hasta donde sé, el único indexador DC ++ es spacelib.dlinkddns.com (y su otra dirección es dcpoisk.no-ip.org). La búsqueda se basa en el motor Sphinx con soporte de morfología. Los resultados de búsqueda consisten en enlaces magnéticos que puede agregar para descargar la cola en el cliente DC ++.
A veces está abajo por mucho tiempo. Por ejemplo, la última vez estuvo inactivo durante 2 meses seguidos.

eDonkey2000 (ed2k), Kad

ed2k es un protocolo de transferencia de archivos descentralizada con concentrador centralizado para consultas de búsqueda y establecer conexión entre usuarios, al igual que DC ++. Solía ​​ser el protocolo número 1 para compartir archivos para todos los grupos sociales antes de la captura del servidor más popular, Razorback 2, en 2006, y la creciente popularidad de BitTorrent.

eDonkey 2000 todavía está vivo. Simplemente por el protocolo Kad descentralizado, que se implementó justo antes de que Razorback 2 y el servidor cliente original quedaran fuera de servicio.

Puede encontrar casi el mismo contenido que en DC ++: series de televisión antiguas con diferentes doblajes, música variada, juegos, warez, libros de programación antiguos, libros de matemáticas y biología. Por supuesto, los nuevos lanzamientos también están aquí. El protocolo admite la funcionalidad de chat, pero es poco probable que pueda usarlo ya que está deshabilitado de forma predeterminada en todos los clientes, sus mensajes simplemente no se mostrarán.

Cómo descargar desde eDonkey2000 / KAD

Como puede suponer, necesitará un cliente ed2k. aMule es una buena elección para Linux. Los usuarios de Windows probablemente deberían usar eMule, aunque no se actualiza desde 2011.
Se recomienda encarecidamente configurar el reenvío de puertos para poder descargar desde usuarios detrás de NAT (LowID).

El proceso de búsqueda y descarga es muy similar al de DC ++. Escriba la consulta de búsqueda, obtenga resultados de los usuarios en línea, haga doble clic en el archivo para comenzar la descarga.
El resultado de la consulta se mostrará incluso si ninguno de los usuarios lo tiene completo, sino solo partes de él.

Busquemos "We Live In Public", un documental menos conocido de 2009 sobre Internet de los años 90. Una parte de esta película habla sobre el servicio de transmisión de video pseudo.com de 1993, que se predice parcialmente en Internet moderno.

Simplemente escriba la consulta de búsqueda, presione el botón y espere los resultados:

Haga doble clic para comenzar la descarga.

La descarga de un archivo puede llevar semanas o incluso meses. Por alguna razón desconocida, la mayoría de los usuarios de ed2k tienen una velocidad de internet desagradable y se muestran en la red solo por algunas horas por semana, o incluso menos. Se paciente.

Soulseek

Soulseek es una red centralizada para compartir música p2p, creada en 2000 por uno de los desarrolladores de Napster. Es conocido en la comunidad IDM y todavía está en desarrollo activo. Los chats grupales y privados, el intercambio de archivos solo de amigo a amigo, la búsqueda de etiquetas y bitrate son algunas de las otras cosas de esta red.
Algunas consultas de búsqueda están censuradas.

El SoulseekQt patentado oficial es el más popular, con dos clientes no oficiales también disponibles: Nicotine + y Museek +.

BitTorrent DHT

Todos los clientes modernos de BitTorrent pueden encontrar pares utilizando la tabla hash distribuida (DHT). Esta característica es utilizada no solo por empresas orientadas a los derechos de autor para monitorear a los usuarios y enviarles mensajes de infracción de derechos de autor, sino también por los indexadores DHT, para recibir el archivo torrent con infohash de la consulta DHT de terceros y guardarlo en la base de datos. Dichos indexadores pueden ser útiles para encontrar torrents raros o inéditos por nombre de archivo o directorio, o para buscar torrents similares con potencialmente más semillas.

El indexador más conocido pero hoy en día muerto es btdigg, los otros sitios vinieron a reemplazarlo:

  • bitsnoop.com
  • godht.com
  • btdb.in
  • digbt.org
  • btdb.in
  • btkitty.bid
  • kikibt.net
  • btdig.com (no está relacionado con el btdigg original, aunque la página de wikipedia asegura lo contrario)

Se sabe que los indexadores DHT viven vidas cortas: dos de mis favoritos, fastbot y BTKitty.red, son inaccesibles cuando escribo este artículo.

Sitios para compartir archivos y servidores FTP

Casi todas las regiones tienen su propio sitio local para compartir archivos, que es popular entre el grupo lingüístico exacto. Por ejemplo, puede encontrar gran cantidad de contenido checo y eslovaco en uloz.to; zone-telechargement.ws es bueno para contenido en francés, mientras que chomikuj.pl es para medios polacos.

Los indexadores FTP no encuentran el archivo solicitado con tanta frecuencia, pero inténtelo de todos modos:

  • mmnt.net
  • searchftps.net
  • filemare.com
  • ftpsearch.lostclus.kiev.ua
  • filewatcher.com
  • krasfs.ru
  • ftplike.com

Los motores de búsqueda de sitios web para compartir archivos tampoco son tan efectivos, pero no se olvide de ellos:

  • archiveiva.com
  • rapid-search-engine.com
  • alluc.ee

Podría encontrar mucho contenido en ex.ua hasta hace muy poco, pero desafortunadamente está cerrado ahora, qué pena.

Cómo buscar lanzamientos de escenas

No siempre es suficiente solo buscar el nombre del contenido, puedes dejar que los lanzamientos de escenas escapen de tus dedos.

La escena Warez, a menudo conocida como The Scene, es una comunidad clandestina de personas que se especializan en la distribución de material protegido por derechos de autor, incluidos programas de televisión y series, películas, música, videos musicales, juegos (todas las plataformas), aplicaciones (todas las plataformas) , libros electrónicos y pornografía. La escena está destinada a estar oculta al público, solo se comparte con aquellos dentro de la comunidad. Sin embargo, a medida que los archivos se filtraban comúnmente fuera de la comunidad y su popularidad crecía, algunas personas de The Scene comenzaron a filtrar archivos y subirlos a hosts de archivos, torrents y ed2k.
https://en.wikipedia.org/wiki/Warez_scene

Los lanzamientos de escenas son conocidos por nombres cortos o intencionalmente confusos para evitar que busque con los medios habituales por nombre de archivo. Para determinar el nombre correcto, debe buscar el lanzamiento de la escena en un indexador de lanzamiento de escena especial: layer13.net, pre.corrupt-net.org y predb.me.

Determinemos el nombre de lanzamiento de la escena de We Live In Public de PUZZLE, usando Layer13:

El nombre NFO es "puzzle-wlip.nfo". Los nombres de archivo en 99% de los casos son iguales al nombre de NFO, así que intentemos buscar "puzzle-wlip" en un indexador de Usenet:

Cómo podemos descargar una imagen de DVD, ¡hurra!

Los motores de búsqueda habituales como Google no siempre son su amigo útil. Primero, Google sigue la DMCA y elimina (oculta) el contenido restringido por derechos de autor. En segundo lugar, podría ser bastante no trivial encontrar contenido con símbolos especiales: intente buscar W.I.T.C.H. y obtendrá los resultados de Witch, The Witch y Blair Witch.
Prefiero DuckDuckGo, Bing y el metabuscador SearX - a veces encuentras materiales no disponibles en ningún otro lado.
Si está interesado en la publicación de un lenguaje exacto, es sensato buscar por nombre localizado que pueda obtener de Wikipedia, IMDb u otros sitios web similares.

Los amantes del anime son libres de usar anidb, que almacena toda la información sobre todos los lanzamientos. La información del grupo generalmente contiene el enlace al sitio web o el canal IRC donde puede hablar con sus miembros y descargar archivos usando XDCC.

Además de la fuente, la resolución de video, el audio y el lenguaje de subtítulos, anidb almacena el hash TTH para DC ++ y el enlace ed2k para eDonkey2000 de cada archivo conocido.

El fin

Así es como busco archivos en Internet. Este artículo no contiene cosas obvias como pedir discos de Amazon o Ebay o buscar en rastreadores populares de Torrent. Todos los métodos descritos son buenos para el contenido de los medios europeos y estadounidenses, pero no tuve la oportunidad de buscar contenido árabe o indio, por lo que no puedo decir si sería efectivo o no en ese caso.