Fuentes y Metodología

La mayoría de los sitios de noticias tratan su proceso de producción como un secreto comercial. Creemos que es una señal de confianza. Aquí le mostramos exactamente cómo un artículo pasa de ser un rumor en un foro a una pieza publicada en RetroShell.

Paso uno: descubrimiento

Nuestra cadena de producción monitoriza continuamente más de 70 fuentes de videojuegos retro. Las fuentes incluyen: sitios especializados (Time Extension, Retro Dodo, Nintendo Life, Hardcore Gaming 101), medios de juegos generales (Vice, Kotaku, Engadget, NotebookCheck), RSS de Google News para 60 términos de búsqueda específicos de retro, una lista de señales seleccionadas de X/Twitter de modders de hardware, archivistas de preservación y periodistas retro, y un conjunto creciente de feeds RSS descubiertos automáticamente de los dominios de editores que citamos.

Paso dos: deduplicación

La misma noticia es a menudo reportada en paralelo por entre cinco y diez medios. Nuestro sistema deduplica en cuatro niveles: canonicalización de URL, similitud de fuente+título (distancia de Jaccard al 65%), similitud de título entre todos los candidatos al 65% y similitud de contenido TF-IDF al 80%. Una pasada de deduplicación por lotes de Gemini detecta los casos que se escapan de los primeros cuatro niveles.

Paso tres: relevancia

Antes de gastar un token de LLM reescribiendo algo, filtramos lo irrelevante: noticias de juegos modernos, contenido de estilo de vida fuera de tema (astrología, criptomonedas, citas), listas de agregadores (“Los 10 mejores X, clasificados”) y ensayos de opinión. Esto lo gestiona un clasificador de contenido de tres vías que dirige la salida a noticias, reportajes o listas con diferentes estándares de calidad por categoría.

Paso cuatro: rastreo de la cadena de fuentes

Para cada historia candidata, intentamos rastrear la cadena de enlaces hasta la fuente primaria: el creador, desarrollador, página de prensa oficial, proyecto de GitHub o archivo. Si la fuente del feed es una reescritura de un agregador y podemos identificar una fuente primaria de mayor confianza, atribuimos la historia a la primaria y acreditamos al agregador como “primero en informar”. Mantenemos heurísticas específicas de dominio para más de veinte grandes titulares de derechos (Nintendo, Xbox, Sony, SNK, Capcom, Square Enix, Sega, Atari, Bandai Namco, Taito, Konami y otros).

Paso cinco: redacción asistida por IA

Las historias que pasan los filtros son redactadas por Google Gemini 2.5 bajo uno de los cinco perfiles de voz de autor (véase Masthead). El borrador está limitado por: ausencia de guiones largos, unidades métricas, ortografía británica (excepto para la sección de consolas de Norteamérica de Marcus Rivera), ausencia de experiencia inventada en primera persona, atribución de fuente específica y un recuento mínimo de palabras apropiado para el tema. La instrucción para el redactor incluye reglas estrictas que obligan al modelo a devolver newsworthiness_score: 0 y a salir en caso de especulación, opinión o reportajes sin un hecho verificable.

Paso seis: guardián de la fabricación

Una segunda pasada de Gemini audita el artículo redactado. Enumera cada afirmación personal, fáctica o referencial específica y marca cada una como respaldada, inferible o fabricada en comparación con el material fuente. Cualquier artículo con una afirmación fabricada se regenera en modo de reportaje en tercera persona. Si la regeneración sigue conteniendo afirmaciones fabricadas, el artículo se descarta.

Paso siete: controles de calidad

Cada artículo pasa por ocho controles antes de poder publicarse: confianza en la cadena de fuentes, verificación de hechos de Devastator, guardián de la fabricación, cumplimiento de la voz, verificación de similitud (plagio), validación de imágenes, completitud SEO y validación de enlaces. Todos los controles estrictos deben pasarse para que un artículo se publique automáticamente. Cualquier fallo en un control retiene el artículo como borrador para la revisión editorial del Editor en Jefe.

Paso ocho: publicación

Los artículos que superan todos los controles estrictos con una puntuación de noticiabilidad de 9 o superior pueden publicarse automáticamente hasta un límite diario. Todo lo demás espera la revisión del Editor en Jefe. Los reportajes y las listas nunca se publican automáticamente; siempre esperan a un editor humano.

Herramientas de IA que utilizamos

  • Google Gemini 2.5 Flash y Pro: redacción de artículos, deduplicación, rastreo de la cadena de fuentes, auditoría de fabricación.
  • xAI Grok 4 Fast: referencia cruzada de verificación de hechos y minería de señales de X/Twitter.
  • Google Nano Banana 2: imágenes generativas de reportajes cuando no hay imágenes de origen disponibles y están claramente etiquetadas en el pie de imagen.
  • Anthropic Claude: auditoría y revisión de seguridad de nuestra propia cadena de producción.

Por qué le contamos esto

La confianza en las noticias en línea es baja por una razón. Creemos que los editores deben ser honestos sobre cómo trabajan, especialmente cuando la IA forma parte de ese proceso. Si tiene sugerencias sobre cómo podríamos mejorar o desea señalar una preocupación sobre la cadena de producción, envíe un correo electrónico a [email protected].