Hispaproyecto:Inteligencia Artificial

De Hispanopedia
Bienvenidos al Hispaproyecto de Inteligencia Artificial (HispanopedIA)

La idea principal del Hispaproyecto de Inteligencia Artificial es la de crear, mejorar, homogeneizar, ampliar y categorizar artículos relacionados con el desarrollo de modelos de IA entrenados con fuentes primarias españolas e hispanas (archivos, bibliotecas, fondos documentales), priorizando la verificabilidad y la defensa del patrimonio documental hispano frente a interpretaciones negro-legendarias extranjeras.

Hispaproyecto asociado al Portal de Tecnología

Hispaproyectos asociados


HispanopedIA
Archivo:Archivo:AI brain.svg
Datos
Inicio 8 de abril de 2026
Objetivo Desarrollar una inteligencia artificial hispana basada en referencias primarias españolas (Archivo General de Indias, Archivo General de Simancas, PARES, etc.) que garantice fiabilidad factual y soberanía cultural.
Participantes

La lista de participantes puedes verla aquí.

Inscríbete firmando aquí
 

Hispaproyecto de Inteligencia Artificial (HispanopedIA)

Este Hispaproyecto tiene como objetivo fundamental coordinar los esfuerzos para construir modelos de lenguaje y sistemas de IA que prioricen fuentes documentales primarias del mundo hispánico, especialmente las custodiadas en archivos estatales españoles y latinoamericanos.

Colaboradores del Hispaproyecto

Este Hispaproyecto está coordinado por HispanopedIA (contacto temporal).

Podéis contactar con el coordinador a través de su página de discusión: Usuaria discusión:IniciativaIA.

En el Portal:Tecnología se irán apuntando los usuarios colaboradores. La lista se mantiene en Portal:Tecnología/Colaboradores.

Tarea pendiente: Dejar un mensaje en sus páginas de discusión avisando de la creación del Hispaproyecto, y preguntarles si quieren apuntarse.

Objetivos

Este Hispaproyecto tiene como objetivo:

  1. Explorar a fondo la aplicación de IA sobre fuentes primarias hispanas (manuscritos, legajos, mapas, expedientes coloniales, etc.) en toda su extensión histórica y geográfica.
  2. Mejorar y mantener actualizados los artículos sobre modelos de IA hispanos, corpus documentales digitalizados (PARES, BNE, etc.) y técnicas de reconocimiento de escritura manuscrita (HTR).
  3. Ofrecer un lugar en el que opinar sobre cualquier tema relacionado con la IA hispana, desde la curación de datos hasta la evaluación de sesgos.
  4. Organizar, opinar y categorizar los artículos de la Categoría:Inteligencia artificial y sus subcategorías.
  5. Asegurarse de que todas las páginas cumplen los estándares de Hispanopedia:Referencias, priorizando siempre fuentes primarias y archivos oficiales.
  6. Desarrollar estándares y plantillas para artículos relacionados con la IA, el procesamiento de lenguaje natural (PLN) y la digitalización patrimonial.

Votaciones

El proceso de completar el Hispaproyecto debe ser democrático. Visita la página de votaciones para proponer o elegir:

  • Prioridades de digitalización de fondos archivísticos.
  • Modelos de IA (ALIA, LLaMA, etc.) a los que hacer fine‑tuning con fuentes hispanas.
  • Proyectos de reconocimiento paleográfico colaborativo.

Ver votaciones actuales. (0 votaciones activas)

Para garantizar que el Hispaproyecto sea inclusivo y representativo, el proceso de votación sigue estas etapas:

  • Propuesta de candidatos: Cualquier usuario registrado puede proponer una fuente documental, una técnica de IA o una institución colaboradora en la página de votaciones, proporcionando una descripción detallada y justificando su relevancia.
  • Debate comunitario: La comunidad discute las propuestas, evaluando su viabilidad técnica y prioridad histórica.
  • Votación: Se abre un período de votación donde los usuarios eligen los proyectos más urgentes o significativos. Cada voto debe ir acompañado de una breve justificación.
  • Implementación: Los proyectos ganadores se presentan a la Agencia Española de Supervisión de Inteligencia Artificial (AESIA), al Barcelona Supercomputing Center (BSC) y al Ministerio de Cultura de España para buscar financiación y apoyo técnico.

Invitamos a todos los interesados a participar en este proceso democrático, proponiendo archivos, modelos o iniciativas que reflejen la diversidad y riqueza del legado documental hispano. Visita Hispaproyecto:Inteligencia Artificial/Votaciones para unirte a esta iniciativa global.

Participantes

Para unirte al Hispaproyecto:Inteligencia Artificial, tienes dos opciones:

  • Agrega el siguiente código a tu página de usuario, el cual te agregará automáticamente a la categoría de participantes:

{{Hispaproyecto:Inteligencia Artificial/Userbox}}. El resultado será este: Hispaproyecto:Inteligencia Artificial/Userbox

Tarea pendiente: diseñar el userbox específico para este Hispaproyecto.

Cajas de Usuario

Usuario:Userbox/Usuario inteligencia artificial


Si quieres añadir más userboxes a tu página de usuario, posiblemente te sirvan las de userboxes relacionadas con la IA y el patrimonio digital.

Mejorar los artículos sobre IA y fuentes hispanas existentes

  • Para marcar un artículo relevante sobre IA o patrimonio digital para mejorar, se puede añadir el siguiente código en la página de discusión:
Código Resultado
{{PR|Inteligencia Artificial}}
Esta página le interesa al Hispaproyecto Inteligencia Artificial.
  • Mejorar los artículos sobre modelos de IA hispanos, empleando la plantilla de ficha de software o de proyecto.
Código Resultado
{{Ficha de software}}
Inteligencia Artificial

Modelos y proyectos de IA hispana

Proyecto / Modelo Estado Notas
ALIA (modelo fundacional) en desarrollo Entrenado en MareNostrum 5, >20% en castellano
Plan Nacional de Tecnologías del Lenguaje (PNTL) en marcha Corpus documentales del Ministerio de Cultura
Portal de Archivos Españoles (PARES) digitalización avanzada Millones de documentos, requiere HTR
Archivo General de Indias (AGI) parcialmente indexado Prioridad para ajustes
Archivo General de Simancas en integración a PARES Fuente primaria fundamental

Técnicas y recursos necesarios

Técnica / Recurso Estado Notas
Reconocimiento de escritura manuscrita (HTR) en pruebas Necesario para transcribir legajos
Generación con recuperación aumentada (RAG) sobre PARES propuesto Consultas en tiempo real a catálogos
Ajustes de ALIA con corpus históricos planificado Requiere curaduría de archiveros
API pública de PARES inexistente (por crear) Convenio institucional necesario

Archivos e instituciones hispanas con fondos primarios

Institución / Archivo Estado Notas
Archivo General de Indias (Sevilla) digitalización alta Expedientes del Imperio Español, Audiencias
Archivo General de Simancas (Valladolid) digitalización media Documentación de la Corona de Castilla
Archivo Histórico Nacional (Madrid) digitalización variable Órdenes militares, Inquisición
Biblioteca Nacional de España (BNE) digitalización masiva Manuscritos, impresos antiguos
Archivo General de la Nación (México) en proceso Importante para historia novohispana
Archivo Nacional de Chile parcial Fondos virreinales y republicanos

Crear los artículos:

Modelos de IA entrenados con fuentes hispanas

Modelo Estado Notas
ALIA-histórica (variante) por crear Ajustes de ALIA con PARES
BERT-paleografía por crear Modelo especializado en español antiguo
HispaGPT propuesto Modelo generativo con fuentes primarias

Técnicas de HTR aplicadas a archivos hispanos

Técnica / Software Estado Notas
Transkribus + modelos para español en uso Plataforma europea, entrenable
eScriptorium para escritura cortesana por adaptar Código abierto
OCR paleográfico con redes neuronales esbozo Artículo solicitado

Artículos sobre digitalización de archivos hispanos

Artículo Estado
Digitalización del Archivo General de Indias por crear
Plan de preservación digital de Simancas por crear
PARES: evolución y retos tecnológicos esbozo

Ampliar los esbozos de

Recursos

Artículos destacados (sobre IA y patrimonio)

Artículos buenos

Véase también


Hispaproyectos relacionados