El curso de 2 ECTS planteado es una introducción teórico-práctica a la problemática que se plantea al trabajar con colecciones de textos (corpus) e intentar extraer información o interpretar su contenido en un contexto financiero, médico o periodo histórico. Y en general se pretende responder a la pregunta ¿Qué hacer cuando se dispone de corpus que contienen miles de textos, pero no de miles de millones de textos? ¿Pueden usarse tecnologías basadas en IA como son los modelos del lenguaje, en dominios específicos? En concreto se presentarán casos de estudio con corpus del dominio financiero (informes), médico (ensayos clínicos) e histórico (periódicos históricos de siglos pasados).