Nova: El Centro Ramón Piñeiro presenta la nueva versión del Corpus de Referencia do Galego, que permite reconocer formas con seseo
21/06/2024
El Centro Ramón Piñeiro presenta la nueva versión del Corpus de Referencia do Galego, que permite reconocer formas con seseo
Valentín García pone en valor esta aplicación informática por su carácter "potente, flexible e innovador" a la hora de facilitar investigaciones "cada vez más amplias y variadas"
La actualización de recursos incorpora un diccionario de frecuencias de usos de nuestro léxico
Santiago de Compostela, 21 de junio de 2024
El secretario xeral da Lingua, Valentín García, participó hoy en la presentación de la versión 4.1 del Corpus de Referencia do Galego Actual (CORGA), una herramienta lingüística en línea desarrollada por el Centro Ramón Piñeiro para la Investigación en Humanidades y representativa del uso lingüístico del gallego actual. Esta nueva versión tiene como una de sus principales novedades la de permitir el reconocimiento de formas con las de seseo.
En la presentación de la nueva versión, el representante de Cultura, Lingua e Xuventude puso en valor este recurso informático por su carácter "potente, flexible, amistoso y también innovador" y que consideró "de suma utilidad" para extraer datos de la lengua gallega actual. De igual manera, destacó que facilitar estudios desde múltiples perspectivas e investigación "cada vez más amplias y variadas".
El secretario xeral da Lingua recordó que se trata de un corpus documental abierto a través de internet que abarca cronológicamente desde 1975 hasta la actualidad. Tiene como objetivo, según concretó, el de "suministrar datos para el estudio de la lengua gallega actual" desde múltiples perspectivas: léxica, morfológica, sintáctica,*fraseológica, terminológica o comunicativa.
Valentín García destacó el valor de la actualización del Corpus ya que con este "nuevo paso" se amplía a un total de 45.665.649 las palabras ortográficas (54.737.277 elementos gramaticales), lo que supone "un corpus pequeño pero con una rica codificación". En este sentido, consideró de relevancia estas cifras, ya que aseguró que "contrastan con corpus en otras lenguas de miles de millones de palabras construidos a partir de Internet, pero con una escasa codificación".
Frecuencia de usos del léxico
Además del reconocimiento de formas con seseo, el secretario xeral da Lingua apuntó que esta herramienta presenta utilidades innovadoras como un diccionario de frecuencias que tiene en cuenta el índice de dispersión, "con el que nos aporta resultados mucho más relevantes sobre la frecuencia del léxico", ensalzó.
De igual manera, este recurso permite ya desde la última versión reconocimiento de formas con gheada o la posibilidad de realizar estudios variados desde la perspectiva de género, teniendo en cuenta el empleo del lenguaje inclusivo y atendiendo a la discriminación de los resultados en función del sexo del autor y/o interlocutor y habilitando cruces entre el sexo de un autor y el sexo de los personajes.