Nova: O Centro Ramón Piñeiro presenta a nova versión do Corpus de Referencia do Galego, que permite recoñecer formas con seseo
21/06/2024
O Centro Ramón Piñeiro presenta a nova versión do Corpus de Referencia do Galego, que permite recoñecer formas con seseo
Valentín García pon en valor esta aplicación informática polo seu carácter “potente, flexible e innovador” á hora de facilitar investigacións “cada vez máis amplas e variadas”
A actualización de recursos incorpora un dicionario de frecuencias de usos do noso léxico
Santiago de Compostela, 21 de xuño de 2024
O secretario xeral da Lingua, Valentín García, participou hoxe na presentación da versión 4.1 do Corpus de Referencia do Galego Actual (CORGA), unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades e representativa do uso lingüístico do galego actual. Esta nova versión ten como unha das súas principais novidades a de permitir o recoñecemento de formas coas de seseo.
Na presentación da nova versión, o representante de Cultura, Lingua e Xuventude puxo en valor este recurso informático polo seu carácter “potente, flexible, amigable e tamén innovador” e que considerou “de suma utilidade” para extraer datos da lingua galega actual. De igual xeito, salientou que facilitar estudos desde múltiples perspectivas e investigación “cada vez máis amplas e variadas”.
O secretario xeral da Lingua lembrou que se trata dun corpus documental aberto a través de internet que abrangue cronoloxicamente desde 1975 ata a actualidade. Ten como obxectivo, segundo concretou, o de “fornecer datos para o estudo da lingua galega actual” desde múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica ou comunicativa.
Valentín García salientou o valor da actualización do Corpus xa que con este “novo paso” se amplía a un total de 45.665.649 as palabras ortográficas (54.737.277 elementos gramaticais), o que supón “un corpus pequeno pero cunha rica codificación”. Neste senso, considerou de relevancia estas cifras, xa que asegurou que “contrastan con corpus noutras linguas de miles de millóns de palabras construídos a partir de Internet, pero cunha escasa codificación”.
Frecuencia de usos do léxico
Ademais do recoñecemento de formas con seseo, o secretario xeral da Lingua apuntou que esta ferramenta presenta utilidades innovadoras como un dicionario de frecuencias que ten en conta o índice de dispersión, “co que nos achega resultados moito máis relevantes sobre a frecuencia do léxico”, enxalzou.
De igual xeito, este recurso permite xa desde a última versión recoñecemento de formas con gheada ou a posibilidade de realizar estudos variados desde a perspectiva de xénero, tendo en conta o emprego da linguaxe inclusiva e atendendo á discriminación dos resultados en función do sexo do autor e/ou interlocutor e habilitando cruzamentos entre o sexo dun autor e o sexo dos personaxes.