Con este algoritmo sabemos la riqueza de vocabulario de una persona

Sicalíptico, onicófago o escible son términos infrecuentes en el habla cotidiana, e incluso en desuso según el Diccionario de la Real Academia. Hay gente, sin embargo, pendante hasta la médula que las usan con relativa frecuencia. Otros, como si fueran el indio de una película del Oeste, prefiere no alejarse mucho del «Ola ke ase».

Sin embargo, podemos incurrir en errores estadísticos si analizamos el habla de una persona a fin de inferir su riqueza léxica. Para evitarlo, se ha desarrollado un algoritmo que lo establece con seguridad.

¿Dónde está la riqueza léxica?

Gracias a este algoritmo, de hecho, se ha llevado a cabo un estudio por parte de investigadores del grupo Vernáculo Urbano Malagueño (VUM) de la Universidad de Málaga.

En concreto, para el trabajo se ha utilizado un corpus lingüístico del español hablado en la ciudad de Málaga. Un material oral que fue obtenido tras más de 80 horas de grabación.

El artículo, publicado en la revista Spanish in Context, permite conocer la diversidad léxica usada en el intercambio lingüístico y determinar cuándo la densidad del léxico aumenta y cuándo decrece en la conversación.

En ese sentido, los factores más importantes el contacto con los medios de comunicación, la ocupación profesional, la educación y la clase social. Según Antonio M. Ávila Muñoz, responsable de la investigación:

La relación que tiene el individuo con los medios de comunicación, por ejemplo, influye en gran medida en su integración con la cultura general y los valores y normas de la comunidad.

Así, por ejemplo, los hablantes con mayor contacto con la prensa escrita obtuvieron un 3,1% más de puntuación en textos de léxico más avanzado que los participantes del grupo con un contacto más restringido a la televisión. Por otro lado, en el ámbito laboral los resultados recogen la evidencia de que el mayor porcentaje (el 53%) de los textos más complejos fueron los registrados por empresarios y personas con profesiones técnicas, cargos medios y funcionarios.

Finalmente, la clase social también parece muy relevante: en la muestra analizada el léxico fluctuó entre las 862 y las 3.055 palabras de media según el grupo social al que pertenecían los hablantes.

Fuente: xatakaciencia.com