¿Por Qué Idiomas Y Dialectos - Estas Son Cosas Completamente Diferentes - Vista Alternativa

¿Por Qué Idiomas Y Dialectos - Estas Son Cosas Completamente Diferentes - Vista Alternativa
¿Por Qué Idiomas Y Dialectos - Estas Son Cosas Completamente Diferentes - Vista Alternativa

Vídeo: ¿Por Qué Idiomas Y Dialectos - Estas Son Cosas Completamente Diferentes - Vista Alternativa

Vídeo: ¿Por Qué Idiomas Y Dialectos - Estas Son Cosas Completamente Diferentes - Vista Alternativa
Vídeo: Los idiomas y dialectos 2024, Mayo
Anonim

Muchas veces, las preguntas simples tienen respuestas complejas. Por ejemplo: ¿cuál es la diferencia entre idioma y dialecto? Si decide preguntarle a un lingüista sobre esto, siéntese. Aunque a primera vista no hay nada de difícil en esta pregunta, se puede responder de diferentes formas.

La distinción entre lengua y dialecto puede depender de un punto de vista u otro. Desde un punto de vista político, el idioma es lo que la gente suele hablar como nación. Por ejemplo, de 1850 a 1992, existió el llamado idioma serbocroata, que incluía varios dialectos, incluidos el serbio, el croata y el bosnio. Pero después de que Yugoslavia se dividiera en varios estados independientes a mediados de la década de 1990, estos dialectos fueron reconocidos como idiomas separados. Esta definición política funciona en parte, aunque trae consigo más problemas que soluciones: hay idiomas que se hablan en diferentes países, un ejemplo llamativo de ello es el español en América Latina. Nadie diría que el español mexicano y el español colombiano son idiomas diferentes. Posiblemente español, hablado en partes de España,tan diferente de sus variedades latinoamericanas que merece ser llamado un idioma aparte, pero esto no está del todo claro.

¿Qué pasa si trazamos la línea entre lengua y dialecto, guiados por el criterio del entendimiento mutuo? Desafortunadamente, este enfoque tampoco es ideal. Un danés entenderá el sueco algo mejor de lo que un sueco entenderá el danés. Del mismo modo, una persona que hable el dialecto campesino específico del inglés británico entenderá mucho mejor a un estadounidense de Los Ángeles que a un estadounidense. El entendimiento mutuo a menudo depende de factores externos (son una variable bastante incontrolable) y no de propiedades inherentes del lenguaje en sí.

Entonces, tal vez deberíamos adoptar un enfoque puramente lingüístico. Imagínese que podemos medir sistemáticamente la diferencia (D) entre dos variantes de habla. El significado específico de D nos permitiría entonces definir el límite entre dos dialectos y dos idiomas. Encontrar ese valor no debería ser muy difícil, ya que los dos idiomas se pueden comparar en muchos criterios, como el inventario de sonido, las características gramaticales o el vocabulario.

norte

Pero, ¿qué pasa si las diferencias entre las variaciones del habla son graduales y la probabilidad de encontrar un valor dado de D es tan alta como la probabilidad de encontrar algún otro valor? Entonces tendríamos que elegir un valor arbitrario de D como punto de partida, y un valor arbitrario nos devolvería a consideraciones de índole política o práctica que no pretendíamos considerar. ¿Queremos que nuestra línea de ruptura esté al nivel en el que el serbio y el croata son idiomas diferentes o uno solo? Catalogando las lenguas del mundo, ¿cuántos miles de lenguas queremos relegar al olvido: cinco? ¿O siete? ¿Quizás diez mil?

En los últimos años, se han superado dos obstáculos importantes para distinguir entre lengua y dialecto. La primera es cómo medir las diferencias entre las variantes del habla, es decir, encontrar un valor para D. En 2008, un grupo de lingüistas creó el Programa de Juicio de Similitud Automatizado (ASJP), un curador diario y fundador del cual es verdaderamente suyo. La ASJP ha preparado minuciosamente un conjunto de datos de comparación sistemática de idiomas que actualmente contiene 7655 listas de palabras. Son relevantes para dos tercios de los idiomas del mundo, asumiendo que, para nuestros propósitos, los idiomas están definidos por el código estándar ISO 639-3. Dado que cada lista de palabras contiene un conjunto fijo de 40 conceptos que se interpretan de manera consistente, es fácil compararlos y así obtener una medida de la diferencia. La medida de diferencia más utilizada entre dos palabras es la distancia de Levenshtein, un término que lleva el nombre de Vladimir Levenshtein, un científico soviético que, en 1965, desarrolló un algoritmo para comparar dos cadenas de caracteres. Definió "espaciado" como el número mínimo de reemplazos, inserciones y eliminaciones necesarias para transformar una línea en otra. La distancia de Levenshtein se puede dividir de manera útil por la longitud de la más larga de las dos líneas, y así poner todas las distancias en una escala de 0 a 1. Este fenómeno se conoce como distancia de Levenshtein normalizada o LDN. Definió "espaciado" como el número mínimo de reemplazos, inserciones y eliminaciones necesarias para transformar una línea en otra. La distancia de Levenshtein se puede dividir de manera útil por la longitud de la más larga de las dos líneas, y así poner todas las distancias en una escala de 0 a 1. Este fenómeno se conoce como distancia de Levenshtein normalizada o LDN. Definió "espaciado" como el número mínimo de reemplazos, inserciones y eliminaciones necesarias para transformar una línea en otra. La distancia de Levenshtein se puede dividir de manera útil por la longitud de la más larga de las dos líneas, y así poner todas las distancias en una escala de 0 a 1. Este fenómeno se conoce como distancia de Levenshtein normalizada o LDN.

norte

El segundo obstáculo es que quizás "lengua" y "dialecto" son conceptos que sólo pueden definirse en un orden arbitrario. Aquí tenemos algunas noticias muy alentadoras para ti. Si miramos todas las familias de lenguas en la base de datos de ASJP, donde los participantes del proyecto han incluido una proporción significativa de variedades estrechamente relacionadas, podemos comenzar a buscar diferentes tipos de comportamiento de lenguas y dialectos. Surge ante nosotros una imagen intrigante: las distancias, por regla general, fluctúan alrededor de un valor relativamente pequeño o alrededor de uno relativamente grande, y se forma una depresión entre ellas. Como resultado, la mayoría de las veces este valle se encuentra en un rango estrecho, con un promedio de alrededor de 0.48 LDN. No nos equivocaremos si decimos que las variantes del habla tienden a no ser parcialmente similares entre sí en su vocabulario básico. O existe una tendencia hacia una mayor similitud, en cuyo caso las variantes del habla pueden definirse como diferentes dialectos, o una menor similitud, en cuyo caso pueden atribuirse a diferentes idiomas. Aquí es donde se encuentra la frontera entre el idioma y el dialecto.

Este fenómeno fue probablemente el resultado de circunstancias sociales. Los dialectos divergen a medida que las personas se establecen en nuevos territorios y forman nuevas identidades, pero si todavía hay algún contacto entre ellos, se puede producir una convergencia de tal manera que las variantes del habla sigan siendo similares en más del 50 por ciento (y por lo tanto el habla se trata de un idioma). Sin embargo, un ligero impulso hacia la divergencia puede hacer que las variantes del lenguaje diverjan relativamente rápido, aumentando la distancia de Levenshtein, en cuyo caso podemos calificarlos como idiomas separados. Puede haber una relación entre el límite de las distancias entre las palabras en la lista estándar utilizada por ASJP y las distancias correspondientes en otras partes de la estructura del lenguaje, lo que puede conducir a una grave pérdida de comprensión. En otras palabras,el umbral de comprensión puede correlacionarse con el umbral entre lenguas y dialectos. Aún no hemos estudiado este tema, pero como objeto de investigación es sumamente interesante.

Video promocional:

Habiendo llegado a un criterio objetivo más que arbitrario para separar las lenguas de los dialectos, podemos aplicarlo a las lenguas del mundo. Algunos pares de variedades de habla que se consideran idiomas nacionales, como el bosnio y el croata, están muy por debajo del umbral de la LDN de 0,48 (lo que significa que son el mismo idioma independientemente de la existencia de Yugoslavia). No muy lejos de este umbral se encuentran idiomas como el hindi y el urdu (difícilmente se pueden llamar dos idiomas diferentes). Y las variedades de árabe y chino, que a menudo se consideran los mismos idiomas, se elevan por encima de LDN = 0.48 (estas variedades son idiomas separados). De hecho, existen varios pares de variedades que suelen considerarse lenguas diferentes pero fluctúan en la frontera: por ejemplo, danés y sueco, que tienen una LDN de 0,4921.

Finalmente, se puede aplicar una técnica derivada de conjuntos de datos, llamada cronología ASJP, para establecer la cantidad de tiempo que tardan los dialectos en distanciarse lo suficiente como para ser considerados idiomas separados. El resultado que encontramos es de 1059 años, si no tenemos en cuenta algún error. Estos hallazgos están respaldados por el tiempo que suele tardar el lenguaje genérico de una familia de lenguas en dividirse en lenguas hijas, que más tarde se convierten en antepasados de subfamilias. Para ello, necesitamos otros métodos de análisis, pero los resultados son similares: se necesitan alrededor de un milenio para convertir los dialectos en idiomas. Sabemos esto porque ahora podemos distinguir uno del otro.

Søren Wichmann es un lingüista danés que colabora con la Universidad de Leiden (Países Bajos), la Universidad Federal de Kazán (Rusia) y la Universidad Lingüística de Pekín (China). Su último libro, Temporal Stability of Linguistic Typological Features (2009), fue coautor con Eric W. Holman.

Recomendado: