El proyecto del léxico inglés

Rodrigo Ricardo Publicado el 15 noviembre, 2020 4 minutos y 19 segundos de lectura

El proyecto del léxico inglés

¿Alguna vez te has preguntado cuántas palabras hay en el idioma inglés? La verdad es que hay demasiados para contar, ¡y se están creando nuevos todo el tiempo! Sin embargo, un equipo de investigadores de distintas universidades quería crear una base de datos , o colección basada en computadora, de tantas palabras en inglés como fuera posible. El resultado fue el English Lexicon Project. Un léxico es la colección de palabras que componen un idioma o el vocabulario de una persona.

Esta base de datos está compuesta por más de 40.000 palabras en inglés, así como por más de 40.000 no palabras (palabras que no son palabras reales, pero que siguen las reglas del idioma inglés). Está en constante crecimiento a medida que se agregan nuevas palabras. El proyecto fue iniciado en 2000 por un equipo de seis universidades de todo el país: Morehead State University, SUNY Albany, University of Kansas, University of South Florida, Washington University y Wayne State University. Es un proyecto abierto y en curso.

La base de datos está abierta al público, aunque la parte de búsqueda es bastante técnica. Está dirigido principalmente a investigadores, especialmente en los campos del lenguaje y la lingüística. Es por eso que incluye no palabras, que a menudo son útiles en la investigación de idiomas.

El English Lexicon Project contiene más de 40.000 palabras en inglés.
Nube de palabras digital

Características léxicas

La base de datos no solo tiene una gran lista de palabras. Cada palabra está organizada por sus características léxicas. Las características léxicas son las características específicas de cada palabra. Esto incluye cosas como ortografía y pronunciación. La base de datos del English Lexicon Project tiene 22 opciones de búsqueda para las características léxicas de una palabra. Sin embargo, estos se pueden agrupar en algunas categorías principales.

1. Longitud: la cantidad de letras en una palabra.

2. Frecuencia: Con qué frecuencia se usa una palabra. Por ejemplo, el tendría una frecuencia más alta que el xilófono .

3. Características ortográficas: cómo se escribe algo. Esto, por ejemplo, le permitiría buscar cualquier palabra que contenga ph .

4. Características fonológicas: cómo se pronuncia una palabra. Cada palabra de la base de datos se ha escrito fonéticamente , por lo que se escribe como suena.

5. Partes del habla: puede buscar específicamente verbos, adjetivos, sustantivos, pronombres, etc.

Al buscar palabras en la base de datos, puede elegir una o combinar cualquier número de ellas para ver qué palabras se ajustan a las características que está buscando.

Propósito

Entonces, ¿cuál es el propósito de este proyecto? El objetivo de la mayoría de las bases de datos es recopilar y organizar grandes cantidades de datos para que la investigación futura sea más fácil y rápida, y el English Lexicon Project comparte ese objetivo. La idea es que ayudará a los investigadores a crear listas de palabras para sus proyectos sin tener que crear listas nuevas cada vez. Ahorra mucho tiempo y energía y permite más tiempo de investigación real.

Por ejemplo, supongamos que desea ver cómo las personas de diferentes áreas del país pronuncian palabras con / au / en ellas (por ejemplo, atrapado ). Con esta base de datos, puede generar rápidamente una lista de estas palabras, así como de las que no son palabras con esa característica, sin tener que buscar en diccionarios u otros tipos de listas de palabras para hacer la lista usted mismo. Es mucho mas rapido.

Además, dado que la base de datos también enumera otras características de la palabra, puede incluir más información en su estudio de la que podría incluir de otra manera. La frecuencia de una palabra, por ejemplo, es algo que puede afectar la pronunciación. Dado que la frecuencia es parte de la base de datos, ya tiene esta información lista para usar.

Resumen de la lección

El English Lexicon Project es una base de datos que se creó para ayudar a los investigadores a crear y organizar listas de palabras para usar en sus estudios y para ayudar con futuras investigaciones. Contiene más de 40.000 de las palabras que componen el léxico del inglés y está en constante crecimiento a medida que las seis universidades involucradas continúan agregando más información. Cada palabra está organizada por sus características léxicas , como longitud, frecuencia, ortografía (ortografía), pronunciación (cada palabra también se escribe fonéticamente) y parte del discurso. Esto significa que los investigadores pueden crear listas de palabras con exactamente las características que desean estudiar y ya tienen información sobre otros aspectos de la palabra que podrían ser útiles. La base de datos es una contribución importante al estudio de idiomas y permite a los investigadores dedicar más tiempo a sus estudios reales y menos a crear listas de palabras precisas.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador