Repository logo
Log In(current)
  1. Home
  2. Colleges & Schools
  3. College of Arts and Sciences
  4. World Languages and Cultures
  5. World Languages and Cultures Publications and Other Works
  6. Corretor ortográfico e corpus linguístico: matar dois coelhos com uma só cajadada
Details

Corretor ortográfico e corpus linguístico: matar dois coelhos com uma só cajadada

Source Publication
Línguas Minoritárias e Variação Linguística
Date Issued
November 1, 2020
Author(s)
Stuckwisch, Matthew S
DOI
10.34624/rj68-vz44
Permanent URI
https://trace.tennessee.edu/handle/20.500.14382/48954
Abstract

O que faz falta para o estudo das línguas minoritarias é ainda muito. Uma das ferramentas mais importantes para o estudo de idiomas é o corpus. Embora seja bastante fácil hoje preparar um corpus básico, é bastante mais difícil criar um corpus etiquetado para a pesquisa de estruturas mais gerais, porque é preciso etiquetar as palavras nele introduzidas. Ao mesmo tempo, essas línguas também costumam estar num estado variável de normalização e estandarização, e elas e os seus falantes poderiam beneficiar de um corrector ortográfico. Proponho que, por mor de economia de recursos, é recomendável que quem quiser desenvolver um corpus também pense em fazer um corretor já que o trabalho para ambas as tarefas é muito parecido, senão quase idêntico. Este processo é aqui demostrado empregando o asturiano como exemplo.


There is much missing in the study of minority languages. One of the most important tools for the study of languages is the corpus. Although today it is easy to prepare a simple corpus, it is more difficult to create a tagged corpus because it is necessary to tag each of the words in it. At the same time, these languages tend to be in a variable state of normalization and standardization, and they and their speakers can benefit from a spell checker. I propose that, in the face of limited resources, it is best that a researcher intending to develop a corpus also consider making a spell checker, as the work for both is very similar, if not virtually identical. This process is demonstrated using Asturian as an example.

Subjects

spell checker

linguistic corpus

Asturian

minority languages

corretor ortográfico

corpus linguístico

asturiano

línguas minoritárias

Disciplines
Digital Humanities
Modern Languages
Other Languages, Societies, and Cultures
Other Spanish and Portuguese Language and Literature
Submission Type
Publisher's Version
File(s)
Thumbnail Image
Name

Corretor_ortogra%CC%81fico_e_corpus_lingui%CC%81stico.pdf

Size

764.93 KB

Format

Adobe PDF

Checksum (MD5)

ad84dbf1f43e3a134ebeab4b503ac487

Built with DSpace-CRIS software - Extension maintained and optimized by 4Science

  • Privacy policy
  • End User Agreement
  • Send Feedback
  • Contact
  • Libraries at University of Tennessee, Knoxville
Repository logo COAR Notify