Use este identificador para citar ou linkar para este item:
https://repositorio.pucsp.br/jspui/handle/handle/39453
Tipo: | Dissertação |
Título: | É possível distinguir a tradução automática da tradução humana? uma perspectiva baseada em corpus e aprendizagem de máquina |
Autor(es): | Souza, Aline Tomasuolo |
Primeiro Orientador: | Sardinha, Antonio Paulo Berber |
Resumo: | Nos últimos anos, houve avanços significativos nas tecnologias de tradução automática, levando ao questionamento sobre sua eficácia em relação à tradução humana. Nesta dissertação de mestrado, exploramos essa questão por meio de uma abordagem baseada em corpus e aprendizagem de máquina. O corpus compilado inclui textos em inglês da área financeira, especificamente de companhias de capital aberto, sendo textos provavelmente produzidos em inglês por nativos do idioma e textos traduzidos do português para o inglês. O corpus foi dividido em três subcorpora: corpus de textos em inglês provavelmente produzidos por nativos do idioma (corpus comparável), corpus de tradução humana e corpus de tradução automática (corpora paralelos). Utilizamos o Biber Tagger para análise gramatical e o Weka para análise lexical dos corpora. Com o Biber Tagger, examinamos as estruturas gramaticais do corpus. Por meio do Weka, realizamos uma análise lexical nos corpora, identificando diferenças e semelhanças entre a tradução automática, a tradução humana e textos provavelmente escritos por nativos da língua inglesa. Esta abordagem nos permitiu criar um modelo probabilístico que pode prever, com 85% de precisão, se uma tradução foi produzida por uma máquina ou um tradutor humano. Assim, concluímos que, lexicalmente, é possível diferenciar a tradução automática da tradução humana; no entanto, gramaticalmente, ambas as traduções são equiparáveis e em níveis comparáveis aos textos provavelmente escritos por falantes nativos de inglês |
Abstract: | In recent years, there have been significant advances in machine translation technologies, leading to questions about their effectiveness compared to human translation. In this master's dissertation, we explore this issue through a corpus-based and machine-learning approach. The compiled corpus includes English texts from the financial area, specifically from listed companies, including translated texts from Portuguese to English and texts written in English by native speakers. The corpus was divided into three subcorpora: an English-native text corpus (comparable corpus), a human translation corpus, and an automatic translation corpus (parallel corpora). We used the Biber Tagger for grammatical analysis and Weka for lexical analysis of the corpora. With the Biber Tagger, we examined the grammatical structures of the corpus. Through Weka, we conducted a lexical analysis of the corpora, identifying differences and similarities between automatic translation, human translation, and texts written by native English speakers. This approach allowed us to create a probabilistic model that can predict, with 85% accuracy, if a translation was produced by a machine or a human translator. We concluded that lexically, it is possible to differentiate automatic translation from human translation; however, grammatically, both translations are nearly identical and at comparable levels to texts written by native English speakers. |
Palavras-chave: | Tradução automática Linguística de corpus Análise multidimensional Análise lexical Machine translation Corpus linguistics Multidimensional analysis Lexical analysis |
CNPq: | CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA |
Idioma: | por |
País: | Brasil |
Editor: | Pontifícia Universidade Católica de São Paulo |
Sigla da Instituição: | PUC-SP |
metadata.dc.publisher.department: | Faculdade de Filosofia, Comunicação, Letras e Artes |
metadata.dc.publisher.program: | Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem |
Citação: | Souza, Aline Tomasuolo. É possível distinguir a tradução automática da tradução humana? uma perspectiva baseada em corpus e aprendizagem de máquina. 2023. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2023. |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.pucsp.br/jspui/handle/handle/39453 |
Data do documento: | 28-Ago-2023 |
Aparece nas coleções: | Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Aline Tomasuolo Souza.pdf | 1,33 MB | Adobe PDF | ![]() Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.