REPOSITORIO PUCSP Teses e Dissertações dos Programas de Pós-Graduação da PUC-SP Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem
Use este identificador para citar ou linkar para este item: https://repositorio.pucsp.br/jspui/handle/handle/39453
Registro completo de metadados
Campo DCValorIdioma
dc.creatorSouza, Aline Tomasuolo-
dc.creator.Latteshttp://lattes.cnpq.br/1166529281267183pt_BR
dc.contributor.advisor1Sardinha, Antonio Paulo Berber-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6940454346543706pt_BR
dc.date.accessioned2023-10-05T13:22:21Z-
dc.date.available2023-10-05T13:22:21Z-
dc.date.issued2023-08-28-
dc.identifier.citationSouza, Aline Tomasuolo. É possível distinguir a tradução automática da tradução humana? uma perspectiva baseada em corpus e aprendizagem de máquina. 2023. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2023.pt_BR
dc.identifier.urihttps://repositorio.pucsp.br/jspui/handle/handle/39453-
dc.description.resumoNos últimos anos, houve avanços significativos nas tecnologias de tradução automática, levando ao questionamento sobre sua eficácia em relação à tradução humana. Nesta dissertação de mestrado, exploramos essa questão por meio de uma abordagem baseada em corpus e aprendizagem de máquina. O corpus compilado inclui textos em inglês da área financeira, especificamente de companhias de capital aberto, sendo textos provavelmente produzidos em inglês por nativos do idioma e textos traduzidos do português para o inglês. O corpus foi dividido em três subcorpora: corpus de textos em inglês provavelmente produzidos por nativos do idioma (corpus comparável), corpus de tradução humana e corpus de tradução automática (corpora paralelos). Utilizamos o Biber Tagger para análise gramatical e o Weka para análise lexical dos corpora. Com o Biber Tagger, examinamos as estruturas gramaticais do corpus. Por meio do Weka, realizamos uma análise lexical nos corpora, identificando diferenças e semelhanças entre a tradução automática, a tradução humana e textos provavelmente escritos por nativos da língua inglesa. Esta abordagem nos permitiu criar um modelo probabilístico que pode prever, com 85% de precisão, se uma tradução foi produzida por uma máquina ou um tradutor humano. Assim, concluímos que, lexicalmente, é possível diferenciar a tradução automática da tradução humana; no entanto, gramaticalmente, ambas as traduções são equiparáveis e em níveis comparáveis aos textos provavelmente escritos por falantes nativos de inglêspt_BR
dc.description.abstractIn recent years, there have been significant advances in machine translation technologies, leading to questions about their effectiveness compared to human translation. In this master's dissertation, we explore this issue through a corpus-based and machine-learning approach. The compiled corpus includes English texts from the financial area, specifically from listed companies, including translated texts from Portuguese to English and texts written in English by native speakers. The corpus was divided into three subcorpora: an English-native text corpus (comparable corpus), a human translation corpus, and an automatic translation corpus (parallel corpora). We used the Biber Tagger for grammatical analysis and Weka for lexical analysis of the corpora. With the Biber Tagger, we examined the grammatical structures of the corpus. Through Weka, we conducted a lexical analysis of the corpora, identifying differences and similarities between automatic translation, human translation, and texts written by native English speakers. This approach allowed us to create a probabilistic model that can predict, with 85% accuracy, if a translation was produced by a machine or a human translator. We concluded that lexically, it is possible to differentiate automatic translation from human translation; however, grammatically, both translations are nearly identical and at comparable levels to texts written by native English speakers.en_US
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESpt_BR
dc.languageporpt_BR
dc.publisherPontifícia Universidade Católica de São Paulopt_BR
dc.publisher.departmentFaculdade de Filosofia, Comunicação, Letras e Artespt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsPUC-SPpt_BR
dc.publisher.programPrograma de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagempt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectTradução automáticapt_BR
dc.subjectLinguística de corpuspt_BR
dc.subjectAnálise multidimensionalpt_BR
dc.subjectAnálise lexicalpt_BR
dc.subjectMachine translationen_US
dc.subjectCorpus linguisticsen_US
dc.subjectMultidimensional analysisen_US
dc.subjectLexical analysisen_US
dc.subject.cnpqCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADApt_BR
dc.titleÉ possível distinguir a tradução automática da tradução humana? uma perspectiva baseada em corpus e aprendizagem de máquinapt_BR
dc.typeDissertaçãopt_BR
Aparece nas coleções:Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Aline Tomasuolo Souza.pdf1,33 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.