REPOSITORIO PUCSP Teses e Dissertações dos Programas de Pós-Graduação da PUC-SP Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem
Use este identificador para citar ou linkar para este item: https://repositorio.pucsp.br/jspui/handle/handle/42184
Tipo: Dissertação
Título: Uso de metáforas por aprendizes brasileiros bilíngues de inglês
Título(s) alternativo(s): The use of metaphors by Brazilian bilingual English learners
Autor(es): Boldarine, Amanda Chiarelo
Primeiro Orientador: Sardinha, Antonio Paulo Berber
Resumo: A pesquisa em Linguística de Corpus de Aprendiz tem tradicionalmente focado em questões gramaticais (como, Rankin, 2015) ou lexicais (como, Cobb e Horst, 2015), na sua maioria. Desse modo, questões ligadas a como os alunos constroem discursos nas tarefas escolares não têm recebido a atenção devida. Desse modo, o presente estudo pretendeu contribuir para preencher essa lacuna por meio de uma investigação acerca dos discursos presentes em composições escolares de alunos do Ensino Fundamental II e Primeiro Ano do Ensino Médio. Para isso, empregou-se a Análise Multidimensional Lexical (Berber Sardinha e Fitzsimmons Doolan, 2024) para identificar os principais discursos em um corpus de 63.297 palavras. A Análise Multidimensional Lexical é uma abordagem baseada na Análise Multidimensional (Biber, 1988) que permite detectar os discursos prevalecentes em corpora, por meio da aplicação de procedimentos estatísticos multivariados em dados lexicais extraídos do corpus. Na pesquisa em Análise Multidimensional Lexical, existe uma lacuna referente à presença de linguagem metafórica nas dimensões. Mais especificamente, não se sabe até que ponto a linguagem metafórica contribuiu para a dimensionalidade dos textos. Assim, a presente pesquisa pretendeu preencher essa segunda lacuna, referente à relação entre dimensões lexicais e metaforicidade. Por fim, entre os estudos de metáfora baseados em corpora, existe há muito tempo a tentativa de detectar metáforas automaticamente, para expandir o escopo de tamanho dos corpora normalmente usados na pesquisa, já que a análise de metáforas em corpora é geralmente feita manualmente, restringindo a quantidade de dados a serem analisados. Dada essa restrição e a disponibilidade recente da Inteligência Artificial, por meio de chatbots como o ChatGPT, Gemini e Llama, este estudo visou a contribuir para a verificação da capacidade de identificação automática de metáforas com a ajuda do ChatGPT. A partir da Análise Multidimensional Lexical, foram identificadas oito dimensões discursivas lexicais. Por exemplo, na Dimensão 1 “Conhecimento abstrato, teórico e científico versus Dinâmicas familiares, resiliência pessoal e crescimento emociona”, o discurso do polo positivo enfatiza a pesquisa estruturada e a análise científica, comum em contextos acadêmicos. Já o polo negativo focou em narrativas pessoais, relacionamentos familiares e superação de problemas pessoais. Para a anotação manual das metáforas, usou-se o MIP (Pragglejaz Group, 2007) e os candidatos à metáfora foram extraídos da lista de variáveis de cada dimensão. Ao final da anotação manual, 245 ocorrências (tokens) dos candidatos foram anotados como metafóricos, o que corresponde a 37% dos candidatos (types). Quanto à anotação automática das metáforas via ChatGPT4, foi identificada uma em cada quatro ou seis das metáforas identificadas pelos analistas usando o protocolo MIP (Pragglejaz Group, 2007). Concluindo, o presente estudo contribuiu para o entendimento dos discursos mobilizados pelos alunos na execução das tarefas, como a tarefa influencia o uso de metáforas linguísticas, assim como a relação entre a idade ou proficiência dos alunos e a incidência de metáforas. Sobre a automatização da identificação de metáforas, a pesquisa apontou possíveis princípios para desenvolvimento de prompts, como restringir o contexto em que a metáfora linguística ocorre. Contudo, a inconsistência na anotação segue como a principal limitação
Abstract: Research in Learner Corpus Linguistics has traditionally focused mostly on grammatical (e.g., Rankin, 2015) or lexical (e.g., Cobb and Horst, 2015) issues. Consequently, much less is known about how students construct discourse in school tasks. This study aimed to address this gap by investigating the discourses present in written texts by Middle School and First-year High School students in Brazil. To achieve this goal, Lexical Multidimensional Analysis was employed (Berber Sardinha and Fitzsimmons Doolan, 2024) to identify the main discourses in a corpus of 450 texts, amounting to 63,297 words. Lexical Multidimensional Analysis is an off-shoot of Multidimensional Analysis (Biber, 1988), which allows for the detection of the underlying discourses in corpora through the application of multivariate statistical procedures to lexical data extracted from the corpus. However, in the Lexical Multidimensional Analysis literature, little is known about whether metaphorical language is manifested in the dimensions, that is, the extent to which metaphorical language contributes to the dimensionality of texts. Thus, this study aimed to fill this second gap, seeking to determine if the lexical items forming the dimensions are metaphorically used or not. Moreover, in the corpus-based metaphor literature, there has long been a desire to automate metaphor detection, so as to enable the analysis of larger corpora in metaphor studies,, as metaphor analysis in corpora is generally done manually, restricting the amount of data to be analyzed. Given this limitation and the recent availability of Artificial Intelligence through chatbots like ChatGPT, Gemini, and Llama, this study aimed to contribute to text the metaphor detection capabilities of ChatGPT. Eight lexical discursive dimensions were identified through Lexical Multidimensional Analysis. For example, in Dimension 1 "Abstract, theoretical, and scientific knowledge versus Family dynamics, personal resilience, and emotional growth", the discourse in the positive pole emphasizes structured research and scientific analysis, common in academic contexts. On the other hand, the negative pole focused on personal narratives, family relationships, and overcoming personal problems. For the manual annotation of metaphors, the MIP (Pragglejaz Group, 2007) was used, and metaphor candidates were extracted from the variable list of each dimension. At the end of the manual annotation, 245 occurrences (tokens) of candidates were annotated as metaphorical, corresponding to 37% of the candidates (types). Regarding the automatic annotation of metaphors via ChatGPT4, at best one in every four (25%) of the metaphors identified by the human analysts using the MIP protocol (Pragglejaz Group, 2007) was identified automatically through AI. In conclusion, this study contributed to understanding not only the discourses mobilized by students in doing the tasks, but also to how tasks influence the use of linguistic metaphors, as well as to describing the relationship between students' age or proficiency and the incidence of metaphors. Regarding the automation of metaphor identification, the research tried out a range of prompts, charting the process of prompt development, such as restricting the context in which linguistic metaphor occurs. However, the results suggest current LLMs are unable to detect the majority of the metaphors in the corpus
Palavras-chave: Linguística de corpus
Corpus de aprendiz
Análise multidimensional lexical
Metáfora
Inteligência artificial
Corpus linguistics
Learner corpora
Lexical multidimensional analysis
Metaphor
Artificial intelligence
CNPq: CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
Idioma: por
País: Brasil
Editor: Pontifícia Universidade Católica de São Paulo
Sigla da Instituição: PUC-SP
metadata.dc.publisher.department: Faculdade de Filosofia, Comunicação, Letras e Artes
metadata.dc.publisher.program: Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem
Citação: Boldarine, Amanda Chiarelo. Uso de metáforas por aprendizes brasileiros bilíngues de inglês. 2024. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024.
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.pucsp.br/jspui/handle/handle/42184
Data do documento: 18-Jun-2024
Aparece nas coleções:Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Amanda Chiarelo Boldarine.pdf1,09 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.