COMPLEXIDADE SEMÂNTICA E HABILIDADE DE DECODIFICAÇÃO: UM MODELO QUANTITATIVO DA COMPREENSÃO DE TEXTOS DENOTATIVOS EM LÍNGUA PORTUGUESA BASEADO NA TEORIA DA INFORMAÇÃO
neurolinguística; estudos cognitivos; análise de frequência.
Com base em princípios da neurociência cognitiva e da teoria da informação, com ênfase no trabalho de Claude Shannon, realizou-se uma análise estatística de 33.101 palavras a partir da coleta de textos científicos da Biblioteca Digital Brasileira de Teses e Dissertações e da Biblioteca Digital da USP, mediante a utilização da linguagem de programação C# e do Microsoft Visual Studio 2012 enquanto complemento do código, incluindo o SQL Server Management Studio 2012 para o gerenciamento do banco de dados, em prol do desenvolvimento do programa de processamento de informação intitulado de CalcuLetra, com o objetivo de mensurar a dificuldade de compreensão textual em Língua Portuguesa. A partir das premissas de que o aprendizado dos significados das letras, palavras e outros símbolos proporciona o desenvolvimento do sistema nervoso central de humanos; que o comportamento metacognitivo do leitor permite a resposta a estímulos advindos do processo de leitura; e que as palavras de maior ocorrência no banco representam as mais conhecidas pelos seus autores, o algoritmo determina, assim, o grau de familiaridade das palavras conforme os parâmetros matemáticos e estatísticos do banco. Ao comparar textos não literários ou denotativos com os valores probabilísticos encontrados, revela-se quão compreensivo é o texto inserido no programa, considerando leitores neurotípicos e que o conteúdo possua os devidos elementos de coesão textual, conforme as regras gramaticais da língua. Nossos resultados revelam grupos de palavras que causam a incompreensão ou facilitam a leitura. Adicionalmente, mostramos lacunas de vocabulário e na utilização do dicionário. Apesar dos resultados preliminares, este estudo foi mais uma prova de conceito para o método empregado e demonstrou seu potencial para futuras pesquisas. A metodologia do modelo de quantificação pode ser adaptada a outras línguas, e espera-se que a pesquisa possa contribuir em prol da elaboração de diagnóstico objetivo de transtornos do comportamento (ex. dislexia), mediante classificação quantitativa da incompreensão escrita; e ter a sua aplicabilidade enquanto instrumento auxiliar na análise de exames dissertativos de vestibulares, do Enem e de concursos públicos, cuja avaliação é ainda de forma subjetiva.