Hoje, vamos tratar, na coluna Teoria Literária, da etapa 2 do Modelo de Análise Estilística de Romances (MAER). Afinal, nos últimos meses, apresentamos, no Bonas Histórias, os conceitos iniciais dessa ferramenta de pesquisa que permite aos analistas literários a realização de estudos estruturados sobre os estilos dos romancistas. Em junho, por exemplo, revelamos no blog a Matriz Completa do MAER. Em julho, explicamos a relevância dos Onze Elementos Constituintes deste modelo. E em agosto, detalhamos a Etapa 1 do MAER – Identificação do Tipo de Estudo. Agora vamos evoluir no debate ao apresentar a Etapa 2 – Definições Estatísticas da Pesquisa.
Por ser um estudo ancorado em elementos quantitativos, apesar de possuir também sua dose qualitativa, o Modelo de Análise Estilística de Romances exige algumas definições estatísticas da pesquisa a ser realizada. As duas vertentes estatísticas mais relevantes são o censo/amostra (número de obras que devem ser selecionadas para o estudo em questão) e a amostragem (como serão selecionados os romances de determinado autor que comporão a amostra). É sobre esses dois pontos que vamos tratar a seguir.
1) Censo/Amostra:
O cálculo do tamanho do censo ou da amostra do estudo deve respeitar os preceitos estatísticos. Segundo David A. Aaker, V. Kumar e George S. Day, o pesquisador acadêmico deve escolher entre o censo e a mostra antes de iniciar uma pesquisa. Os dois conceitos estão atrelados à população, isto é, ao conjunto total de sujeitos ou elementos constituintes do problema da pesquisa (2001, p. 377).
Se o estudo literário recair sobre os romances de Nora Roberts, por exemplo, a população será formada pelos 213 romances escritos pela autora norte-americana entre 1981 (data do início de sua produção) e 2017 (data atual). Se, por outro lado, o estudo estiver voltado para os romances de Raduan Nassar, a população será bem menor. Neste caso, ela será constituída por “Lavoura Arcaica” (Companhia das Letras) e “Um Copo de Cólera” (Companhia das Letras), os dois únicos romances publicados pelo escritor paulista, em 1975 e 1978, respectivamente.
Uma vez identificada a população da pesquisa, o analista literário precisará escolher entre o censo e a amostra. O censo é caracterizado quando todos os respondentes de uma população forem considerados como fontes de informação para o estudo. Isso ocorre quando o tamanho populacional não é tão elevado e o analista literário pode se ater sobre toda a população. A amostra é quando um conjunto considerável da população é selecionado para se extrair as informações necessárias de toda a população. Assim, a amostra, uma parcela representativa de um conjunto maior, serve como fonte de informação válida e segura estatisticamente para o estudo da população (AAKER, KUMAR e DAY, 2001, p. 377).
No caso da investigação estilística dos romances de Raduan Nassar, o ideal é o analista literário utilizar o censo. Afinal, são apenas dois romances publicados pelo autor e a exclusão de um deles representaria elevada perda para a investigação proposta. Por outro lado, o estudo estilístico dos romances de Nora Roberts deve ser feito a partir do estabelecimento de uma amostra. Até porque seria humanamente impossível a realização de um trabalho acadêmico voltado para o estudo de mais de duas centenas de obras. Portanto, nesse caso, o analista literário deve calcular a amostra para sua pesquisa.
A amostra (n) é calculada de acordo com a seguinte fórmula (AAKER, KUMAR e DAY, 2001, p.406-411):
Nesta fórmula:
n = amostra calculada
N = população
Z = valor correspondente ao intervalo de confiança.
p = verdadeira probabilidade do evento
e = erro amostral
Os conceitos de amostra (n) e de população (N) já foram discutidos anteriormente. Agora, é necessária uma explicação mais detalhada sobre o que significa erro amostral (e), valor correspondente ao intervalo de confiança (Z) e verdadeira probabilidade do evento (p).
O erro amostral (e) é a diferença entre o valor estimado pela pesquisa amostral e o valor que pode ser encontrado em uma investigação com toda a população. Frequentemente, esse valor é estipulado em 5%. Ou seja, o resultado que esperamos alcançar com a pesquisa feita pela amostra difere em 5% da pesquisa que seria realizada com a população inteira. Os estatísticos consideram essa variação pequena ou desprezível. Assim, um erro amostral de 5% valida os resultados alcançados pela pesquisa como sendo verdadeiros.
De maneira superficial, o valor correspondente ao intervalo de confiança (Z) é um número extraído da tabela de curva normal especialmente usado na fórmula matemática de cálculo do tamanho amostral. O intervalo de confiança (também chamado de margem de segurança) refere-se à estimativa de variação de resultados obtidos a partir do uso de diferentes amostras. Geralmente, os estatísticos usam a margem de confiança em 68%, 95%, 95,5% e 99,7%. Veja, a seguir, o valor correspondente ao intervalo de confiança (Z) de cada uma dessas margens (AAKER, KUMAR e DAY, 2001, p.406-411):
Margem de Segurança ou Intervalo de Confiança = 68%, Z = 1;
Margem de Segurança ou Intervalo de Confiança = 95%, Z = 1,96;
Margem de Segurança ou Intervalo de Confiança = 95,5%, Z = 2;
Margem de Segurança ou Intervalo de Confiança = 99,7%, Z = 3;
E a verdadeira probabilidade do evento (p) refere-se à relação entre a repetição do experimento e a constatação do mesmo resultado de ocorrência do evento. Em suma, quando não sabemos a probabilidade do evento, convencionou-se atribuir o valor de 50% (p = 0,5).
Com essas informações, já é possível calcular o tamanho da amostra. Para tal, basta o analista literário preencher os dados da fórmula do cálculo amostral e extrair o resultado. Quem não gosta ou não é bom em matemática, há calculadoras virtuais na Internet que fazem rapidamente esse tipo de cálculo para o pesquisador. Uma delas é a Calculadora Amostral, encontrada no seguinte endereço eletrônico: https://comentto.com/calculadora-amostral/.
2) Amostragem:
Se a escolha recaiu para o censo, a amostragem dessa pesquisa é simples: todos os romances do autor (ou seja, todos os elementos da população) integram o conjunto a ser analisado pelo estudo. No caso da investigação sobre Raduan Nassar, a amostragem é formada por “Lavoura Arcaica” e “Um Copo de Cólera”, os dois romances da população considerada.
Se a escolha do pesquisador recaiu para a amostra, a amostragem deve ser definida. Importante esclarecer a diferença entre amostra e amostragem. Enquanto a amostra determina quantos elementos da população investigada devem integrar o conjunto representativo que fornecerá informação ao pesquisador (amostra é quanto, é um número), a amostragem determina quais elementos da população podem integrar a pesquisa (amostragem é quem, determina como serão eleitos os indivíduos considerados pela pesquisa).
Em outro exemplo, o cálculo amostral de uma pesquisa de determinado romancista com muitas obras apontou o número de 17 títulos a ser considerado na amostra. A partir daí, deve-se discutir quais dos romances desse autor podem integrar essa amostragem. Qual o critério de seleção a ser utilizado pelo pesquisador? Ele irá escolher os livros aleatoriamente ou irá selecionar os de maior vendagem? Esse critério faz parte da amostragem (e não da amostra, que já foi estabelecida no cálculo amostral - 17).
Há duas formas para se definir a amostragem: a probabilística e a não probabilística. A probabilística utiliza critérios objetivos e estatísticos em todas as fases do processo de seleção da amostragem. Já a não probabilística utiliza algum critério subjetivo e/ou não estatístico em alguma das fases da amostragem.
Se nas ciências chamadas de exatas o método probabilístico de seleção da amostragem é o mais comum, na literatura o método não probabilístico se faz mais presente. Isso acontece porque nem todas as obras de um escritor possuem o mesmo peso para a análise estilística. Em muitos casos, o ideal é o analista literário escolher para a amostragem os romances mais conceituados de um autor, os mais vendidos ou aqueles que marcaram determinada fase da carreira do escritor. Apesar de não probabilístico, esse tipo de seleção enriquece a pesquisa, ao invés de desmerecê-la.
Bibliografia:
AAKER, David A.; KUMAR, V.; DAY, George S. Pesquisa de Marketing. São Paulo: Atlas, 2001.
Calculadora Amostral - Disponível em: https://comentto.com/calculadora-amostral/
Que tal este post? Gostou do Blog Bonas Histórias? Seja o(a) primeiro(a) a deixar um comentário aqui. Para saber mais sobre esse tema, clique em Teoria Literária. E não se esqueça de curtir a página do Bonas Histórias no Facebook.