: : FALE CONOSCO : : Dúvidas Frequentes : : WEBMAIL
Secretaria > Projetos > Núcleo de Avaliação > Perguntas frequentes > O que é TRI?
Mapa do Site
Publicações
Legislação

A Teoria da Resposta ao Item

 


Usualmente, quando desejamos medir a proficiência de um aluno em uma área do conhecimento, fazemos uso do escore, o número de acertos, do aluno em um teste com determinado número de itens (questões). Os itens são analisados através de parâmetros denominados “discriminação” e “dificuldade”, que dependem fundamentalmente do grau de dificuldade do teste e do escore do aluno e do grupo de respondentes. Nesse caso, comparações entre desempenhos de alunos de diferentes anos e ao longo dos anos são difíceis de ser realizados.

            Para contornar tais dificuldades e também para permitir uma medida mais apropriada da proficiência do aluno, foi desenvolvida a Teoria da Resposta ao Item (TRI), cujo foco principal, como bem diz o seu nome, é o item, e não o teste como um todo. Dentro do contexto da TRI, a medida de proficiência de um aluno não depende dos itens apresentados a ele, assim como os parâmetros de discriminação e de dificuldade do item não dependem do grupo de respondentes. Em outras palavras, um item mede determinado conhecimento, independentemente de quem o está respondendo, e a proficiência de um aluno não depende dos itens a ele apresentados.

            A TRI é um conjunto de modelos que relacionam a probabilidade de um aluno apresentar determinada resposta a um item com sua proficiência e com as características (parâmetros) do item. Os itens podem ser de diferentes tipos. Para cada um deles existe um modelo apropriado de TRI. Importantes avaliações, tais como o Sistema de Avaliação da Educação Básica (Saeb) e, mais recentemente, o Exame Nacional do Ensino Médio (Enem), utilizam modelos logísticos da TRI.

            Além dos parâmetros de discriminação e de dificuldade, algumas avaliações fazem uso ainda de um parâmetro para controlar o acerto casual. Este último tem um papel bastante importante nas avaliações com itens de múltipla escolha.

            O modelo logístico parte do princípio de que, quanto maior a providência do respondente, maior sua probabilidade de acerto, construto acumulativo. Seu parâmetro de dificuldade é medido na mesma escala da proficiência, o que permite a comparabilidade entre resultados de diferentes testes e a construção e interpretação de escalas de proficiência, como a escala nacional de proficiência construída pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), do Ministério da Educação (MEC), para Matemática e Língua Portuguesa. Outra leitura para esse parâmetro, a qual nos parece mais apropriada, é dizer que ele representa a proficiência mínima que um respondente deve possuir para que sua probabilidade de acerto seja alta.

            O parâmetro de discriminação, como já diz seu nome, deve ser um valor mínimo, de modo a garantir que respondentes com proficiências diferentes tenham probabilidades diferentes de acerto. O grau de informação do item está diretamente relacionado a esse parâmetro.

            Em situações em que não existe a possibilidade de acerto casual, temos o modelo logístico de dois parâmetros, e quando todos os itens possuem o mesmo parâmetro de discriminação temos o modelo logístico de um parâmetro, ou, como é muito mais conhecido, modelo de Rasch. A Provinha Brasil e o Pisa fazem uso desse modelo.

            Em avaliações em que o acerto casual  é possível, a medida de proficiência da TRI leva em conta não só o número de acertos como também o padrão de respostas do aluno. Em outras palavras, dois alunos com o mesmo escore podem receber da TRI diferentes valores de proficiência. Receberá maior proficiência aquele que apresentar respostas aos itens de forma mais coerente com o construto que está sendo medido.

            A partir de um banco de itens calibrados, isto é, itens com seus parâmetros todos na mesma escala de proficiência, podemos construir um ou mais testes com graus de dificuldade apropriados para atender aos objetivos de uma ou mais avaliações. Tudo o que precisamos é que o banco de itens seja constituído por itens com boa discriminação e com diferentes valores do parâmetro de dificuldade. Um teste montado com itens com boa discriminação e diferentes valores do parâmetro de dificuldade será bastante informativo e permitirá boas estimativas das proficiências dos respondentes.

            Testes (provas) diferentes, porém com itens comuns, podem ter seus resultados comparados todos em uma mesma escala de medida de proficiência. Esse processo é conhecido como equalização. No Brasil, exemplos importantes seriam o Saeb – com a utilização de itens do 4º ano do ensino fundamental na prova do 8º ano e de itens de 8º ano na prova de 3º ano do ensino médio – e o projeto do Ministério da Educação que acompanhou alunos do 1º até o 4º ano. Nesse estudo longitudinal, itens de 1º ano foram utilizados na prova de 2º ano, itens de 2º, na de 3º ano e itens de 3º na do 4º ano. Ao final, foi possível analisar a curva de crescimento não só das séries, mas também dos alunos que participaram ao longo de todo o período analisado. Estudos de simulação mostram que testes diferentes com pelo menos 20% de itens comuns permitem uma boa equalização de seus resultados.

            Outra forma de avaliação mais recente, e fundamentalmente dependente da TRI, são os denominados Testes Adaptativos por Computador (CAT, na sigla em inglês). Neles, cada avaliado pode ser submetido a uma prova diferente: porém, todos os resultados são representados na mesma escala de medida e, portanto, comparáveis. Para cada avaliado é construído, interativamente, um teste no qual o próximo item é selecionado dependendo da resposta que o avaliado apresentou ao item anterior.

            Podemos concluir que a TRI é uma metodologia que pode, e muito, contribuir para as avaliações brasileiras. Em nossa opinião, ela não vem sendo mais amplamente utilizada pelo fato de sua aplicação exigir um uso bastante intensivo de programas computacionais específicos. A capacitação de pessoal nessa metodologia e nos programas computacionais necessários para sua aplicação bastaria para torná-la mais conhecida e utilizável.

 

ANDRADE, Dalton. A Teoria da Resposta ao Item. Avalia em Ação: Ensinar com qualidade e valores, São Paulo, n. 3, p.26-27, 2010. Semestral.