Análise do Jogo de Imagens aplicadas no Ensino médio

Amostra dos dados da pesquisa realizada

head(pos_gabarito$dados, 10)
ABCDEFGHIJ0123456789
codigo
<int>
municipio
<chr>
escola
<chr>
modelo
<dbl>
turmas
<dbl>
sexo
<chr>
idade
<chr>
temp.residencia
<chr>
area
<chr>
1SilvâniaParticular11Feminino17Urbana
2SilvâniaParticular11Feminino1717Urbana
3SilvâniaParticular11Masculino1717Urbana
4SilvâniaParticular11Masculino1717Urbana
5SilvâniaParticular21Feminino1717Rural
6SilvâniaParticular21Feminino1715Rural
7SilvâniaParticular21Masculino183Urbana
8SilvâniaParticular31Feminino168Rural
9SilvâniaParticular31Masculino16Urbana
10SilvâniaParticular31Feminino1717Urbana

Determinado a taxa de percepção

Entende-se por taxa de percepção o fator determinado pela quantidade média de acertos dentre as questões apresentadas aos alunos, em relação a turma em que o questionario foi aplicado.

Percepção dos alunos

print(pos_gabarito$percentual_acerto)
ABCDEFGHIJ0123456789
codigo
<int>
municipio
<chr>
turmas
<dbl>
area
<chr>
sexo
<chr>
frequencia
<chr>
fez.aula
<chr>
flona
<chr>
nota
<dbl>
1Silvânia1UrbanaFemininoÁs vezesSim, parque ou trilhaNão3.3
2Silvânia1UrbanaFemininoÁs vezesSim, parque ou trilhaSim5.0
3Silvânia1UrbanaMasculinoFrequentementeSim, FLONASim5.2
4Silvânia1UrbanaMasculinoFrequentementeNão fezNão2.2
5Silvânia1RuralFemininoFrequentementeNão fezNão2.6
6Silvânia1RuralFemininoSempreSim, fazendaNão3.0
7Silvânia1UrbanaMasculinoSempreNão fezNão1.0
8Silvânia1RuralFemininoSempreNão fezSim3.2
9Silvânia1UrbanaMasculinoÁs vezesNão fezSim3.3
10Silvânia1UrbanaFemininoFrequentementeSim, fazendaNão4.0

Entendendo a distribuição das médias

Níveis de reconhecimento (acertos) por tipo de origem dos animais

grid.arrange(
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_nome_exoticas,
                  pos_gabarito$percentual_acerto$p_nome_nativas,
                  "Identificação dos nomes"),
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_origem_exoticas,
                  pos_gabarito$percentual_acerto$p_origem_nativas,
                  "Identificação das origens", y = ""),
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_indice_exoticas,
                  pos_gabarito$percentual_acerto$p_indice_nativas,
                  "Taxa de reconhecimento", y = ""), 
    ncol = 3,
    top = textGrob("Niveis de reconhecimento por origem\n", 
                   gp = gpar(fontsize = 20, font = 2)),
    right = "\n"
)

Diferença de acertos

grid.arrange(
    pos_gabarito$dados %>%
        ggplot(aes(x = exoticas - nativas)) +
        geom_histogram(binwidth = 1) +
        labs(title = "Nomes das espécies", y = "Freq") +
        my_theme +
        theme(axis.text.x = element_text(angle = 0, hjust = .5, size = 12)),
    pos_gabarito$dados %>%
        ggplot(aes(x = origem_exoticas - origem_nativas)) +
        geom_histogram(binwidth = 1) +
        labs(title = "Origem das espécies", y = "Freq") +
        my_theme +
        theme(axis.text.x = element_text(angle = 0, hjust = .5, size = 12)),
    pos_gabarito$dados %>%
        ggplot(aes(x = indice_exoticas - indice_nativas)) +
        geom_histogram(binwidth = 1) +
        labs(title = "Taxa de reconhecimento", y = "Freq") +
        my_theme +
        theme(axis.text.x = element_text(angle = 0, hjust = .5, size = 12)),
    ncol = 1,
    top = textGrob("Histograma das diferenças Exoticas x Nativas\n",
                   gp = gpar(fontsize = 20, font = 2)),
    #heights=c(3/4, 1/4),
    right = "\n",
    bottom = "\n"
)

Grupos taxonómicos

rbind(
    cbind(grupo = "Aves", origem = "exotica",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_exotica_aves))),
    cbind(grupo = "Aves", origem = "nativa",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_nativa_aves))),
    cbind(grupo = "Invertebrados", origem = "exotica",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_exotica_invertebrado))),
    cbind(grupo = "Invertebrados", origem = "nativa",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_nativa_invertebrado))),
    cbind(grupo = "Mamiferos", origem = "exotica",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_exotica_mamifero))),
    cbind(grupo = "Mamiferos", origem = "nativa",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_nativa_mamifero))),
    cbind(grupo = "Peixes", origem = "exotica",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_exotica_peixe))),
    cbind(grupo = "Peixes", origem = "nativa",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_nativa_peixe))),
    cbind(grupo = "Répteis", origem = "exotica",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_exotica_reptil))),
    cbind(grupo = "Répteis", origem = "nativa",
          as.data.frame(table(pos_gabarito$percentual_acerto$p_nativa_reptil)))
) %>%
        ggplot(aes(x=Var1, y = Freq, fill = origem)) + 
        geom_bar(stat="identity", width=.5, position = "dodge") +
        facet_wrap(~grupo, scales = "free") + 
        labs(title = "Percentual de acerto x grupos taxonomicos\n", 
             y = "Frequencia", x = "Percentual de acerto") +
        my_theme

Medindo as médias de acerto na identificação do nome das espécies

grafico_densidade <- function(variavel, cor, titulo) {
    plot <- 
        pos_gabarito$proporcoes$por_turma %>% 
        ggdensity(x = variavel, fill = cor,
          main = titulo,
          xlab = "Percentual de acertos") + 
        xlim(0, 1) + 
        ylim(0, 8)
    nomalidade <- 
        ggtexttable(
            normalidade(pos_gabarito$proporcoes$por_turma[[variavel]]), 
            rows = NULL, theme = ttheme(base_style = "mOrange", base_size = 8)
        )
    
    resultado <- list(
        plot = plot,
        normalidade = nomalidade
    )
    return(resultado)
}
t1 <- grafico_densidade("p_nativas", "green", "Identificação do nome das espécies de origem Nativas")
t2 <- grafico_densidade("p_exoticas", "red", "Identificação do nome das espécies de origem Exóticas")
t3 <- grafico_densidade("p_origem_nativas", "darkgreen", "Identificação de origem Nativas")
t4 <- grafico_densidade("p_origem_exoticas", "darkred", "Identificação de origem Exóticas")
t5 <- grafico_densidade("p_indice_nativas", "orange", "Indice de reconhecimento Nativas (origens + espécies)")
t6 <- grafico_densidade("p_indice_exoticas", "orangered", "Indice de reconhecimento Exóticas (origens + espécies)")
barplot(tapply(
    pos_gabarito$percentual_acerto$p_indice_nativas, 
    pos_gabarito$percentual_acerto$turmas,
    mean), main = "\nMédia de taxa de reconhecimento das origens nativas por turmas\n")

Teste de normalidade

Para determinar a normalidade nas distribuiçoes das respostas do jogo de imagens.

Identificação médio das turmas (nomes das espécies & origens)

grid.arrange(t1$plot, t2$plot,
             t1$normalidade, t2$normalidade,
             t3$plot, t4$plot,
             t3$normalidade, t4$normalidade,
             ncol = 2,
             heights = c(3,2,3,2),
             top = textGrob("Densidade de identificação média das turmas entre \nespecies e suas origens\n",
                            gp = gpar(fontsize = 20, font = 2))
             )

Indice de reconhecimento médio das turmas

grid.arrange(t5$plot, t6$plot,
             t5$normalidade, t6$normalidade,
             ncol = 2,
             heights = c(4,3),
             top = textGrob("Densidade dos indices de reconhecimento médio das turmas\n",
                            gp = gpar(fontsize = 20, font = 2))
             )

Q-Q Test

qqplot.data <- function (vec, titulo) {
  # following four lines from base R's qqline()
  y <- quantile(vec[!is.na(vec)], c(0.25, 0.75))
  x <- qnorm(c(0.25, 0.75))
  slope <- diff(y)/diff(x)
  int <- y[1L] - slope * x[1L]
  d <- data.frame(resids = vec)
  ggplot(d, aes(sample = resids)) + 
      stat_qq() + 
      geom_abline(slope = slope, intercept = int, col = "red") +
      xlim(-2, 2) +
      ylim(0, 1) +
      theme_bw() +
      labs(
        title = titulo
    )
}
q1 <- qqplot.data(pos_gabarito$proporcoes$por_turma$p_nativas, "Identificação do nome das espécies de origem Nativas")
q2 <- qqplot.data(pos_gabarito$proporcoes$por_turma$p_exoticas, "Identificação do nome das espécies de origem Exoticas")
q3 <- qqplot.data(pos_gabarito$proporcoes$por_turma$p_origem_nativas, "Identificação de origem Nativas")
q4 <- qqplot.data(pos_gabarito$proporcoes$por_turma$p_origem_exoticas, "Identificação de origem Exoticas")
q5 <- qqplot.data(pos_gabarito$proporcoes$por_turma$p_indice_nativas, "Indice de reconhecimento Nativas (origens + espécies)")
q6 <- qqplot.data(pos_gabarito$proporcoes$por_turma$p_indice_exoticas, "Indice de reconhecimento Exoticas (origens + espécies)")
grid.arrange(q1, q2, 
             q3, q4,
             q5, q6,
             ncol = 2,
             top = textGrob("Normal Q-Q Plot\n", 
                            gp = gpar(fontsize = 20, font = 2))
             )

Teste de variância

Para determinar a variância

variancia <- data.frame(
    Algoritmo = c("F test to compare two variances"),
    "Comparação" = c("Nativas x Exóticas"),
    "Variável" = c(
        "Indice de reconhecimento",
        "Identificação do nome das espécies",
        "Identificação da origem"
    ),
    "p_valor" = c(
        var.test(pos_gabarito$proporcoes$por_turma$p_indice_nativas, 
                 pos_gabarito$proporcoes$por_turma$p_indice_exoticas, 
                 alternative = "two.sided")$p.value,
        var.test(pos_gabarito$proporcoes$por_turma$p_nativas, 
                 pos_gabarito$proporcoes$por_turma$p_exoticas, 
                 alternative = "two.sided")$p.value,
        var.test(pos_gabarito$proporcoes$por_turma$p_origem_nativas, 
                 pos_gabarito$proporcoes$por_turma$p_origem_exoticas, 
                 alternative = "two.sided")$p.value
    )
)
variancia <- variancia %>%
    mutate(
        variancia = p_valor > 0.05,
        p_valor = cell_spec(round(p_valor, 4), bold = T, color = "black", align = "right"),
        variancia = cell_spec(variancia, bold = variancia,
                       color= ifelse(variancia, "white", "black"), 
                       background = ifelse(variancia, "green", "#CCCCCC"))
    )
package ‘bindrcpp’ was built under R version 3.4.4
variancia %>%
  kable(escape = F) %>%
  kable_styling(c("striped", "bordered"), full_width = TRUE) %>%
  column_spec(1, bold = TRUE) %>%
  collapse_rows(columns = 1:2, valign = "top") 
Algoritmo Comparação Variável p_valor variancia
F test to compare two variances Nativas x Exóticas Indice de reconhecimento 0.2969 TRUE
Identificação do nome das espécies 0.7332 TRUE
Identificação da origem 0.0343 FALSE

Analises descritivas

pos_gabarito$especies
ABCDEFGHIJ0123456789
origem
<chr>
grupo
<chr>
especie
<fctr>
especieDesc
<fctr>
modelo
<int>
NativoMamiferotamandua-bandeiratamandua-bandeira1
ExóticoMamiferoornitorrincoornitorrinco4
ExóticoPeixepeixe-palhaçopeixe-palhaço4
ExóticoAveavestruzavestruz2
ExóticoMamiferojavalijavali2
ExóticoMamiferocoalacoala1
ExóticoRéptilcobra-najacobra-naja3
ExóticoInvertebradomosquito-denguemosquito-dengue1
ExóticoRéptilcamaleaocamaleao4
NativoAvecoruja-buraqueiracoruja-buraqueira3

Reconhecimento do nome das especies

Por origem
pos_gabarito$especies %>% 
    ggplot(aes(especieDesc, fr, fill = grupo)) + 
    geom_bar(stat="identity") +
    geom_text(aes(label = paste0(round(fr * 100, 1), "%")), 
              position = position_dodge(0.9), vjust = 0.5,
              hjust = -0.5) +
    scale_y_continuous(limits = c(0,1.2), labels = scales::percent) +
    facet_wrap(~origem, scales = "free_y") +
    coord_flip() +
    theme_bw() +
    labs(title = "Reconhecimento do nome das especies por origem",
         fill = "Grupos", x = "", y = "\nFrequencia relativa") +
    my_theme

Por espécie
pos_gabarito$especies %>% 
    ggplot(aes(especieDesc, fr, fill = origem)) + 
    geom_bar(stat="identity") +
    geom_text(aes(label = paste0(round(fr * 100, 1), "%")), 
              position = position_dodge(0.9), vjust = 0.5,
              hjust = -0.3) +
    scale_y_continuous(limits = c(0,1.2), labels = scales::percent) +
    facet_wrap(~grupo, scales = "free_y") +
    coord_flip() +
    theme_bw() +
    labs(title = "Reconhecimento do nome das especies por grupo taxonómico",
         fill = "Origem", x = "", y = "\nFrequencia relativa") +
    my_theme

Testes de hipoteses

Esperado p-valor >= 0.05 na normalidade (espera-se H0) Esperado p-valor <= 0.05 no teste de hipotese (espera-se H1)

Tabela dos testes de hipoteses aplicados

t1 <- t.test(
   pos_gabarito$percentual_acerto$p_nome_exoticas, 
   pos_gabarito$percentual_acerto$p_nome_nativas, 
   alternative = "two.sided", paired = TRUE, conf.level = .95)
t2 <- t.test(
   pos_gabarito$percentual_acerto$p_origem_exoticas, 
   pos_gabarito$percentual_acerto$p_origem_nativas, 
   alternative = "two.sided", paired = TRUE, conf.level = .95)
t3 <- t.test(
    pos_gabarito$percentual_acerto$p_indice_exoticas, 
    pos_gabarito$percentual_acerto$p_indice_nativas, 
    alternative = "two.sided", paired = TRUE, conf.level = .95)
t1b <- wilcox.test(
    pos_gabarito$percentual_acerto$p_nome_exoticas, 
    pos_gabarito$percentual_acerto$p_nome_nativas, 
    alternative = "two.sided", paired = TRUE)
t2b <- wilcox.test(
    pos_gabarito$percentual_acerto$p_origem_exoticas, 
    pos_gabarito$percentual_acerto$p_origem_nativas, 
    alternative = "two.sided", paired = TRUE)
t3b <- wilcox.test(
    pos_gabarito$percentual_acerto$p_indice_exoticas, 
    pos_gabarito$percentual_acerto$p_indice_nativas, 
    alternative = "two.sided", paired = TRUE)
data.frame(
    "Comparação" = c("Exóticas x Nativas"),
    Algoritmo = c(t1$method, t2$method, t3$method, t1b$method, t2b$method, t3b$method),
    "Variável" = c(
        "Identificação do nome das espécies",
        "Identificação da origem",
        "Indice de reconhecimento"
    ),
    p_valor = c(t1$p.value, t2$p.value, t3$p.value, 
                t1b$p.value, t2b$p.value, t3b$p.value),
    H0 = c(t1$p.value >= 0.05, t2$p.value >= 0.05, t3$p.value >= 0.05, 
           t1b$p.value >= 0.05, t2b$p.value >= 0.05, t3b$p.value >= 0.05),
    H1 = c(t1$p.value < 0.05, t2$p.value < 0.05, t3$p.value < 0.05,
           t1b$p.value < 0.05, t2b$p.value < 0.05, t3b$p.value < 0.05),
    "Confiança" = c(
        paste(paste0(round(t1$conf.int * 100, 2), "%"), collapse = " ~ "),
        paste(paste0(round(t2$conf.int * 100, 2), "%"), collapse = " ~ "),
        paste(paste0(round(t3$conf.int * 100, 2), "%"), collapse = " ~ "),
        "-",
        "-",
        "-"
    )
) %>%
  mutate(
    p_valor = cell_spec(p_valor, bold = T, color = "black", align = "right"),
    H0 = cell_spec(H0, bold = H0,
                   color= ifelse(H0, "white", "black"), 
                   background = ifelse(H0, "green", "#CCCCCC")),
    H1 = cell_spec(H1, bold = H1, 
                   color = ifelse(H1, "white", "black"), 
                   background = ifelse(H1, "green", "#CCCCCC"))
  ) %>%
  kable(escape = F) %>%
  kable_styling(c("striped", "bordered"), full_width = TRUE) %>%
  column_spec(2, bold = TRUE) %>%
  collapse_rows(columns = 1:2, valign = "top") %>%
  footnote(general = "Intervalo de confiança 95%",
           general_title = "\nObs.: ",
           footnote_as_chunk = T)
Comparação Algoritmo Variável p_valor H0 H1 Confiança
Exóticas x Nativas Paired t-test Identificação do nome das espécies 3.04980558564671e-88 FALSE TRUE 33.88% ~ 39.25%
Identificação da origem 9.53291446070658e-46 FALSE TRUE -31.12% ~ -24.46%
Indice de reconhecimento 2.42750761381397e-13 FALSE TRUE 8.53% ~ 14.47%
Wilcoxon signed rank test with continuity correction Identificação do nome das espécies 9.13901290530953e-52 FALSE TRUE -
Identificação da origem 1.34804992730944e-34 FALSE TRUE -
Indice de reconhecimento 4.73943028972212e-12 FALSE TRUE -

Obs.:
Intervalo de confiança 95%

1 - Estudantes têm maior proporção de acerto de espécies exóticas do que espécies nativas brasileiras

Resultado do teste paramétrico


    Paired t-test

data:  pos_gabarito$percentual_acerto$p_nome_exoticas and pos_gabarito$percentual_acerto$p_nome_nativas
t = 27, df = 370, p-value <2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.3388 0.3925
sample estimates:
mean of the differences 
                 0.3657 

Resultado do teste não paramétrico


    Wilcoxon signed rank test with continuity correction

data:  pos_gabarito$percentual_acerto$p_nome_exoticas and pos_gabarito$percentual_acerto$p_nome_nativas
V = 52000, p-value <2e-16
alternative hypothesis: true location shift is not equal to 0

2 - Estudantes identificam mais origem das espécies exóticas

Resultado do teste paramétrico


    Paired t-test

data:  pos_gabarito$percentual_acerto$p_origem_exoticas and pos_gabarito$percentual_acerto$p_origem_nativas
t = -16, df = 370, p-value <2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.3112 -0.2446
sample estimates:
mean of the differences 
                -0.2779 

Resultado do teste não paramétrico


    Wilcoxon signed rank test with continuity correction

data:  pos_gabarito$percentual_acerto$p_origem_exoticas and pos_gabarito$percentual_acerto$p_origem_nativas
V = 4100, p-value <2e-16
alternative hypothesis: true location shift is not equal to 0

3 - Estudantes tem maior proporção de reconhecimento (nome e origem) de espécies exóticas do que espécies nativas brasileiras

Resultado do teste paramétrico


    Paired t-test

data:  pos_gabarito$percentual_acerto$p_indice_exoticas and pos_gabarito$percentual_acerto$p_indice_nativas
t = 7.6, df = 370, p-value = 2e-13
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.08525 0.14472
sample estimates:
mean of the differences 
                  0.115 

Resultado do teste não paramétrico


    Wilcoxon signed rank test with continuity correction

data:  pos_gabarito$percentual_acerto$p_indice_exoticas and pos_gabarito$percentual_acerto$p_indice_nativas
V = 25000, p-value = 5e-12
alternative hypothesis: true location shift is not equal to 0

4 - Estudantes que residem em cidade próxima a UC têm maior proporção de acerto entre as espécies nativas brasileiras.

tmp <- pos_gabarito$percentual_acerto %>%
    select(municipio, p_nome_exoticas:p_indice_nativas)
t.test(p_indice_nativas ~ municipio, tmp)

    Welch Two Sample t-test

data:  p_indice_nativas by municipio
t = 0.65, df = 360, p-value = 0.5
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.02863  0.05711
sample estimates:
mean in group Bela Vista de Goiás            mean in group Silvânia 
                           0.3362                            0.3220 

5 - Estudantes que residem em área rural tem maior proporção de acertos sobre espécies nativas brasileiras do que estudantes que residem na área urbana

tmp <- pos_gabarito$percentual_acerto %>%
    select(area, p_nome_exoticas:p_indice_nativas)
t.test(p_indice_nativas ~ area, tmp)

    Welch Two Sample t-test

data:  p_indice_nativas by area
t = -2, df = 110, p-value = 0.05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.1040103  0.0002798
sample estimates:
 mean in group Rural mean in group Urbana 
              0.2873               0.3392 
tmp <- pos_gabarito$percentual_acerto %>%
    select(area, p_nome_exoticas:p_indice_nativas) %>%
    melt("area")
tmp <-
    cbind(tmp, colsplit(tmp$variable, "_", c("p", "indicador", "origem"))) %>%
    select(area, indicador, origem, value)
tmp %>%
  ggplot() + 
  geom_boxplot(aes(x = area, y = value, fill = origem), show.legend = T) + 
  scale_y_continuous(limits = c(0,1), labels = scales::percent) +
  facet_wrap(~indicador) +
  theme_bw() +
  labs(title = "Boxplot de identificação de espécies Nativas nos critérios estabelecidos",
       y = "Percentual de identificação", x = "") +
  my_theme

6 - Estudantes que visitam a UC têm maior proporção de acerto de espécies nativas do que estudantes que não visitam

tmp <- 
    pos_gabarito$percentual_acerto %>%
    filter(municipio == "Silvânia") %>%
    select(flona, p_indice_nativas)
#normalidade(tmp$p_indice_nativas)
t.test(p_indice_nativas ~ flona, tmp)

    Welch Two Sample t-test

data:  p_indice_nativas by flona
t = -1.6, df = 86, p-value = 0.1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.13024  0.01485
sample estimates:
mean in group Não mean in group Sim 
           0.2808            0.3385 

7 - Estudantes tem maior proporção de acertos em relação aos grupos de maior porte e da fauna exótica do que espécies menores e nativas.

plotAnaliseTaxonomicosGenovart()

grid.arrange(
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_exotica_aves,
                  pos_gabarito$percentual_acerto$p_nativa_aves,
                  "Aves", "Média percentual de acertos\n",
                  mean(pos_gabarito$percentual_acerto$p_indice_exoticas),
                  mean(pos_gabarito$percentual_acerto$p_indice_nativas)),
    
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_exotica_invertebrado,
                  pos_gabarito$percentual_acerto$p_nativa_invertebrado,
                  "Invertebrados", y = "",
                  mean(pos_gabarito$percentual_acerto$p_indice_exoticas),
                  mean(pos_gabarito$percentual_acerto$p_indice_nativas)),
    
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_exotica_mamifero,
                  pos_gabarito$percentual_acerto$p_nativa_mamifero,
                  "Mamiferos", y = "",
                  mean(pos_gabarito$percentual_acerto$p_indice_exoticas),
                  mean(pos_gabarito$percentual_acerto$p_indice_nativas)), 
    
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_exotica_peixe,
                  pos_gabarito$percentual_acerto$p_nativa_peixe,
                  "Peixes", y = "",
                  mean(pos_gabarito$percentual_acerto$p_indice_exoticas),
                  mean(pos_gabarito$percentual_acerto$p_indice_nativas)), 
    
    plotAnaliseMedias(pos_gabarito$percentual_acerto$p_exotica_reptil,
                  pos_gabarito$percentual_acerto$p_nativa_reptil,
                  "Répteis", y = "",
                  mean(pos_gabarito$percentual_acerto$p_indice_exoticas),
                  mean(pos_gabarito$percentual_acerto$p_indice_nativas)), 
    ncol = 5,
    top = textGrob("Niveis de reconhecimento por origem\n", 
                   gp = gpar(fontsize = 20, font = 2)),
    right = "\n"
)

tmp <- pos_gabarito$percentual_acerto %>%
    select(p_exotica_aves:p_nativa_reptil) %>%
    melt()
# anova(lm(value ~ variable, tmp))
tmp <- cbind(tmp, colsplit(tmp$variable, "_", c("p", "origem", "grupo"))) %>%
    select(origem, grupo, value)
anova(lm(value ~ grupo * origem, tmp))
Analysis of Variance Table

Response: value
               Df Sum Sq Mean Sq F value  Pr(>F)    
grupo           4     14     3.6    17.3 4.4e-14 ***
origem          1    123   122.7   597.4 < 2e-16 ***
grupo:origem    4     18     4.5    21.7 < 2e-16 ***
Residuals    3660    752     0.2                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
tukey <- TukeyHSD(aov(lm(value ~ grupo * origem, tmp)))
tukey
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = lm(value ~ grupo * origem, tmp))

$grupo
                            diff      lwr      upr  p adj
invertebrado-aves     -1.458e-01 -0.21034 -0.08122 0.0000
mamifero-aves         -7.883e-15 -0.06456  0.06456 1.0000
peixe-aves            -4.905e-02 -0.11361  0.01551 0.2319
reptil-aves           -1.294e-01 -0.19399 -0.06487 0.0000
mamifero-invertebrado  1.458e-01  0.08122  0.21034 0.0000
peixe-invertebrado     9.673e-02  0.03217  0.16129 0.0004
reptil-invertebrado    1.635e-02 -0.04821  0.08091 0.9585
peixe-mamifero        -4.905e-02 -0.11361  0.01551 0.2319
reptil-mamifero       -1.294e-01 -0.19399 -0.06487 0.0000
reptil-peixe          -8.038e-02 -0.14494 -0.01582 0.0062

$origem
                  diff    lwr     upr p adj
nativa-exotica -0.3657 -0.395 -0.3363     0

$`grupo:origem`
                                              diff       lwr       upr  p adj
invertebrado:exotica-aves:exotica        -0.032698 -0.138602  0.073206 0.9935
mamifero:exotica-aves:exotica             0.103542 -0.002362  0.209446 0.0616
peixe:exotica-aves:exotica                0.114441  0.008537  0.220345 0.0222
reptil:exotica-aves:exotica              -0.147139 -0.253043 -0.041235 0.0005
aves:nativa-aves:exotica                 -0.220708 -0.326612 -0.114804 0.0000
invertebrado:nativa-aves:exotica         -0.479564 -0.585468 -0.373660 0.0000
mamifero:nativa-aves:exotica             -0.324251 -0.430155 -0.218347 0.0000
peixe:nativa-aves:exotica                -0.433243 -0.539147 -0.327339 0.0000
reptil:nativa-aves:exotica               -0.332425 -0.438329 -0.226521 0.0000
mamifero:exotica-invertebrado:exotica     0.136240  0.030336  0.242144 0.0019
peixe:exotica-invertebrado:exotica        0.147139  0.041235  0.253043 0.0005
reptil:exotica-invertebrado:exotica      -0.114441 -0.220345 -0.008537 0.0222
aves:nativa-invertebrado:exotica         -0.188011 -0.293915 -0.082107 0.0000
invertebrado:nativa-invertebrado:exotica -0.446866 -0.552770 -0.340962 0.0000
mamifero:nativa-invertebrado:exotica     -0.291553 -0.397457 -0.185649 0.0000
peixe:nativa-invertebrado:exotica        -0.400545 -0.506449 -0.294641 0.0000
reptil:nativa-invertebrado:exotica       -0.299728 -0.405632 -0.193824 0.0000
peixe:exotica-mamifero:exotica            0.010899 -0.095005  0.116803 1.0000
reptil:exotica-mamifero:exotica          -0.250681 -0.356585 -0.144777 0.0000
aves:nativa-mamifero:exotica             -0.324251 -0.430155 -0.218347 0.0000
invertebrado:nativa-mamifero:exotica     -0.583106 -0.689010 -0.477202 0.0000
mamifero:nativa-mamifero:exotica         -0.427793 -0.533697 -0.321889 0.0000
peixe:nativa-mamifero:exotica            -0.536785 -0.642689 -0.430881 0.0000
reptil:nativa-mamifero:exotica           -0.435967 -0.541871 -0.330063 0.0000
reptil:exotica-peixe:exotica             -0.261580 -0.367484 -0.155676 0.0000
aves:nativa-peixe:exotica                -0.335150 -0.441054 -0.229246 0.0000
invertebrado:nativa-peixe:exotica        -0.594005 -0.699909 -0.488101 0.0000
mamifero:nativa-peixe:exotica            -0.438692 -0.544596 -0.332788 0.0000
peixe:nativa-peixe:exotica               -0.547684 -0.653588 -0.441780 0.0000
reptil:nativa-peixe:exotica              -0.446866 -0.552770 -0.340962 0.0000
aves:nativa-reptil:exotica               -0.073569 -0.179473  0.032335 0.4575
invertebrado:nativa-reptil:exotica       -0.332425 -0.438329 -0.226521 0.0000
mamifero:nativa-reptil:exotica           -0.177112 -0.283016 -0.071208 0.0000
peixe:nativa-reptil:exotica              -0.286104 -0.392008 -0.180200 0.0000
reptil:nativa-reptil:exotica             -0.185286 -0.291190 -0.079382 0.0000
invertebrado:nativa-aves:nativa          -0.258856 -0.364760 -0.152952 0.0000
mamifero:nativa-aves:nativa              -0.103542 -0.209446  0.002362 0.0616
peixe:nativa-aves:nativa                 -0.212534 -0.318438 -0.106630 0.0000
reptil:nativa-aves:nativa                -0.111717 -0.217621 -0.005813 0.0291
mamifero:nativa-invertebrado:nativa       0.155313  0.049409  0.261217 0.0002
peixe:nativa-invertebrado:nativa          0.046322 -0.059582  0.152226 0.9321
reptil:nativa-invertebrado:nativa         0.147139  0.041235  0.253043 0.0005
peixe:nativa-mamifero:nativa             -0.108992 -0.214896 -0.003088 0.0377
reptil:nativa-mamifero:nativa            -0.008174 -0.114078  0.097730 1.0000
reptil:nativa-peixe:nativa                0.100817 -0.005087  0.206721 0.0777
tky <- as.data.frame(tukey$`grupo:origem`)
tky <- tky %>%
  mutate(pair = reorder(rownames(tky), `diff`),
         signifcante = (`p adj` <= 0.05),
         cor = ifelse(`p adj` <= 0.05, "red", "black"))
ggplot(tky, aes(colour = cut(`p adj`, c(0, 0.05, 1), 
                               label = c("Significante", "Não significante")))) +
  geom_hline(yintercept=0, lty="11", colour="grey30") +
  geom_errorbar(aes(pair, ymin=lwr, ymax=upr), width=0.5, size=1) +
  geom_point(aes(pair, diff), size=3, shape=21) +
  scale_color_manual(values = c("red", "black"))+
  coord_flip() +
  theme_bw() +
  theme(axis.text.x = element_text(size = 10),
        axis.text.y = element_text(size = 10), 
        legend.position = "top") +
  labs(title = "Grupo taxonómico x Origem das espécies",
       subtitle = "Análise Tukey",
       colour = "", x = "Comparação de grupos", y = "\nDiferença entre as médias")

8 - Estudantes que possuem maior frequência de contato com a natureza têm maior proporção de acertos das espécies nativas

tmp <- pos_gabarito$percentual_acerto %>%
    select(frequencia, p_nome_exoticas:p_indice_nativas) %>%
    melt(id = "frequencia")
tmp <-
    cbind(tmp, colsplit(tmp$variable, "_", c("p", "indicador", "origem"))) %>%
    select(frequencia, indicador, origem, value)
tmp %>%
  ggplot() + 
  geom_boxplot(aes(x = origem, y = value, fill = frequencia), show.legend = T) + 
  scale_y_continuous(limits = c(0,1), labels = scales::percent) +
  facet_wrap(~indicador) +
  theme_bw() +
  labs(title = "Boxplot de identificação de espécies Nativas nos critérios estabelecidos",
       y = "Percentual de identificação", x = "") +
  my_theme

anova(lm(value  ~ frequencia, data = tmp %>% filter(indicador == "indice")))
Analysis of Variance Table

Response: value
            Df Sum Sq Mean Sq F value Pr(>F)
frequencia   4    0.1  0.0247    0.46   0.76
Residuals  729   38.9  0.0533               
#TukeyHSD(aov(lm(value  ~ frequencia, data = tmp %>% filter(indicador == "indice"))))

9 - Estudantes que participam de aulas práticas tem maior proporção de acertos sobre as espécies nativas do que estudantes sem tais aulas

tmp <- pos_gabarito$percentual_acerto %>%
    select(fez.aula, p_nome_exoticas:p_indice_nativas) %>%
    melt(id = "fez.aula")
tmp <-
    cbind(tmp, colsplit(tmp$variable, "_", c("p", "indicador", "origem"))) %>%
    select(fez.aula, indicador, origem, value)
tmp %>%
  ggplot() + 
  geom_boxplot(aes(x = origem, y = value, fill = fez.aula), show.legend = T) + 
  scale_y_continuous(limits = c(0,1), labels = scales::percent) +
  facet_wrap(~indicador) +
  theme_bw() +
  labs(title = "Boxplot de identificação de espécies Nativas nos critérios estabelecidos",
       y = "Percentual de identificação", x = "") +
  my_theme

anova(lm(value  ~ fez.aula, data = tmp %>% filter(indicador == "indice")))
Analysis of Variance Table

Response: value
           Df Sum Sq Mean Sq F value Pr(>F)
fez.aula    6    0.2  0.0388    0.73   0.63
Residuals 727   38.7  0.0533               
#TukeyHSD(aov(lm(value  ~ frequencia, data = tmp %>% filter(indicador == "indice"))))

10 - Rankings das espécies citadas

a1 <- 
    pos_gabarito$raking_animais$nativos %>%
    head(20) %>%
    ggplot(aes(x = animais, y = freq, fill = freq)) +
    geom_bar(stat="identity", show.legend = F) +
    geom_text(aes(label = freq), position = position_dodge(0.9), vjust = -1, hjust = 0.5) +
    scale_y_continuous(limits = c(0,90)) +
    scale_fill_gradient(low = "orange", high = "red") +
    theme_bw() +
    labs(title = "Espécies citadas como nativas",
       y = "Frequencia", x = "") +
    my_theme
a2 <- 
    pos_gabarito$raking_animais$exoticos %>%
    head(20) %>%
    ggplot(aes(x = animais, y = freq, fill = freq)) +
    geom_bar(stat="identity", show.legend = F) +
    geom_text(aes(label = freq), position = position_dodge(0.9), vjust = -1, hjust = 0.5) +
    scale_y_continuous(limits = c(0,90)) +
    scale_fill_gradient(low = "lightblue", high = "darkblue") +
    theme_bw() +
    labs(title = "Espécies citadas como exóticas",
       y = "Frequencia", x = "") +
    my_theme
grid.arrange(a1, a2,
             nrow = 2,
             top = textGrob("TOP 20 - Ranking das espécies citadas como exemplo\n", 
                            gp = gpar(fontsize = 20, font = 2))
)

a3 <- 
    pos_gabarito$raking_animais$protegidos %>%
    head(20) %>%
    ggplot(aes(x = animais, y = freq, fill = freq)) +
    geom_bar(stat="identity", show.legend = F) +
    geom_text(aes(label = freq), position = position_dodge(0.9), vjust = -1, hjust = 0.5) +
    scale_y_continuous(limits = c(0,190)) +
    scale_fill_gradient(low = "green", high = "darkgreen") +
    theme_bw() +
    labs(title = "Espécies citadas como nativas",
       y = "Frequencia", x = "") +
    my_theme
grid.arrange(a3,
             top = textGrob("TOP 20 - Ranking das espécies citadas como exemplo para proteção\n", 
                            gp = gpar(fontsize = 20, font = 2))
)

