heRcules

UM REPOSITÓRIO COM SCRIPTS PARA O APRENDIZADO DA ANÁLISE DE DADOS EM R

Palavras-chave: R, Análise de dados, Tamanho amostral, Gráficos, GitHub, Teste de hipóteses

Resumo

A análise de dados é uma etapa crucial no desenvolvimento de projetos científicos, desempenhando um papel central na validação e interpretação dos resultados obtidos. Antes de iniciar a coleta de dados, o pesquisador deve planejar seus experimentos e análises de maneira meticulosa e estruturada, garantindo uma abordagem robusta que minimiza a influência de vieses que possam comprometer a validade dos resultados. O presente documento relata a criação do repositório "heRcules", um recurso de acesso público que oferece modelos de scripts em linguagem R para a análise de dados científicos, com foco especial nas disciplinas das Ciências Biológicas e da Saúde. Este repositório é projetado para ser uma ferramenta valiosa para pesquisadores, fornecendo scripts prontos para executar tarefas essenciais como planejamento experimental, análise de dados, visualização de resultados e testes de hipóteses. O modelo inicial, descrito neste documento, inclui scripts para uma ampla gama de funções: cálculo de tamanho amostral, cálculo de poder estatístico, importação de planilhas, criação de vetores e data frames, estatísticas descritivas, exportação de arquivos, criação de gráficos (tanto com base R quanto com ggplot2), testes de outliers, testes de normalidade, e criação de notebooks com o R Markdown. O repositório está hospedado na plataforma GitHub (https://github.com/drhrf/heRcules.git), assegurando que os recursos estejam disponíveis de forma eficiente, gratuita e colaborativa para a comunidade científica. Esse repositório tem como objetivo não apenas facilitar o trabalho de pesquisadores individuais, mas também promover a transparência e a reprodutibilidade da pesquisa científica, oferecendo uma base sólida para a condução de análises de dados rigorosas e bem fundamentadas, tais como aquelas exemplificadas no presente modelo.

Biografia do Autor

Hércules Rezende Freitas, Universidade Federal do Rio de Janeiro

Hércules é Biólogo e Matemático, com especializações em Fitoterapia, Farmacologia e Big Data. Também é Mestre e Doutor em Biofísica (UFRJ/Universidade de Coimbra), com pós-doutorado em Neuropatologia na Universidade da Califórnia. Atua como Bioestatístico para o Instituto Nacional de Traumatologia e Ortopedia e é professor universitário na Universidade do Grande Rio.

Referências

CHAMPELY, S. pwr: Basic Functions for Power Analysis. R package version 1.3-0, 2020. Disponível em: https://link.ufms.br/1gVny. Acesso em: 4 mar. 2004.

DEBASTIANI, V. J. Introdução ao R. [S. l.], 2020. Disponível em: https://link.ufms.br/jrVkK. Acesso em: 21 dez. 2021.

DRAGULESCU, A.; ARENDT, C. xlsx: Read, Write, Format Excel 2007 and Excel 97/2000/XP/2003 Files. R package version 0.6.5, 2020. Disponível em: https://link.ufms.br/50ihv. Acesso em: 4 mar. 2004.

GROSJEAN, P.; IBANEZ, F. pastecs: Package for Analysis of Space-Time Ecological Series. R package version 1.3.21, 2018. Disponível em: https://link.ufms.br/RC3TO. Acesso em: 4 mar. 2004.

KASSAMBARA, A. rstatix: Pipe-Friendly Framework for Basic Statistical Tests. R package version 0.7.0, 2021. Disponível em: https://link.ufms.br/aOTIi. Acesso em: 4 mar. 2004.

R CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2013. Disponível em: https://link.ufms.br/U0dqv. Acesso em: 4 mar. 2004.

REVELLE, W. psych: Procedures for Personality and Psychological Research, Northwestern University, Evanston, Illinois, USA, 2021. Versão 2.1.9. Disponível em: https://link.ufms.br/R179A. Acesso em: 4 mar. 2004.

SHAPIRO, A. S. S.; WILK, M. B. An Analysis of Variance Test for Normality (Complete Samples). Biometrika, v. 52, n. 3/4, p. 591–611, 1965. Disponível em: https://doi.org/10.2307/2333709. Acesso em: 4 mar. 2004.

TORCHIANO, M. effsize: Efficient Effect Size Computation. R package version 0.8.1, 2020. Disponível em: https://doi.org/10.5281/zenodo.1480624. Acesso em: 4 mar. 2004.

TUKEY, J. W. Comparing individual means in the analysis of variance. Biometrics, v. 5, n. 2, p. 99-114, 1949. Disponível em: https://doi.org/10.2307/3001913. Acesso em: 4 mar. 2004.

WARING, E.; QUINN, M.; MCNAMARA, A.; LA RUBIA, E. A.; ZHU, H.; ELLIS, S. skimr: Compact and Flexible Summaries of Data. R package version 2.1.3, 2021. Disponível em: https://link.ufms.br/g9Atv. Acesso em: 4 mar. 2004.

WICKHAM, H. Reshaping Data with the reshape Package. Journal of Statistical Software, v. 21, n. 12, p. 1-20, 2007. Disponível em: https://doi.org/10.18637/jss.v021.i12. Acesso em: 4 mar. 2004.

WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.

WICKHAM, H.; FRANÇOIS, R.; HENRY, L.; MÜLLER, K. dplyr: A Grammar of Data Manipulation. R package version 1.0.7, 2021. Disponível em: https://link.ufms.br/udQwn. Acesso em: 4 mar. 2004.

WUERTZ, D.; SETZ, T.; CHALABI, Y. fBasics: Rmetrics - Markets and Basic Statistics. R package version 3042.89.1, 2020. Disponível em: https://link.ufms.br/HOaQj. Acesso em: 4 mar. 2004.

ZHU, H. kableExtra: Construct Complex Table with ‘kable’ and Pipe Syntax. R package version 1.3.4, 2021. Disponível em: https://link.ufms.br/UUuNg. Acesso em: 4 mar. 2004.

Publicado
2024-12-26
Como Citar
FREITAS, H. R. heRcules. Revista Edutec - Educação, Tecnologias Digitais e Formação Docente, v. 4, n. 1, 26 dez. 2024.

Dados de financiamento