heRcules
UM REPOSITÓRIO COM SCRIPTS PARA O APRENDIZADO DA ANÁLISE DE DADOS EM R
Resumo
A análise de dados é uma etapa crucial no desenvolvimento de projetos científicos, desempenhando um papel central na validação e interpretação dos resultados obtidos. Antes de iniciar a coleta de dados, o pesquisador deve planejar seus experimentos e análises de maneira meticulosa e estruturada, garantindo uma abordagem robusta que minimiza a influência de vieses que possam comprometer a validade dos resultados. O presente documento relata a criação do repositório "heRcules", um recurso de acesso público que oferece modelos de scripts em linguagem R para a análise de dados científicos, com foco especial nas disciplinas das Ciências Biológicas e da Saúde. Este repositório é projetado para ser uma ferramenta valiosa para pesquisadores, fornecendo scripts prontos para executar tarefas essenciais como planejamento experimental, análise de dados, visualização de resultados e testes de hipóteses. O modelo inicial, descrito neste documento, inclui scripts para uma ampla gama de funções: cálculo de tamanho amostral, cálculo de poder estatístico, importação de planilhas, criação de vetores e data frames, estatísticas descritivas, exportação de arquivos, criação de gráficos (tanto com base R quanto com ggplot2), testes de outliers, testes de normalidade, e criação de notebooks com o R Markdown. O repositório está hospedado na plataforma GitHub (https://github.com/drhrf/heRcules.git), assegurando que os recursos estejam disponíveis de forma eficiente, gratuita e colaborativa para a comunidade científica. Esse repositório tem como objetivo não apenas facilitar o trabalho de pesquisadores individuais, mas também promover a transparência e a reprodutibilidade da pesquisa científica, oferecendo uma base sólida para a condução de análises de dados rigorosas e bem fundamentadas, tais como aquelas exemplificadas no presente modelo.
Referências
CHAMPELY, S. pwr: Basic Functions for Power Analysis. R package version 1.3-0, 2020. Disponível em: https://link.ufms.br/1gVny. Acesso em: 4 mar. 2004.
DEBASTIANI, V. J. Introdução ao R. [S. l.], 2020. Disponível em: https://link.ufms.br/jrVkK. Acesso em: 21 dez. 2021.
DRAGULESCU, A.; ARENDT, C. xlsx: Read, Write, Format Excel 2007 and Excel 97/2000/XP/2003 Files. R package version 0.6.5, 2020. Disponível em: https://link.ufms.br/50ihv. Acesso em: 4 mar. 2004.
GROSJEAN, P.; IBANEZ, F. pastecs: Package for Analysis of Space-Time Ecological Series. R package version 1.3.21, 2018. Disponível em: https://link.ufms.br/RC3TO. Acesso em: 4 mar. 2004.
KASSAMBARA, A. rstatix: Pipe-Friendly Framework for Basic Statistical Tests. R package version 0.7.0, 2021. Disponível em: https://link.ufms.br/aOTIi. Acesso em: 4 mar. 2004.
R CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2013. Disponível em: https://link.ufms.br/U0dqv. Acesso em: 4 mar. 2004.
REVELLE, W. psych: Procedures for Personality and Psychological Research, Northwestern University, Evanston, Illinois, USA, 2021. Versão 2.1.9. Disponível em: https://link.ufms.br/R179A. Acesso em: 4 mar. 2004.
SHAPIRO, A. S. S.; WILK, M. B. An Analysis of Variance Test for Normality (Complete Samples). Biometrika, v. 52, n. 3/4, p. 591–611, 1965. Disponível em: https://doi.org/10.2307/2333709. Acesso em: 4 mar. 2004.
TORCHIANO, M. effsize: Efficient Effect Size Computation. R package version 0.8.1, 2020. Disponível em: https://doi.org/10.5281/zenodo.1480624. Acesso em: 4 mar. 2004.
TUKEY, J. W. Comparing individual means in the analysis of variance. Biometrics, v. 5, n. 2, p. 99-114, 1949. Disponível em: https://doi.org/10.2307/3001913. Acesso em: 4 mar. 2004.
WARING, E.; QUINN, M.; MCNAMARA, A.; LA RUBIA, E. A.; ZHU, H.; ELLIS, S. skimr: Compact and Flexible Summaries of Data. R package version 2.1.3, 2021. Disponível em: https://link.ufms.br/g9Atv. Acesso em: 4 mar. 2004.
WICKHAM, H. Reshaping Data with the reshape Package. Journal of Statistical Software, v. 21, n. 12, p. 1-20, 2007. Disponível em: https://doi.org/10.18637/jss.v021.i12. Acesso em: 4 mar. 2004.
WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.
WICKHAM, H.; FRANÇOIS, R.; HENRY, L.; MÜLLER, K. dplyr: A Grammar of Data Manipulation. R package version 1.0.7, 2021. Disponível em: https://link.ufms.br/udQwn. Acesso em: 4 mar. 2004.
WUERTZ, D.; SETZ, T.; CHALABI, Y. fBasics: Rmetrics - Markets and Basic Statistics. R package version 3042.89.1, 2020. Disponível em: https://link.ufms.br/HOaQj. Acesso em: 4 mar. 2004.
ZHU, H. kableExtra: Construct Complex Table with ‘kable’ and Pipe Syntax. R package version 1.3.4, 2021. Disponível em: https://link.ufms.br/UUuNg. Acesso em: 4 mar. 2004.
A Revista Edutec utiliza como base a Licença Creative Commons - Atribuição 4.0 Internacional, pois acredita na importância do movimento do acesso aberto nos periódicos científicos, como Open Archives Initiative.
Ao submeter um texto à revista os autores concordam com os seguintes termos:
- Os autores concordam em licenciar os trabalhos aceitos para publicação sob a Licença Creative Commons - Atribuição 4.0 Internacional.
- Com o licenciamento em CC-BY 4.0, os autores mantém os direitos intelectuais sobre o texto e concedem à Revista Edutec o direito de primeira publicação.
- Os autores concordam em autorizar o envio e indexação dos textos de sua autoria em bases de dados e portais de informação acadêmica e científica.
- Os autores têm permissão e são estimulados a publicar e distribuir seu trabalho online, em repositórios institucionais, em páginas pessoais e redes sociais acadêmicas, após o processo editorial, desde que sejam respeitadas as formas de licenciamento e apresentação do texto, além da indicação do local de origem de publicação, no caso, o link para a Revista Edutec.
- Os autores dos trabalhos publicados na Revista Edutec são expressamente responsáveis de direito por seu conteúdo.
- Todos os trabalhos submetidos à Revista Edutec que possuírem em seu corpo imagens, fotografias, figuras em que estejam registradas imagens de seres humanos, devem vir acompanhados de Termo de Autorização de Uso de Imagem, do membro participante da imagem e, no caso de crianças, dos familiares das crianças expostas, com dados e assinatura dos mesmos.
- Em compromisso com práticas para abertura e popularização da ciência, a Revista Edutec poderá criar conteúdos (inclusive com participação de Inteligência Artificial Generativa, sempre com supervisão editorial) para divulgação científica da publicação em mídias sociais, citando a autoria e o link de acesso.
Dados de financiamento
-
Conselho Nacional de Desenvolvimento Científico e Tecnológico
Números do Financiamento (Subsídios) 152071/2020-2











2.png)

