heRcules

UN REPOSITORIO CON SCRIPTS PARA EL APRENDIZAJE DEL ANÁLISIS DE DATOS EN R

Palabras clave: R, Análisis de datos, Tamaño de muestra, Gráficos, GitHub, Prueba de hipótesis

Resumen

El análisis de datos es una etapa crucial en el desarrollo de proyectos científicos, desempeñando un papel central en la validación e interpretación de los resultados obtenidos. Antes de comenzar la recopilación de datos, el investigador debe planificar sus experimentos y análisis de manera meticulosa y estructurada, garantizando que el enfoque sea robusto y minimizando la influencia de sesgos que puedan comprometer la validez de los resultados. El presente documento informa sobre la creación del repositorio "heRcules", un recurso de acceso público que ofrece modelos de scripts en lenguaje R para el análisis de datos científicos, con un enfoque especial en las disciplinas de Ciencias Biológicas y de la Salud. Este repositorio está diseñado para ser una herramienta valiosa para los investigadores, proporcionando scripts listos para ejecutar tareas esenciales como la planificación experimental, el análisis de datos, la visualización de resultados y las pruebas de hipótesis. El modelo inicial, descrito en este documento, incluye scripts para una amplia gama de funciones: cálculo del tamaño de la muestra, cálculo del poder estadístico, importación de hojas de cálculo, creación de vectores y data frames, estadísticas descriptivas, exportación de archivos, creación de gráficos (tanto con base R como con ggplot2), pruebas de valores atípicos, pruebas de normalidad y creación de cuadernos con R Markdown. El repositorio está alojado en la plataforma GitHub (https://github.com/drhrf/heRcules.git), lo que garantiza que los recursos estén disponibles de manera eficiente, gratuita y colaborativa para la comunidad científica. Este repositorio tiene como objetivo no solo facilitar el trabajo de los investigadores individuales, sino también promover la transparencia y la reproducibilidad de la investigación científica, proporcionando una base sólida para la realización de análisis de datos rigurosos y bien fundamentados, como los ejemplificados en el modelo actual.

Biografía del autor/a

Hércules Rezende Freitas, Universidade Federal do Rio de Janeiro

Hércules é Biólogo e Matemático, com especializações em Fitoterapia, Farmacologia e Big Data. Também é Mestre e Doutor em Biofísica (UFRJ/Universidade de Coimbra), com pós-doutorado em Neuropatologia na Universidade da Califórnia. Atua como Bioestatístico para o Instituto Nacional de Traumatologia e Ortopedia e é professor universitário na Universidade do Grande Rio.

Citas

CHAMPELY, S. pwr: Basic Functions for Power Analysis. R package version 1.3-0, 2020. Disponível em: https://link.ufms.br/1gVny. Acesso em: 4 mar. 2004.

DEBASTIANI, V. J. Introdução ao R. [S. l.], 2020. Disponível em: https://link.ufms.br/jrVkK. Acesso em: 21 dez. 2021.

DRAGULESCU, A.; ARENDT, C. xlsx: Read, Write, Format Excel 2007 and Excel 97/2000/XP/2003 Files. R package version 0.6.5, 2020. Disponível em: https://link.ufms.br/50ihv. Acesso em: 4 mar. 2004.

GROSJEAN, P.; IBANEZ, F. pastecs: Package for Analysis of Space-Time Ecological Series. R package version 1.3.21, 2018. Disponível em: https://link.ufms.br/RC3TO. Acesso em: 4 mar. 2004.

KASSAMBARA, A. rstatix: Pipe-Friendly Framework for Basic Statistical Tests. R package version 0.7.0, 2021. Disponível em: https://link.ufms.br/aOTIi. Acesso em: 4 mar. 2004.

R CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2013. Disponível em: https://link.ufms.br/U0dqv. Acesso em: 4 mar. 2004.

REVELLE, W. psych: Procedures for Personality and Psychological Research, Northwestern University, Evanston, Illinois, USA, 2021. Versão 2.1.9. Disponível em: https://link.ufms.br/R179A. Acesso em: 4 mar. 2004.

SHAPIRO, A. S. S.; WILK, M. B. An Analysis of Variance Test for Normality (Complete Samples). Biometrika, v. 52, n. 3/4, p. 591–611, 1965. Disponível em: https://doi.org/10.2307/2333709. Acesso em: 4 mar. 2004.

TORCHIANO, M. effsize: Efficient Effect Size Computation. R package version 0.8.1, 2020. Disponível em: https://doi.org/10.5281/zenodo.1480624. Acesso em: 4 mar. 2004.

TUKEY, J. W. Comparing individual means in the analysis of variance. Biometrics, v. 5, n. 2, p. 99-114, 1949. Disponível em: https://doi.org/10.2307/3001913. Acesso em: 4 mar. 2004.

WARING, E.; QUINN, M.; MCNAMARA, A.; LA RUBIA, E. A.; ZHU, H.; ELLIS, S. skimr: Compact and Flexible Summaries of Data. R package version 2.1.3, 2021. Disponível em: https://link.ufms.br/g9Atv. Acesso em: 4 mar. 2004.

WICKHAM, H. Reshaping Data with the reshape Package. Journal of Statistical Software, v. 21, n. 12, p. 1-20, 2007. Disponível em: https://doi.org/10.18637/jss.v021.i12. Acesso em: 4 mar. 2004.

WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.

WICKHAM, H.; FRANÇOIS, R.; HENRY, L.; MÜLLER, K. dplyr: A Grammar of Data Manipulation. R package version 1.0.7, 2021. Disponível em: https://link.ufms.br/udQwn. Acesso em: 4 mar. 2004.

WUERTZ, D.; SETZ, T.; CHALABI, Y. fBasics: Rmetrics - Markets and Basic Statistics. R package version 3042.89.1, 2020. Disponível em: https://link.ufms.br/HOaQj. Acesso em: 4 mar. 2004.

ZHU, H. kableExtra: Construct Complex Table with ‘kable’ and Pipe Syntax. R package version 1.3.4, 2021. Disponível em: https://link.ufms.br/UUuNg. Acesso em: 4 mar. 2004.

Publicado
2024-12-26
Cómo citar
FREITAS, H. R. heRcules. Revista Edutec - Educación, Tecnologías Digitales y Formación Docente, v. 4, n. 1, 26 dic. 2024.

Funding data