comments 7

10 razones para utilizar el entorno R

R es un lenguaje y un entorno gratuito de programación para el cálculo estadístico y gráfico, muy popular actualmente entre los estadísticos. La funcionalidad básica de R la controlan entre unas pocas personas (el “R Development Core Team”), y todo lo demás se va creando mediante la colaboración entre los miles y miles de usuarios de esta plataforma, quienes van publicando sus programas a través de paquetes – esto es, colecciones de datos y funciones empaquetadas, y que descargamos en nuestro ordenador. Los paquetes de R se distribuyen principalmente a través de repositorios, entre los cuales destacan CRAN (The Comprehensive R Archive Network, el repositorio primario de R), omegahat, BioConductor y otros.

R es una implementación del lenguaje de programación S que incluye una característica llamada “lexical scoping” (para los interesados, probad a teclear > demo(“scoping”) en la línea de comandos). El lenguaje S fue escrito por John Chambers en los Laboratorios Bell. Posteriormente, Ross Ihaka y Robert Gentleman crearon R  en la Universidad de Auckland, Nueva Zelanda (y lo bautizaron así por la “R” inicial de sus nombres, y por analogía con “S”). En los últimos años, R se ha convertido en una alternativa real a los lenguajes comerciales tales como SAS, SPSS y Stata.

Y bien, ¿qué razones tengo yo para usar R?

1 R es gratuito: no hay que pagar nada por utilizarlo. En cambio, otros entornos como SAS o SPSS son extremadamente caros (sobre todo el primero).

2R ha conseguido reunir a una comunidad colaboradora muy activa, así como establecer mecanismos de difusión eficaces, mediante repositorios como los que hemos mencionado. Muchos trabajos de investigación se publican apoyados en paquetes de R mediante estas plataformas. Por tanto, cuando buscamos la implementación de algún cálculo estadístico en particular, es muy probable que ya haya sido implementado por alguien en R; muchas veces, por el mismo creador del método.

3

Por los mismos motivos, seguramente R sea la plataforma ideal para publicar software estadístico.

4

Gracias a que existen normas concretas para publicar paquetes, la documentación es estándar, lo cual ayuda mucho a la hora de averiguar qué funcionalidades proporcionan. A veces encontramos manuales que son casi como libros: un buen ejemplo es el del paquete “mice” de Stef van Buuren. La página de ayuda asociada a las funciones suele proporcionar de unos cuantos ejemplos ilustrativos, que suelen ser un buen punto de partida. Para los no-iniciados, probad a teclear >help(nombreFuncion), mirad si hay ejemplos en el último apartado. Suele ser buena idea copiarlos y pegarlos en la línea de comandos, y ver qué pasa.

5

R, al ser software de libre distribución, viene sin garantías (al igual que algún software comercial, véase el caso de SAS, puntos 6 y 7), pero hay ciertos mecanismos de control. El repositorio CRAN exige cumplir con una una serie de requerimientos para los paquetes que distribuye. Como mínimo, se garantiza que no contienen software malintencionado, y que no interfieren con los paquetes que ya tengamos instalados. Además, la mejor garantía es que tenemos acceso al código, lo que significa que nuestros cálculos se pueden trazar con precisión.

6

R está siendo aceptado en todos los ámbitos donde se trabaja con análisis de datos: en la administración pública, en la empresa privada (más allá de la universidad). Hay cursos de R por todas partes, todo el mundo está poniéndose con ello.

7

R dispone de un IDE fantástico, RStudio, que nos permite trabajar de una forma muy cómoda con paquetes, nuestras propias funciones, con la ayuda en línea, y ventanas gráficas, todo muy fácil de manejar. Aunque de vez en cuando falla, no se suele perder el trabajo incluso aunque no se haya salvado.

8

R dispone de paquetes fantásticos para visualizar datos, como ggplot2 y lattice. De ellos hablaremos en otros posts.

9

R se puede usar para crear “documentos dinámicos”, tanto intermedios (de trabajo) como finales (para publicar). La idea de los documentos dinámicos es que se trabaja en un único archivo que integra tanto el texto como los cálculos, intercalados pero separados en diferentes apartados distinguidos por marcadores. Este archivo se compila (el mismo RStudio permite hacerlo), y se genera un documento que actualiza ¡¡al mismo tiempo!! los cambios en el texto y en los resultados. Con esto se terminó la pesadilla de ir pegando gráficos o tablas en un documento de Word y otros horrores por el estilo. Dedicaremos un post a ello.

10

R es cautivador para muchos (entre los cuales me incluyo). Es mucho más interesante trabajar creando ‘objetos’, esto es funciones, que se corresponden con conceptos y no usando menús de SPSS que nos lo dan todo cerrado, que no permiten profundización conceptual alguna. Por ejemplo: puedo crear una función cuya misión es extraer 100 muestras de mis datos con un subconjunto de variables, y luego calcular un índice, que finalmente me devuelve una tabla con los 100 índices obtenidos. Esta forma de pensar es mucho más adecuada y afín a lo que debiera ser el razonamiento estadístico, que trabajar con menús restrictivos (recetas) como los de SPSS.

Anuncios
Filed under: R

About the Author

Escrito por

Nací en el año 1980 en Donostia, hija única de una familia entusiasta de las Letras. A pesar de ello a los dieciocho años tomé la rara decisión de estudiar Matemáticas. Obtuve la Licenciatura en 2003, y comencé mi andadura profesional en Tekniker, un centro tecnológico afincado en Eibar dedicado al mundo de la automoción. Desde el inicio me encontré analizando datos estadísticos que nunca se ajustaban a los ejemplos de los libros de texto. Tras un breve paso por la Universidad de Deusto, el destino me llevó a un Banco donde trabajé con modelos de riesgo de crédito (de esos que saben si uno va a pagar incluso antes de que se le ocurra pedir la hipoteca). Debido a la crisis salí catapultada de aquel puesto, circunstancia que aproveché para cuidar plenamente de mi hijo recién nacido, Miguel. A los pocos meses de nacer el segundo, Ion, corrí a incorporarme a un proyecto sobre enlace de encuestas en el Instituto Vasco de Estadística - Eustat. Ahora sigo trabajando con datos que no se ajustan a los libros de texto, pero ya casi no me importa, y soy más feliz pensando que a lo mejor se trata de hacer algo que no está escrito.

7 Comments

  1. No me he enterado de mucho, pero es normal.
    Estoy alejado de la vida académica, de la estadística y de la ciencia en general.
    Yo con el Statgraphics ya tenía grandes encontronazos y decepciones mutuas, jejeje.

    Buena suerte con el blog, la herramienta de comunicación más válida de los últimos 20 años.

  2. Pingback: 4 razones para no ignorar los valores perdidos | X razones para Y

  3. Hola Inés:

    Que gran sorpresa la que me he llevado al encontrarte por la red. ¡Muy de acuerdo con todo lo que escribes en este post! Yo también soy un fan de R.

    Un abrazo.

    Juanjo

  4. ¡Hola Juanjo!

    Muchas gracias por tu comentario, me alegro de que estés de acuerdo conmigo. Yo hubiera puesto como primer motivo (y no como último) que R engancha y que es muy divertido, pero quedaría un poco raro, ¿no crees?

    Me alegro de haberte encontrado, yo también voy a seguir tus contribuciones desde ya mismo 😉

  5. Gustavo Adolfo

    ¡Hola Inés!

    Tengo la E(x) que cumplas el 50% de lo que nos prometes con tu blog; aceptando un sd de 1 caso, me tendrás como tu fiel seguidor… 😉

    Espero que escribas pronto sobre los modelos de Riesgo… yo también estuve en Banca un tiempo, pero en mero Análisis financiero y Gestión de Inversiones, así que con seguridad aprenderé mucho aquí contigo.

    Saludos desde Colombia!

    • Hola Adolfo,

      Muchísimas gracias por tu comentario. Esto de llevar el blog y la especialización de Coursera a la vez no es tarea fácil, pero espero poder cumplir el 50% de tus expectativas 🙂

      Pensaré en ese post que me pides. Hace tiempo que no estoy en Banca pero algo podré decir sobre los modelos de riesgo de crédito, que era mi tema (entre otros). Me alegra saber que tú también estuviste en algo relacionado durante un tiempo.

      Mientras tanto nos vemos en el foro de la especialización. Suerte con los cursos, seguimos en contacto.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s