A pesar de los múltiples artículos escritos sobre este tema, muy pocos ofrecen argumentos que ayuden a las personas a elegir. Esta pregunta parece persistir y hay un sinfín de artículos que intentan ayudar a las personas a elegir el "lenguaje correcto" para el análisis y la ciencia de datos. Ahora en este artículo no hablaremos de una introducción histórica sobre el creador de Python o de R; aunque es información interesante, no ayuda a tomar una decisión. Además, una comparación extensa que incluye diferencias como Python es una programación orientada a objetos y R es un lenguaje funcional. Esto no significa nada para alguien nuevo en el campo. E independientemente, para muchos esto es irrelevante. Es como comparar el propósito del idioma español con el inglés; ¿Conocer estas diferencias te ayuda a elegir?
R es un lenguaje de programación y también un programa (software) que se usa principalmente para análisis de datos, estadística y gráficos. Es muy popular entre científicos, analistas y personas que trabajan con muchos datos, porque permite hacer cálculos complejos y crear gráficos de alta calidad de forma relativamente fácil.
Con R, puedes desde hacer una simple suma de datos hasta construir modelos estadísticos avanzados o visualizar información con gráficos muy detallados. Es muy usado en áreas como la ciencia, la economía, la medicina y cualquier lugar donde sea importante entender grandes cantidades de información.
Python es un lenguaje de programación que fue creado para ser fácil de leer y de usar, incluso para quienes están empezando a aprender a programar. Su estilo simple hace que escribir código en Python sea parecido a escribir instrucciones en inglés. Esto lo ha convertido en uno de los lenguajes más populares en el mundo.
¿Para qué sirve Python? Sirve para muchísimas cosas: crear páginas web, construir aplicaciones, analizar datos, hacer inteligencia artificial, automatizar tareas repetitivas, programar videojuegos y mucho más. Además, como tiene miles de librerías ya hechas (pequeños paquetes de funciones), permite trabajar en proyectos grandes sin tener que empezar todo desde cero.
R y Python son dos de las herramientas más usadas para analizar datos, pero tienen diferencias importantes:
R fue creado específicamente para estadística y análisis de datos. Es ideal cuando quieres hacer análisis estadísticos muy complejos o crear gráficos detallados de manera rápida. Muchos científicos, matemáticos y académicos prefieren R porque ya tiene muchísimas funciones estadísticas listas para usar.
Python, en cambio, es un lenguaje más general. No fue hecho solo para datos, pero gracias a librerías como Pandas, NumPy, Matplotlib y Scikit-learn, se ha vuelto muy poderoso para análisis de datos, machine learning e inteligencia artificial. Python además es más flexible para combinar el análisis de datos con la creación de aplicaciones web, automatización, inteligencia artificial y mucho más.
Otros post se centran en una demostración de cómo se ve el código de R contra python, a menudo comparando su longitud y el tiempo que lleva ejecutar el código. A menudo, la conclusión es que para algunas cosas un lenguaje necesita más líneas de código y en otras situaciones ocurre lo contrario, mientras que la diferencia en el tiempo de ejecución suele ser de segundos. Pero ninguna de estas cosas es significativa. Para ejemplificarlo, si supieras que la palabra alemana más larga tiene 42 letras en comparación con la palabra española que tiene 32 letras, ¿esto te ayudará a elegir un idioma?
Por esa razón y muchas otras más no menos importantes, es que te recomendamos este curso de python profesional, el cual lo imparten de manera presencial o en linea, con instructores expertos en este lenguaje de programación.
También suelen incluir un gráfico que muestra los lenguajes más comunes, donde Python aparece mucho más arriba en la lista, y clasificaciones como esta que a menudo colocan a Python en la cima. Esto es engañoso porque los lenguajes de programación se utilizan para algo más que ciencia de datos, y Python se puede utilizar para el desarrollo de software, por lo que parece ser más popular, ya que es algo así como una navaja suiza.
Comparaciones de curvas de aprendizaje en las que, dependiendo de dónde lea, la respuesta es Python o R, que es mucho más simple. Pero la decisión no debe basarse en la simplicidad, sino en un propósito.
Y la parte favorita de estos artículos es la conclusión de que aprender ambos no le hace mal a nadie, porque es mejor tener más habilidades. Podemos ver el atractivo de saber más lenguajes, pero esto no ayuda a dar el primer paso.
Un post de este tipo sin duda fue un artículo útil porque el autor analizó las ofertas de trabajo y las palabras asociadas con mayor frecuencia con R contra python. La conclusión más importante es que si desea trabajar en investigación, es mejor que aprenda R. Esto tiene sentido, ya que R fue desarrollado por estadísticos, por lo que cualquier trabajo que requiera un análisis e investigación extensos utiliza este lenguaje. Por el contrario, Python fue desarrollado por un científico informático. Aunque este consejo es útil, la tecnología ha avanzado y hay formas de colaborar al codificar en diferentes lenguajes. Y aún más, aquí hay una lista de empresas que usan R (incluye Facebook, Amazon, Google que también usan Python, por lo que R no solo se usa en el mundo académico).
Diseño Web Grupo Codesi