Sitio optimizado para Tabletas y PCs. No para Teléfonos Móviles.

python-logo Publicaciones en Python


  • 2023-02-27

    Pandas es una librería de Python especializada en el manejo y análisis de estructuras de datos. En este artículo encontrarás la guía más completa de sus funciones para la manipulación de datos... Continuar leyendo.

  • 2023-01-15

    Uso de Tablas pivote en Pandas para el manejo y análisis de estructuras de datos. En este artículo encontrarás una guía completa para la manipulación de datos... Continuar leyendo.

  • 2023-01-10

    En la ciencia de datos, una tarea común es la detección de anomalías, es decir, comprender si una observación es "inusual". En primer lugar, ¿qué significa ser inusual? En este artículo vamos a inspeccionar tres formas diferentes en las que una observación puede ser inusual... Continuar leyendo.

  • 2022-12-20

    Es posible que hayas intentado utilizar gráficos con FacetGrid, son hermosos, flexibles pero pueden ser difíciles de configurar, si eres analista de datos o científico de datos, necesitas compartir información y, a veces, debe hacerlo rápidamente... Continuar leyendo.

  • 2022-11-10

    Este caso de estudio tiene como objetivo crear gráficos para respaldar el proceso de ciencia de datos. Las visualizaciones se pueden utilizar durante el análisis exploratorio, antes o después del procesamiento de datos, para construir gráficos estadísticos para el análisis de conjuntos de datos, identificar relaciones de variables o evaluar la distribución de datos... Continuar leyendo.

  • 2022-10-20

    La Programación Orientada a Objetos (OOP en Python) nos permite diseñar programas usando objetos y clases. Este principio une los datos y las funciones relacionadas. C++, C#, Python y Java son algunos de los lenguajes de programación orientada a objetos... Continuar leyendo.

  • 2022-10-02

    La visualización de datos es la forma más cómoda e intuitiva para que el cerebro humano comprenda de manera efectiva cualquier información. Para cualquier persona que trabaje con datos, la capacidad de crear hermosas visualizaciones intuitivas es una habilidad muy importante para poder transmitir los hallazgos e impulsar acciones de manera efectiva... Continuar leyendo.

  • 2022-09-20

    La probabilidad es el concepto central fundamental que se encuentra en la ciencia de datos, y la distribución de probabilidad es el tema principal en probabilidad. Por lo tanto, para dominar la ciencia de datos, ¡debe familiarizarse y sentirse cómodo con esas 10 distribuciones de probabilidad!... Continuar leyendo.

  • 2022-08-05

    Realizaremos el análisis del conjunto de datos que contiene seis países diferentes con sus Productos Internos Brutos (PIB) y Expectativas de Vida para los años 2000 a 2015, exploraremos el conjunto de datos, utilizando visualizaciones para comprender mejor la información proporcionada... Continuar leyendo.

  • 2022-07-10

    La detección de anomalías o novedades es aplicable en una amplia gama de situaciones en las que se requiere una advertencia clara y temprana de una condición anormal, como datos de sensores, operaciones de seguridad y detección de fraude, entre otros... Continuar leyendo.

  • 2022-06-02

    Los datos son el combustible en los proyectos de Data Science. Pero, ¿y si las observaciones son escasas, caras o difíciles de medir? Los datos sintéticos pueden ser la solución... Continuar leyendo.

  • 2022-05-15

    Gracias a la sensibilidad del Análisis de Componentes Principales (PCA), se puede utilizar para detectar valores atípicos en conjuntos de datos multivariados, haciendo uso de los métodos T2 y SPE/DmodX de Hotelling.... Continuar leyendo.

  • 2022-04-10

    Tener una buena idea de un nuevo conjunto de datos no siempre es fácil y lleva tiempo. Sin embargo, un buen y amplio análisis exploratorio de datos puede ayudar mucho a comprender su conjunto de datos, tener una idea de cómo están conectadas las cosas y qué se debe hacer para procesar adecuadamente su conjunto de datos... Continuar leyendo.

  • 2022-03-03

    Hay mucho más en el análisis de componentes principales, más allá del contenido de este artículo, por lo que la única manera de apreciar verdaderamente la belleza de este es experimentarlo por usted mismo. Por lo tanto, vamos a compartir algunos fragmentos de código aquí para cualquiera que quiera probarlo... Continuar leyendo.

  • 2022-02-28

    Valores de Explicación de Características Shapley (SHAP), En este caso práctico se profundizarán los conocimientos de los valores de explicación de características Shapley, mejor conocidos como SHAP, este tema había sido tratado en una anterior publicación de manera general, para revisar dicho artículo... Continuar leyendo.

  • 2022-01-31

    En este caso práctico se analizará la rotación de empleados de una Empresa, se establecerá una hipótesis del por qué los empleados abandonan la Empresa a través de los datos actuales y realizarán predicciones de cuantos empleados posiblemente abandonarán su cargo... Continuar leyendo.

  • 2021-12-19

    Mucha gente dice que los modelos de aprendizaje automático son "cajas negras", en el sentido de que pueden hacer buenas predicciones, pero no se puede entender la lógica detrás de esas predicciones. Esta afirmación es cierta en el sentido... Continuar leyendo.

  • 2021-02-28

    Utilizaremos el siguiente caso de ejemplo. Un familiar ha ganado millones de dólares especulando con bienes raíces. Se ha ofrecido a convertirse en socio comercial con nosotros debido a su interés en la ciencia de datos. Él proporcionará el dinero y nosotros proporcionaremos... Continuar leyendo.

  • 2021-02-15

    En el siguiente caso de uso, se desea predecir el precio de una vivienda mediante el uso de funciones independientes o variables como promedio de renta de las personas, población de la zona y edad de la vivienda. Se determinará si las variables independientes fluctúan... Continuar leyendo.

  • 2021-02-10

    En este artículo mostraremos el proceso Exploratory Data Analysis (EDA) con técnicas de visualización para analizar si una muestra de agua con cierto contenido es potable o no. Este proceso se implementa en el lenguaje de programación Python... Continuar leyendo.

  • 2021-01-20

    La detección de valores atípicos en datos multivariados a menudo puede ser uno de los desafíos de la fase de preprocesamiento de datos, existen varias métricas, puntuaciones y técnicas para detectar valores atípicos... Continuar leyendo.

  • 2021-01-16

    En este artículo les enseñaremos como generar gráficos llamativos para la representación gráfica de sus datos a través de las librerías de Python: Matplotlib y Seaborn. Para este ejercicio... Continuar leyendo.

  • 2021-01-12

    La regresión lineal univariada se basa en determinar la relación entre una variable independiente (variable explicativa) y una variable dependiente. Para demostrarlo realizaremos un ejemplo donde el modelo realizará predicciones en la puntuación de un estudiante... Continuar leyendo.

  • 2021-01-06

    En este artículo se creará un modelo de aprendizaje automático simple, usando un conjunto de datos para predecir el tamaño de la tripulación de un barco, este proyecto está organizado de la siguiente... Continuar leyendo.

  • 2021-01-04

    Una de las maneras de predicción más antigua y básica es la regresión lineal, aún hoy día se utiliza ampliamente en muchos campos diferentes para extrapolar e interpolar datos. En este artículo, explicaremos los conceptos básicos de cómo... Continuar leyendo.

  • 2020-12-23

    En este artículo les enseñaremos como es posible obtener gráficos directamente desde la librería Pandas, por lo general la librería más utilizada para este fin es la de Matplotlib... Continuar leyendo.

  • 2020-12-19

    Función concat() que debes conocer para acelerar tus análisis de datos. Pandas proporciona varias funciones integradas para combinar fácilmente conjuntos de datos. Entre ello... Continuar leyendo.

  • 2020-12-17

    Como ya sabemos la librería de Python más popular utilizada por quienes trabajan con datos es Pandas, una librería de análisis y manipulación de datos fácil y flexible. existe una gran cantidad de métodos... Continuar leyendo.

  • 2020-12-15

    Una función para resumen y análisis de datos. Groupby es una función muy popular en Pandas. Es especialmente buena para resumir, transformar, filtrar y en algunas ocasiones para el análisis de datos muy esenciales... Continuar leyendo.

  • 2020-12-13

    La librería de análisis de datos más popular. Pandas es una de las librerías de ciencia de datos más populares, sin ningún tipo de duda. Ha existido desde hace bastante tiempo... Continuar leyendo.

  • 2020-12-11

    En esta publicación se mostrarán las maneras más simples de personalizar los gráficos para hacerlos más agradables estéticamente, esperamos que estos sencillos trucos le ayuden a elaborar gráficos más llamativos y le ahorre tiempo en ajustar gráficos individuales... Continuar leyendo.

  • 2020-12-09

    En este artículo, se repasarán dos conceptos importantes de la estadística descriptiva: La Asimetría y la Curtosis, al concluir este artículo se obtendrán respuestas a preguntas como, ¿qué es asimetría derec... Continuar leyendo.

  • 2020-12-07

    Walmart, es una cadena de tiendas minoristas líder en los EE.UU., la empresa desea predecir las ventas de productos en sus tiendas con cierta precisión. Ciertos eventos y días festivos afectan las ventas de cada día. Se tienen disponible... Continuar leyendo.

  • 2020-12-06

    Cuando comencé a estudiar sobre aprendizaje automático, solía leer blogs, ver el videos, en todos estos señalaban que el EDA es uno de los pasos esenciales, esto plantea una pregunta, ¿por qué?. Imagina que planeas comprar algún producto... Continuar leyendo.

  • 2020-12-05

    Vivir en Nueva York puede ser caro, pero ¿cuánto de caro exactamente?, en este artículo simple, encontraremos la media, la mediana y la moda de los cinco distritos de Nueva York: Brooklyn, Manhattan y Queens... Continuar leyendo.

  • 2020-12-02

    En este apartado se analizarán los precios de las acciones de tres empresas: Amazon (AMZN), Google (GOOGL) y Apple (AAPL). Se realizará un análisis de datos exploratorio simple de estas acciones mediante la generación... Continuar leyendo.

  • 2020-11-25

    El análisis exploratorio de datos nos permite entender mejor los datos proporcionados para que podamos encontrar algo de sentido en estos. En estadística, el análisis de datos exploratorios es un enfoque para... Continuar leyendo.

r-logo Publicaciones en R


  • 2020-05-31

    Vivir en Nueva York puede ser caro, pero ¿cuánto de caro exactamente?, en este artículo simple, encontraremos la media, la mediana y la moda de los cinco distritos de Nueva York: Brooklyn, Manhattan y Queens... Continuar leyendo.

  • 2020-05-29

    El ggplot2 es una de las librerías de trazado más populares que se pueden aprovechar para obtener hermosos gráficos listos para publicación. El problema surge cuando desea combinar sus múltiples parcelas juntas... Continuar leyendo.

  • 2020-05-27

    En este apartado se realizará un procedimiento de exploración rápido de los datos contenidos en un dataset especialmente seleccionado para dicho fin, en donde se podrán observar los diferentes tipos de variables para su identificación... Continuar leyendo.

  • 2020-05-25

    Introducción : La correlación es una medida estadística que indica la medida en que dos o más variables fluctúan juntas. La correlación positiva indica el grado en que esas variables aumentan o disminuyen... Continuar leyendo.

General

Cómo convertirse en un profesional de datos

Publicado el: 23 de Noviembre del 2020

Probablemente la mayoría de ustedes haya oído hablar de la publicación de Harvard Business Review llamada: "Científico de datos: el trabajo más sexy del siglo XXI", hay otras publicaciones científicas y comerciales... Continuar leyendo.

Acerca

Soy un Profesional con Master en Big Data e Inteligencia de Negocios, Master en Administración de Empresas (MBA), y profesional de la Ingeniería Industrial con una inmensa pasión por el análisis, transformación, interpretación, y visualización de datos.

En mi preparación académica como analista de datos e inteligencia de negocios, he adquirido conocimientos y habilidades utilizando lenguajes de bases de datos SQL y NoSQL, minería de datos a través de Orange de código abierto como recurso de visualización, creación de modelos estadísticos para predicción de eventos a través del lenguaje de programación R, creación y administración de redes neuronales a través de lenguaje de programación Python, además el uso técnicas de aprendizaje automático para construir modelos de clasificación y predicción, análisis de resultados y visualización de datos utilizando herramientas de visualización como Microsoft Power BI, Tableau, y mejora de calidad de datos a través de herramientas como Talend y Trifacta.

Me describo personalmente como una persona exigente y precisa, con fuerte actitud de resolución de problemas, automotivada, positiva, concienzuda y organizada, con amplia experiencia trabajando en ambientes con equipos de gran número de integrantes e independiente.