Las 5 principales API de datos geoespaciales para análisis avanzado | de Amanda Iglesias Moreno | octubre 2024

Las 5 principales API de datos geoespaciales para análisis avanzado | de Amanda Iglesias Moreno | octubre 2024

Explore Overpass, Geoapify, Distancematrix.ai, Amadeus y Mapillary para obtener mapas avanzados y datos de ubicación Kyle Glenn en Unsplash (Fuente: https://unsplash.com/es/@kylejglenn) Los datos geográficos son importantes en muchos análisis porque nos permiten tomar decisiones basadas en la ubicación y los patrones espaciales.. Ejemplos de proyectos en los que los datos geográficos pueden resultar útiles incluyen…

Leer más
Pruebas efectivas de canalizaciones ETL con Python | de Robin von Malottki | octubre 2024

Pruebas efectivas de canalizaciones ETL con Python | de Robin von Malottki | octubre 2024

Cómo detectar instantáneamente problemas de calidad de datos e identificar sus causas Foto por error digital y obtenido de Pexels.com En el mundo actual impulsado por los datos, las organizaciones dependen en gran medida de datos precisos para tomar decisiones comerciales críticas. Como ingeniero de datos responsable y confiable, garantizar la calidad de los datos…

Leer más
Prepare los datos de texto para la IA. Una introducción al uso de soluciones sin código | por Brian Perron, Ph.D. octubre 2024

Prepare los datos de texto para la IA. Una introducción al uso de soluciones sin código | por Brian Perron, Ph.D. octubre 2024

Una introducción al uso de soluciones sin código Gráfico que muestra el procesamiento de datos desordenados. Imagen del autor usando ChatGPT-4o. La gente utiliza grandes modelos de lenguaje para realizar diversas tareas con datos de texto de diferentes fuentes. Estas tareas pueden incluir (entre otras) editar, resumir, traducir o extraer texto. Uno de los principales…

Leer más
5 clics para sorprender: cómo cambiar los tipos de datos puede optimizar rápidamente su modelo de Power BI | de Nikola Ilic | octubre 2024

5 clics para sorprender: cómo cambiar los tipos de datos puede optimizar rápidamente su modelo de Power BI | de Nikola Ilic | octubre 2024

Optimizar el modelo semántico de Power BI no siempre tiene por qué ser una tarea desalentadora y que requiere mucho tiempo. ¡A menudo puedes celebrar muchas victorias rápidas y fáciles! Imagen del autor Hace unas semanas, me encargaron la tarea de optimizar un informe de Power BI de rendimiento lento. Por supuesto, puede haber docenas…

Leer más
Cómo manejar conjuntos de datos desequilibrados en proyectos de aprendizaje automático | de Jiayan Yin | octubre 2024

Cómo manejar conjuntos de datos desequilibrados en proyectos de aprendizaje automático | de Jiayan Yin | octubre 2024

Técnicas para manejar conjuntos de datos desequilibrados, ejemplos y fragmentos de Python Foto por Nick Fewings seguro desempaquetar Imagine que ha entrenado un modelo predictivo con una puntuación de precisión de hasta 0,9. Las métricas de evaluación como la precisión, la recuperación y la puntuación f1 también parecen prometedoras. Pero tu experiencia e intuición te…

Leer más
5 técnicas esenciales para dominar el análisis de series temporales | de Sara Nóbrega | Septiembre 2024

5 técnicas esenciales para dominar el análisis de series temporales | de Sara Nóbrega | Septiembre 2024

¡Mejore sus predicciones de aprendizaje automático con división precisa de datos, validación cruzada de series temporales, ingeniería de funciones y más! Fuente: Dall-E. (Sí, intenté generar gráficos de series temporales con una herramienta de inteligencia artificial. De hecho, estoy sorprendido por el resultado). Analizar datos de series temporales, la mayoría de las veces, no es…

Leer más
GenAI con Python: Crea agentes desde cero (Tutorial completo) | de Mauro Di Pietro | Septiembre 2024

GenAI con Python: Crea agentes desde cero (Tutorial completo) | de Mauro Di Pietro | Septiembre 2024

con Ollama, LangChain, LangGraph (sin GPU, sin APIKEY) 15 minutos de lectura · hace 11 horas Foto por Mateo popa seguro desempaquetar (Todas las imágenes son del autor a menos que se indique lo contrario) Introducción Ingeniería rápida es la práctica de diseñar y refinar indicaciones (entradas de texto) para mejorar el comportamiento de modelos…

Leer más
Explorando el vínculo entre los trastornos del sueño y los indicadores de salud | de María Ara | Septiembre 2024

Explorando el vínculo entre los trastornos del sueño y los indicadores de salud | de María Ara | Septiembre 2024

Un análisis de Python de los datos de salud de MIMIC-IV (DREAMT) para descubrir información sobre los factores que afectan los trastornos del sueño. Foto por Benjamín Voros seguro desempaquetar En este artículo, analizaré la información de los participantes del conjunto de datos DREAMED para descubrir las relaciones entre los trastornos del sueño como la…

Leer más
La ciencia de datos se encuentra con la política. Desenredando la dinámica del Congreso con… | de Luiz Venosa | Septiembre 2024

La ciencia de datos se encuentra con la política. Desenredando la dinámica del Congreso con… | de Luiz Venosa | Septiembre 2024

Primero, necesitamos datos. Descargué datos sobre cada ley aprobada y cómo votó cada miembro del Congreso desde 2023 a 2024 hasta el 18 de mayo. Todos los datos disponibles en Brasil Cel portal de datos abiertos del congreso. Luego creé dos marcos de datos de pandas diferentes, uno con todas las leyes aprobadas y otro…

Leer más