Lanzan Apache Arrow 4.0

El equipo de Apache Arrow anunció una nueva la versión de Apache Arrow. Más en concreto, la versión de Apache Arrow 4.0.0.

Esta nueva versión cubre 3 meses de trabajo y desarrollo, en las que se incluyen hasta 711 problemas resueltos de 114 colaboradores diferentes.

Se han realizado muchas correcciones de errores y mejoras: Si lo deseas, puedes tener acceso al registro completo de los cambios.

A continuación, comparto una pequeña introducción a Apache Arrow para quién no lo conozca y desee investigar un poco más sobre el proyecto.

¿Qué es Apache Arrow?

Apache Arrow es una plataforma de desarrollo de software para crear aplicaciones de alto rendimiento que procesan y transportan grandes conjuntos de datos.

Está diseñado para mejorar el rendimiento de los algoritmos analíticos y la eficiencia de mover datos de un sistema o lenguaje de programación a otro.

Un componente crítico de Apache Arrow es su formato de columnas en memoria, una especificación estandarizada independiente del lenguaje para representar conjuntos de datos estructurados en memoria en forma de tabla.

Este formato de datos tiene un rico sistema de tipos de datos (incluidos tipos de datos anidados y definidos por el usuario) diseñado para satisfacer las necesidades de los sistemas de bases de datos analíticas, bibliotecas de frameworks de datos y más.

¿Qué bibliotecas de Apache Arrow existen?

El proyecto Arrow contiene bibliotecas que permiten trabajar con datos en formato de columnas Arrow en muchos idiomas.

Las bibliotecas C++, C #, Go, Java, JavaScript, Julia y Rust contienen distintas implementaciones del formato Arrow.

Estas bibliotecas se someten a pruebas de integración entre sí para garantizar su fidelidad al formato.

Además, las bibliotecas Arrow para C (Glib), MATLAB, Python, R y Ruby se construyen sobre la biblioteca de C++.

Estas bibliotecas oficiales permiten que los proyectos de terceros funcionen con datos de Arrow sin tener que implementar el formato de columnas de Arrow ellos mismos.

También contienen muchos componentes de software que ayudan con los problemas del sistema relacionados con la entrada y salida de datos de los sistemas de almacenamiento remoto y el movimiento de datos con formato Arrow a través de las interfaces de red, entre otros posibles casos de uso.

? CONOCE MÁS SOBRE EL PROYECTO APACHE ARROW

? VISITA EL REPOSITORIO OFICIAL DE APACHE ARROW

Fuente: Apache Arrow

Relacionado

Storm (Procesador de Eventos)

Apache Storm es un framework de cálculo de procesamiento de flujo distribuido escrito principalmente en el lenguaje de programación Clojure. Originalmente creado por Nathan Marz y el equipo de BackType, el proyecto fue de código abierto después de ser adquirido por Twitter. Utiliza "spouts" y "bolts" creados a medida para definir las fuentes de información y las manipulaciones para permitir el procesamiento por lotes y distribuido ¡SEGUIR LEYENDO!

Scala 3: Lanzan una nueva versión del lenguaje de programación Scala

Después de 8 años de trabajo, 28.000 confirmaciones, 7.400 solicitudes de extracción y 4.100 problemas cerrados: Se lanza Scala 3. Desde 2012, más de un centenar de personas han contribuido al proyecto. Scala 3 incorpora las últimas investigaciones en teoría de tipos, así como todo lo mejor de Scala 2. Hablemos de Scala 3 Vas a encontrar muchas nuevas características en Scala 3 y el lugar ¡SEGUIR LEYENDO!

Lanzan una nueva versión de NodeJS: Node.js 16 disponible

El equipo de Node JS anunció hoy, una nueva versión de Node JS, la versión de NodeJS 16. Esta nueva versión, estará en vigor durante los próximos 6 meses y posteriormente, se promoverá a Soporte a largo plazo (LTS) en Octubre de 2021. Tras, el lanzamiento de NodeJS 15 en Octubre de 2020, ya tenemos aquí una nueva actualización. Desde el equipo de Node, nos dejan ¡SEGUIR LEYENDO!

Lanzan Sublime Text 4

El equipo de Sublime Text ha lanzado la primera versión estable de Sublime Text 4. Sublime Text es, sin lugar a dudas, uno de los editores de texto más queridos por los desarrolladores y sobre todo, entre los usuarios de Linux. Sublime Text 4 from Sublime HQ on Vimeo. Entre los cambios más importantes, se incluyen: La selección múltiple de pestañas, la compatibilidad con las compilaciones ¡SEGUIR LEYENDO!

Lanzan Flask 2.0, Jinja y más

El equipo de Pallets Proyects encargados de mantener un grupo de muy interesantes proyectos, entre ellos, interesantes proyectos para Python. Como son el framework de Python: Flask. Conjunto a sus proyectos adjuntos: Jinja, Click, Werzeug, ItsDangerous y MarkupSafe. Flask: Framework de desarrollo web para Python. Jinja: Es un motor de creación de plantillas para Python. Click: Un paquete de Python para la creación de interfaz de ¡SEGUIR LEYENDO!

Salir de la versión móvil