#ApacheHadoop

khushnumakhushnuma
2024-12-04

In the world of data science, raw data serves as the foundation for generating actionable insights. However, managing, processing, and transforming this data into a usable format requires specialized tools.

read more: reshukhushi.wordpress.com/2024

2024-08-21

Podcast "Techtiefen": Big Data auf Kubernetes mit Stackable

Für diese Podcast-Episode hat sich Nico Kreiling Lars Francke eingeladen. Sie schauen auf frühere Hadoop-Zeiten und moderne Datenverarbeitung.

heise.de/blog/Podcast-Techtief

#ApacheHadoop #BigData #CloudComputing #Containerisierung #Kubernetes #news

Doug Whitfield [Minneapolis]musicman
2024-01-25

I hope we open source some of the work we are doing because Dark Lord knows this is harder than it should be.

🛡 H3lium@infosec.exchange/:~# :blinking_cursor:​H3liumb0y@infosec.exchange
2024-01-12

"⚠️ New Cyber Threat Alert: Apache Hadoop & Flink Under Siege 🔒"

Researchers at Aqua Nautilus have identified a new cyberattack targeting Apache Hadoop and Flink applications. Attackers exploit misconfigurations in the YARN's (Yet Another Resource Negotiator) Resource Manager to deploy malware and cryptocurrency miners. This stealth approach is a significant challenge for traditional security defenses, highlighting the need for robust configurations and monitoring in Apache applications.

Source: Aqua Security Blog

Tags: #Cybersecurity #ApacheHadoop #ApacheFlink #Malware #Rootkits #SecurityDefense #InfoSec 🚨🖥️🔐

Authors: Nitzan Yaakov & Assaf Morag

Chris K Wenselcwensel@fosstodon.org
2023-06-15

For those a little familiar with Cascading, in #java, it was originally designed to run on #ApacheHadoop, and then #ApacheTez, but it also has a local planner.

This lets developers create non-clustered data applications, without the Hadoop/Tez etc dependencies or runtime.

I've been using the local planner in production for over 5 years now.

But Parquet requires Hadoop libraries, and this is ok, there is a shim between the libraries that allow Parquet and S3AFileSystem to be used locally.

Chris K Wenselcwensel@fosstodon.org
2023-06-15

A little more color on this announcement..
fosstodon.org/@cwensel/1105490

First, #ApacheParquet removed #Cascading support, so I had to splice the original source into Cascading. But the ParquetScheme didn't honor type information fully. So there is a new TypedParquetScheme that has native support for JSON and Timestamps.

Second, Parquet requires the #ApacheHadoop FileSystem, which means we get the wonderful S3A implementation. But we also get a 331MB jar dependency with the aws bundle.

heise online (inoffiziell)heiseonline@squeet.me
2022-03-24
Apache Drill bringt eine Rückportierung zu Hadoop 2 und eine Anbindung an die Datenbank-Engine Apache Phoenix. Auch neue Dateiformate sind nun möglich.
SQL-Engine: Apache Drill 1.20 abwärtskompatibel zu Hadoop 2
heise online (inoffiziell)heiseonline@squeet.me
2021-07-20
Das Update der Plattform zur Datenflussautomatisierung legt den Fokus auf sichere Grundeinstellungen und bietet erweiterte Security-Optionen.
Big Data: Apache NiFi 1.14 arbeitet sicherer
heise online (inoffiziell)heiseonline@squeet.me
2021-07-19
Das neue Release der analytischen Datenbank sieht einige Änderungen bei Authentifizierung und Autorisierung vor, darunter die Integration mit Apache Knox.
Hadoop: Apache Impala 4.0 mit erweitertem Multithreading
heise online (inoffiziell)heiseonline@squeet.me
2021-06-02
Die Private-Equity-Firmen KKR und Clayton, Dubilier & Rice sollen Cloudera den Weg zu mehr Kunden und produktgetriebenem Wachstum weisen. Hadoop-Pionier Cloudera will sich abseits der Börse neu positionieren
heise online (inoffiziell)heiseonline@squeet.me
2021-04-09
Die ASF hat zahlreiche Projekte endgültig in den Ruhestand geschickt. Apache Falcon benötigte knapp zwei Jahre für den Weg auf den Dachboden. Apache Software Foundation räumt beim großen Frühjahrsputz auf
heise online (inoffiziell)heiseonline@squeet.me
2020-07-20
Das Governance- und Metadaten-Framework für Hadoop liegt in Version 2.1 vor, mit Verbesserungen bei der Suche und Performance.
Apache Atlas 2.1 bietet verbesserte Entity-Verwaltung dank Labels
#ApacheAtlas #ApacheHadoop #ApacheSoftwareFoundation #Governance
heise online (inoffiziell)heiseonline@squeet.me
2020-06-05
Apache Hudi, ein Tool zum Verwalten großer Datenströme, hat die Bewährungsphase im Apache Incubator abgeschlossen.
Apache Software Foundation erhebt Hudi zum Top-Level-Projekt
#ApacheHadoop #ApacheHudi #ApacheSoftwareFoundation #Top-Level-Projekt
heise online (inoffiziell)heiseonline@squeet.me
2018-04-10
Zahlreiche Fehlerbereinigungen und neue Funktionen sollen Hadoop 3.1 für Microservices und die Anbindung containerisierter Anwendungen optimieren. Für den produktiven Einsatz ist das Release jedoch noch nicht freigegeben. www.heise.de/developer/meldung… #Apache #ApacheHadoop #BigData #HDFS #YARN
heise online (inoffiziell)heiseonline@squeet.me
2018-02-08
Die Schnittstelle für Hadoop-Cluster gilt nun als reif für den produktiven Einsatz. Sie verbindet einen Proxy mit Diensten zur Authentifizierung und Clientschnittstellen. Einige Plattformen haben Knox bereits vor dem 1.0-Release an Bord genommen. www.heise.de/developer/meldung #ApacheHadoop #ApacheKnox #Authentifizierung #RESTAPI
heise online (inoffiziell)heiseonline@squeet.me
2018-01-22
Eine Einführung in die Installation und Konfiguration von Hadoop bringt ein Seminar am 15./16. März in Hannover. www.heise.de/ix/meldung/iX-Wor #ApacheHadoop #BigData
heise online (inoffiziell)heiseonline@squeet.me
2017-12-14
Eine neues Encoding für HDFS reduziert den Speicherbedarf, und YARN Timeline Service v.2 erweitert die im YARN Timeline Server eingeführten Dienste zum Speichern anwendungsspezifischer Informationen. www.heise.de/developer/meldung #Apache #ApacheHadoop #BigData #HDFS #YARN

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst