2022.05.09 - [분류 전체보기] - Flume Flume 연속적으로 생성되는 데이터 스트림을 수집 및 전송하고 HDFS에 저장할 수 있는 도구이다. 로그파일, 소셜 미디어 데이터, 이메일 메시지 등 다양한 데이터를 다룬다. Flume의 구성요소는 다음과 malachai.tistory.com 2022.05.09 - [분류 전체보기] - Sqoop Sqoop RDBMS와 HDFS 간의 효율적인 대용량 bulk 데이터 전송을 지원해주는 도구이다. MS SQL, PostgreSQL, MySQL, Oracle 등 JDBC와 호환되는 모든 RDBMS에 사용이 가능하다. Sqoop은 Hadoop 내에서 실행되는데, Sqoop I.. malachai.tistory.com 2022.05.09 - [분류 전체보기..