<개요>
- Apache NiFi를 사용하다 보면 디스크 용량을 많이 차지하는 것을 볼 수 있다.
- 이유는 DataFlow상에서 각 Processor를 거칠때 마다 모든 내용을 다 저장하기 때문이다.
- 이러한 내용들도 결국 어딘가에 다 저장될 텐데 NiFi에서는 Repositories 라는 논리적 개념을 통해서 이를 정리하고 있다.
<내용>
- The FlowFile Repository : 현재 흐름상에 있는 FlowFiles들의 Metadata를 저장한다.
- The Content Repository : 현재 흐름상에 있는 Contents와 과거 FlowFiles를 저장한다.
- The Provenance Repository : FlowFiles들의 history를 저장한다.
이러한 각 Repository들을 통해서 Nifi가 어떻게 Data Flow를 처리하고, 각 Transcation들을 보장하며 메모리와 디스크를 어떻게 사용하고 Log를 관리하고 활용하는지를 더 자세하게 살펴볼 예정이다.
1. FlowFile Repository
2. Content Repository
3. Provenance Repository
<참조사이트>
https://nifi.apache.org/docs/nifi-docs/html/nifi-in-depth.html#repositories
'Software Architecture' 카테고리의 다른 글
Algorithm In Architecture #1 (Start) (0) | 2019.10.30 |
---|---|
Reactive Programming #1 (관련 개념정리) (0) | 2018.10.17 |
Apache NiFi In Depth #2 (Copy on write) (0) | 2017.11.02 |
Data 수집 아키텍처 (0) | 2016.03.13 |
소프트웨어 아키텍처와 가장 연관이 있는 것은 조직과 문화 (0) | 2015.08.27 |