Software Architecture
Apache Nifi In Depth #1 (Repositories)
멋진그이름
2018. 10. 11. 15:57
<개요>
- Apache NiFi를 사용하다 보면 디스크 용량을 많이 차지하는 것을 볼 수 있다.
- 이유는 DataFlow상에서 각 Processor를 거칠때 마다 모든 내용을 다 저장하기 때문이다.
- 이러한 내용들도 결국 어딘가에 다 저장될 텐데 NiFi에서는 Repositories 라는 논리적 개념을 통해서 이를 정리하고 있다.
<내용>
- The FlowFile Repository : 현재 흐름상에 있는 FlowFiles들의 Metadata를 저장한다.
- The Content Repository : 현재 흐름상에 있는 Contents와 과거 FlowFiles를 저장한다.
- The Provenance Repository : FlowFiles들의 history를 저장한다.
이러한 각 Repository들을 통해서 Nifi가 어떻게 Data Flow를 처리하고, 각 Transcation들을 보장하며 메모리와 디스크를 어떻게 사용하고 Log를 관리하고 활용하는지를 더 자세하게 살펴볼 예정이다.
1. FlowFile Repository
2. Content Repository
3. Provenance Repository
<참조사이트>
https://nifi.apache.org/docs/nifi-docs/html/nifi-in-depth.html#repositories