다른 서버에 로그 파일이 있고 (5 개의 서버가 LAN을 통해 연결됨) 결과를 처리하고 가져와야합니다.
모든 로그 파일을 caseesndra에로드 한 다음 쿼리하면 어떻게됩니까 (미리로드 할 수 있음)? 빠른 방법은 ..?
HDFS 와 Cassandra 는 각각 고유 한 장점이 있습니다.
모든 로그 파일을 완전히 처리해야하는 경우 HDFS 는 파일 시스템 이고 대량의 데이터를 저장하고 일괄 처리하도록 설계 되었기 때문에 더 나은 선택 입니다.
이제 로그 파일 의 일부만 처리해야하는 경우 기본 키로 데이터를 필터링하고 더 빠르게 액세스 할 수 있으며 모든 파일을 스캔하는 것을 건너 뛸 수 있으므로 Cassandra 와 같은 데이터 저장소 가 더 나은 선택입니다.
Cassandra 는 OLTP 워크로드 용으로 설계되었지만 HDFS 및 종류는 OLAP 워크로드 용으로 설계되었습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다