kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),有如下特性:

1. 通過O(1)的磁盤數據結構提供消息的持久化,這種結構對于即使數以TB的消息存儲也能夠保持長時間的穩(wěn)定性能。

2 .高吞吐量:即使是非常普通的硬件kafka也可以支持每秒數十萬的消息。

3 .支持通過kafka服務器和消費機集群來分區(qū)消息。

4 .支持Hadoop并行數據加載。

 本篇屬于大數據技術-> kafka 系列的開篇,本文從以下幾個基礎層面概述Kafka的知識點,后續(xù)在針對于單個的技術點擴展每篇博文。

  • Kafka背景介紹

  • Kafka基本架構組件

  • Kafka設計原理

  • Kafka用途


一:Kafka背景介紹

Kafka是一種高吞吐量的,分布式,快速、可擴展的,分區(qū)和可復制,基于發(fā)布/訂閱模式的消息系統(tǒng),由Linkedin開發(fā),之后成為Apache項目的一部分。使用Scala語言編寫,目前已被廣泛應用于各行業(yè)各類型的數據管道和消息系統(tǒng)中。

kafka的設計目的是提供一個發(fā)布訂閱解決方案,它可以處理消費者規(guī)模的網站中的所有動作流數據。 這種動作(網頁瀏覽,搜索和其他用戶的行動)是在現代網絡上的許多社會功能的一個關鍵因素。 這些數據通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。

延伸閱讀

學習是年輕人改變自己的最好方式-Java培訓,做最負責任的教育,學習改變命運,軟件學習,再就業(yè),大學生如何就業(yè),幫大學生找到好工作,lphotoshop培訓,電腦培訓,電腦維修培訓,移動軟件開發(fā)培訓,網站設計培訓,網站建設培訓學習是年輕人改變自己的最好方式