卡夫卡的目的是提供一个发布订阅解决方案,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群机来提供实时的消费。
Apache Kafka 0.10.2.0正式发布,此版本供修复超过200个bugs,合并超过500个 PR。本版本添加了一下的新功能:
1、支持session windows,参见KAFKA-3452
2、提供ProcessorContext中低层次Metrics的访问,参见KAFKA-3537
3、不用配置文件的情况下支持为 Kafka clients JAAS配置,参见KAFKA-4259
4、为Kafka Streams提供全局Table支持,参见KAFKA-4490
|