我们计划将大量的度量数据放入某种nosql数据库中,可能是cassandra,也许是其他服务器上的其他内容. 我们希望在地图缩减样式中对数据进行计算(在机器所在的位置聚合数据,然后合并结果). 我使用Cassandra和Hadoop以及mapreduce进行了POC.启动mapreduce作业并获得结果的开销对我们的需求来说太高了. 在我们自己开始之前,还有其他任何强调性能的分布式Java框架吗?解决方法:在我们自己开始之前,还有其他任何强调性能的分布式Java框架吗?...
业务:查询热点词汇 实现:使用聚合函数,统计前100条高频词汇 解决聚合只显示10条问题: 在构建termsBuilder聚合查询对构建器时,在最后设置size值为100,完美解决 public ESReturn searchHotPoint(Integer day, Integer num) {ESReturn esReturn = new ESReturn();List<BucketsReturnVO> bucketsReturnVOList = new ArrayList<>();Client client = clientHelper.getClient();//分组聚合AggregationBuilder termsBuilder = Aggregation...