在阅读了有关查询优化技术的知识之后,我开始了解以下技术。
1. Indexing - bitmap and BTree
2. Partitioning
3. Bucketing
我得到了分区和存储分区以及何时使用它们的区别,但是我仍然对索引的实际工作方式感到困惑。索引的元数据存储在哪里?是存储它的namenode吗?即,实际上,在创建分区或存储桶时,我们可以在hdfs中看到多个目录,这些目录解释了查询性能的优化,但是如何可视化索引呢?尽管存在分区和存储桶,但它们是否真的在现实生活中使用?
对于上述查询,请帮我,Hadoop和Hive开发人员社区是否有专门的页面?