数据仓库论文阅读报告.pptx
文本预览下载声明
实时数据仓库中一种
改进的数据流更新算法;;1;;;2;;3; 相比MESHJOIN,EH-JOIN 有2 个关键的改进:
(1)修改了Hash 连接组件让它可以利用索引。
(2)将频繁使用的主数据缓存到内存中,极大地减少了I / O消耗; EH-JOIN 是一种迭代算法,在每次迭代中,磁盘关系集R 的一个分块 作为一个探测输入。因此,这个分块被装载到磁盘缓存中且仅占用 磁盘缓存的一部分。算法执行了一个典型的哈希连接操作,即它遍 历磁盘缓冲区的所有元组,并在哈希表中进行查找。每一次匹 配成功,算法就会输出那个匹配的数据流元组。;;;4;;;;5;;谢谢
显示全部