当前位置:首页 > 技术 > 正文内容

使用 Guava Table 实现多维数据建模

访客 技术 2026年5月22日 3

在实际开发中,我们经常需要处理具有多个分类维度的数据。虽然 Guava 的 Table 接口本质上是二维结构(由行键和列键共同定位一个值),但通过结合其他集合类型如 Map 或嵌套 Table,我们可以构建出支持三维甚至更高维度的数据模型。

利用嵌套 Table 模拟三维结构

一种常见做法是将 Table 的值类型设为另一个 Table,从而形成"表中表"的结构。例如,在分析销售数据时,可以将日期作为外层表的行键,区域作为列键,而每个单元格存储的是一个包含各项指标(如销售额、利润)的子表。

import com.google.common.collect.HashBasedTable;
import com.google.common.collect.Table;
import org.junit.jupiter.api.Test;

import java.util.Map;

public class ThreeDimensionalDataTest {

    @Test
    public void simulateThreeDimensionsWithNestedTable() {
        // 外层表:日期 → 区域 → (指标 → 数值) 的映射表
        Table<String, String, Table<String, Integer>> timeSeriesData = HashBasedTable.create();

        // 构造北方区域的数据
        Table<String, Integer> northMetrics = HashBasedTable.create();
        northMetrics.put("Sales", 1000);
        northMetrics.put("Profit", 200);

        // 构造南方区域的数据
        Table<String, Integer> southMetrics = HashBasedTable.create();
        southMetrics.put("Sales", 1200);
        southMetrics.put("Profit", 300);

        // 填充主表
        timeSeriesData.put("2024-12-01", "North", northMetrics);
        timeSeriesData.put("2024-12-01", "South", southMetrics);

        // 查询特定维度组合下的值
        Table<String, Integer> northData = timeSeriesData.get("2024-12-01", "North");
        Integer salesInNorth = northData.get("Sales");
        System.out.println("2024-12-01 北区销售额: " + salesInNorth); // 输出: 1000

        Table<String, Integer> southData = timeSeriesData.get("2024-12-01", "South");
        Integer profitInSouth = southData.get("Profit");
        System.out.println("2024-12-01 南区利润: " + profitInSouth); // 输出: 300
    }
}

遍历多层级数据结构

对于这种嵌套结构,可以通过逐层迭代的方式访问所有元素。这种方式适用于需要批量处理或导出全量数据的场景。

@Test
public void traverseMultiLevelStructure() {
    Table<String, String, Table<String, Integer>> dataCube = HashBasedTable.create();

    Table<String, Integer> eastRegion = HashBasedTable.create();
    eastRegion.put("Sales", 2000);
    eastRegion.put("Profit", 500);

    Table<String, Integer> westRegion = HashBasedTable.create();
    westRegion.put("Sales", 1500);
    westRegion.put("Profit", 450);

    dataCube.put("2024-12-01", "East", eastRegion);
    dataCube.put("2024-12-01", "West", westRegion);

    // 逐层遍历
    for (String date : dataCube.rowKeySet()) {
        System.out.println("日期: " + date);
        for (String region : dataCube.columnKeySet()) {
            System.out.println("  区域: " + region);
            Table<String, Integer> metrics = dataCube.get(date, region);
            for (Map.Entry<String, Integer> metric : metrics.cellSet()) {
                System.out.println("    " + metric.getKey() + " = " + metric.getValue());
            }
        }
    }
}

扩展至四维及以上:Map 与 Table 联合使用

当需要表达四个或更多维度时,可引入 Map 进行外层封装。例如,以年份为最外层键,其对应值是一个二维 Table,再内嵌一层指标表,实现时间(年、月)、地理(区域)、业务指标的四维索引。

@Test
public void fourDimensionalModelUsingMapAndTable() {
    // 四维结构:年份 → (月份 → 区域 → 指标)
    Map<String, Table<String, String, Table<String, Integer>>> fourDimData = new java.util.HashMap<>();

    // 创建具体数据
    Table<String, Integer> monthlyMetrics = HashBasedTable.create();
    monthlyMetrics.put("Sales", 1500);
    monthlyMetrics.put("Profit", 300);

    Table<String, String, Table<String, Integer>> yearData = HashBasedTable.create();
    yearData.put("January", "Central", monthlyMetrics);

    fourDimData.put("2024", yearData);

    // 查询 2024 年 1 月 中部地区的销售额
    Integer janSales = fourDimData.get("2024")
                                  .get("January", "Central")
                                  .get("Sales");
    System.out.println("2024年1月中区销售额: " + janSales); // 输出: 1500
}

总结

尽管 Guava 的 Table 仅原生支持两个键,但借助嵌套容器的设计思想,开发者能够灵活地模拟出三维乃至更高维度的数据结构。这种模式特别适合用于报表生成、数据分析、配置管理等需要多条件联合索引的业务场景。合理运用此类技巧,可以在不牺牲性能的前提下显著提升代码的可读性和维护性。

标签: GuavaTable

相关文章

Linux crontab 详解

1) crontab 是什么cron 是 Linux 的定时任务守护进程;crontab 是用来编辑/查看“按时间周期执行命令”的表(cron table)。常见两类:用户 crontab:每个用户一份(crontab -e 编辑)系统级 crontab / cron.d:可指定执行用户(/etc/crontab、/etc/cron.d/*)2) crontab 时间...

富文本里可以允许的 HTML 属性

一、所有标签默认允许的安全属性(极少)class        (可选)id           (通常建议禁用)title️ 注意:id 容易被滥用做锚点注入,很多系统直接禁用class 允许的话最好只允许固定前缀(如 editor-*)二、a 标签允许属性<a href="" t...

Mac 安装 Node.js 指南

方法一:通过官网安装包(最简单,适合初学者)如果你只是想快速安装并开始使用,这是最直接的方法。访问 Node.js 官网。页面会显示两个版本:LTS (Recommended For Most Users):长期支持版,最稳定。建议选这个。Current:最新特性版,包含最新功能但可能不够稳定。下载 .pkg 安装包并运行。按照安装向导点击“下一步”即可完成。方法二:使用 Homebrew 安装(...

Dom\HTML_NO_DEFAULT_NS 的副作用:自动加闭合标签

在使用Dom\HTMLDocument时,Dom\HTML_NO_DEFAULT_NS 将禁止在解析过程中设置元素的命名空间, 此设置是为了与DOMDocument向后兼容而存在的。当使用它时,已知的一个副作用就是:自动加闭合标签例如 </img> 为什么会这样?当你使用:Dom\HTML_NO_DEFAULT_NS文档会变成 无命名空间模式,此时内部更接近 XML...

Laravel 事件和监听器创建

在 Laravel 中,使用 Artisan 命令创建 Events(事件) 和 Listeners(监听器) 是非常高效的。你可以通过以下几种方式来实现:1. 手动创建单个 Event如果你只想创建一个事件类,可以使用 make:event 命令:Bashphp artisan make:event UserRegistered执行后,文件将生成在 app/Even...

自定义域名解析神器 dnsmasq

什么是 dnsmasq?dnsmasq 是一个轻量级、功能强大的网络服务工具,专为小型和中等规模网络设计。它是一个综合的网络基础设施解决方案[1]。dnsmasq 能做什么?功能说明应用场景DNS 转发与缓存将 DNS 查询转发到上游服务器(ISP、Google DNS 等),并在本地缓存结果加快 DNS 查询速度,减少外部 DNS 流量本地 DNS解析本地网络设备的主机名,无需编辑&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。