当前位置:首页 > 技术 > 正文内容

Guava Table嵌套组合实现多维度数据存储

访客 技术 2026年6月29日 1

在数据处理中,二维Table可以理解为行列交叉的网格,但实际业务常需要更多维度(如时间+地区+指标)。Guava的Table虽然原生只支持二维,但通过组合其他集合类型,可以灵活模拟出多维结构。

1. 通过Table嵌套构造三维数据

核心思路是将Table的值域扩展为另一个Table,从而获得三维索引能力(例如:日期→区域→指标)。示例代码演示了如何存储和查询时间序列数据:

import com.google.common.collect.HashBasedTable;
import com.google.common.collect.Table;
import java.util.Map;

public class Demo3DTable {
    public void run() {
        // 三维Table: 日期 -> 区域 -> 子Table(指标名 -> 值)
        Table<String, String, Table<String, Integer>> data = HashBasedTable.create();

        // 构造第一组区域数据
        Table<String, Integer> northMetrics = HashBasedTable.create();
        northMetrics.put("Sales", 1000);
        northMetrics.put("Profit", 200);

        // 构造第二组区域数据
        Table<String, Integer> southMetrics = HashBasedTable.create();
        southMetrics.put("Sales", 1200);
        southMetrics.put("Profit", 300);

        // 填充三维结构
        data.put("2024-12-01", "North", northMetrics);
        data.put("2024-12-01", "South", southMetrics);

        // 查询:2024-12-01的North区域Sales值
        Table<String, Integer> northSub = data.get("2024-12-01", "North");
        System.out.println("North Sales: " + northSub.get("Sales")); // 输出1000

        // 查询:2024-12-01的South区域Profit值
        Table<String, Integer> southSub = data.get("2024-12-01", "South");
        System.out.println("South Profit: " + southSub.get("Profit")); // 输出300
    }
}

这种嵌套方式允许通过三个连续的键(日期、区域、指标名)精确定位到数值,直观地模拟了三维数据表。

2. 多维度遍历与查询

遍历多维数据时,可以逐层深入:先遍历外层Table的行列键,再遍历子Table的内容。以下代码展示了完整的层级访问:

public void traverse3D() {
    Table<String, String, Table<String, Integer>> cube = HashBasedTable.create();

    // 填充数据
    Table<String, Integer> d1 = HashBasedTable.create();
    d1.put("Sales", 2000); d1.put("Profit", 500);
    Table<String, Integer> d2 = HashBasedTable.create();
    d2.put("Sales", 1500); d2.put("Profit", 450);
    cube.put("2024-12-01", "North", d1);
    cube.put("2024-12-01", "South", d2);

    // 遍历所有维度
    for (String date : cube.rowKeySet()) {
        for (String region : cube.columnKeySet()) {
            Table<String, Integer> metrics = cube.get(date, region);
            if (metrics != null) {
                System.out.printf("Date=%s, Region=%s%n", date, region);
                for (Map.Entry<String, Integer> entry : metrics.cellSet()) {
                    System.out.printf("  %s: %d%n", entry.getKey(), entry.getValue());
                }
            }
        }
    }
}

通过cellSet()可以获取子Table中的所有键值对,结合外层键即可得到完整的多维索引。

3. 用Map+Table实现四维结构

当需要四维或更高维度时,可以混合使用Map与Table。例如用外层Map表示年份,内层Table表示月份→区域→指标:

import java.util.HashMap;
import java.util.Map;

public class Demo4D {
    public void build4DStructure() {
        // 四维:年份 → 月份 → 区域 → 指标值
        Map<String, Table<String, String, Table<String, Integer>>> yearData = new HashMap<>();

        // 构造第三层:区域 → 指标
        Table<String, String, Integer> regionMetric = HashBasedTable.create();
        regionMetric.put("Sales", 1500);
        regionMetric.put("Profit", 300);

        // 构造第二层:月份 → 区域结构
        Table<String, String, Table<String, Integer>> monthData = HashBasedTable.create();
        monthData.put("January", "North", regionMetric);

        // 放入第一层Map
        yearData.put("2024", monthData);

        // 查询:2024年1月的North区域Sales值
        Table<String, String, Table<String, Integer>> jan = yearData.get("2024");
        Table<String, Integer> north = jan.get("January", "North");
        int sales = north.get("Sales");
        System.out.println("2024 January Sales: " + sales); // 输出1500
    }
}

通过Map与Table的任意组合,理论上可以构造任意维度的数据容器,但需注意可维护性和性能开销。

小结

Guava Table虽然仅提供二维语义,但通过嵌套和组合其他集合类(Table、Map),可以灵活构建三维甚至四维的数据结构。这种设计在时间序列、多维度报表等场景中非常实用,能够用简洁的代码实现复杂的多维索引逻辑。

相关文章

Linux crontab 详解

1) crontab 是什么cron 是 Linux 的定时任务守护进程;crontab 是用来编辑/查看“按时间周期执行命令”的表(cron table)。常见两类:用户 crontab:每个用户一份(crontab -e 编辑)系统级 crontab / cron.d:可指定执行用户(/etc/crontab、/etc/cron.d/*)2) crontab 时间...

富文本里可以允许的 HTML 属性

一、所有标签默认允许的安全属性(极少)class        (可选)id           (通常建议禁用)title️ 注意:id 容易被滥用做锚点注入,很多系统直接禁用class 允许的话最好只允许固定前缀(如 editor-*)二、a 标签允许属性<a href="" t...

Mac 安装 Node.js 指南

方法一:通过官网安装包(最简单,适合初学者)如果你只是想快速安装并开始使用,这是最直接的方法。访问 Node.js 官网。页面会显示两个版本:LTS (Recommended For Most Users):长期支持版,最稳定。建议选这个。Current:最新特性版,包含最新功能但可能不够稳定。下载 .pkg 安装包并运行。按照安装向导点击“下一步”即可完成。方法二:使用 Homebrew 安装(...

Dom\HTML_NO_DEFAULT_NS 的副作用:自动加闭合标签

在使用Dom\HTMLDocument时,Dom\HTML_NO_DEFAULT_NS 将禁止在解析过程中设置元素的命名空间, 此设置是为了与DOMDocument向后兼容而存在的。当使用它时,已知的一个副作用就是:自动加闭合标签例如 </img> 为什么会这样?当你使用:Dom\HTML_NO_DEFAULT_NS文档会变成 无命名空间模式,此时内部更接近 XML...

Laravel 事件和监听器创建

在 Laravel 中,使用 Artisan 命令创建 Events(事件) 和 Listeners(监听器) 是非常高效的。你可以通过以下几种方式来实现:1. 手动创建单个 Event如果你只想创建一个事件类,可以使用 make:event 命令:Bashphp artisan make:event UserRegistered执行后,文件将生成在 app/Even...

自定义域名解析神器 dnsmasq

什么是 dnsmasq?dnsmasq 是一个轻量级、功能强大的网络服务工具,专为小型和中等规模网络设计。它是一个综合的网络基础设施解决方案[1]。dnsmasq 能做什么?功能说明应用场景DNS 转发与缓存将 DNS 查询转发到上游服务器(ISP、Google DNS 等),并在本地缓存结果加快 DNS 查询速度,减少外部 DNS 流量本地 DNS解析本地网络设备的主机名,无需编辑&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。