One Billion Row Challenge：Java 一十亿行聚合性能竞赛

1brc 是面向 Java 的高性能聚合基准与实现集合，通过统一数据格式与评测环境鼓励极限优化，适合性能工程师用于比较、实验与教学。

GitHub gunnarmorling/1brc 更新 2025-09-01 分支 main 星标 7.3K 分叉 2.1K

Java 高性能基准 GraalVM/Native 文件解析与聚合 Unsafe 优化 Apache-2.0 许可

💡 深度解析

这个项目真正要解决的核心问题是什么？它如何在技术上实现这一目标？

核心分析 ¶

项目定位：1brc 的目标是展示并比较在 JVM/Java 生态中，对一个确定格式（station;value，value 恰有一位小数）的超大文本文件（1B 行）进行聚合（min/mean/max）时，如何通过一系列工程手段把吞吐推向极限。该仓库不是通用库，而是一个可复现的性能实验与对比平台。

技术特点 ¶

低分配字节级解析：利用输入格式确定性将浮点数转为整数（乘以 10），手写解析字节流，避免中间 String/Float 对象分配，从而减少 GC 压力并提高吞吐。
最小化内存与对象复用：通过对象池、原生内存或 Unsafe 操作累积统计信息，降低堆分配频率与内存碎片化。
并行/分片策略：按文件块或 station 分区进行多线程处理，以饱和多核 CPU 吞吐。
本机化运行（GraalVM native-image）：减少运行时与启动开销，某些实现将总体时间进一步压缩到秒级（排行榜前列实例）。

实用建议 ¶

从简单实现开始：先用安全、可维护的实现验证结果正确性，再逐步引入分片、复用与低分配优化以观察收益。
重用解析思路：将“整数化”和“字节级解析”作为可迁移的解析优化，即使不使用 Unsafe 也能获得显著提升。
严格复现环境：复现排行榜结果时应使用仓库提供的脚本/Docker 并匹配 JDK/Graal 与硬件描述（例如 README 中的 Hetzner 机器）。

重要提示：顶尖实现为性能优先，常牺牲可维护性或兼容性（依赖 Unsafe、native-image）。把这些实现当作技术参考而非直接生产库。

总结：1brc 通过明确任务、统一评测和多种实现，提供了在 JVM 上将大规模文本解析与聚合推向极限的实用样例与可复现证据，对性能工程师具有较高参考价值。

85.0%

为什么项目中普遍采用“整数化+字节级解析+低分配”的技术路径？这些技术的具体优势是什么？

核心分析 ¶

问题核心：为什么把浮点解析替换为整数化并采用字节级解析与低分配策略，是该比赛中普遍且有效的选择？

技术分析 ¶

输入格式的确定性是关键：题目规定 measurement 恰有一位小数，这意味着可以简单地把数值乘以 10 并用整数表示，从而避免慢速浮点解析路径。
避免短生命周期对象：常规解析会产生大量 String 或包装类型，这些短生命周期对象会触发频繁 GC，限制吞吐。字节级解析直接在缓冲区上操作，省去拷贝与分配。
算术与累加更快：用整型累加（sum/count/min/max）比浮点解析后做运算更省时、且可用 64-bit 原语无锁或低锁实现。
更好的缓存与内存布局：原生数组或 off-heap 结构比大量小对象更有利于 CPU 缓存命中和预取，进一步提升吞吐。

实用建议 ¶

优先采用整数化：如果输入格式允许，先将小数位固定并转为整数，这一步通常是“低成本高收益”的优化。
实现字节级解析库/模板：封装可复用的字节流解析器，避免项目内多次重复实现。
分阶段优化：先验证正确性与可维护实现，再在热点处引入字节级解析与对象复用。

重要提示：这些技术依赖于输入格式的严格约束，若输入可能缺失小数位、含异常或需更高精度，直接整数化或省略检查会导致精度/健壮性问题。

总结：对于受控、格式化良好的大规模文本解析任务，整数化 + 字节级解析 + 低分配是最直接且高效的优化路径，解释了 1brc 中许多高分实现的成功原因。

85.0%

如何在不同硬件和 JDK 版本上可重复地复现排行榜上的结果？有什么关键要点？

核心分析 ¶

问题核心：如何可靠复现排行榜结果？

技术分析（关键变量）¶

硬件特征：CPU 微架构、核数、缓存、NUMA 布局和内存带宽都会显著影响吞吐。排行榜使用的是 Hetzner AX161（AMD EPYC 7502P）。
JDK / Graal 版本：顶尖实现依赖 21.0.2-graal native-image 或特定 JDK 参数，版本不匹配会导致显著差异。
I/O 与文件缓存：磁盘/文件系统缓存与 memory-mapped I/O 行为会改变读取速度，需清楚是否预热或使用 direct I/O。
系统级设置：CPU 频率调度、CPU pinning、cgroups 限制、HugePages 等都会影响结果稳定性。

实用建议（复现步骤）¶

使用仓库脚本/Dockerfile：优先采用官方提供的容器或脚本以减少环境差异。
匹配 JDK/Graal 与构建参数：精确使用排行榜中列出的 JDK/Graal 及 native-image 构建命令。
固定系统环境：关闭节能模式，设置 CPU 亲和，确保无其他竞争负载。
多次运行并取稳健统计：执行多次测量并报告最小/中位数，避免一次性噪声。

重要提示：即便严格匹配，轻微差异（内核更新、BIOS 策略）仍可能导致不同，因此把排行榜视为有条件参考而非绝对值。

总结：复现排行榜需要严格复制硬件、JDK/Graal、系统调优与输入数据，并采用仓库提供的自动化脚本与证书作为基线。

85.0%

项目学习曲线和常见陷阱有哪些？我在上手时应注意什么？

核心分析 ¶

问题核心：上手 1brc 的真实成本是什么？有哪些容易踩的坑？

技术分析（学习曲线与陷阱）¶

学习曲线：
低门槛起步：仓库包含可读性较好的“安全实现”，用于理解题目与基本逻辑。
高成本深化：要复现顶尖实现，需要掌握 Unsafe、off-heap、memory-mapped I/O、GraalVM native-image、多线程/NUMA 优化与 GC 调优等。
常见陷阱：
可移植性问题：依赖 sun.misc/Unsafe 或特定 Graal 版本可能在不同 JVM/OS 上出错。
正确性风险：为性能省略输入校验或舍入策略可能导致错误统计结果。
性能非稳态：不同硬件、内核或 JDK 会改变优化收益，需谨慎解读 leaderboard 时间。