jsonlines 格式介绍
jsonlines也称为newline-delimited JSON格式,它实际上是JSON格式的引申。
它每一行都是一个标准的 JSON 格式字符串,而通过行分隔。由于这种机制它保留了 json 优点的同时还能够很好的流式处理文本。
规范
jsonlines 的规范很简单,只包括三条强制的和一条建议:
- 要求每一行的 JSON 必须是 utf-8 编码
- 每一行都必须是符合标准的 JSON 值
- 行分隔符是
\n,这意味着\r\n也支持,因为解析 JSON 时会忽略周围空格 - (建议)扩展名推荐
.jsonl,如果使用了其他流式压缩器可以添加对应的后缀例如.jsonl.gz、.jsonl.xz等