Skip to content

获取所有文件

SEC 中存在非常多的文件类型,每个公司会对应提供该类型的文件。经过十几年的积累存在了非常多的文件。

通过网页获取公司的所有文件

可以通过 https://www.sec.gov/edgar/search/ 来进行搜索,注意需要打开 + more search options:

edgar search

  • Document word or phrase: 搜索特定文档的,可以是文档中的内容也可以是文档的名称
  • Company name, ticker, CIK number or individual's name: 用于通过公司名称、CIK 等搜索所有文档,这个是我们获取所有文档的地方

他支持 since 2001 的所有文档,例如 0001524006:

search by cik

通过文件获取

实际上 SEC 的 https://www.sec.gov/search-filings/edgar-application-programming-interfacesBulk data 中有介绍一个 submission.zip 文件,其中包含了每个 CIK 对应的提交历史,他其中的文件对应 CIK{cik_number}.json 整个的目录结构如下:

JSON
{
  "cik": "1524006",
  "entityType": "other",
  "sic": "",
  "sicDescription": "",
  "ownerOrg": null,
  "insiderTransactionForOwnerExists": 1,
  "insiderTransactionForIssuerExists": 0,
  "name": "HarbourVest International Private Equity Partners V-Direct Fund L.P.",
  "tickers": [],
  "exchanges": [],
  "ein": "550897489",
  "description": "",
  "website": "",
  "investorWebsite": "",
  "category": "",
  "fiscalYearEnd": "1231",
  "stateOfIncorporation": "DE",
  "stateOfIncorporationDescription": "DE",
  "addresses": {
    "mailing": {
      "street1": "HARBOURVEST PARTNERS",
      "street2": "ONE FINANCIAL CENTER, 44TH FLOOR",
      "city": "BOSTON",
      "stateOrCountry": "MA",
      "zipCode": "02111",
      "stateOrCountryDescription": "MA"
    },
    "business": {
      "street1": "HARBOURVEST PARTNERS",
      "street2": "ONE FINANCIAL CENTER, 44TH FLOOR",
      "city": "BOSTON",
      "stateOrCountry": "MA",
      "zipCode": "02111",
      "stateOrCountryDescription": "MA"
    }
  },
  "phone": "617-348-3707",
  "flags": "",
  "formerNames": [],
  "filings": {
    "recent": {
      "accessionNumber": [
        "0001193125-16-460998",
        "0000899243-15-007306",
        "0001209191-12-025330",
        "0001209191-12-024130"
      ],
      "filingDate": ["2016-02-12", "2015-10-29", "2012-05-02", "2012-04-24"],
      "reportDate": ["", "2015-10-27", "2012-04-30", "2012-04-24"],
      "acceptanceDateTime": [
        "2016-02-12T06:09:00.000Z",
        "2015-10-29T21:36:20.000Z",
        "2012-05-02T10:41:37.000Z",
        "2012-04-24T20:14:42.000Z"
      ],
      "act": ["", "34", "34", "34"],
      "form": ["SC 13G", "4", "4", "3"],
      "fileNumber": ["", "001-35205", "001-35205", "001-35205"],
      "filmNumber": ["", "151185193", "12803193", "12777387"],
      "items": ["", "", "", ""],
      "core_type": ["SC 13G", "4", "4", "3"],
      "size": [73742, 11191, 15918, 12662],
      "isXBRL": [0, 0, 0, 0],
      "isInlineXBRL": [0, 0, 0, 0],
      "primaryDocument": [
        "d121386dsc13g.htm",
        "xslF345X03/doc4.xml",
        "xslF345X03/c28490_4x0.xml",
        "xslF345X02/c28360_3x0.xml"
      ],
      "primaryDocDescription": [
        "SC 13G",
        "FORM 4 SUBMISSION",
        "MAIN DOCUMENT DESCRIPTION",
        "MAIN DOCUMENT DESCRIPTION"
      ]
    },
    "files": []
  }
}
字段 含义
cik SEC 分配的 CIK,唯一标识该公司
entityType 公司类型,例如 operating(运营公司)或 investment(投资公司)
sic 标准行业分类代码(SIC),表示公司的行业
sicDescription SIC 代码的描述
tickers:list 股票交易代码
name 公司当前名称
ownerOrg 所属组织(可能是公司、子公司代理机构等)
formerNames:list 公司曾用名称(如果有),其中值是包含name from(开始时间) to(结束时间)键的字典
fiscalYearEnd 公司财年结束日期,格式为 MMDD,通常是 1231 即 12 月 31 日
exchanges:list 公司上市的证券交易所(如 "NASDAQ")
ein 雇主识别号(EIN),类似公司税号
description 公司简介
website 公司官网
stateOfIncorporation 公司注册州(如 "DE" 代表特拉华州)
stateOfIncorporationDescription 注册州的完整名称(如 "Delaware")
category 分类
addresses 地址,包括 bussiness 和 mailing
phone 电话
insiderTransactionForOwnerExists 表示文件中是否存在与内部人(insider)作为所有者的交易信息,例如高管购买了公司股票
insiderTransactionForIssuerExists 表示文件中是否存在与公司作为发行人(Issuer)相关的交易信息,例如公司向高管授予了股票期权

上面的都是公司的基本信息,而对于提交的文件信息则是放置到 filings 字段的,它包含两个字段:

  1. recent: 最近提交文件的信息
  2. files: list: 其中包含类似 {'name': 'CIK0000005272-submissions-001.json', 'filingCount': 2003, 'filingFrom': '2012-12-12', 'filingTo': '2019-12-29'} 这样的内容,你能够在 submission.zip 中找到 CIK0000005272-submissions-001.json 文件,*其中的文件中的内容结构和 recent 完全相同,它属于历史提交文件,其中 filingFrom - filingTo 记录了提交的历史

Tips

因此一个完整的历史提交是 recentCIKxxxx-submissions-xxx.json 文件的合体。

所有的历史提交信息都位于最为核心的 recent 字段中,他具有以下结构:

字段 解释 示例
accessionNumber 提交编号,SEC 生成的唯一标识符,格式: CIK-年-该CIK提交文件的流水号 "0001041792-24-000001"
filingDate 提交到 SEC 的日期,格式:YYYY-MM-DD "2024-02-15"
reportDate 财务报告日期,即报告所涵盖的时间段的结束日期。可能为空(如 8-K 通常无此字段) "2023-12-31"
acceptanceDateTime SEC 接收时间(UTC 格式),比 filingDate 更精确,包含时分秒 "2024-02-15T17:05:32.000Z"
act 法案,指提交文件所依据的证券法案,例如 34 代表《1934 年证券交易法》 "34"
form SEC 表单类型,如: 10-K(年报)、8-K(重大事件)、S-1(IPO 申请) "10-K"
fileNumber 文件编号,SEC 内部使用 "001-35205"
filmNumber 胶片编号,SEC 内部使用 "151185193"
items 对应提交的事项编号 "2.02"
size 文件大小 73742
isXBRL 是否是 XBRL 格式,0-False 1-True 0
isInlineXBRL 是否是内联 XBRL 格式,0-False 1-True 0
primaryDocument 主文档文件名,HTML/PDF 格式的文件名 "biib-10k_2023.htm"
primaryDocDescription 文档描述,如 "Annual Report"(年报)或 "Current Report"(8-K 报告) "Annual Report"

filings 部分就是该公司的所有文件提交信息,其中的每个字段对应了 search 页面的信息 show Columns 中的字段,其中比较特殊的就是每个文件可以对应多个 CIK,具体的原因不太清楚,不过他们都能够导航到同一个文件:

cik_to_file

通过 submission.zip 文件来获取文件有个问题就是他只包含了提交的主文件,对于其他 Exhibit(附表) 是没有在其中记录的,不过我们一种途径来获取他。下面介绍两个拼接获取文件的方式以及浏览所有提交文件的链接:

  1. 通过 https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 剔除-}/{primaryDocument} 来下载主文件
  2. 通过 https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 剔除-}/{accessionNumber 不剔除-}.txt 来全部文件,注意他是主文件以及各种其他扩展文件通过 <DOCUMENT></DOCUMENT> 标签来拼接而得到的文件
  3. 通过 https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 不剔除-}-index.html 能浏览对应的 accessionNumber 中提交了什么文件

Tips

可以打开 https://www.sec.gov/Archives/edgar/data/{cik} 网址可以更加清晰的了解归档的目录结构以及上面的连接为什么要这样构造。他可以看作是 https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 不剔除-}-index.html 的 ftp 版本

Tips

实际上 accessionNumber.txt 中包含了该公司的所有基本信息,不过他是基于 tab 来拆分的并不是很好解析,因此直接使用 json 中的基本信息是更好的选择。

Tips

accessionNumber 也是有规律的,他们以 CIK-YEAR-{文件在该 CIK 账户下当天提交的流水号} 但是并不清楚这里的 CIK 和提交公司的 CIK 为什么有时候不太一样,因此不要依赖这里的 CIK 来组装下载链接