获取所有文件
SEC 中存在非常多的文件类型,每个公司会对应提供该类型的文件。经过十几年的积累存在了非常多的文件。
通过网页获取公司的所有文件
可以通过 https://www.sec.gov/edgar/search/
来进行搜索,注意需要打开 + more search options
:
Document word or phrase
: 搜索特定文档的,可以是文档中的内容也可以是文档的名称Company name, ticker, CIK number or individual's name
: 用于通过公司名称、CIK 等搜索所有文档,这个是我们获取所有文档的地方
他支持 since 2001
的所有文档,例如 0001524006
:
通过文件获取
实际上 SEC 的 https://www.sec.gov/search-filings/edgar-application-programming-interfaces
的 Bulk data
中有介绍一个 submission.zip
文件,其中包含了每个 CIK 对应的提交历史,他其中的文件对应 CIK{cik_number}.json
整个的目录结构如下:
{
"cik": "1524006",
"entityType": "other",
"sic": "",
"sicDescription": "",
"ownerOrg": null,
"insiderTransactionForOwnerExists": 1,
"insiderTransactionForIssuerExists": 0,
"name": "HarbourVest International Private Equity Partners V-Direct Fund L.P.",
"tickers": [],
"exchanges": [],
"ein": "550897489",
"description": "",
"website": "",
"investorWebsite": "",
"category": "",
"fiscalYearEnd": "1231",
"stateOfIncorporation": "DE",
"stateOfIncorporationDescription": "DE",
"addresses": {
"mailing": {
"street1": "HARBOURVEST PARTNERS",
"street2": "ONE FINANCIAL CENTER, 44TH FLOOR",
"city": "BOSTON",
"stateOrCountry": "MA",
"zipCode": "02111",
"stateOrCountryDescription": "MA"
},
"business": {
"street1": "HARBOURVEST PARTNERS",
"street2": "ONE FINANCIAL CENTER, 44TH FLOOR",
"city": "BOSTON",
"stateOrCountry": "MA",
"zipCode": "02111",
"stateOrCountryDescription": "MA"
}
},
"phone": "617-348-3707",
"flags": "",
"formerNames": [],
"filings": {
"recent": {
"accessionNumber": [
"0001193125-16-460998",
"0000899243-15-007306",
"0001209191-12-025330",
"0001209191-12-024130"
],
"filingDate": ["2016-02-12", "2015-10-29", "2012-05-02", "2012-04-24"],
"reportDate": ["", "2015-10-27", "2012-04-30", "2012-04-24"],
"acceptanceDateTime": [
"2016-02-12T06:09:00.000Z",
"2015-10-29T21:36:20.000Z",
"2012-05-02T10:41:37.000Z",
"2012-04-24T20:14:42.000Z"
],
"act": ["", "34", "34", "34"],
"form": ["SC 13G", "4", "4", "3"],
"fileNumber": ["", "001-35205", "001-35205", "001-35205"],
"filmNumber": ["", "151185193", "12803193", "12777387"],
"items": ["", "", "", ""],
"core_type": ["SC 13G", "4", "4", "3"],
"size": [73742, 11191, 15918, 12662],
"isXBRL": [0, 0, 0, 0],
"isInlineXBRL": [0, 0, 0, 0],
"primaryDocument": [
"d121386dsc13g.htm",
"xslF345X03/doc4.xml",
"xslF345X03/c28490_4x0.xml",
"xslF345X02/c28360_3x0.xml"
],
"primaryDocDescription": [
"SC 13G",
"FORM 4 SUBMISSION",
"MAIN DOCUMENT DESCRIPTION",
"MAIN DOCUMENT DESCRIPTION"
]
},
"files": []
}
}
字段 | 含义 |
---|---|
cik | SEC 分配的 CIK,唯一标识该公司 |
entityType | 公司类型,例如 operating(运营公司)或 investment(投资公司) |
sic | 标准行业分类代码(SIC),表示公司的行业 |
sicDescription | SIC 代码的描述 |
tickers:list | 股票交易代码 |
name | 公司当前名称 |
ownerOrg | 所属组织(可能是公司、子公司代理机构等) |
formerNames:list | 公司曾用名称(如果有),其中值是包含name from(开始时间) to(结束时间) 键的字典 |
fiscalYearEnd | 公司财年结束日期,格式为 MMDD ,通常是 1231 即 12 月 31 日 |
exchanges:list | 公司上市的证券交易所(如 "NASDAQ") |
ein | 雇主识别号(EIN),类似公司税号 |
description | 公司简介 |
website | 公司官网 |
stateOfIncorporation | 公司注册州(如 "DE" 代表特拉华州) |
stateOfIncorporationDescription | 注册州的完整名称(如 "Delaware") |
category | 分类 |
addresses | 地址,包括 bussiness 和 mailing |
phone | 电话 |
insiderTransactionForOwnerExists | 表示文件中是否存在与内部人(insider)作为所有者的交易信息,例如高管购买了公司股票 |
insiderTransactionForIssuerExists | 表示文件中是否存在与公司作为发行人(Issuer)相关的交易信息,例如公司向高管授予了股票期权 |
上面的都是公司的基本信息,而对于提交的文件信息则是放置到 filings 字段的,它包含两个字段:
recent
: 最近提交文件的信息files: list
: 其中包含类似{'name': 'CIK0000005272-submissions-001.json', 'filingCount': 2003, 'filingFrom': '2012-12-12', 'filingTo': '2019-12-29'}
这样的内容,你能够在submission.zip
中找到CIK0000005272-submissions-001.json
文件,*其中的文件中的内容结构和recent
完全相同,它属于历史提交文件,其中filingFrom - filingTo
记录了提交的历史
Tips
因此一个完整的历史提交是 recent
和 CIKxxxx-submissions-xxx.json
文件的合体。
所有的历史提交信息都位于最为核心的 recent 字段中,他具有以下结构:
字段 | 解释 | 示例 |
---|---|---|
accessionNumber | 提交编号,SEC 生成的唯一标识符,格式: CIK-年-该CIK提交文件的流水号 | "0001041792-24-000001" |
filingDate | 提交到 SEC 的日期,格式:YYYY-MM-DD | "2024-02-15" |
reportDate | 财务报告日期,即报告所涵盖的时间段的结束日期。可能为空(如 8-K 通常无此字段) | "2023-12-31" |
acceptanceDateTime | SEC 接收时间(UTC 格式),比 filingDate 更精确,包含时分秒 | "2024-02-15T17:05:32.000Z" |
act | 法案,指提交文件所依据的证券法案,例如 34 代表《1934 年证券交易法》 | "34" |
form | SEC 表单类型,如: 10-K(年报)、8-K(重大事件)、S-1(IPO 申请) | "10-K" |
fileNumber | 文件编号,SEC 内部使用 | "001-35205" |
filmNumber | 胶片编号,SEC 内部使用 | "151185193" |
items | 对应提交的事项编号 | "2.02" |
size | 文件大小 | 73742 |
isXBRL | 是否是 XBRL 格式,0-False 1-True | 0 |
isInlineXBRL | 是否是内联 XBRL 格式,0-False 1-True | 0 |
primaryDocument | 主文档文件名,HTML/PDF 格式的文件名 | "biib-10k_2023.htm" |
primaryDocDescription | 文档描述,如 "Annual Report"(年报)或 "Current Report"(8-K 报告) | "Annual Report" |
filings
部分就是该公司的所有文件提交信息,其中的每个字段对应了 search 页面的信息 show Columns
中的字段,其中比较特殊的就是每个文件可以对应多个 CIK,具体的原因不太清楚,不过他们都能够导航到同一个文件:
通过 submission.zip
文件来获取文件有个问题就是他只包含了提交的主文件,对于其他 Exhibit(附表) 是没有在其中记录的,不过我们一种途径来获取他。下面介绍两个拼接获取文件的方式以及浏览所有提交文件的链接:
- 通过
https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 剔除-}/{primaryDocument}
来下载主文件 - 通过
https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 剔除-}/{accessionNumber 不剔除-}.txt
来全部文件,注意他是主文件以及各种其他扩展文件通过<DOCUMENT></DOCUMENT>
标签来拼接而得到的文件 - 通过
https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 不剔除-}-index.html
能浏览对应的 accessionNumber 中提交了什么文件
Tips
可以打开 https://www.sec.gov/Archives/edgar/data/{cik}
网址可以更加清晰的了解归档的目录结构以及上面的连接为什么要这样构造。他可以看作是 https://www.sec.gov/Archives/edgar/data/{cik}/{accessionNumber 不剔除-}-index.html
的 ftp 版本
Tips
实际上 accessionNumber.txt
中包含了该公司的所有基本信息,不过他是基于 tab 来拆分的并不是很好解析,因此直接使用 json 中的基本信息是更好的选择。
Tips
accessionNumber 也是有规律的,他们以 CIK-YEAR-{文件在该 CIK 账户下当天提交的流水号}
但是并不清楚这里的 CIK 和提交公司的 CIK 为什么有时候不太一样,因此不要依赖这里的 CIK 来组装下载链接