EDINETスクレイピング

EDINET API

書類一覧API

import requests

url = "https://disclosure.edinet-fsa.go.jp/api/v1/documents.json"
params = {"date": "2019-08-22", "type": 2}

res = requests.get(url, params=params, verify=False)

path = 'edinet_api.txt'

with open(path_w, mode='w') as f:
    f.write(res.text)

欲しい情報

filerName

会社名

"特殊電極株式会社"

secCode

EdinetCodeだけなじゃなく、証券コードも付属。
5桁表示のコードなので末尾1桁は削って使いましょう。

"secCode": "34370",

docDescription

書類のタイトル。

"四半期報告書-第73期第1四半期(平成31年4月1日-令和1年6月30日)"

submitDateTime

報告日。DB管理上は欲しい。

"2019-08-09 09:00"

docID

書類取得APIで指定する書類のコード。

docTypeCode

たくさんあるけど重要そうな項目は以下。

コード値 コード名称
120 有価証券報告書
130 訂正有価証券報告書
140 四半期報告書
150 訂正四半期報告書
160 半期報告書
170 訂正半期報告書
350大量保有報告書
360訂正大量保有報告書

code

import requests
import json
import re

date = "2019-08-08"
url = "https://disclosure.edinet-fsa.go.jp/api/v1/documents.json"
params = {"date": date, "type": 2}

res = requests.get(url, params=params, verify=False)
path = 'edinet_api.txt'

rj = res.json()
com = rj["results"]
pattern =r"四半期"
repattern = re.compile(pattern)

for c in com:
  if c["docDescription"] == None:
    pass
  else:
    if re.search(repattern, c["docDescription"]):
      with open(path, mode='a') as f:
        f.write("{}\n{}\n{}\n".format(c["docID"], c["docDescription"], c["filerName"]))
    else:
      pass
XBRLから上場企業の決算書の情報を得る。 - Qiita
XBRLとはXBRL は企業の決算書などのビジネスレポートを XML 形式で記述するための国際標準の仕様です。日本ではす...
GitHub - teatime77/xbrl-reader: XBRLファイルを解析して財務諸表のデータを読み取ります。
XBRLファイルを解析して財務諸表のデータを読み取ります。. Contribute to teatime77/xbrl-...

コメント