サポートするディレクトリ構造
目的
RDE構造化処理でサポートされるディレクトリ構造の詳細仕様について説明します。入力・出力ディレクトリの役割と命名規則、dividedディレクトリの使用方法を理解できます。
ディレクトリ構造仕様
入力ディレクトリ
構造化処理実行時に必要な入力ディレクトリ群です。ローカル実行時は事前に作成が必要です:
ディレクトリ名 | 種別 | 用途 |
---|---|---|
inputdata | 入力データ | 入力データファイルを格納 |
invoice | 送り状データ | 送り状(invoice.json)が格納されます。 |
tasksupport | 画像ファイル | 事前にテンプレート作成時に登録した構造化処理補助ファイル群を格納 |
構造化処理実行前のディレクトリ例
ローカルで構造化処理を実行する場合、以下のように事前にディレクトリを作成します:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
出力ディレクトリ
出力ディレクトリは、構造化処理を実行した結果を格納するディレクトリ群です。rdetoolkitでは、構造化処理実行すると、下記ディレクトリが自動で作成されます:
ディレクトリ名 | 種別 | 用途 |
---|---|---|
meta | 主要パラメータ情報ファイル | 主要パラメータ情報ファイル(metadata.json )を格納 |
main_image | 画像ファイル | RDEデータセット詳細画像として表示されるサムネイルファイル |
other_image | 画像ファイル | RDEデータセットファイル一覧にのみ表示される |
thumbnail | 画像ファイル | RDEデータセット一覧に表示される画像ファイル |
attachment | - | 添付ファイル(※) |
nonshared_raw | - | 共有不可能なファイル群を配置 |
raw | rawデータファイル | 共有可能なrawファイル群を配置。入力データを配置する。 |
structured | 構造化ファイル | 構造化処理により生成されたファイルを配置。入力データを配置する。 |
logs | - | データセットに登録・反映されませんが、ログを蓄積するためのディレクトリが作成されます。 |
temp | - | データセットに登録・反映されませんが、一時的ディレクトリとして、tempディレクトリが作成されるケースがあります。 |
Warning
attachmentは、rdetoolkitでは自動で生成されません。
ローカルで構造化処理実行後のディレクトリ例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
|
dividedディレクトリ
概要
RDE構造化処理では、ExcelInvoiceや、マルチデータタイルモードという、一度に複数のデータを登録するモードが存在します。このモードを使用する場合、divided
というディレクトリを作成しなければなりません。
Note
ExcelInvoiceや、マルチデータタイルモードを設定ファイルに記述し、指定した入力規則で構造化処理を実行した場合、自動的にdividedディレクトリが作成されます。
dividedディレクトリの命名規則
- 命名規則:
data/divided/00xx
00xx
: 4桁でゼロ埋め(例:0001/, 0029/など)data/divided/00xx
配下に、structured
やmeta
などのRDE構造化処理がサポートするディレクトリを配置- この時、
inputdata
,invoice
,tasksupport
は作成しなくて良い
dividedディレクトリ構造例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
|
DirectoryOpsによるディレクトリ作成
概要
上記で示した通り、RDE構造化処理でサポートするディレクトリは、divided/00xx
のようにディレクトリなど、命名規則にしたがって生成しなければならないケースが存在します。rdetoolkit.core.DirectoryOps
使用すると、簡単にRDE構造化処理をサポートするディレクトリを作成することができます。
使用例
DirectoryOpsの使用方法 | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
|
関連情報
ディレクトリ構造についてさらに学ぶには、以下のドキュメントを参照してください:
- 構造化処理の概念でディレクトリが使用される処理フローを理解する
- ディレクトリパス取得でパス操作方法を確認する
- 処理モードでdividedディレクトリを使用するモードを学ぶ