kaggle datasets api 使い方
はじめに
kaggle datasets apiの使い方が少し癖あったので、備忘録
初期化
最初にフォルダを初期化してあげる必要があります。
- フォルダを登録
kaggle datasets init -p /path/to/datasets
- 生成されたメタデータファイルをいじる
tiitle
とid
を任意の値に変更します(titleは6~50文字)
vim path/to/datasets/dataset-metadata.json
- 作成
kaggle datasets create -p path/to/datasets
追加アップロード(バージョニング)
単一ファイルの場合
kaggle datasets version -p /path/to/dataset -m "comments"
フォルダ階層になっている場合
複数ファイルの場合は圧縮形式の指定が必要です。
kaggle datasets version -p path/to/datasets -m "comments" --dir-mode zip
dir-mode
create
コマンドでもフォルダ階層になってる場合は--dir-mode
必須です
dir-mode
は3種類あります
skip
zip
tar
zipとかは圧縮に時間取られたりするので、細々していなければskipが一番はやいです。
追記:
tar
にすると、アップデート後もフォルダが.tar
形式になるみたいなので、zip
一択ですね