AWS Glue での Spark のパフォーマンス (実行時間) を改善したい

AWS BigData

はじめに準備データ計測関数 CSV vs Parquet Parquet 参考読み取り速度比較データ作成読み取り読み取って Filter 処理した際の速度比較データサイズ比較 csv gzip はどれくらい？まとめ Glue DynamicFrame vs Spark DataFrame データ読み取り速度比…

#Spark #Glue #AWS #BigData

2023-06-23

Git で間違った Author 情報で remote repository に commit を push しちゃったとき

OSS Github

はじめにコミットの修正 rebase 複数ある場合 Force push 参考はじめに git log でちゃんと確認したはずが、GitHub へ push したときに committer が間違っていることに気が付きました。今度からは push 前にローカルで git log --pretty=full を見て確認…

2023-03-06

VS Code Remote Development (Dev Containers) で dind (Docker in Docker) する方法

サーバ

VS code remote development で dind する設定 devcontainer.json に設定を一行追記するだけで OK だった。 devcontainer.json "features":{ "ghcr.io/devcontainers/features/docker-in-docker:2": {} }, 以下に dev containers の feature がいろいろあっ…

#dind #Docker #VSCode Remote - Containers

2022-04-19

自宅IPを固定せず、Raspberry Piで自宅VPNを実現する

Web サーバ

はじめに VPN構成構築クラウド側インスタンス作成 docker, docker-composeインストール実行自宅ネットワーク側（ラズパイ側）ビルドーツール softether bridge Setting 実行停止自動起動はじめに個人的な話ですが、アイルランドに引っ越しました。…

#VPN #EC2 #Raspberry Pi

2021-11-11

Suphx: Mastering Mahjong with Deep Reinforcement Learning

DLゼミ論文紹介強化学習機械学習

メタ情報著者発表リンクスライド Zennメモ説明感想メタ情報著者 Junjie Li (Microsoft Research Asia) Sotetsu Koyamada (Kyoto University) Qiwei Ye (Microsoft Research Asia) Guoqing Liu (University of Science and Technology of China) Chao…

#麻雀 #suphx #強化学習 #スライド

2021-10-30

GPUクラスタの使用状況をログインノードから一発で確認するシェルスクリプト

OSS サーバ linux

はじめに cluster-smi 使用方法技術的な話シンボリックリンク並列化なぜシェルスクリプト？はじめにうちの研究室にはGPUクラスタがありますが、各GPUノードの使用率を見るには、各GPUノードにsshしてnvidia-smiをしなければいけません。これでは不便…

#nvidia-smi #GPU #bashスクリプト #シェルスクリプト

2021-09-29

MacでNTFS(windows)を書き込み可能でマウントする方法

linux OSX

はじめに外付けHDDを探すマウントマウント先を作成デフォルトのマウントをアンマウント NFTS読み書き可でマウント Finderで表示アンマウント参考はじめに Windowsでフォーマットした外付けSSDをMacに差したら、なんと読み取り専用でマウントされまし…

#Mac OS X #NTFS #Mount

2021-08-25

Decision Transformer: Reinforcement Learning via Sequence Modeling

強化学習機械学習論文紹介 DLゼミ

メタ情報著者発表リンクスライド Zennメモ説明感想メタ情報著者 Lili Chen (UC Berkeley) Kevin Lu (UC Berkeley) Aravind Rajeswaran (Facebook AI Research) Kimin Lee (UC Berkeley) Aditya Grover (Facebook AI Research) Michael Laskin (UC Be…

#Transformer #GPT #reinforcement learning

2021-08-19

Kaggle SETI 59th solution

Kaggle Python 機械学習

はじめに SETIコンペについて Pipeline Augmentation Test Time Augmentation (TTA) Resizing Network 学習モデルその他試したこと感想はじめにコンペ途中リークが発覚し、データセットリセットがあるなど波乱のコンペでした。また、今回も@kambe さん…

2021-06-28

Kaggle Coleridge 52nd solution

Kaggle Python

はじめに Coleridgeコンペについて validationの分け方 Pipeline Shorten sentence Classifier MLM Jaccard filter 試したこと感想第4位の解法当時のアイディアはじめに今回Kaggleに参加して初めてメダルを取ることができました。 Public scoreでは全然…

#kaggle #銀 #coleridge #solution

2021-06-23

pytorchのモデルをスクリプトごと違うGPUで実行したいとき

Kaggle Python サーバ

はじめに解決方法はじめに Pytorchのnn.Moduleはto()とかcuda()でテンソルを違うGPU番号へ移すことができますが、すべてのテンソルが移ってくれるわけではありません。 nn.Moduleの実装のすべてを移さなくてはいけないのです。これはだるい。解決方法方…

#Pytorch #GPU #tensor #cuda

2021-06-06

kaggle datasets api 使い方

Kaggle

はじめに初期化追加アップロード（バージョニング）単一ファイルの場合フォルダ階層になっている場合 dir-mode 参考はじめに kaggle datasets apiの使い方が少し癖あったので、備忘録初期化最初にフォルダを初期化してあげる必要があります。フォル…

#kaggle #機械学習

2021-05-27

MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2) 解説

DLゼミ論文紹介強化学習

メタ情報著者発表リンクスライド Zennメモ説明感想メタ情報著者 Danijar Hafner (Google Research) Timothy Lillicrap(DeepMind) Mohammad Norouzi (Google Research) Jimmy Ba(University of Toronto) 発表 ICLR 2021 リンク Paper: https://arxiv.…

#DreamerV2 #reinforcement learning

2021-05-12

オンプレGPU環境でmlfowのサーバを立てる

OSS Kaggle サーバ

はじめに立て方 guiで削除したrunsを完全削除したいはじめに機械学習モデルを複数で開発するときがあるとおもいます。しかしデフォルトだと、各ユーザのフォルダにmlrunsフォルダが作成されており、自分で実行した分しか見られません。そこでdocker-com…

#mlflow #GPU #kaggle

2021-04-22

MLFlowの使い方

Kaggle 機械学習 OSS Python

はじめに MLFlowの3本の柱 MLFlow Tracking 最小サンプル複数の実験を管理したい Experiments Runs Tags log_param argparseをまるごと記録したい log_metric x軸をtimeじゃなくてstepで記録したい log_metricの履歴のcsvが欲しい log_artifact フォルダま…

#mlflow #kaggle #DevOps

2021-04-14

OpenCVで点線を描画する

C++

はじめに点線を描画する関数はじめに OpenCVには点線を描画する関数がありません。すごしググると以下のようにcv::LineIteratorを使う方法がヒットしますが、これでは太さの指定ができません。 https://answers.opencv.org/question/180090/how-to-draw-a…

#OpenCV #C++ #点線

2021-04-11

singularity sandboxが削除できないとき (Device or resource busy)

サーバ linux

解決方法 lsofコマンドを使って、そのフォルダを使用してるプロセスをkillすれば良いコマンド lsof /path_to_sandbox 結果 COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME bash 269589 aaa rtd DIR 0,55 4096 397411169 path_to_sandbox run 269603 a…

#singularity #lsof #sandbox #docker

2021-03-31

強化学習の報酬のグラフを良い感じに書く

Python 強化学習機械学習

完成図想定するデータコード説明定数例完成図報酬のグラフこんな感じで2つのアルゴリズムを比較できるように作りました。もちろん、1つでも使えます。（報酬が離散的すぎてやや例としては悪いですが…）想定するデータなんでも良いのですが、今回…

#Python #強化学習 #報酬 #matplotlib

2021-03-14

Pytorch Distributed Data Parallel(DDP) 実装例 (pytorch ddp vs huggingface accelerate)

Python 機械学習

はじめに新しくhuggingface accelerateを用いたDDPの実装を加えました (2021/11/1) 学習コード DataParallel nn.DataParallelのソース DDP DDPのソース実行コマンド DDPソース説明 DDP (accelerate) DDPのソース (accelerate) 実行コマンド DDP(accelerate…

#Pytorch #DDP #VGG16 #Kaggle #accelerate

2021-03-04

はてなブログで技術ブログを書く

Web

はじめにテーマはじめに Qiita、Zenn等の技術記事専門サイトもありますが、はてブロで始めたいという方におすすめの設定を紹介します。テーマ等ブログのテーマは公式のEpicです。個人の主観前回ですが、これが一番見やすい気がします。あと、デフォル…

#はてなブログ #技術ブログ #Epic #カスタマイズCSS

2021-03-04

Pythonでmultipart/form-dataの送受信

Python サーバ

はじめに送信受信 AWSのLambda その他はじめに以下記事の通り、AWS上のLambdaを使って機械学習モデルのAPIを立てたのですが、 Pythonでmultipart/form-dataのパースが大変だったので共有します。 tmyoda.hatenablog.com 送信 requestsモジュールを使用す…

#AWS #multipart #Lambda #Python

2021-03-02

セグメンテーションするpytorch機械学習モデルをAWSへデプロイ（API Gateway, Lambda, ECR)

Github Python Web サーバ機械学習

はじめに独り言構成コンテナイメージの作成フォルダ構成 Dockerfile POST, Responseスキーム app.py ローカルでテスト Lmabdaのロギング ECRにプッシュ Lambda関数作成 API Gatewayの作成 POSTテスト感想参考はじめに pythonを使った機械学習モデルは…

#AWS #Lambda #機械学習モデル #デプロイ

2021-02-19

Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning (2017)

論文紹介機械学習強化学習 DLゼミ

動画 1Pが人間のエキスパート 2Pが強化学習エージェント論文紹介 https://arxiv.org/abs/1702.06230 スマブラDXを強化学習して、エキスパートに勝利した論文です。 DX大好きなので読んでみました。しかしQ学習が非定常性な相手であるself-playに向かないっ…

#スマブラ #強化学習

2021-02-19

Emergent Complexity via Multi-Agent Competition (ICLR 2018)

論文紹介強化学習機械学習 DLゼミ

論文紹介 https://arxiv.org/abs/1710.03748 競争的な環境におけるSelf playに関する論文を読んだメモです。 zennのスクラップという機能を使ってみました。 zennのメモ Emergent Complexity via Multi-Agent Competition (ICLR 2018) しばらくスクラップをO…

#RL #self-play #強化学習 #論文紹介

2021-02-11

EfficientDetのsingle-machine model parallelを実装して、D8(D7x)を学習させる

Python Github OSS 機械学習

はじめに実装したリポジトリ実装解説バックボーン NMS まとめはじめに魚群コンペ記事の第二弾です。 tmyoda.hatenablog.com EfficientDetの良さそうなリポジトリを見つけ、このリポジトリをコンペに使おうと思いました。 github.com しかし、EfficientD…

#efficientnet #efficientdet #物体検出 #signate #コンペ

2021-02-10

mAP(mean Average Precision)を手っ取り早く上げるには

機械学習

はじめに結論理由 mAPの算出方法 APの算出方法例 mAPを上げるにははじめに signateの物体認識コンペ（魚群検知）に参加したので、そのときに得た知見をいくつか共有したいと思います。（複数記事に分ける予定） signate.jp 新記事公開しました。(21.02.1…

#物体検出 #signate #mAP #コンペ

2021-02-05

singularityでcuda+pytorchのコンテナの作り方

サーバ Python OSS

はじめに構成使い方実行方法 sandbox作成 shellに入る .defファイルはじめに tmyoda.hatenablog.com この記事の亜種です。 singularityは--nvを付ければホストのGPUをマウントするので、本来はホストのcudaを使いますが、harmo2とharmo5のcudaバージョン…

#singularity #cuda #python #Container

2021-01-25

singularityでubuntu20.04+python(+pipenv)環境を構築

サーバ Github Python

はじめに構成使い方実行方法 sandbox作成 shellに入る .defファイルはじめに pythonは仮想環境が豊富なので、わざわざコンテナ化する必要ある？って思っていましたが、いざGPUクラスタ上で動かすときに環境構築ハマったので、そのとき作成したpythonを…

#singularity #container #pipenv

2021-01-24

docker, singularityでtzdata等の対話が必要なモジュールのインストールで止まるとき Please select the geographic area in which you live.

サーバ Python

解決方法（非推奨）解決方法 singularityをdefからbuildしていたのですが、以下ような画面でインストールが止まってました。 Configuring tzdata ------------------ Please select the geographic area in which you live. Subsequent configuration quest…

#singularity #docker #tzdata

2020-10-07

pysparkの使い方に慣れるためにirisデータセットをいじってみる