上田ブログ

なお、このサイトはbashでできている。

お知らせ: 詳解確率ロボティクス増刷 /  シェルスクリプト高速開発手法入門改訂2版発売中 /  エンジニアHubで記事を書きました / 

Pythonをコマンドラインで使いたいのでopyというコマンドを作った

Sun Sep 8 16:22:46 JST 2019 (modified: Mon Sep 9 18:33:27 JST 2019)
views: 7305, keywords: opy, Python, ワンライナー, シェル芸

  このエントリーをはてなブックマークに追加 
   

 一つ前の記事をもうちょい真面目に書きました。

この記事の要旨

  • Pythonをコマンドラインで直接使うのは面倒。Pythonワンライナーは地獄。
  • 解決のために opy というコマンドを作って公開
    • 使い方はREADMEにあります
  • なかなかいいので使ってみてください
  • opyを変な呼び方しないでください!やるなよ!絶対やるなよ!!

経緯

 Rubyにrbというワンライナー用のコマンド(Rubyのラッパー)があるという話を聞いたので、Pythonでも作ってみました。

設計指針と実装

行指向で、AWKよりさらに便利に

 ワンライナー中で使う汎用的な言語というとAWKです(コマンドとしてはawk)。ワンライナーやコマンドライン中でAWKが他のものより親和性が高いのは行指向だからです。awkは、次のようにコードもオプションもなにもなしで、標準入力を一行ずつ読み込んで変数にフィールド(空白で区切られたデータ)をセットしてくれます。

$ seq 3 | awk '{print $1*3}'  # 1列目に3をかける
3
6
9

また、上記のように数字は数字として解釈してくれるのも、短く書ける理由です。

 一方、Pythonは行指向でもなく、インデントのルールがあるのでワンライナーとは程遠い言語です。同じことをしようとすると次のように大変なことになります。

$ seq 3 | python3 -c 'import sys;print("\n".join([ str(int(x)*3) for x in sys.stdin ]))'
3
6
9

 ただ、Pythonにはリストがあります。そして、awkが一行読んで$1, $2, ...とデータを分けたり、ユーザがそれを加工して空白区切りでデータを出力することは、Pythonのリスト操作に似ています。そこで、最初から一行読んで一行出力するなら、awk{print $1*3}と書くところ(アクション)にリストを書けばそのまま出力してくれるようにすればいいのではないか、という発想に至りました。

 そういう考えで作ったコマンドopy(おーぴーわい or おーぱい。促音しないこと!!)を使うと、上のPythonワンライナーと等価なワンライナーを、次のように記述できます。

$ seq 3 | opy '[F1*3]'
3
6
9

Python3どころか、AWKより短くできました。

 AWKのパターンも使えます。次の例は入力が奇数のときのみ出力する場合です。

### AWK ###
$ seq 3 | awk '$1%2{print $1*3}'
3
9
### Python3 ###
$ seq 3 | python3 -c 'import sys;print("\n".join([ str(int(x)*3) for x in sys.stdin if int(x)%2 ]))'
3
9
### opy ###
$ seq 3 | opy 'F1%2:[F1*3]'
3
9

複数の列も次のように出力できます。

$ seq 3 | opy 'F1%2:["%dは奇数"%F1, F1*3]'
1は奇数 3
3は奇数 9

また、リストを与えるだけでは済まない処理も、AWKと同様'{}'で可能です。

$ seq 3 | opy '{print(F1, end="")}'
123

このタイプのアクションは「ノーマルアクション」と呼ぶことにしました。リストをアクションとして渡したものは「リストアクション」とします。

文法

 Pythonの文法の外側に、ルール(パターンとアクションの組、あるいはどちらか一方)が追加されます。文法を書き出すと次のようになります。

<rules> ::= <rule> | <rule> ";" <rules>
<rule> ::= <pattern> | <pattern> ":" <action> | <action>
<action> ::= <list action> | <normal action>
<pattern> ::= Pythonのbool式 | "B" | "BEGIN" | "E" | "END" 
<normal action> ::= "{" Pythonの文 "}"
<list action> ::= Pythonのリスト

 B, BEGIN, E, ENDなどの文字列はAWKのBEGINパターン、ENDパターンと同じもので、行を読み込む前の処理を書けます。次は一例です。

$ seq 100 | opy 'B:{a=0};{a+=F1};E:[a]'
5050

モジュール

 モジュールの読み込み方は3通りあります。まず、リストアクションの中では、自動的にモジュールが読み込まれます。ちょっとした計算に便利なようにしました。

### sin 1を求める ###
$ opy 'B:[math.sin(1)]'
0.8414709848078965
### sqrt(3*3 + 4*4)の計算 ###
$ opy 'B:[numpy.hypot(3,4)]'
5.0

ただし、これは「PythonがNameErrorを起こしたときにモジュールの読み込みを試みる」という安直な実装で実現しています。ですので、リストの中で副作用のある計算をすると、モジュールを読み込む前にリストの中で行った計算が2度実行される可能性があります。

 もう一つは明示的にインポートする方法で、-m(モジュール)オプションを使う方法が簡単です。

### -m オプション ###
$ opy -m numpy 'E:{print(numpy.pi)}'
3.141592653589793
### 二つ以上指定する時はカンマで ###
$ opy -m math,numpy 'B:[math.e,numpy.e]'
2.718281828459045 2.718281828459045

 最後の方法はBEGINパターンを使うものです。

$ opy 'B:{import numpy};E:{print(numpy.pi)}'
3.141592653589793
$ opy 'B:{import numpy as np};E:{print(np.pi)}'
3.141592653589793

スピード

 これはあまり重視していません。

変数のスコープ

 実装中にexecとかevalをたくさん使っていて正直把握しきれていませんが、BEGINパターンで作った変数は他のパターンでも利用できます。

ユーザー

 シェル芸botにインストールされているので、すでに界隈に熟練のopyer(促音しないこと)が増えてます。

おわりに

 またいろいろ説明が書き足らないことがありますが、とりあえずリポジトリは

ですので、とりあえずインストールしておいて、ここぞというときに思い出して使ってみていただければ幸いです。



prev:pyというコマンドを作ったった next:自作コマンド(opy)をbrewとsnapに対応した