日記(実験データ解析にGlueLang投入から慌ててwhileを実装)
Tue Feb 10 23:30:09 JST 2015 (modified: Fri Sep 29 21:38:45 JST 2017)
views: 1536, keywords:eachline,GlueLang,while,寝る,日記,グルー言語を作る この記事は最終更新日が7年以上前のものです。
昨日から実験データの解析をしており、締め切りが遠いことからGlueLangを投入してみました。これが記念すべき最初のコードです。書きなぐりなので意味を追って読まないでください。
#!/usr/local/bin/glue
import PATH
= '{
file size = $1*$2*$3*$4;
vec_length = $5;
rep_vec_num = 18*36*144*324/vec_length;
table_size = 2;
bit_for_action = int(log(1.0*rep_vec_num)/log(2.0)+0.5);
bit_for_vector_choice
print bit_for_vector_choice*table_size + rep_vec_num * vec_length * bit_for_action,$0;
}'
./results/'
find '>>= grep 'comp_'
>>= xargs 'grep' -H ''
>>= tr ':_' ' '
>>= self '2/6' 'NF' 8
>>= awk '$6~/suc|bro|tim/'
#18 1 144 1 32 success 24.88
>>= grep -v 'success 0$'
>>= awk '{if($6=="broken"){$7=100};print}'
>>= sm2 '+count' 1 5 7 7
#18 1 144 1 32 100 24.88
>>= sort
>>= sm2 1 5 6 7
>>= awk -f size
#274752 18 36 1 1 32 14167 193095.34
>>= awk '{avg = $8/$7;print $1,$2,$3,$4,$5,$6,avg}'
>>= sort '-k1,1n'
全部パイプなのでbashとたいして変わらんと言えば変わらんのですが、自分の作った言語で実験のコード書くの楽しいという自己満足に浸ることができました。
いや、行頭にパイプの記号を書く(bashでも確かできるけど「|」が目立たないのであまりやりたくない)ことができるということや、awkのコードを書く部分がちょっとbashより楽だったので、ちょっとはコードを早く書ける効能がありました。GlueLang作るのに相当時間を潰してますが・・・。
やっとwhileみたいなものを作る気になった。作った。
実はこれを書く前に細かいファイルを1つずつさばくコードを書こうとしましたが、どうしてもまだ実装していないwhileが必要になり、断念してbashを使ってしまいました。ということで、急遽今夜、1時間くらいでwhileみたいなものを実装しました。名前はeachlineで、前段のパイプから受けとった文字列を引数にしてコマンドに次々と渡します。まあ、xargsのようなものです。ていうかxargsです。ただ、コマンドの代わりに手続き(proc)に書いたコードを渡すことができるので、これでforとwhileの機能の大半は実現していることになります。
例を一個のっけておきます。(まだちょっと引数の受け渡しにバグがあるようで、このコードをちょっと変えたら変なファイル名のファイルができました。ファイルを作るときは安全なディレクトリで試してみてください。)
:~ ueda$ cat hoge.glue
uedambp#!/usr/local/bin/glue
import PATH
=
proc hoge # eachlineで受け取った引数の1番目をhogeとともにひっくり返す
= echo 'hoge' argv[1] >>= rev
file f # 二番目の引数をファイル名にして中間ファイルfをカレントディレクトリにmv
2]
mv f argv[
seq 1 10
>>= xargs -n 2
# 1 2 \\n 3 4 \\n ...
>>= eachline this.hoge
動かしてみます。
###シバンにある通り/usr/local/bin/glueにインストールしたglueを使うのでスクリプトをそのまま実行###
:~ ueda$ ./hoge.glue
uedambp###ファイルができる###
:~ ueda$ ls [0-9]*
uedambp10 2 4 6 8
###ファイルの中身###
:~ ueda$ cat 10
uedambp9 egoh
:~ ueda$ cat 2
uedambp1 egoh
もうかなりC++のコードが構造化されていたので実装は30分くらいで済みましたが、引数を渡すときにメモリの確保を忘れてバグを作ってしまい、そいつを取るのに30分かかってしまいました。メモリリーク怖いっす。
明日も仕事なので、寝る。