【問題と解答】第17回ジュンク堂はシェル芸が乗っ取った勉強会
Thu Jun 18 23:59:56 JST 2015 (modified: Fri Sep 29 21:38:45 JST 2017)
views: 3449, keywords:コマンド,CLI,Linux,Unix,勉強会,シェル芸,シェル芸勉強会 この記事は最終更新日が8年以上前のものです。
ルール
- ワンライナーで出されたお題を解きます。
- 汎用的な解を考えるのは出された問題をとりあえず解いてから。
- 特にどの環境とは指定しないので各自環境に合わせて読み替えを。ただし今回、AWKだけはGNU Awk 4.0.1を使っていると明記しておきます。
- 今回のテーマはAWKですが、何で解いても構いません。別にPowerShellだろうがRubyだろうが構いません。ワンライナーじゃないけどエクセル方眼紙でも。
環境
今回はLinuxで解答例を作りましたので、BSDやMacな方は以下の表をご参考に・・・。
| Mac,BSD系 | Linux |
|---|---|
| gdate | date |
| gsed | sed |
| tail -r | tac |
| gtr | tr |
| gfold | fold |
Q1
次のようなデータを
$ cat data1
a 1
b 4
a 2
a 3
b 5次のように変換してみましょう。
a 1 2 3
b 4 5余力のある人は次のようなJSON形式にしてみましょう。
{a:[1,2,3],b:[4,5]}解答
連想配列にデータを追記していって最後に出力するのが楽な方法です。
$ cat data1 | awk '{d[$1]=d[$1]" "$2}END{for(k in d){print k d[k]}}'
a 1 2 3
b 4 5JSONにするには力技(しか思い浮かばなかった)。
$ cat data1 | awk '{d[$1]=d[$1]" "$2}END{for(k in d){print k d[k]}}' |
awk -v q='"' '{printf q$1q":[";for(i=2;i<=NF;i++){printf $i","};print "]"}' |
xargs | tr ' ' ',' | awk '{print "{"$0"}"}' | sed 's/,]/]/g'
{a:[1,2,3],b:[4,5]}Q2
以下の数字のファイルから同じレコード(行)があるかないかを調べ、ある場合には何行目と何行目にあるのか出力しましょう。
$ cat data
0.5937836043 0.4644710001
0.3637036697 0.5593602512
0.5655269331 0.6793148112
0.7804610574 0.2905477797
0.3637036697 0.5593602512解答
$ cat data | awk 'a[$0]{print a[$0],NR,$0}{a[$0]=NR}'1千万行でも10秒くらいで答えが出ることを確認済みです。もっと大きなレコード数で行う場合はもう一捻り必要です。
Q3
次のJSONのデータについて、aに対応づけられた配列内の数字の合計とbに対応づけられた配列内の数字の合計を求めましょう。
$ cat data
{"a":[1,2,3],"b":[4,5]}解答
きれいな方法が思い浮かばないので力技で。
$ grep -o '"[ab]":\\[[^\\[]*\\]' data | tr '":[],' ' ' |
awk '{n=0;for(i=2;i<=NF;i++){n+=$i};print $1,n}'
a 6
b 9
$ cat data | jq . | tr -dc '[:alnum:]\\n' |
awk '/[ab]/{k=$1}!/[ab]/{n[k]+=$1}END{for(k in n){print k,n[k]}}'
a 6
b 9
###jqを使う例を。もっとうまくできるようですが・・・。###
$ cat data | jq 'reduce .a[] as $n (0; . + $n),reduce .b[] as $n (0; . + $n)'
6
9Q4
次のようなIPv6アドレスをechoした後にパイプでコマンドをつなぎ、「::」で省略されているセクションに0を補ってください。
$ echo 2001:db8::9abcただし、同じワンライナーが
::1でも使えるようにしてください。
解答
whileを使ってNFが8になるまでフィールドを補ってから処理してやると素直な処理になります。初めてシェル芸勉強会でawkのwhileを使いました・・・。
$ echo 2001:db8::9abc |
awk -F: '{while(NF!=8){gsub(/::/,":0::",$0)};for(i=1;i<=8;i++){$i=$i!=""?$i:0};print}' |
tr ' ' ':'
2001:db8:0:0:0:0:0:9abc
$ echo ::1 |
awk -F: '{while(NF!=8){gsub(/::/,":0::",$0)};for(i=1;i<=8;i++){$i=$i!=""?$i:0};print}' |
tr ' ' ':'
0:0:0:0:0:0:0:1
###別解###
$ echo 2001:db8::9abc |
awk -F: '{while(NF!=8){gsub(/::/,":0::",$0)}print}' |
tr ':' '\\n' | awk '!NF{print 0}NF{print}' | xargs | tr ' ' ':'
ノート
Tweet