【問題と解答】第17回ジュンク堂はシェル芸が乗っ取った勉強会

Thu Jun 18 23:59:56 JST 2015 (modified: Fri Sep 29 21:38:45 JST 2017)
views: 2499, keywords:コマンド,CLI,Linux,Unix,勉強会,シェル芸,シェル芸勉強会 この記事は最終更新日が6年以上前のものです。

ルール

  • ワンライナーで出されたお題を解きます。
  • 汎用的な解を考えるのは出された問題をとりあえず解いてから。
  • 特にどの環境とは指定しないので各自環境に合わせて読み替えを。ただし今回、AWKだけはGNU Awk 4.0.1を使っていると明記しておきます。
  • 今回のテーマはAWKですが、何で解いても構いません。別にPowerShellだろうがRubyだろうが構いません。ワンライナーじゃないけどエクセル方眼紙でも。

環境

今回はLinuxで解答例を作りましたので、BSDやMacな方は以下の表をご参考に・・・。

Mac,BSD系 Linux
gdate date
gsed sed
tail -r tac
gtr tr
gfold fold

Q1

次のようなデータを

$ cat data1
   a 1
   b 4
   a 2
   a 3
   b 5

次のように変換してみましょう。

a 1 2 3
   b 4 5

余力のある人は次のようなJSON形式にしてみましょう。

{a:[1,2,3],b:[4,5]}

解答

連想配列にデータを追記していって最後に出力するのが楽な方法です。

$ cat data1 | awk '{d[$1]=d[$1]" "$2}END{for(k in d){print k d[k]}}' 
   a 1 2 3
   b 4 5

JSONにするには力技(しか思い浮かばなかった)。

$ cat data1 | awk '{d[$1]=d[$1]" "$2}END{for(k in d){print k d[k]}}' |
    awk -v q='"' '{printf q$1q":[";for(i=2;i<=NF;i++){printf $i","};print "]"}' |
    xargs | tr ' ' ',' | awk '{print "{"$0"}"}' | sed 's/,]/]/g'
   {a:[1,2,3],b:[4,5]}

Q2

以下の数字のファイルから同じレコード(行)があるかないかを調べ、ある場合には何行目と何行目にあるのか出力しましょう。

$ cat data
   0.5937836043 0.4644710001
   0.3637036697 0.5593602512
   0.5655269331 0.6793148112
   0.7804610574 0.2905477797
   0.3637036697 0.5593602512

解答

$ cat data | awk 'a[$0]{print a[$0],NR,$0}{a[$0]=NR}'

1千万行でも10秒くらいで答えが出ることを確認済みです。もっと大きなレコード数で行う場合はもう一捻り必要です。

Q3

次のJSONのデータについて、aに対応づけられた配列内の数字の合計とbに対応づけられた配列内の数字の合計を求めましょう。

$ cat data
   {"a":[1,2,3],"b":[4,5]}

解答

きれいな方法が思い浮かばないので力技で。

$ grep -o '"[ab]":\\[[^\\[]*\\]' data | tr '":[],' ' ' |
    awk '{n=0;for(i=2;i<=NF;i++){n+=$i};print $1,n}'
   a 6
   b 9
   $ cat data | jq . | tr -dc '[:alnum:]\\n' |
    awk '/[ab]/{k=$1}!/[ab]/{n[k]+=$1}END{for(k in n){print k,n[k]}}'
   a 6
   b 9
   ###jqを使う例を。もっとうまくできるようですが・・・。###
   $ cat data | jq 'reduce .a[] as $n (0; . + $n),reduce .b[] as $n (0; . + $n)'
   6
   9

Q4

次のようなIPv6アドレスをechoした後にパイプでコマンドをつなぎ、「::」で省略されているセクションに0を補ってください。

$ echo 2001:db8::9abc

ただし、同じワンライナーが

::1

でも使えるようにしてください。

解答

whileを使ってNFが8になるまでフィールドを補ってから処理してやると素直な処理になります。初めてシェル芸勉強会でawkのwhileを使いました・・・。

$ echo 2001:db8::9abc |
    awk -F: '{while(NF!=8){gsub(/::/,":0::",$0)};for(i=1;i<=8;i++){$i=$i!=""?$i:0};print}' |
    tr ' ' ':'
   2001:db8:0:0:0:0:0:9abc
   $ echo ::1 |
    awk -F: '{while(NF!=8){gsub(/::/,":0::",$0)};for(i=1;i<=8;i++){$i=$i!=""?$i:0};print}' |
    tr ' ' ':'
   0:0:0:0:0:0:0:1
   ###別解###
   $ echo 2001:db8::9abc |
    awk -F: '{while(NF!=8){gsub(/::/,":0::",$0)}print}' |
    tr ':' '\\n' | awk '!NF{print 0}NF{print}' | xargs | tr ' ' ':'
ノート   このエントリーをはてなブックマークに追加 
 

prev:【問題のみ】第17回ジュンク堂はシェル芸が乗っ取った勉強会 next:SoftwareDesign2015年7月号の一行感想文

やり散らかし一覧

記事いろいろ