高専プロコン競技部門に参加した

どうも、Haskellの宣伝をしまくっていた@fumievalです。

全国高等専門学校 第24回プログラミングコンテスト競技部門に、@NKMR_YA@39moguraさんと一緒に茨城工業高等専門学校の代表チームとして出場しました。

f:id:fumiexcel:20131016123648p:plain

去年もそれを使った、ような…

競技の流れは以下の通りです。

  • 送信側m人と受信側n人(m + n = 3)に分かれる。
  • 送信側に文字列Sが配布される。
    • 木製の長方形の容器(パケット)と、 それぞれの面に1から6までの点が刻まれた立方体状の樹脂(サ イ コ ロが与えられるので、必要に応じてそれを使う。
    • 設置されたカメラにより、20秒間隔でパケットが撮影される。ただし、手などが写っていると魂を抜かれ失格。
  • 受信側は、何らかの文字列S'をサーバーに送信する。必要に応じて、送信側で撮影されたパケットの画像を利用することができる。
  • 制限時間が過ぎると終了。
    • SとS'を先頭から比較し、もっとも一致している文字数が多いチームが勝利。
    • 文字数が等しい場合、その文字列を提出するまでの秒数が少ないほうが勝利。
    • 秒数が等しい場合、いくつかのサイコロを振り、その合計が大きいほうが勝利。

それはとっても簡単だなって

去年の問題は、乱雑に置かれたサイコロの個数を数えるという高難易度…むしろ人間がやったほうが楽なものでしたが、今年の問題はある程度プログラミングを生かせると感じました。もう何も怖くない。

GUIも、CUIもあるんだよ

私がエンコーダ、デコーダを開発し、残りの二人が画像認識プログラムを作るという割り当てでした。配置を表示するプログラムも作ってしまったので、それを使うことになりました。

f:id:fumiexcel:20131016123335p:plain

写真のようにサイコロの1、2、5の目だけを使い、中央の色を調べることで画像認識を簡単にするという方針でした。

f:id:fumiexcel:20130926170951j:plain

工夫なんて、あるわけない

後述する事情により、1から6までの目を使うことになりました。エンコード方法は、サイコロ5つを2文字に割り当てるという至極単純なもの。暗号化も圧縮もありません。目の列は1行ごとに左から右に並べられます。

本番で与えられた文字列がこんな感じだったので、エントロピー符号くらいは使うべきでした…あたしって、ほんとバカ

こんなの絶対おかしいよ

本番はマウスも含め周辺機器が利用できません。これはちょっと厳しいです…本当のルールと向き合えますか?

もう誰にも頼らない

真上から撮影できるとは限らないことが判明したため、急遽私も画像認識のプログラムを開発することになりました。

10/9頃、ある程度サイコロの目を判別できるようになりました。幾度ものパラメータの調整を経て、百発百中の精度を得ました。

f:id:fumiexcel:20131016124840p:plain

アルゴリズムは、画像の中の黒い点をカウントするだけです。

この時点でシステムのすべてがHaskell製になりましたが、そこは…まあ。データ構造、線型代数、画像処理、並列化などの多少の勉強になりました。

わたしの、サイコロの友達

他の二方のおかげで、準優勝というよい結果を残すことができました。とても感謝しています。来年はその一つ上を目指すだけなので、気が楽です。来年はサイコロじゃないといいなあ。

最後に、ともに闘ってくれたチームのメンバー、本コンテストを開催した運営の方々、会場を用意していただいた旭川市民文化会館の方々、および財布を拾っていただいたホテルの方に、心より感謝を申し上げます。

リンク

型からHello world

Restricted Wordsに参加した。

"Hello World"という文字列を出力するプログラムを、文字・文字列・数値リテラル使わずに書くという問題。で、回答のコードがこちら。

import Data.Reflection -- cabal install reflection

main = putStrLn $ map toEnum [
      reflect ([] :: [D (D (D (SD (D (D (SD Z))))))])
    , reflect ([] :: [(SD (D (SD (D (D (SD (SD Z)))))))])
    , reflect ([] :: [(D (D (SD (SD (D (SD (SD Z)))))))])
    , reflect ([] :: [(D (D (SD (SD (D (SD (SD Z)))))))])
    , reflect ([] :: [(SD (SD (SD (SD (D (SD (SD Z)))))))])
    , reflect ([] :: [D (D (D (D (D (SD Z)))))])
    , reflect ([] :: [SD (SD (SD (D (SD (D (SD Z))))))])
    , reflect ([] :: [(SD (SD (SD (SD (D (SD (SD Z)))))))])
    , reflect ([] :: [D (SD (D (D (SD (SD (SD Z))))))])
    , reflect ([] :: [(D (D (SD (SD (D (SD (SD Z)))))))])
    , reflect ([] :: [D (D (SD (D (D (SD (SD Z))))))])
    ]

reflectは、型レベルにエンコードされた値を値レベルに戻す関数なのだ。

class Reifies s a | s -> a where
  -- | Recover a value inside a 'reify' context, given a proxy for its
  -- reified type.
  reflect :: proxy s -> a

通常は、なんとunsafeCoerceを駆使してインスタンスを動的に生成するという方法で、値を実行時に型にエンコードするのが普通の使い方。コワイ!だが、Reifiesにはもう一つ、Intのインスタンスもある。

data Z -- 0
data D  (n :: *) -- 2n
data SD (n :: *) -- 2n+1
data PD (n :: *) -- 2n-1

[Z]という型をreflectすると0、[D n]という型をreflectすると2 * n、[SD n]という型をreflectすると2 * n + 1になる。これを利用して、型から自然数を生み出せるのだ。

Prelude Data.Reflection> reflect ([] :: [(D (SD (D (SD (D (SD Z))))))])
42

あとはtoEnum :: Int -> Charで文字に変換して、リストを作ればOK。なんて卑怯純粋で安全な方法!

Given

give :: a -> (Given a => r) -> rという関数は、動的にGivenクラスのインスタンスを生成するgiveで与えた値は、given :: Given a => aによっていつでもどこでも取り出せる。何かと便利だ。

Lazy K 基礎文法最速マスター

Unlambda記法

適用

`FG

F、Gは任意の式。

コンビネータ計算記法

適用

(FG)

F、Gは任意の式。

Iota記法

適用

*FG

F、Gは任意の式。

Jot記法

  • 空白のコード → 恒等関数
  • X0 → X S K
  • X1 → S (K X)

Xは任意の式で、S、Kはコンビネータ

モナドとはモナドである

この記事を読む前に、絶対に理解出来ないモナドチュートリアルに一度目を通してみてほしい。モナドを理解していく上で、とても重要なことが書かれている。


改めて言おう、モナドモナド。コンテナだとかプログラマブルセミコロンだという説明では、モナドのすべてを正確に表せるとは言い難い。では、モナドを過不足なく説明できる、モナド以外の言葉はあるのか?

実は、モナドを表現し、かつモナドで表現される言葉は存在する。その一つは手続きである。手続き型言語の「手続き」だ。

手続きとは何か

手続きは結果を持つ

おおよそすべての手続きは何らかの結果を持つ。Haskellの()、C言語のvoid、PythonのNone、Rubyのnilなども結果の一種だ。結果が出ないとしたら、そのプログラムは停止しないか、途中で異常終了するだろう。

手続きには最小単位が存在する

処理系が扱っている以上、手続きが際限なく分解できるということはあり得ない。抽象的な文脈なら、「文字を出力する」のも最小単位と見てよいだろう。

「手続きAを実行した後手続きBを実行する」といったものも手続きである

当たり前だが、大事な性質だ。これによって手続きを組み合わせ、大きなプログラムを作ることができる。

「何もしない」のも手続きである

何もしなくても手続きになる。ならないと色々と困る。ただし、「結果を持つ」という性質は満たさなければならない。

さて、手続きの4つの性質を確認したが、以下のような疑問が残る。

  • 「Aを実行した後Bを実行する」とき、Aの結果はどこに行くの?

多くの手続き型言語では代入構文を使って手続きの結果を保存している。Pythonならこんな感じだ。

s = raw_input()

しかし、結果を利用するためだけに変数の仕組みを持ち出すのは美しくない。「変数なんてどの言語でも備えているだろ」と思うかもしれないが、今回はそうではないのだ。そこで、「関数」を使おう。

  • 「Aを実行し、その結果を手続きを返す関数に渡す。そして、返ってきた手続きBを実行する。」

要するに、「現在のスコープに結果がある」という条件を満たせばよい。

Haskellで手続きを表現する

以上の点を踏まえて、Haskellで手続きを表現する方法を考えてみよう。

手続きは「結果」を持つ。

結果の型をaとすると、少なくとも手続きの型はT aのようになる。単なる値と区別しないと作る意味がない。

手続きには最小単位が存在する

とりあえず、以下のものを最小単位としてみよう。

Helloworld :: T () -- Hello, worldを表示する。
GetLine :: T String -- 文字列を入力する。
PutStrLn :: String -> T () -- 文字列を引数に取り、その文字列を表示するという手続きを返す。

ちょっと待った!HelloworldやMyGetLineはコンストラクタなのに(コンストラクタは大文字で始まる)、自由に型を指定することができるのか?

できる、そう、GADTならね。GHCのGADTs拡張を使うと、コンストラクタとその型を列挙して代数的データ型を定義できる。

{-# LANGUAGE GADTs #-}

data T x where
    Helloworld :: T () -- Hello, worldを表示する。
    GetLine :: T String -- 文字列を入力する。
    PutStrLn :: String -> T () -- 文字列を引数に取り、その文字列を表示するという手続きを返す。

GADTはとても便利な機能だ。以降の性質も、GADTを使って表現しよう。

「Aを実行し、その結果を手続きを返す関数に渡す。そして、返ってきた手続きBを実行する。」

これを実現するには、手続きAと、結果を受け取る関数がコンストラクタの引数に含まれていればよい。

infixl 1 :>>=
data T x where
    Helloworld :: T ()
    GetLine :: T String
    PutStrLn :: String -> T ()

    (:>>=) :: T r -> (r -> T a) -> T a

(:>>=)という演算子はなにかに似ている気がするが、今は考えないでほしい。

「何もしない」のも手続きである

ただ結果を保持するだけのコンストラクタを追加する。

data T x where
    Helloworld :: T ()
    GetLine :: T String
    PutStrLn :: String -> T ()

    (:>>=) :: T r -> (r -> T a) -> T a
    Return :: a -> T a

これで、文字を入出力するという操作ができる、手続きの枠組みができた。では、使ってみよう。

Return 42 :: T Int -- 42を返す
Helloworld :>>= \_ -> Return 42 -- Hello, world!した後42を返す
GetLine :>>= PutStrLn -- 入力した文字列をそのまま返す
GetLine :>>= PutStrLn . reverse -- 入力した文字列を逆転させて返す

確かに表現力はある。実は、これがモナドだ。

正体

モナドは、上で定義した4つの性質のうち、「結果を持つ」「合成できる」「何もしない」が保証される構造だ。

Haskellの強力な仕組みである型クラスを使うと、このように表現できる。

class Monad m where
    return :: a -> m a
    (>>=) :: m a -> (a -> m b) -> m b

上で定義したTは、直接Monadインスタンスにできる。

instance Monad T where
    return = Return
    (>>=) = (:>>=)

Monadインスタンスにすると、これから出てくる様々なモナドを、returnと(>>=)という二つの関数で統一的に扱える。しかも、do記法というHaskellの非常に便利な機能を使えるようになる。

do記法を用いると、さながら手続き型言語のように手続きを記述することができる。いや、do自体が手続き型言語であると言った方が良いだろう。

echoReversed = do
    s <- GetLine
    PutStrLn (reverse s)

もっと様々な手続きを書きたければ、Tに新たなコンストラクタを追加すればよい。モナドは、実はとても簡単に作れるものなのだ。

もっと簡単に

(:>>=)とReturnはモナドに必ず必要なため、この部分だけを切り出した構造を作れば、より簡単にモナドを作れそうだ。

data Program x where
    (:>>=) :: Program r -> (r -> Program a) -> Program a
    Return :: a -> Program a

ところが、これだけだと手続きの最小単位がないため意味がない。手続きの最小単位のための型を別に作るようにしてみよう。

data Program t x where
    Unit :: t a -> Program t a
    (:>>=) :: Program t r -> (r -> Program t a) -> Program t a
    Return :: a -> Program t a

data MyActions x where
    Helloworld :: MyActions ()
    GetLine :: MyActions String
    PutStrLn :: String -> MyActions ()

type T = Program MyActions x

こうして得られたTもやはりモナドになる。機能を拡張したいときは、Programを変えずに、MyActionsを変更すれば大丈夫。

このような、機能の最小単位の集まりからモナドを作る仕組みは、Operationalモナドと呼ばれている。これからのHaskellプログラミングで、非常に大きな役割を果たすだろう。

IOの世界

今までモナドを自作してきたが、HaskellではIOモナドという非常に重要なモナドがあらかじめ定義されている。なんと、IOモナドは、処理系がモナドを分解して、現実世界に対する副作用に変換できるのだ!

IOモナドとして表現される手続きをmainとして定義すると、処理系がそれを解釈してコンピュータに副作用を発生させる。これにより、Haskellのプログラムは使えるようになる。

main = putStrLn "Hello, world!"

これを実行すれば、あなたのターミナルにはHello, world!と表示されるだろう。神秘的だ…

IOモナドの中身をプログラムが把握することはできないが、Operationalモナドの中身を把握することは可能だ。これは、処理系が現実世界の中身を把握できなくても、IOモナドの中身を把握できるのと似ている。ということは、Operationalモナドを解釈してIOに影響を及ぼす処理系を作れるのではないだろうか?……作れる。

toIO :: Program MyActions a -> IO a

toIO (Unit HelloWorld) = putStrLn "Hello, world!"
toIO (Unit (PutStrLn str)) = putStrLn str
toIO (Unit GetLine) = getLine

toIO (Return a) = return a
toIO (m :>>= k) = toIO m >>= toIO . k

そう、まさに言語と処理系の関係。Operationalモナドは、一つの手続き型言語を、命令の一覧から自動生成してしまうモナドなのだ。しかも、IOなどの特定の環境に依存しない(クロスプラットフォーム)。処理系がプログラミング言語の挙動をエミュレートする――メタ世界の住人が我々をエミュレートする――という関係が、言語の中に出てきただけなのだ。

ここで作ったOperationalモナドは、より洗練された実装がある。実用する際はこちらを使おう。

ここで紹介した以外にも、Haskellの世界には様々なモナドがある。モナドの六つの系統モナドのすべてを参考に、様々なモナドを使って、そして作ってみてほしい。

まとめ

  • 手続きモナド
  • モナド手続きであり、それ自体が一つの言語
  • モナドは沢山あり、それらを変換する処理系を作ることができる
  • すべてのモナドはOperationalに通ず

モナドの六つの系統[Functor x Functor]

モナドは「アクション」を表す抽象的な構造である。モナドは、Haskellにさまざまな概念に対する記述能力をもたらす。

モナドの基礎

  • return :: a -> m a: 純粋な値をモナドで包む。
  • m >>= f :: m a -> (a -> m b) -> m b: モナドmに包まれた値をfに渡し、その結果として現れたモナドを結合する。
  • 固有アクション: それぞれのモナドに固有の方法でモナドを生み出す。
  • 実行: モナドに包まれた値を、より根源的な形に還元する。

モナド

モナドに以下の三つの制約を課すことによって、最低限度の記述能力を保証している。

return a >>= k == k a
m >>= return == m
m >>= (\x -> k x >>= h) == (m >>= k) >>= h

より強い制約は、より強い力を生み出す。

モナドの分類

モナドは、以下の6つの系統に分類できる。

f:id:fumiexcel:20130605170915p:plain

隣り合っているものほど相性がよく、近い性質を持つことが多い。

内包系

Identity, Maybe, Either, [], Iterateeなど

値を何らかの形で包みつつ、モナドの性質を付与したもの。失敗する可能性のある計算に使用できるものも多い。ストリームを扱うモナドIterateeは、継続系の性質も併せ持つ。

  • Nothing :: Maybe a (固有アクション)計算をすべてに終わりにする。これが出現すると、(>>=)は一切意味をなさなくなる。

出力系

主にWriter

値を出力できるという性質を備えたモナド

  • tell :: Monoid w => w -> Writer w () (固有アクション)モナドに値を送り込む。モナドが結合できるという制約から、送る値も結合可能でなければならない。

  • runWriter :: Writer w a -> (a, w) (実行)計算の結果と、書き込まれた値を取り出す。

環境系

主にReader

モナドの中で値を取り出し、自由に使用できるという性質を持つ。

  • ask :: Reader r r (固有アクション)環境から値を取り出す。

  • runReader :: Reader r a -> r -> a (実行)環境を設定し、その下で行われた計算の結果を求める。環境に持たせる値はどんなものでもよい。

世界系

IO, STM, ST, Q, Freeなど

現実を含む、世界に作用できる特殊なモナドHaskellにおける、副作用を表現する唯一の方法である。

  • putStrLn :: String -> IO () (固有アクション)現実世界の標準出力に文字列を送る。

  • getLine :: IO String (固有アクション)現実世界の標準入力から、一行分の文字列を取り出す。

  • unIO :: IO a -> (State# RealWorld -> (# State# RealWorld, a #)) (実行)GHCのIOの中身は、現実世界を受け取り、変更後の現実世界と結果を返す関数である。通常、我々がこの型 を目にすることはない。

  • liftF :: Functor f => f a -> Free f a (固有アクション)すべてのFunctorには、自由モナド(free monad)と呼ばれるモナドが対応する。自由モナドは強力な抽象化、コードの分離を行うことができる*1

  • singleton :: t a -> Program t a (固有アクション)なんと、この世にはすべてのデータ型にモナドを対応させる仕組みが存在するのだ*2。筆者はこれを最強のモナドの一つだと確信している。

状態系

主にState

モナドの中なら、値を読み込んだり書き込んだりできる。

  • get :: State s s (固有アクション)現在の状態を読み込む。

  • put :: s -> State s () (固有アクション)現在の状態を置き換える。

  • runState :: State s a -> s -> (a, s) (実行)初期状態を与えて、結果と変更後の状態を取得する。

継続系のCodensityモナドを使うと、環境系モナドの性質を状態系モナドに変化させることができる。

継続系

Cont, CC, Parser, Codensity, Logicなど

「継続」と呼ばれる、計算の結果を受け取る関数を扱うモナド。表現力が高く、興味深い性質を示すものも多い。

  • cont :: ((a -> r) -> r) -> Cont r a (固有アクション)継続を受け取る関数からモナドを作る。rの型がわかっているとき、非常に柔軟な処理が可能となる。

  • runCont :: Cont r a -> (a -> r) -> r (実行)継続を渡し、計算の結果を求める。

  • dnew :: CC (Dynvar CC a) (固有アクション)限定継続モナドCCの中で、変更可能な変数*3を具現化する。IOなどの現実世界と関わる処理は一切ない。

ほとんどのモナドはこの継続系の変種として表現できるという面白い特徴を持つ。Logicモナド継続系でありながら非常に内包系に近い特性を持つ*4

まとめ

良いプログラムを書くには、これら六系統のモナドをバランス良く使いこなしていくことが大事である。

参考文献

Freeモナドを超えた!?operationalモナドを使ってみよう

限定版IOみたいなモナドを簡単に作れたら、コードが分離できるしテストもしやすくなるのになあ…

数か月前なら、

それ、Freeモナド*1でできるよ!

と返されるだろう。だが今は違う。Freeモナドよりも簡単にモナドを作れるモナドOperationalモナドがあるのだ。

Freeモナドについて復習しよう。FreeモナドはFunctorを基にMonadを作れる構造であり、Functorで自分自身を包むことによってモナドの力を得ている*2。FunctorそのものはDeriveFunctor拡張を使って簡単に作れる。

{-# LANGUAGE DeriveFunctor #-}
import Control.Monad.Free

data CharIO a = PutCh Char a | GetCh (Char -> a) | LiftIO (IO a) deriving Functor

putCh ch = wrap $ PutCh ch (return ())
getCh = wrap $ GetCh return
liftIO = wrap . LiftIO . fmap return

CharIOを標準入出力上で動かす場合は以下のようになる。

type MyIO = Free CharIO

runCharIO :: Free CharIO a -> IO a
runCharIO (Free (PutCh ch cont)) = putChar ch >> runCharIO cont
runCharIO (Free (PutCh cont)) = getChar >>= runCharIO . cont
runCharIO (Free (LiftIO m)) = m >>= cont
runCharIO (Pure a) = return a

チャーチエンコード(Boehm-Berarducciエンコード?)されたバージョンはより高速に動作する。

import Control.Monad
import Control.Monad.Free.Church

type MyIO = F CharIO

runCharIO :: MyIO a -> IO a
runCharIO m_ = runF m_ return w where
    w (PutCh ch cont) = putChar ch >> cont
    w (GetCh cont) = getChar ch >>= cont
    w (LiftIO m) = join m

ここからが本題

ところが、Operationalモナドはより簡単にモナドを構成できる。ここでは、実装の一つであるfree-operationalパッケージを使う。

{-# LANGUAGE GADTs #-}
import Control.Monad.Operational.Simple

-- 必要なアクションの型を並べる
data CharIO x where
    GetCh :: CharIO Char
    PutCh :: Char -> CharIO ()
    LiftIO :: IO a -> CharIO a

type MyIO = Program CharIO
getCh :: Program CharIO Char
getCh = singleton GetCh

putCh :: Char -> Program CharIO ()
putCh = singleton . PutCh

liftIO :: IO a -> Program CharIO a
liftIO = singleton . LiftIO

驚くべきことに、Functorすら使わずにモナドを作れる。しかも、他のモナドに変換するのも非常に簡単だ。

runCharIO :: MyIO a -> IO a
runCharIO = interpret advent where
    advent GetCh = getChar
    advent (PutCh ch) = putChar ch
    advent (LiftIO m) = m

なぜこんなことができるのか――そこには、Coyoneda*3と呼ばれるFunctorの力が隠されていた。

{-# LANGUAGE GADTs, Rank2Types #-}

data Coyoneda t x where
    Coyoneda :: t r -> (r -> a) -> Coyoneda t a

instance Functor (Coyoneda t) where
    fmap f (Coyoneda t g) = Coyoneda t (f . g)

liftCoyoneda :: t a -> Coyoneda t a
liftCoyoneda t = Coyoneda t id

なんとこのCoyonedaは、ただのデータ型からFunctorを生み出せるのだ!!

Operationalモナド(上の例ではProgram)は、本質的には以下のようになっている。

type Program t = Free (Coyoneda t)

何もないところからFunctorが作れて、FunctorがあればMonadが作れる――したがって何もないところからMonadを作れる、という理屈だ。

それは、元の構造をアクションに変形するsingleton関数によって表現できる。

-- liftCoyoneda :: t a -> Yoneda t a
-- liftF :: Functor f => f a -> Free f a

singleton :: t a -> Program t a
singleton = liftF . liftCoyoneda

あとはinterpretを定義すれば、adventのような関数を与えるだけで動かせる。

interpret :: Monad m => (forall x. instr x -> m x) -> Program instr a -> m a
interpret eval (Free (Coyoneda t f)) = eval t >>= interpret eval . f
interpret _ (Pure a) = return a

欲しいアクションの型を並べれば、freeなモナドが手に入る

じゃあいつ使うか?

今でしょ!

追記: minioperationalという、シンプルかつ高速なOperationalモナドの実装を作ったのでぜひ使ってみてほしい。

*1:昨年の冬、日本のコミュニティでやたら流行った

*2:詳しくは過去の記事を参照

*3:Data.Functor.Yoneda.Contravariant.Yonedaと等しい